能否利用 NLP 找到词典中那些循环定义或者定义模糊的词好问题。我年

好问题。我年轻的时候（大概初中吧），曾经幻想过编制一本字典，把汉语（或者英语，或者任何一门语言）当中，不能被仅用该语言词汇库中的其它词汇明确解释（也就是题主说的循环解释，许慎称之为转注）的词列出来，称之为「基本词汇集」。当时我想，有了这个以后，我就可以仅用这本字典里的词汇来描述世间万事万物了，而不需要不断地新造词汇。后来接触到NLP和人工智能，我觉得这种字典可以当做建立类人意识的机器人语料库的Seeds。毕竟，语言是思维的载体，无论在人类还是计算机上。我的这个灵感来自于计算机的ASCII码。当时我刚刚了解到ASCII码的工作原理，就是用0和1的组合表示26个字母以及一些标点符号，还有一些基本的操作（增删改查）。于是，对于一台文字处理机来说，它的基本词汇就是0和1，系统内的所有其他词汇都有这两个无法定义的词汇进行派生。毫无疑问，任何自然语言的词汇都是冗余的。自然语言的语法（grammatical）复杂性提升了语义（semantical）复杂性，为什么计算机只用两个基本词汇0和1，是因为物理层的语法只有「栈」这个一维的测度。在编那本「基本词汇集」的时候，我发现随着科技的进步，语言的发展，一个语言当中的基本词汇越来越少，越来越「去冗余化」，因为越来越多的事物间的内在联系被我们发现了，原本不能被解释的词汇也可以被解释了。也就是说，自然语言的发展，和NLP是两个相反的过程。一个是induction，一个是deduction。这也就是为什么机器翻译可以做到语法上几乎无误而语义上经常出错。就像海森堡测不准定理一样，归纳性质的算法只能逼近语法OR语义其中一项的准确。所以，扯了这么远，本问题我的答案是，利用NLP总结基本词汇，必须把过程反过来。先让机器适应这门语言，再在不断的应用语言过程中，发现并改进词汇的内在联系和组织结构。而且每一种自然语言都一定不只有一本「基本词汇集」，使用不同的算法可以演绎出不同的词汇集，只要结果等效就可以了。那么未来会不会真的出现一门人工语言，其词汇完全由抽象的、不可拆分的、不可解释的词汇组成呢？未来计算机化的社会当中，这种语言会不会打败所有自然语言成为新人类的通用语呢？我很好奇，拭目以待。
■网友
比如“能力”“眼光”“优秀”之类的模糊又常见的词语

能否利用 NLP 找到词典中那些循环定义或者定义模糊的词

推荐阅读

名韵世家|明星同款儿童房，你值得拥有！

股票|距征求意见仅1个月，券商分类评级新规落地！2019券商经营业绩排名同天出炉，业务收入加分初见分晓

傅火狐说体育|这些球员曾经也是一个酒鬼，酒精是个坏东西

环球时报热点|外媒称苹果等美国公司呼吁停止微信禁令：将严重削弱美企

我爱我的娱乐圈|老穆小未才是人间真爱，《爱我就别想太多》：被忽视的1对恋人

[支付宝]3月支付宝在线挂号量增长162%，这三个科室最火爆

科特迪瓦中国抗疫医疗专家组考察科特迪瓦新冠患者定点收治医院

英国考文垂大学课程设置及录取要求简述

蚂蚁电竞ANT27VQ电竞显示器开箱体验：超高色域，豪华配置

萌娃哭诉名字太难写想叫小花■可爱萌娃哭诉名字太难写想叫小花众网友评论亮了

格力电器被中国移动取消中标资格|格力电器被中国移动取消中标资格这是什么情况？

王者十点半各路都有人才出，玩不明白射手照样蹭蹭上分，S19分路特征显著

天天汽车|第十代索纳塔的“必杀技”在哪？，正面叫板雅阁

『SUV』这款SUV上市又要火！标配1.5T+LED灯，仅9万起，哈弗H6突然不香了

春尖和毛尖有什么区别,喝茶和品茶有什么区别没有

「猫藓」猫藓到底难不难治

中国新闻网|淡季不淡，牛肉价格连续10周上涨，为啥？

女生怎样瘦臀部，肚子，和大腿好急

财务管理是干什么的

阿拉斯加说电影▲两人同穿一件“茄子裙”，谁更时尚一目了然，沈梦辰吴昕成功撞衫