怎样做词频统计

时态、单复数、英美拼写、变体等情况可以用 Version 6 of the 12dicts word lists 提供的 2+2+3 lem list (http://wordlist.aspell.net/12dicts-readme/#223lem) 来转换。顺带安利一下我用 Python 写的词频统计脚本:英语文本词频统计 in Python - 魏华的文章 - 专栏
■网友
Antconc,加载一个lemma list(官网有),就可以消除了。

■网友
要不试一试这个软件?
【软件分享】英语试卷统计翻译
1)统计英语文本中单词个数、音标和翻译,并导出文件。
2)支持查看单词在文本中的分布。
3)支持自己添加过滤词。
4)对于英语单词进行词形还原处理。避免went和gone统计程不同的单词。
链接:
https://pan.baidu.com/s/1yQQhLpSvXgBPkcGgl_CiYQ 提取码: k6ei
链接不好用的话 ,私信我即可。
【怎样做词频统计】 怎样做词频统计

怎样做词频统计

怎样做词频统计



■网友
ConGram 据说可以做lemmatization of wordlist
■网友
关于第一个问题,每种语言处理方式不一样,如果是拉丁语系的,可以看看snowball


    推荐阅读