怎样做词频统计
时态、单复数、英美拼写、变体等情况可以用 Version 6 of the 12dicts word lists 提供的 2+2+3 lem list (http://wordlist.aspell.net/12dicts-readme/#223lem) 来转换。顺带安利一下我用 Python 写的词频统计脚本:英语文本词频统计 in Python - 魏华的文章 - 专栏
■网友
Antconc,加载一个lemma list(官网有),就可以消除了。
■网友
要不试一试这个软件?
【软件分享】英语试卷统计翻译
1)统计英语文本中单词个数、音标和翻译,并导出文件。
2)支持查看单词在文本中的分布。
3)支持自己添加过滤词。
4)对于英语单词进行词形还原处理。避免went和gone统计程不同的单词。
链接:
https://pan.baidu.com/s/1yQQhLpSvXgBPkcGgl_CiYQ 提取码: k6ei
链接不好用的话 ,私信我即可。
【怎样做词频统计】
■网友
ConGram 据说可以做lemmatization of wordlist
■网友
关于第一个问题,每种语言处理方式不一样,如果是拉丁语系的,可以看看snowball
推荐阅读
- 聪明人养花,这3种“花”怎样也要养一盆,每年能省不少医药费
- 互联网怎样解决“家政服务上门速度慢”的问题
- 怎样看待从1月8号起,QQ钱包开始提现收费
- 银行it人怎样转型
- 创新经营|
- 汽车|冬天怎样让车内温度快速升高?座椅加热的最佳使用方式二,外循环的作用总结
- 怎样进入通信行业
- 怎样评价扶他柠檬茶的小说《云养汉》的结尾
- 怎样成为一名合格的Python程序员?
- 怎样评价华为、诺基亚、中兴中标中国移动高端路由交换设备扩容集采