数据不平衡问题( 五 )
?同义词替换(Synonym Replacement, SR):从句子中随机选取n个不属于停用词集的单词 , 并随机选择其同义词替换它们;
?随机插入(Random Insertion, RI):随机的找出句中某个不属于停用词集的词 , 并求出其随机的同义词 , 将该同义词插入句子的一个随机位置 。 重复n次;
?随机交换(Random Swap, RS):随机的选择句中两个单词并交换它们的位置 。 重复n次;
?随机删除(Random Deletion, RD):以 p的概率 , 随机的移除句中的每个单词;
推荐阅读
- 西部数据在CES 2021推出多款4TB容量的旗舰级SSD
- WhatsApp收集用户数据新政惹众怒,“删除WhatsApp”在土耳其上热搜
- 一则消息传来,苹果iPhone12再现问题,“果粉”有点慌
- 与荷兰光刻机完成联机!国产芯片设备传来喜讯:技术问题已经解决
- 未来想进入AI领域,该学习Python还是Java大数据开发
- 国产芯再传好消息,关键技术问题已经解决,与荷兰光刻机联机成功
- 黑客窃取250万个人数据 意大利运营商提醒用户尽快更换SIM卡
- 小米11屏幕翻车发绿怎么回事 屏幕问题检测方法介绍
- 装机点不亮 如何简易排查硬件问题?
- 消费者报告 | 美团充电宝电量不足也扣费,是质量问题还是系统缺陷?