评估|自媒体文章质量如何AI知道,这是微信的自动评估算法( 三 )
文章图片
作者设计了扰动实验 , 以验证模型是否可以学习到所关注的写作逻辑和布局模式 。 实验中 , 随机打乱所有被正确预测为正样本的文章的句子或布局内容块的顺序 , 并将打乱后的样本视为负样本 , 观察成功扰动的比例 。 扰动率越高 , 说明模型对写作逻辑和布局模式更为敏感 , 对文章质量的评估能力越强 。
从结果来看 , 本文提出的模型显然比所有对比模型对句子打乱的干扰更为敏感 , 这表明 CoQAN 可以更轻松地捕获句子之间的内聚关系 , 并学习内容和写作逻辑的一致性 。 单文本语义子网络(TS)的成功干扰率要高于整体联合网络 CoQAN, 这是因为扰动实验是对正样本进行的 , 而正样本具有良好的文本质量和排版质量 。 因此 , 当仅打乱句子时 , 良好的布局会在一定程度上阻止 CoQAN 将其判断为负样本 。 同时打乱布局顺序和句子顺序时 , 成功干扰的比例远高于单一维度下的干扰 。 这些结果证明了本文提出的 CoQAN 成功地学习到了文本写作和页面布局的知识 。
文章图片
另外 , 作者对特征的交互关系进行了可视化分析 , 发现底部自注意力层可以区分主导特征 , 而顶层则学习更复杂的特征空间交互 , 获得有意义的高阶融合特征 。 图中结果可见 , 占主导的特征有文本长度和图片中的最大字符数 , 高质文章通常具有更丰富的内容和更规则的图片 , 而低质文章通常具有不完整的内容 , 并且经常出现包含很多文本文字的广告图片 。 其他重要特征包括图片中文本区域占比 , 非重复词数 , 标题中的关键词数 , 图片数 , 段落数和词性等 , 表明图片、标题、写作和正文的组织对于自媒体在线文章质量都非常重要 。
文章图片
? THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
_原题为 《自媒体文章质量如何AI知道 , 这是微信的自动评估算法》
【评估|自媒体文章质量如何AI知道,这是微信的自动评估算法】阅读原文
推荐阅读
- |《我的女友是机器人》首曝花絮,辛芷蕾包贝尔搞怪
- 综艺节目|艺人新媒体指数综艺排名,四位明星能进前十,这节目居功至伟!
- 【地评线】安全开学,精细化防控
- 【地评线】京彩好评:改革不停顿开放不止步是最好的纪念
- 【地评线】安全开学,精细化防控|【地评线】安全开学,精细化防控
- 外交部回应安倍晋三宣布辞职:祝愿他早日康复
- 外交部|外交部回应安倍晋三宣布辞职:祝愿他早日康复
- 意大利|意大利:为开学做准备
- 亿吨级油田陆梁油田累产原油突破3000万吨
- 【行走自贸区】一面墙、一个窗口、一张空域图,为何让媒体采访团纷纷驻足?