评估|自媒体文章质量如何AI知道,这是微信的自动评估算法( 三 )


评估|自媒体文章质量如何AI知道,这是微信的自动评估算法
文章图片

作者设计了扰动实验 , 以验证模型是否可以学习到所关注的写作逻辑和布局模式 。 实验中 , 随机打乱所有被正确预测为正样本的文章的句子或布局内容块的顺序 , 并将打乱后的样本视为负样本 , 观察成功扰动的比例 。 扰动率越高 , 说明模型对写作逻辑和布局模式更为敏感 , 对文章质量的评估能力越强 。
从结果来看 , 本文提出的模型显然比所有对比模型对句子打乱的干扰更为敏感 , 这表明 CoQAN 可以更轻松地捕获句子之间的内聚关系 , 并学习内容和写作逻辑的一致性 。 单文本语义子网络(TS)的成功干扰率要高于整体联合网络 CoQAN, 这是因为扰动实验是对正样本进行的 , 而正样本具有良好的文本质量和排版质量 。 因此 , 当仅打乱句子时 , 良好的布局会在一定程度上阻止 CoQAN 将其判断为负样本 。 同时打乱布局顺序和句子顺序时 , 成功干扰的比例远高于单一维度下的干扰 。 这些结果证明了本文提出的 CoQAN 成功地学习到了文本写作和页面布局的知识 。
评估|自媒体文章质量如何AI知道,这是微信的自动评估算法
文章图片

另外 , 作者对特征的交互关系进行了可视化分析 , 发现底部自注意力层可以区分主导特征 , 而顶层则学习更复杂的特征空间交互 , 获得有意义的高阶融合特征 。 图中结果可见 , 占主导的特征有文本长度和图片中的最大字符数 , 高质文章通常具有更丰富的内容和更规则的图片 , 而低质文章通常具有不完整的内容 , 并且经常出现包含很多文本文字的广告图片 。 其他重要特征包括图片中文本区域占比 , 非重复词数 , 标题中的关键词数 , 图片数 , 段落数和词性等 , 表明图片、标题、写作和正文的组织对于自媒体在线文章质量都非常重要 。
评估|自媒体文章质量如何AI知道,这是微信的自动评估算法
文章图片

? THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
_原题为 《自媒体文章质量如何AI知道 , 这是微信的自动评估算法》
【评估|自媒体文章质量如何AI知道,这是微信的自动评估算法】阅读原文


推荐阅读