评估|自媒体文章质量如何AI知道，这是微信的自动评估算法( 三 ) 文章|自动|质量|

文章图片

作者设计了扰动实验，以验证模型是否可以学习到所关注的写作逻辑和布局模式。实验中，随机打乱所有被正确预测为正样本的文章的句子或布局内容块的顺序，并将打乱后的样本视为负样本，观察成功扰动的比例。扰动率越高，说明模型对写作逻辑和布局模式更为敏感，对文章质量的评估能力越强。
从结果来看，本文提出的模型显然比所有对比模型对句子打乱的干扰更为敏感，这表明 CoQAN 可以更轻松地捕获句子之间的内聚关系，并学习内容和写作逻辑的一致性。单文本语义子网络（TS）的成功干扰率要高于整体联合网络 CoQAN，这是因为扰动实验是对正样本进行的，而正样本具有良好的文本质量和排版质量。因此，当仅打乱句子时，良好的布局会在一定程度上阻止 CoQAN 将其判断为负样本。同时打乱布局顺序和句子顺序时，成功干扰的比例远高于单一维度下的干扰。这些结果证明了本文提出的 CoQAN 成功地学习到了文本写作和页面布局的知识。

文章图片

另外，作者对特征的交互关系进行了可视化分析，发现底部自注意力层可以区分主导特征，而顶层则学习更复杂的特征空间交互，获得有意义的高阶融合特征。图中结果可见，占主导的特征有文本长度和图片中的最大字符数，高质文章通常具有更丰富的内容和更规则的图片，而低质文章通常具有不完整的内容，并且经常出现包含很多文本文字的广告图片。其他重要特征包括图片中文本区域占比，非重复词数，标题中的关键词数，图片数，段落数和词性等，表明图片、标题、写作和正文的组织对于自媒体在线文章质量都非常重要。

文章图片

? THE END
转载请联系本公众号获得授权
投稿或寻求报道：content@jiqizhixin.com
_原题为 《自媒体文章质量如何AI知道，这是微信的自动评估算法》
【评估|自媒体文章质量如何AI知道，这是微信的自动评估算法】阅读原文

评估|自媒体文章质量如何AI知道，这是微信的自动评估算法( 三 )

推荐阅读

「菡户寻云」不联网就能保住数据安全？黑客利用风扇就能窃取

养生董医师|可远离高血压和糖尿病，前两点容易，第三点却很难，3个饮食习惯

原汁鲍鱼

苹果|标准版成丐中丐！iPhone 14系列配置图出炉：低配依然60Hz刘海屏、无缘A16

长盈精密上半年净利润2.29亿元，同比增长91.1%

别人说老牛吃嫩草,我应该怎么回答,别人说自己老牛吃嫩草怎么回复-

「国际金融报」瑞幸咖啡股价暴跌超70%！两岁即上市神话要凉，自曝伪造交易22亿

意义|华德福冬至庆典“深冬花园”的意义

小号撩车|10.88万起全系三缸发动机，新款福克斯上市

松茸怎样冷冻保存视频松茸怎样冷冻保存

比亚迪汉|听了同事的建议，花27万提辆比亚迪汉EV，车主：我想说句良心话！

花甲怎么开壳

炒新|最赚钱新股双双开板：一签20万，算不算牛过中芯国际？业内：科创板炒新逻辑有别

Lombok入门使用教程及其优缺点详解

詹姆斯|西强东弱？湖人是第一！詹姆斯回应MVP之争，美媒：灭霸詹将上线

阵容|云顶之弈10.16新版最强上分阵容推荐重秘宇航狙阵容攻略详解

|洗米华与Mandy复合引热议：他知道愧对妻子，并曝出自己很无奈

小纪谈育儿|但准妈妈也不要盲目跟风，容易吃亏，顺产虽好

艺术品|1956年的5分硬币，收藏价值怎么样？

邀请丁真看海？湖南卫视元旦又在“搞事情啦”