在没有链轮的情况下,百度是咋通过内容辨别一个站是不是垃圾站的

比如 内容和链接增量的关系 内容增量速度 内容的独特程度 链接增速以及链接质量 模板和其他垃圾站的相似度 如果已经有排名再加上跳出率二次搜索间隔 应该不会存在唯一的,决定判断你是垃圾站的因素,各项因素采用类似记分制的方式来识别 etcsvm是不是只适合识别内容?
■网友
内容重复度、更新频率、关键词密度
■网友
特征识别为主,内容重复度为辅,单靠SVM效果不会很好
■网友
主要还是内容重复度吧
■网友
【在没有链轮的情况下,百度是咋通过内容辨别一个站是不是垃圾站的】 百度以前有一个算法来判断,第一个看是否是镜像网站,一个是内容专业度,第二个是内容与网站标签的符合,如果都是采集过来的,他会发现,很多同质化的内容,这样子,后期就很少来你的网站了,那么你就不会有排名了,

■网友
从用户需求角度来理解,你的网站是否对某些用户产生了需求。

■网友
看看百度一搜出来一堆垃圾站就明白了。百度根本没有处理。跟谷歌高质量的内容一对比,就发现,百度除了受政策保护之外一无是处,可惜了谷歌的技术,之前搜索引擎只用谷歌。。后来只能翻墙搜技术文章
■网友
友联,内容等,新司机路过http://bbs.vrcrl.com,谢谢
■网友
svm分类也可以识别出来。和微博的朋友聊过,微博垃圾帖的识别是使用开源的libsvm


    推荐阅读