优酷的搜索算法(逻辑)是不是有问题

没有才有鬼了。。。
■网友
逻辑应该谈不上有问题,只是排序的算法可能不是那么好搜索排序是非常复杂的,不考虑个性化数据(比如,地理位置,用户喜好之类),一个简单的排序公式可以是 a*文本分数 + b* 质量分数文本分数采用 Okapi BM25, 质量分数对于普通网页来说可以用PageRank对于优酷来说,文本需要匹配多个域,比如title, summary,可以使用BM25的weighted fields 扩展模型, 质量分数可以使用的因子也很多,播放次数,更新时间,视频时间长短等等, 利用这些因子训练一个质量分数的模型。这么简单的打分模型已经有很多参数需要学习了,提高文本的匹配度,需要强大的自然语言处理技术做支撑,提高质量分数模型,需要机器学习领域的经验和能力。这些优酷都很难跟有google搜索背景的youtube 相比国内类似于优酷这种第二梯度企业,不具备做好搜索,尤其是ranking的实力和能力,一般搜索团队也就几个人,搞一套lucene的变种,搭一个比字符串匹配强不了多少的搜索系统....
■网友
谢邀。
【优酷的搜索算法(逻辑)是不是有问题】 我对算法一窍不通,只是一个业余视频字幕爱好者,也不太用优酷的搜索功能。以下回答只是臆测。
无论是优酷和现阶段的youtube,在一定程度上还是依靠上传者自己定义的标签来归类视频的。而让人来定义标签,肯定有不少问题。
例如:我为了扩大自己视频的影响力,有动机用根本与视频内容不相符的标签来吸引眼球。在识别这种虚假标签方面,优酷和youtube都有待提高。
当然肯定用到了自动识别技术,但精准度有待提高。No offense,但优酷并不是技术公司,也许缺乏精准识别的技术,所以搜索出来的东西有时驴唇不对马嘴也就在所难免——当然,youtube也同样存在这样的问题。前不久,youtube就爆出丑闻(YouTube被指变相支持恐怖主义 谷歌遭250余家企业抵制)。
结论是:不是搜索算法有问题,只是技术水平达不到用户预期而已。
顺便说一句:Google推出的Cloud Video Intelligence API,能更精准地识别视频内任何物体。因此,将来上传视频后,很可能无需上传者自己选择或自定义标签,油管就能猜得八九不离十了。这样搜索的精准度就会进一步提高。
最后,我认为:与youtube相比,优酷从来没有采取以上传者为中心的态度。

■网友
国家故意不想要人民搜索出想要的信息,优酷爱奇艺现在都只能搜索20页,并且是竖屏的搜索


    推荐阅读