现在百度右边栏的“相关XX”是深度学习的结果吗
数据挖掘出来的,算不上机器学习。原理来自于大家日常的搜索习惯——我们习惯于把搜索当成一个工具,查找资料的一个工具。于是当我们有问题的时候,就会来搜索查找所需。当我们找到后,就停止搜索了。以目前搜索对于用户需求满足的情况来看,接近8成的搜索是能够找到比较满意的结果的,当找到结果后,就停止搜索了。根据这个原理,用户最后一次的搜索有可能找到最终满意结果的概率非常大,于是我们把大多数人最后搜索的词以及点击结果的内容等进行挖掘聚类,就能够得出来右边这些内容,再通过对一些内容挖掘聚类,比如我们必须要知道小泽武藤空之类一定是一个类的,如果不知道的,就出现了其他人还搜这样标签的内容,里面的分类乱七八糟,大家可以去搜搜看。由于很多搜索第一次就能非常好的满足搜索结果,再进行的下一次搜索就与原来的搜索词不搭边,比如天气,推出过红烧肉等。这个也是这个产品的局限,但是可以通过不断的改进去剔除。最后这些内容也是需要进行非常严格的数据筛选的,比如法律禁止的,色情的内容,比如搜索天安门,原始挖掘出来的内容就有很多98(请把数字换一下)相关内容的东西。包括还有很多刷词作弊的搜索等等,都需要过滤掉。总之这个产品主要还是依靠于数据挖掘。
■网友
这个是推荐算法,其实也勉强属于人工智能吧
■网友
这是知识图谱在搜索引擎中的经典应用
■网友
这个属于知识图谱的应用,从结构化的数据中推荐出来的。可以参见google的knowledge graph,目前很多搜索引擎都有这个应用了。
■网友
深度学习主要是用在结构有深度的东西,比如图像和语音,搜索的query都是短文本,用不着深度学习
■网友
这个感觉像是决策树学习出来的。
■网友
相关性确实厉害,比如我输锤子,连方舟子都能出来。但有些相关内容的配图是怎么回事?
比如:
为什么要用我 MAX!
还有,以前百度《尸兄》的时候,相关人物会出来主角白小飞,但图片用的是黄章的照片!
还有这两位:
让王祖蓝和白客情何以堪。
学习还要努力啊。
【现在百度右边栏的“相关XX”是深度学习的结果吗】 (这个感受由来已久,不吐不快,过会儿删)
推荐阅读
- OC为何跌出语言榜前十
- 坐标合肥,请问在哪里能捕捉到程序员这种生物他们大都出现在哪里呢
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- dart这编程语言现在发展怎么样了,语法与Java,c#很相似,甚至更简洁
- 为啥到现在你还没有女朋友 ?
- 为啥开通了百度云超级会员下载速度还是会那么慢
- 白皮书一般是政府发布的正式报告或文件,那么现在物联网、智慧城市等热门领域这么多企业发布的白皮书算咋回事呢
- 汽车|现在即未来
- 孩子|现在远离还来得及当心!这三种光也会伤害宝宝视力
- 三本的物联网工程有出路吗