实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?


实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
文 | 新浪财经 周文猛
半个月前,360创始人周鸿祎向外界展示了360人工智能进展,并希望网友为其命名 。直播间中,呼声最高的名为“红孩儿” 。如今,周鸿祎的“红孩儿”360智脑宣布内测 。
作为首批获邀参与内测的企业,新浪财经体验了“360智脑”内测版本,并将其与文心一言、通义千问及微软new bing等进行了对比 。
那么,作为国内第三款推出并且已植入浏览器的“类ChatGPT”产品,“360智脑”能力如何?在这背后,360凭什么成为最早一批推出的企业?
实测“淄博烧烤”:热点事件时效性强
对于热点事件的回答质量以及速度,是检验一款AI问答产品对于网络内容即时获取能力的关键 。
近日,淄博烧烤意外忽然在网络走俏,并且吸引全国各地年轻人、旅游者前往打卡体验 。当被问到“淄博烧烤近期为什么忽然火热了”时,“360智脑”给出的答案是:
“原因可能有多种 。首先可能是因疫情期间人们对于户外餐饮的需求增加,淄博作为旅游城市吸引更多的游客前来品尝美食 。其次可能是由一些社交媒体上的网红的推荐,让更多的人知道了淄博的烤串文化并慕名而来 。此外,淄博市政府出台了相关政策鼓励市民在夜间到店消费,也增加了夜市经济的活力也为淄博烧烤的热度 。”
实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
从回答的内容角度来看,比较贴合当下“淄博烧烤忽然走红”的理由 。此外,“360智脑”在给出答案的同时,还会给出援引来源,供用户溯源确认 。
【实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?】相比而言,文心一言和通义千问在回答问题时,虽然也给出了贴合当下季节和网络传播特性的结论性描述,但多少有一些大而全的套话嫌疑,而且少了援引来源的标注,读者若想深究或求证,就会略显不便 。
实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
(文心一言)
实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
(通义千问)
此外,在回答诸如“小米13 Ultra发布时间”等问题时,360智脑给出的答复,也非常具有时效性,同时还给出了关于该款手机的更多基本介绍 。
实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
相较而言,文心一言给出的答案同样具有时效性,为“2023 年4月18日19:00”,但未做过多展开;通义千问只给出的答案则为,“将于2023年上半年发布 。”
虽然,在连续多次的饱和式提问后,360智脑给出的一些问题也会存在准确性偏差 。但新浪科技实测发现,由于已经与360搜索进行绑定,“360智脑”在信息的即时性上,有着更为不错的表现 。
而且,在进行知识类问答时,除了抓取网页之外还会调用360问答以及360文库内容进行回答,充分发挥了360搜索生态内的各平台优势,有着不错的交互体验 。
此外,由于提问后能够直接将搜索结果提前提取并呈现给读者,这种摘要式的问题产出模式,大幅度地提升了内容检索的效率,在一定程度上推动了搜索产品的代际变革 。
知识问题之外,通过“360智脑”写提纲或者推荐行程安排时,它也能快速地给出了一个具体且有一定参考价值的计划 。
实测周鸿祎“红孩子”,卷向GPT市场的360,能力几何?

文章插图
在民生证券参与内测给出的报告中,通过将360智脑与微软New Bing进行对比测试后,民生证券也指出,“在涉及逻辑陷阱、知识类、任务完成类、时效性、运算、推理、编程等多维度,大部分问题基本比肩微软new bing 。”
最先与搜索结合,如何做到“真智能”?
作为国内第三家推出的基于GPT大语言模型对话产品,“360智脑”同时也是最先落地到搜索应用产品中的 。
就在上个月底,周鸿祎在展示自家新的大语言模型产品时,还因为现场测试的“梅西在阿根廷国家队进了多少个球”这样的问题,为难了一把自家的GPT产品 。如今,短短不到一月后,360智脑便迅速地开启了企业内测,如此迅速地与搜索应用结合,360有何底气呢?
首先,还得回归到360在搜索业务之上的能力 。据统计网站statcounter发布数据,截至2022年5月份,中国桌面浏览器市占率前四名分别是谷歌浏览器(Chrome)、360浏览器、微软浏览器以及QQ浏览器 。其中,360浏览器的市场份额为23.17% 。


推荐阅读