文心大模型升级3.5版本,有多强?我们帮你试了试

作者:蛋酱
三个多月前,机器之心向刚刚诞生的文心一言提过一个问题:
「设有三个房间,每个房间都有?个开关,其中?个控制着同?楼层的?个电灯 。你现在在开关所在的楼层,不能看到电灯所在的楼层 。你只能上楼?次,然后必须确定哪个开关对应哪个电灯 。请问如何推理以确定正确的开关?」
对于大部分人,这道逻辑推理题确实有点绕,对于当时的文心一言来说亦有难度 。从结果中,我们可以看出文心一言进行了分析,有思维链,但忽略了「只能上楼一次」这个条件,所以最后给出的结果并不是完全正确的:

文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
但今天,站在你面前的,是基于「文心大模型 3.5」的文心一言 。
面对同一个问题,现在它的回答是这样的:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
从三月中旬推出到现在,文心一言始终在悄悄努力变优秀 。这种变化的背后,是文心大模型的不断进化、迭代 。
上个月,百度文心大模型正式从 3.0 升级到 3.5,不仅实现了创作、问答、推理和代码能力上全面升级,安全性显著提升,训练和推理速度也大幅提升 。
在今天开幕的世界人工智能大会上,作为国产大模型的代表之作,文心大模型 3.5 毫不意外地吸引了众人的目光 。
WAIC 产业全体论坛上,百度首席技术官王海峰带来了文心大模型 3.5 的深入解读 。
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
现场,王海峰展示了一组数据:通过各项算法和数据的优化,相比于 3.0 版本,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍 。
对文心一言的所有个人及企业用户乃至全行业来说,这意味着一个新的阶段 。
最新版文心一言,做了哪些改变?
作为百度自主研发的大模型体系,文心大模型的诞生要追溯到 2019 年 3 月,发展到现在文心的基础模型涵盖了 NLP、视觉、跨模态等多个领域,每个领域涵盖不同的能力模型,比如对话模型、代码生成模型、文图生成模型等 。
到了 2021 年,文心 3.0 已是百亿级别的大模型 。演变至今,文心大模型已从最初的自然语言理解大模型,发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台 。
在文心大模型 3.5 加持的文心一言中,问答、推理、代码、文生图等能力都向前迈了一步 。这些变化,文心一言的用户们在对话过程中也能体会到 。这里,我们通过几个例子感受一下:
「疯狂星期四是什么?」「为什么很多人都在说 V 我 50?」如果一位 2g 冲浪的网友抱有这个疑惑,去问 3.0 版本加持的文心一言,得到的回答可能是这样的:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
而现在,3.5 版本加持的文心一言不仅能够给出正确答案,还能进一步解释「疯狂星期四」的名词来源、活动背景等信息,甚至还能指导你参与活动 。而且对于「V 我 50」这个流行语,文心一言 3.5 还能找到最早的出处 。
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
再试试代码能力 。下面是「生成一个斐波那契数列」的对比:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
最新生成的结果,额外解释了斐波那契数列的概念,并给出了简洁的 Python/ target=_blank class=infotextkey>Python 代码:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
同样的领悟能力提升还体现在「文生图」上,下面这张是机器之心在三月份的测试结果,从风格上说更偏 CG 绘画:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
而最新生成的结果更加符合人们熟悉的二次元风格了:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
此外,在最新版本的文心一言中,用户感受到的一大变化是引入了插件机制,目前提供了两个选项:
文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
第一个是默认内置插件「百度搜索」,使得文心一言具备生成实时准确信息的能力 。
我们知道,如果不接入互联网,对话式 AI 所提供的信息通常会受到训练数据输入时间的限制 。但现在,你能问它许多「新鲜热乎」的问题了 。
比如,向文心一言提问:「最近的热门电视剧有哪些?」


推荐阅读