文心大模型升级3.5版本,有多强?我们帮你试了试( 三 )


找到大模型落地的正确打开方式
大模型的出现,已经改变了 IT 行业的整个技术栈架构 。在人工智能时代之前,IT 技术栈通常是三层架构:芯片层、操作系统层、应用层 。当人工智能时代来临之后,技术栈变为四层架构:芯片层、框架层、模型层、应用层 。
【文心大模型升级3.5版本,有多强?我们帮你试了试】百度从 2010 年开始全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司 。目前,从芯片层的昆仑芯片、框架层的飞桨深度学习平台、模型层的文心大模型到应用层的搜索、小度、Apollo 等,百度在技术栈的各层都有领先业界的关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率 。
在现场,王海峰还透露了飞桨的一个最新数字 。飞桨迄今已经凝聚 750 万名开发者,这是百度 2023 年以来首次对外披露飞桨生态最新数据 。位于框架层的飞桨是国内首个自主研发的产业级深度学习开源开放平台,并在国内的深度学习平台综合市场份额上连续两年位居第一 。
最新的文心大模型 3.5 同样经历了四层架构的端到端优化,尤其是框架和模型层的协同优化,让训练速度、模型效果加速提升 。
大模型热潮已持续半年,却未有退潮的趋势,但在火热的技术进展和产品迭代之外,我们应该关心的下一步是:如何落地应用 。
正如百度创始人、董事长兼首席执行官李彦宏所言:「新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的 AI 应用,这些个应用在多大程度上提升了生产效率 。」
文心一言的实践,或许能够为行业提供一些可借鉴的经验 。
面向 C 端用户,文心一言 App 的上线与插件机制的引入,能够帮助文心一言打造一个「终端 + 平台+生态」的完整系统,探索 ToC 商业化模式 。
面向 B 端市场,一般的通用大模型往往缺乏具体、专业的场景支持,而文心一言正在积极应用到各种应用场景,比如智能办公、智能会议、智能编程、智能营销、智能媒体、智能教育、智能金融等 。在文心一言之外,百度还拥有 11 个行业大模型,覆盖交通、能源等重点领域 。
例如,百度「如流」已经基于文心一言的能力上线了「智能总结」、「超级助手」等多个新功能,不仅能帮助总结工作沟通要点,实时记录会议内容,形成会议议题、摘要及总结等关键信息,还可以通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等 。
对于编程工作,百度的智能编码助手 Comate 能够根据自然语言的描述,生成对应的代码片段,还支持在代码编辑区内根据注释自动生成代码,提升开发效率:

文心大模型升级3.5版本,有多强?我们帮你试了试

文章插图
当然,今天的大模型产业化其实还面临着很大的挑战,模型体积大、训练难度高、算力数据需求高…… 对于任何一家公司,不管是模型提供方还是模型使用方,这些挑战都是同样存在的且不容忽视的 。
因此,想要在技术突破之后,走出产业化的关键一步,就必须将复杂的事情简单化,同时将落地的成本打下来 。这也是以百度为代表的大模型生产厂商正在探索的道路:封装已有的、复杂的模型生产过程,并开放精调、推理、部署的各项工具,让用户能够「上手即用」 。
在理想的状态下,未来的任何一家企业,都只需要提供业务需求和少量精调数据,就能在短时间内找到合适的模型并完成场景适配 。借此,众多大模型才能真正释放的力量,有效支撑千行百业的应用 。




推荐阅读