国产大模型:创新为道 落地为王

未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合 。这不仅需要具备坚实的技术基?。?也需要大模型产品具有坚实的基于场景的应用 。未来,从实践中来 , 到实践中去的“实用级”大模型将成为趋势 。
◎实习采访人员 罗云鹏
快速准确地提炼各方观点并输出会议纪要、辅助医生进行医疗影像诊断、在自动驾驶中进行路线决策……当前,大模型技术正惠及各行各业 。
过去一周,国内有关大模型的话题热度持续攀升 。9月7日,腾讯混元大模型正式对外亮相,至此国内已有超过130个大模型 。一个个大模型的背后 , 都离不开自主创新 。
上半?。嚎?寡蟹?ldquo;马拉松”Token,大语言模型中最小的文本单位 。腾讯混元大模型的这个文本单位已跃升至超2万亿 。
“腾讯混元大模型从零开始训练,掌握了从模型算法、机器学习框架 , 到人工智能基础设施的全链路自研技术 。”腾讯集团副总裁蒋杰说,“从2021年开始,腾讯不断加大对技术研发的投入,这是不断积累的过程 。”
大模型的研发无疑是一场“马拉松” 。复旦大学中国研究院副研究员刘典认为,人工智能的发展不是一蹴而就的,要继续加强投入,坚持自主研发、自立自强,做好在人工智能领域“打持久战”的准备 。
一项来自腾讯内部的数据显示,从2021年开始 , 该集团先后推出了多个千亿和万亿参数的大模型,并在实际应用中不断优化大模型底层算法开发,提升工程能力 。从2018年起 , 腾讯累计投入研发经费超过2300亿元,在全球获得专利授权3.3万件,申请专利总数超过6.6万件 。
不仅是互联网头部企业,我国的“国家队”也在大模型研发上不断发力 。
从2019年开始,中国科学院自动化研究所就多模态大模型领域开始攻关,通过对海量数据弱关联图文音数据的跨模态自监督学习,于2021年9月正式发布了千亿参数多模态大模型“紫东太初” 。“从算法到硬件、算力,‘紫东太初’都是‘中国造’ 。”中国科学院自动化研究所紫东太初大模型研究中心常务副主任王金桥此前在接受媒体采访时说,“在国产软硬件的支撑下,我们的大模型一样能跑得很好、很快 。”
2023年6月,科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》 。该报告显示,从全球已发布的大模型数量来看 , 中国和美国大幅领先,超过全球总数的80% 。
中国信息协会常务理事、国研新经济研究院创始院长朱克力认为,当前国家对民营经济高度重视,作为我国数字科技公司多年来重视科技创新的阶段成果,大模型构成了我国加快实现高水平科技自立自强的重要力量 。
百度创始人、董事长兼首席执行官李彦宏在参加2023世界互联网大会时也表示,更创新、更领先的国产大模型,可以为解决全球医疗卫生、气候变化、经济增长等重大挑战提出“中国方案” 。
下半?。壕劢狗?袂?邪僖?/h3>【国产大模型:创新为道 落地为王】采访人员梳理发现,时下 , 在大模型应用领域,阿里达摩院的“通义千问”、商汤科技的“商量”、中国科学院的“紫东太初”、抖音的“云雀”等均已在不同行业和领域落地应用 。
“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力 , 也为解决产业痛点带来了全新思路 。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,大模型需要基于产业场景,与企业数据融合才能释放出最大价值 。
在9月5日举行的2023百度云智大会上,李彦宏曾公开表示 , 模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义 。
上海财经大学校长刘元春认为 , 中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,并且已经在数字技术和应用上取得了巨大成就,为中国的大模型提供了更深入、更丰富的落地场景以及能够“持续训练、终身学习”的环境 。
据腾讯数据,目前腾讯已和1.1万家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业 。而据百度数据,已有500多家生态伙伴通过百度智能云千帆大模型平台使用各类大模型服务,千帆大模型平台月活企业数超过1万家 。


推荐阅读