文章插图
来源 :价值研究所
进入5月,国产大模型的风口非但没有熄火,反倒越烧越旺 。过去一个星期,就有多家企业发布AI大模型相关产品:
5月5日,网易有道发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品布局;5月6日,科大讯飞发布认知大模型“讯飞星火”,董事长刘庆峰表示有信心超越ChatGPT;同日,淘云科技发布“国内首个”儿童认知大模型“阿尔法蛋”……
在上述公司之外,还有很多企业宣布进军大模型,类ChatGPT产品正在密锣紧鼓研发中,预计不久便会正式上线 。企业的热情毋庸置疑,AI大模型似乎已经不是一条选择题,而是必做题 。
文章插图
然而,狂热背后不乏担忧 。大模型技术应用范围虽广,目前落地的场景毕竟有限 。而这群入局大模型的企业,分别来自游戏、教育、动漫等诸多行业,和大模型的应用场景离得很远 。
当国产大模型变得泛滥,我们该如何分辨优劣?
没技术不要紧
有公司靠“外援”捣鼓大模型
要评判一个大模型的优劣,首先看技术,其中最核心的是算法和算力,即训练参数量 。因为参数量越大,系统的知识面就会越广,表现也会越稳定 。资料显示,openAI在2020年推出的ChatGPT-3参数量已经达到1750亿,谷歌在一年后发布的PaLM则达到5400亿,更不用说最新的ChatGPT-4了 。
参照此技术标准,我们可以精准识别一批蹭热点的企业:它们要么确实拿出了产品,但参数量和ChatGPT等有较大差距,功能也较单一;更有甚者,套用别家公司的硬件、数据库来预训练参数,本身缺乏核心技术 。
当中的代表,有昆仑万维 。
4月10日,昆仑万维宣布联合奇点智源研发“天工3.5”国产大语言模型 。根据发布会上的介绍,“天工3.5”定位为“中国第一个真正实现智能涌现”的大模型产品,具备智能问答、聊天互动、文本生成等多种应用功能以及丰富的科学、技术、文化、艺术和历史知识储备 。
根据官方资料,昆仑万维最早在2020年布局AIGC业务,投入数亿元组建研发团队 。去年12月,“昆仑天工”首次亮相,初代产品提供图像、音乐、文本及代码AI生成功能 。作为对比,大模型领头羊 openAI在2019年发布ChatGPT-1,每一代产品的研发周期都在一年左右 。
乍一看,昆仑万维的“天工3.5”功能全面对标ChatGPT,比起百度“文心一言”、阿里“通义千问”等国产大模型毫不逊色 。在研发速度上,昆仑万维也领先于大多数国内同行 。不过昆仑万维的缺点也很突出——“天工3.5”是和阿里云合作的产物,后者的参数、硬件设备帮了昆仑万维很大忙 。
事实上,昆仑万维一直抱紧阿里云的大腿 。资料显示,过去几年昆仑万维的海外数据基本都在使用阿里云公有云储存服务,2020年布局AIGC时也是在阿里云的协助下建立算力集群 。在“天工3.5”发布后,还有媒体爆出昆仑万维缺乏文本生成、数据处理专利的消息,和百度、阿里形成鲜明对比 。
同样遭遇技术质疑的,还有“AI四小龙”之一的商汤科技 。
商汤科技在4月10日发布了自研大模型系统“日日新SenseNova”,内含AI数字人视频生成平台“如影”,3D内容生成平台“琼宇”和“格物”,类ChatGPT产品“SenseChat”等产品 。别人都是发布单个产品,商汤科技一次过拿出一套“全家桶”,可见其野心之大 。
然而,商汤的大模型全家桶在发布那天就有翻车迹象 。演示视频公布后,就有媒体和网友发现商汤“妙画”生成的图片和AI网站Civitai的图片撞车,甚至还有来自Civitai的文字注释 。SenseChat则在一些基础问题上表达含糊不清,其训练参数量也遭到质疑 。
在价值研究所(ID:jiazhiyanjiusuo)看来,缺乏数据源,是昆仑万维和商汤科技共同的命门 。
“文心一言”背后有百度的海量搜索数据和语料库,阿里的“通义千问”则有来自电商、云计算等领域的语料库,流量大、用户覆盖面广,能提供足够的参数 。缺乏面向C端用户的通用产品、没有参数积累,强行上马大模型,昆仑万维和商汤科技的尴尬处境完全可以预料 。
没应用场景又如何?
这些企业硬要和AI攀关系
推荐阅读
- MathGPT来了!专攻数学大模型,解题讲题两手抓
- 大模型“群雄逐鹿”,科大讯飞何以脱颖而出?
- 除了推出大模型,AI发展还应做什么
- 对话签名支持暂停巨型AI研发的科学家:我更担心中国有太多大模型
- AI十年浮沉,与改变命运的大模型
- 大模型商业化开荒 微软走到哪里了
- 大模型111人:谷歌和OpenAI的人才战争
- 胡泳:对于AI大模型,我们真正应该担心什么?
- |张含韵发福体重130斤,新电影宣传站角落,谁在引领白幼瘦审美?
- 玛丽莲·梦露|微博之夜刘亦菲杨幂到底谁在搞事一目了然!