AI“源神”启动!影响多大?( 二 )


而开源方面,除了Llama系列,目前应用较广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly , 以及MosaicML的MPT等 。国内则包括 , 阿里巴巴的通义千问,智谱的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等 。
形成这样的分化,很多时候是受技术进步和商业模式迭代等的多重影响 。
天使投资人、资深人工智能专家郭涛认为,从技术角度来看,开源可以促进学术界的研究和创新,而闭源则有助于在一定时间内保持技术领先优势 。
从商业角度来看,开源可以吸引开发者社区的贡献,促进技术的快速迭代和应用的广泛传播,但可能会影响到公司的盈利模式 。闭源则可以保护知识产权 , 为公司创造直接的收入来源,但可能会限制技术的普及和生态的建设 。
事实上,在Llama3发布之前,中文互联网刚刚经历了一轮开闭源论战 。
据媒体报道 , 百度CEO李彦宏近日表态,认为大模型开源意义不大,闭源模型性能会不断提升 。“有了文心大模型4.0,我们可以根据需要兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,且支持精调和post pretrain 。通过降维裁剪出的模型,比直接拿开源调出来的模型,同等尺寸下效果更好 , 同等效果下成本明显更低 。”
李彦宏一直是闭源路线的忠实拥趸,理由包括但不限于认可闭源商业模式可以更好地聚集人力和财力等 。
而其反对者——360创始人周鸿祎言简意赅,“一句话,今天没有开源就没有 linux , 没有 Linux 就没有互联网 。”
“源神”启动,影响几何?
“Llama 3的发布会带来市场格局的改变 。”郭涛在接受21采访人员采访时指出,其优异表现可能吸引更多的用户和投资者,从而增加其市场份额 。
官网显示 , Llama 3将有条件地开源给商业使用(月活用户超过7亿需要单独申请) 。“不过这基本等于完全免费商用了 。”卡兹克表示 。
此前,投资人朱啸虎曾经就人工智能市场相关话题接受腾讯新闻采访 。当被问及2023年大模型发展的关键节点时,他给出的回答正是Llama上线 。这让中国在应用层面创新有了基础,降低了商业化门槛 。
当然 , 朱啸虎提到的变现是指开源生态内的用户 。对于开源大模型发布者的能否盈利,或者能等来盈利机会,很多时候并没有确定的答案 。
闭源大模型通常通过授权使用、订阅服务或者直接销售产品来盈利 。其中的代表便是AI领域的领跑者OpenAI,虽然其一直有推进开源项目的动作,但其处在核心地位的ChatGPT却一直采取收取API许可费的方式向其他公司提供服务 。在API服务过程,其他公司不会接触到ChatGPT模型的细节和源代码,仅仅通过API接口进行调用 。
创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示 , ChatGPT以70%的应用率成为美国小型企业应用最多的生成式AI产品,这说明OpenAI选择的闭源模式的商业化之路在一定程度已经跑通 。
开源模型如何寻求生存和发展的机会?
首先是以开放的生态吸引用户 。国盛证券研报就指出,开源大模型借助更大标识符训练数据集、DeepSpeed、RLHF等方式,实现低训练成本和高性能,超大模型以下大模型的壁垒正在消失 。
“在拥有用户后 , 开源大模型通常通过提供增值服务、定制开发、技术支持等方式来实现盈利” 。郭涛指出,公司可以在开源模型的基础上提供专业的训练服务或者定制化的应用解决方案 。
对于Meta甚至众多开源者而言,开源的野心不仅是短期的商业变现,其更想引领规则设计以及搭建生态 。 有业内专家分析,开源后壁垒并没有那么容易破除 , 高质量、标注过的训练数据集尤其是专业模型的壁垒 。
星纪魅族集团数据合规执行总监朱玲凤表示,目前有些开源AI由头部公司主导,“越多人使用 , 就越能强化网格效应,而且不是真正的开放 , 后续需要使用它们的配套工具、配套服务 。头部公司还可能利用监管豁免的方式,获得寻租空间 。”换言之,以开源为噱头的巨头游戏,可能会进一步强化大公司的垄断地位,反而不利于产业竞争 。
据报道,去年4月,在扎克伯格与分析师的一次电话会议中,他就谈到,如果行业能够在Meta使用的基础工具上达成标准化,那么meta就能从其他人的改进中受益 。同年5月,谷歌内部泄露的文件《我们没有护城河,OpenAI也没有》在SemiAnalysis网站上传播,其中的观点包括 , 比起开源社区需要谷歌,谷歌更需要开源社区等等 。文章作者指出,不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手 , 与开源AI竞争的结果必然是失败 。


推荐阅读