作 者丨冯恋阁 王俊 实习生孔雅萱
编 辑丨王俊
开源还是闭源?这是属于大模型的时代之问 。
今年年初,埃隆·马斯克在对AI target=_blank class=infotextkey>OpenAI及其CEO萨姆·奥特曼提起诉讼时,就对OpenAI逐渐不公开其模型研究相关细节的行为大加谴责 。“时至今日 , OpenAI公司网站还宣称,它的宗旨是确保通用人工智能造福全人类 。然而,在现实中,OpenAI已经转变为科技巨头微软事实上的闭源子公司 。”这位曾经的OpenAI联合创始人如此表示 。
OpenAI不够“Open” , META却“Open”了自己最新的开源人工智能模型 。
4月18日,Meta 发布了其最新版本的开源大模型 Llama 3,引起开源AI社区的一阵欢呼 。巧合的是 , Llama 3发布当天正好是AI领域顶尖学者、AI开源倡导者吴恩达的生日 。“(Llama 3是)至今为止最好的礼物,谢感谢Meta!”他说 。
行至2024,开闭源之争日渐白热化 。闭源阵营以目前最强的OpenAI为代表 , 开源阵营Meta的LLaMa、Mistral和google等也在不断迭代 。闭源阵营坚持对Scaling Law的信仰,押注在更强通用模型的打造上;开源阵营模型能力不断提升 , 并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地 。
关于应该选择模型开源还是闭源讨论经久不息 。
对于局内人 , 这一选择这不仅决定了他们将如何点亮AI“科技树”,更将影响他们的商业路线选择 。换言之,这很有可能是这个残酷竞争市场下的生存问题 。
两个版本,多重惊喜
Meta此次发布的Llame 3包括8B和70B的预训练和指令微调版本 。
据Meta官网信息,Llama 3 模型将数据和规模提升到新的高度 。它在两个定制24K GPU集群上基于超过 15T 的数据进行了训练——训练数据集是Llame 2使用量的7倍有余 。它支持 8K 上下文长度,是 Llama 2 容量的两倍 。
除了 Llama 3,Meta 还发布了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2 。
据悉 , Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平台上线,Llama还得到AMD、AWS、戴尔、英特尔、Nvidia和高通提供的硬件平台的支持 。
在官网上 , Meta还放出了Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数对比 。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM—8K(数学能力)、MATH(比较难的数学问题)5个评测集上均表现良好 。
文章插图
值得注意的是,Llama3的代码能力非常优秀 。在AI领域公众号“数字生命卡兹克”主理人卡兹克分享的用户实测中,Llama3—8B能够给出国际象棋中经典皇后问题的解题代码 。而其前代版本Llama2需要专门的代码模型才能实现 。
【AI“源神”启动!影响多大?】市场的反应速度很快 。18日当天,Meta股价逆势收涨1.54% 。次日,百度智能云千帆大模型平台开放邀约测试,提供针对Llama 3的训练推理方案,帮助开发者训练专属大模型 。
8B和70B 两个型号的模型,仅仅标志着 Llama 3 系列的开端,Meta AI首席科学家杨立昆在其社交媒体透露 , 在接下来的几个月 , 还会有更多版本陆续发布 。
英伟达高级科学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版本将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型 。
不下牌桌,各显神通
上一轮元宇宙竞争中被认为可能跌进坑里的Meta , 在人工智能的牌桌上打出了Llama系列这把好牌 。要讨论Llama3带来的行业震荡 , 首先要明白,什么是大模型领域的开源?
大模型领域的开源通常意味着模型的架构、训练代码和预训练权重等都被公开,允许研究人员和开发者自由地访问和使用 。
不过,开源的程度因模型而异 。“有些可能只提供有限的访问权限或部分代码 。”郭涛指出,判断大模型是否真正开源的基准可能包括:代码和数据的可访问性、使用许可的宽松程度、社区支持的活跃度以及对改进和新应用的开放性 。
放眼AI界,两条路径上都各有“头号玩家”分布 。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是百度的文心一言以及风头正劲的月之暗面Kimi 。
推荐阅读
- AI“入职”综艺,有多少导演会丢饭碗?
- 49岁陈紫函“紫色深V人鱼姬”,越熟越性感,珠圆玉润太美了
- 对于想来大陆捞钱的“台独”艺人,我们可以一剑封喉!
- 白百何红毯新高度,若隐若现成新宠?网友直呼:小心“尺度”过大
- 葛斯齐再爆料,指有男星试菜后“一起上厕所”,称其比黄子佼可恶
- 买林俊杰“付完款变潘玮柏”!平台爆大型跳票,粉丝抗议损失10万
- 花少有自己的“食物链”
- 华晨宇注定被载入“史册”,凌晨3点开演唱会,或带动百亿GDP!
- “后悔带妈妈去看凤凰传奇演唱会”,扫兴式的家教,终会不欢而散
- 《浪姐5》让女星“原形毕露”:有的口是心非,有的只顾自己