OpenAI危险了


OpenAI危险了

文章插图
出品 | 虎嗅科技组
作者 | 齐健
编辑 | 廖影
头图 | 《复仇者联盟3·无限战争》剧照
8月7日 , 国内又一家AI创业公司发布了自己的开源且免费可商用的AI大模型:XVERSE-13B 。这家名为元象XVERSE的公司 , 由前腾讯副总裁、腾讯AI lab创始人姚星创立 。
自从Meta在7月发布了开源可免费商用的LLaMA 2系列大模型 , AI大模型市场上正在酝酿一波“开源”的新浪潮 。
8月2日 , 百度旗下的AI大模型平台文心千帆 , 宣布接入LLaMA2全系列开源模型 , 平台可调用的大模型数量增至33款 , 除了3款文心模型 , 其他30款均为开源模型 , 其中包括ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等 。
此后一天 , 阿里云也宣布加入开源模型行列 。开源通义千问70亿参数模型 , 包括通用模型Qwen-7B和对话模型Qwen-7B-Chat , 两款模型已上线魔搭社区 , 开源、免费、可商用 。
有趣的是 , 这种对开源开放的积极态度 , 正是始于闭源大模型ChatGPT的大东家——微软 。7月18日 , 微软宣布携手Meta发布开源可商用版本的LLaMA 2模型 , 为企业提供OpenAI和谷歌模型的平替产品 。OpenAI在AI大模型市场的垄断地位 , 似乎正在遭到全行业的“针对” , 甚至是自己最亲密的合作伙伴 。
作为全球公认的大语言模型第一名 , OpenAI的GPT-4是目前唯一一个有大量用户愿意为其买单的大语言模型 。
班里第一名的同学 , 通常没有参加学习小组的动力 。同样 , OpenAI也没有什么开源的理由和动力 。
然而 , 随着LLaMA 2的全面开源 , 越来越多的开发者投入了Meta以及各种开源模型的阵营 。就像Android用开源对抗IOS一样 , 一众开源AI大模型 , 正在绕过GPT-4的技术壁垒 , 以开源生态包围OpenAI 。
为什么开源?
OpenAI刚刚推出插件功能的时候 , 就有很多人把AI大模型比做未来的windows、iOS、Android 。如今 , 随着LLaMA 2的发布 , AI大模型不只是功能 , 连市场格局也正在朝着操作系统的方向发展 。
由UC伯克利主导的组织LMSYS Org发起的 , 一项针对大语言模型(LLMs)的排位赛;截至7月20日的最新版排名共统计了40款AI大模型 , 前五名仍是闭源模型(Proprietary) , 分别是GPT-4、GPT-3.5-turbo和Claude的三款模型 。不过 , 后边的34款模型 , 除了谷歌的PaLM-Chat-Bison-001 , 均为开源模型 , 其中15款为不可商用(Non-commercial) 。
排名模型? Arena Elo rating(评级)MT-bench (评分)MMLULicense(许可)1GPT-412068.9986.4Proprietary2Claude-111667.977Proprietary3Claude-instant-111387.8573.4Proprietary4Claude-211358.0678.5Proprietary5GPT-3.5-turbo11227.9470Proprietary6Vicuna-33B10967.1259.2Non-commercial7Vicuna-13B10516.5755.8Llama 2 Community8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.09WizardLM-13B-v1.110406.7650Non-commercial10Guanaco-33B10386.5357.6Non-commercial11PaLM-Chat-Bison-00110156.4
Proprietary12Vicuna-7B10066.1749.8Llama 2 Community13Llama-2-13b-chat9876.6553.6Llama 2 Community14Koala-13B9835.3544.7Non-commercial15GPT4All-13B-Snoozy9675.4143x16Llama-2-7b-chat9616.2745.8Llama 2 Community17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.018RWKV-4-Raven-14B9433.9825.6Apache 2.019Alpaca-13B9234.5348.1Non-commercial20OpenAssistant-Pythia-12B9154.3227Apache 2.021ChatGLM-6B9004.536.1Non-commercial22FastChat-T5-3B8923.0447.7Apache 2.023StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.024Dolly-V2-12B8423.2825.7MIT25LLaMA-13B8172.6147Non-commercial26WizardLM-30B
7.0158.7Non-commercial27Vicuna-13B-16k
6.8754.1Llama 2 Community28Llama-2-70b-chat
6.8663Llama 2 Community29Tulu-30B
6.4358.1Non-commercial30Guanaco-65B
6.4162.1Non-commercial31OpenAssistant-LLaMA-30B
6.4156Non-commercial32WizardLM-13B
6.3552.3Non-commercial33Vicuna-7B-16k
6.2248.5Llama 2 Community34Baize-v2-13B
5.7548.9Non-commercial35XGen-7B-8K-Inst
5.5542.1Non-commercial36Nous-Hermes-13B
5.5149.3Non-commercial37MPT-30B-Instruct
5.2247.8CC-BY-SA 3.038Falcon-40B-Instruct
5.1754.7Apache 2.039ChatGLM2-6B
4.9645.5Apache-2.040H2O-Oasst-OpenLLaMA-13B
4.6342.8Apache 2.0
7月20日发布的LMSYS Org大语言模型(LLMs)的排行榜
Chatbot Arena:使用超过 50000 名用户投票来计算 Elo 评级 。
MT-Bench:一组具有挑战性的多回合问题 。


推荐阅读