OpenAI危险了 _OpenAI

文章插图
出品 | 虎嗅科技组
作者 | 齐健
编辑 | 廖影
头图 | 《复仇者联盟3·无限战争》剧照
8月7日，国内又一家AI创业公司发布了自己的开源且免费可商用的AI大模型：XVERSE-13B 。这家名为元象XVERSE的公司，由前腾讯副总裁、腾讯AI lab创始人姚星创立。
自从Meta在7月发布了开源可免费商用的LLaMA 2系列大模型， AI大模型市场上正在酝酿一波“开源”的新浪潮。
8月2日，百度旗下的AI大模型平台文心千帆，宣布接入LLaMA2全系列开源模型，平台可调用的大模型数量增至33款，除了3款文心模型，其他30款均为开源模型，其中包括ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等。
此后一天，阿里云也宣布加入开源模型行列。开源通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat ，两款模型已上线魔搭社区，开源、免费、可商用。
有趣的是，这种对开源开放的积极态度，正是始于闭源大模型ChatGPT的大东家——微软。7月18日，微软宣布携手Meta发布开源可商用版本的LLaMA 2模型，为企业提供OpenAI和谷歌模型的平替产品。OpenAI在AI大模型市场的垄断地位，似乎正在遭到全行业的“针对” ，甚至是自己最亲密的合作伙伴。
作为全球公认的大语言模型第一名， OpenAI的GPT-4是目前唯一一个有大量用户愿意为其买单的大语言模型。
班里第一名的同学，通常没有参加学习小组的动力。同样， OpenAI也没有什么开源的理由和动力。
然而，随着LLaMA 2的全面开源，越来越多的开发者投入了Meta以及各种开源模型的阵营。就像Android用开源对抗IOS一样，一众开源AI大模型，正在绕过GPT-4的技术壁垒，以开源生态包围OpenAI 。
为什么开源？
OpenAI刚刚推出插件功能的时候，就有很多人把AI大模型比做未来的windows、iOS、Android 。如今，随着LLaMA 2的发布， AI大模型不只是功能，连市场格局也正在朝着操作系统的方向发展。
由UC伯克利主导的组织LMSYS Org发起的，一项针对大语言模型（LLMs）的排位赛；截至7月20日的最新版排名共统计了40款AI大模型，前五名仍是闭源模型（Proprietary），分别是GPT-4、GPT-3.5-turbo和Claude的三款模型。不过，后边的34款模型，除了谷歌的PaLM-Chat-Bison-001 ，均为开源模型，其中15款为不可商用（Non-commercial）。
排名模型? Arena Elo rating（评级）MT-bench （评分）MMLULicense（许可）1GPT-412068.9986.4Proprietary2Claude-111667.977Proprietary3Claude-instant-111387.8573.4Proprietary4Claude-211358.0678.5Proprietary5GPT-3.5-turbo11227.9470Proprietary6Vicuna-33B10967.1259.2Non-commercial7Vicuna-13B10516.5755.8Llama 2 Community8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.09WizardLM-13B-v1.110406.7650Non-commercial10Guanaco-33B10386.5357.6Non-commercial11PaLM-Chat-Bison-00110156.4
Proprietary12Vicuna-7B10066.1749.8Llama 2 Community13Llama-2-13b-chat9876.6553.6Llama 2 Community14Koala-13B9835.3544.7Non-commercial15GPT4All-13B-Snoozy9675.4143x16Llama-2-7b-chat9616.2745.8Llama 2 Community17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.018RWKV-4-Raven-14B9433.9825.6Apache 2.019Alpaca-13B9234.5348.1Non-commercial20OpenAssistant-Pythia-12B9154.3227Apache 2.021ChatGLM-6B9004.536.1Non-commercial22FastChat-T5-3B8923.0447.7Apache 2.023StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.024Dolly-V2-12B8423.2825.7MIT25LLaMA-13B8172.6147Non-commercial26WizardLM-30B
7.0158.7Non-commercial27Vicuna-13B-16k
6.8754.1Llama 2 Community28Llama-2-70b-chat
6.8663Llama 2 Community29Tulu-30B
6.4358.1Non-commercial30Guanaco-65B
6.4162.1Non-commercial31OpenAssistant-LLaMA-30B
6.4156Non-commercial32WizardLM-13B
6.3552.3Non-commercial33Vicuna-7B-16k
6.2248.5Llama 2 Community34Baize-v2-13B
5.7548.9Non-commercial35XGen-7B-8K-Inst
5.5542.1Non-commercial36Nous-Hermes-13B
5.5149.3Non-commercial37MPT-30B-Instruct
5.2247.8CC-BY-SA 3.038Falcon-40B-Instruct
5.1754.7Apache 2.039ChatGLM2-6B
4.9645.5Apache-2.040H2O-Oasst-OpenLLaMA-13B
4.6342.8Apache 2.0
7月20日发布的LMSYS Org大语言模型（LLMs）的排行榜
Chatbot Arena：使用超过 50000 名用户投票来计算 Elo 评级。
MT-Bench：一组具有挑战性的多回合问题。

OpenAI危险了

推荐阅读

湖南可能“合并”的两座城市，合并后长沙地位难保，岳阳恐被超越

北京|北京冬奥会合作伙伴俱乐部主题活动在京举行

什么是量比啊什么是量比指标

王诗晴和程晓玥同框，朋友圈都是有钱人，难怪她要和纪焕博离婚了

长篇|四本值得一看的长篇言情小说，这下再也不用怕书荒了！

白茶保健功效作用,白茶缓解焦虑功效

闲谈易趣我要粉丝|个个退的干净，到现在都没有一位复出，当红时期退圈的四位女星

糖尿病人适合做啥工作

有限公司|海兰信：实际控制人申万秋1140万股质押展期

广东省|广东定了！年底全省禁用！

雷军小米推十周年感恩季活动：爆款手机最高闪降500元

游侠网|ERSB评级泄露《古惑狼4：时机已到》将登陆次世代

罗汉果和枸杞

有的人（男女都有）小便时，声音特别响，急水摩擦冲刷般的哨响，请问这是咋回事

「小赵老师谈养生」血糖高多吃蔬菜？尤其春季多吃这两种菜,能有效稳定血糖的''平衡''

一才说球|但国产最佳后卫，也失去了悬念，狂轰45分6板9助！广厦输了

昆虫记中谁是一种长得很漂亮的蛾什么是一种很漂亮的蛾它们中最大的来自欧洲

朝鲜战争李奇微调走知乎,朝鲜战争李奇微更厉害吗-

IOS系统iOS 14 Beta 6 发布：AirPods Pro 全新空间音频功能现身

电视剧|《暗恋橘生淮南》男主胡一天，高颜值演员班底，颜控粉的春天到了