每经编辑:杜宇
当地时间4月18日,AI 领域迎来重磅消息 , Meta正式发布了人们等待已久的开源大模型Llama 3 。
文章插图
与此同时,Meta首席执行官扎克伯格宣布:基于最新的Llama 3模型,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站 。另外还有一个图像生成器,可根据自然语言提示词生成图片 。
Meta首席执行官马克·扎克伯格在一段视频中表示 , 该助理可以回答问题、制作动画和生成图像 。
文章插图
扎克伯格在 Facebook 上发帖:Big AI news today
Meta首席执行官马克·扎克伯格在视频中表示:我们相信 , Meta AI现在是你可以自由使用的最智能的人工智能助手 。Meta AI内置于WhatsApp、Instagram、Facebook和Messenger应用程序的搜索框中,因此用户可以轻松地提出可以通过新工具回答的问题 。
文章插图
扎克伯格表示,Meta 提供的生成式 AI 能力在免费产品中性能是最强大的 。
在 Facebook、Instagram、WhatsApp 和 Messenger 上 , 用户现在可以借助 Meta AI 进行搜索,无需在应用程序之间切换:
文章插图
当你浏览信息流的时候,还可以直接从帖子中向 Meta AI 询问更多信息:
文章插图
图像生成器带来的玩法更加有趣,Imagine 功能带来了从文本实时创建图像 。这一功能的测试版从今天开始在美国的 WhatsApp 和 Meta AI 网络体验上推出 。
开始打字时,你会看到一个图像出现,每多输入几个字母,图像都会发生变化:
【重磅!Meta推出开源大模型Llama 3,性能直逼GPT-4】
文章插图
Meta表示 , Llama 3在多个关键的基准测试中性能优于业界先进同类模型,其在代码生成等任务上实现了全面领先 , 能够进行复杂的推理,可以更遵循指令 , 能够可视化想法并解决很多微妙的问题 。
Llama 3的主要亮点包括:
基于超过15T token训练,相当于Llama 2数据集的7倍还多;
支持8K长文本,改进的tokenizer具有128K token的词汇量,可实现更好的性能;
在大量重要基准中均具有最先进性能;
新能力范畴,包括增强的推理和代码能力;
训练效率比Llama 2高3倍;
带有Llama Guard 2、Code Shield和CyberSec Eval 2的新版信任和安全工具 。
刚刚发布的8B和70B版本Llama 3模型已用于Meta AI助手 , 同时也面向开发者进行了开源,包括预训练和微调版本 。
最新发布的8B和70B参数的Llama 3模型可以说是Llama 2的重大飞跃 , 由于预训练和后训练(Post-training)的改进,本次发布的预训练和指令微调模型是当今8B和70B参数规模中的最佳模型 。与此同时 , 后训练过程的改进大大降低了模型出错率,进一步改善了一致性,并增加了模型响应的多样性 。
Llama 3将数据和规模提升到新的高度 。Meta表示,Llama 3是在两个定制的24K GPU集群上、基于超过15T token的数据上进行了训练——相当于Llama 2数据集的7倍还多,代码数据相当于Llama 2的4倍 。从而产生了迄今为止最强大的Llama模型 , Llama 3支持8K上下文长度,是Llama 2容量的两倍 。
此外,Meta还开发了一套新的高质量人类评估数据集 。该评估集包含1800个提示,涵盖12个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结 。为了防止Llama 3在此评估集上出现过度拟合,Meta表示他们自己的团队也无法访问该数据集 。下图显示了针对Claude So.NET、Mistral Medium和GPT-3.5对这些类别和提示进行人工评估的汇总结果 。
下图是 Llama 3 预训练模型和其他同等规模模型的比较,前者表现出 SOTA 水平 。
文章插图
为了训练最好的语言模型,管理大型、高质量的训练数据集至关重要 。Meta在预训练数据上投入了大量成本 。Llama 3使用超过15T的token进行了预训练,这些token都是从公开来源收集的 。总体上讲,Llama 3的训练数据集是Llama 2使用的数据集的七倍多,并且包含四倍多的代码 。为了为即将到来的多语言用例做好准备,超过5%的Llama 3预训练数据集由涵盖30多种语言的高质量非英语数据组成 。但是,Llama 3在这些语言上的性能水平预计不会与英语相同 。
推荐阅读
- Meta AI 全球市场扩张,并上线网页版 meta.ai
- 《不可告人》迷雾剧场重磅归来,欧豪李一桐携手破解悬疑迷局!
- 浪姐2024重磅来袭!公式照公布!韩雪柳岩苗苗等加盟,你最期待谁
- Meta如何将缓存一致性提高到99.99999999%
- AI是万灵药?Meta要把大模型塞进AR眼镜里
- AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
- Meta:Quest 手势追踪不会用于模拟手柄
- 重磅减肥科研突破:科学家揭示二甲双胍与食物如何联手抑制食欲
- 03重磅真丝怎么样,真丝衣服缩水 重磅真丝缩水么
- 要上天!美国公司推出电动“飞的”每英里收费43元