文章插图
图片来源@视觉中国
文 | 零点有数科技作为人工智能史上里程碑事件之一的ChatGPT,自2022年11月30日发布至今,一直备受热议 。在ChatGPT热潮尚未见减弱之势,2023年3月14日,OpenAI公司继续发布新一代AI语言大模型GPT-4,并官宣称GPT-4是“OpenAI最先进的系统”“能够产生更安全、更有用的响应” 。
作为同一家公司推出的同属人工智能技术驱动的自然语言处理工具(AI语言大模型),相比此前的ChatGPT,GPT-4到底有何先进之处?支持这些先进之处的底层逻辑是什么?点击阅读原文,领取零点有数专家的超万字详细解读 。
鉴于ChatGPT是基于GPT-3.5大模型微调形成的一个应用产品——AI聊天机器人,而GPT-4则是GPT-3.5的下一代大模型,本文将从两个层面来比较:一是从基础模型层面,比较GPT-4与GPT-3.5(作为底层逻辑);二是从应用能力层面,比较GPT-4与ChatGPT(作为先进之处) 。
01 GPT-4与GPT3.5
GPT-4是OpenAI公司自2018年6月发布GPT-1以来,并历经GPT-2、GPT-3、GPT-3.5之后的最新一代AI自然语言大模型(参见下表1) 。
从历代沿革来看,原理基本相同 。第一,都是采用一种称之为“自回归生成”的关联统计方法;第二,都是首先采用无监督学习预训练出一个基础通用模型,然后再通过监督学习进行微调适配各种任务,最后采用“从人类反馈中强化学习”的强化学习方法,使得模型能像人类一样进行对话交流;第三,都是基于一种称之为“Transformer”的算法框架 。即都是“GPT”(生成式预训练转换器,或称生成式预训练大模型) 。
然而不同的是,演变的变量主要关乎模型的规模(即参数个数)、预训练的数据量、对输入信息的支持能力(是否是多模态、是否是长信息)、模型功能(是否有多种能力)以及模型性能、应用安全和可靠性等方面 。
具体对比如下:
1、模型规模 。相较于GPT-3.5的1750亿个参数,GPT-4的参数达到了5000亿个(也有报道为1万亿),GPT-4的规模比GPT-3.5更大 。更大的规模通常意味着更好的性能,能够生成更复杂、更准确的语言 。
2、训练数据 。GPT-3.5使用了来自维基百科、新闻报道、网站文章等互联网上的大量文本数据,大小为45TB左右 。而GPT-4则使用了更大量的网页、书籍、论文、程序代码等文本数据,同时还使用了大量的可视数据 。尽管无法考究具体数值,但毫无疑问,GPT-4的训练数据比GPT-3.5更丰富 。这使得GPT-4具备更广泛的知识,回答也更具针对性 。
表1 OpenAI历代GPT模型参数与预训练数据量对比
3、模态与信息 。GPT-3.5是基于文本的单模态模型,无论是图像、文本、音频,用户只能输入一种文本类型的信息 。而GPT-4是一个多模态模型,可以接受文本和图像的提示语(包括带有文字和照片的文件、图表或屏幕截图) 。这使得GPT-4可以结合两类信息生成更准确的描述 。在输入信息长度方面,与GPT-3.5限制3000个字相比,GPT-4将文字输入限制提升至2.5万字 。文字输入长度限制的增加,也大大扩展了GPT-4的实用性 。例如可以把近50页的书籍输入GPT-4从而生成一个总结概要,直接把1万字的程序文档输入给GPT-4就可直接让它给修改Bug 。
4、模型功能 。GPT-3.5主要用于文字回答和剧本写作 。而GPT-4,除文字回答和剧本写作外,还具有看图作答、数据推理、分析图表、总结概要和角色扮演等更多功能 。
5、模型性能 。虽然GPT-3.5已经表现出很强大的性能,但GPT-4在处理更复杂的问题方面表现得更好 。例如,在多种专业和学术基准方面,GPT-4表现出近似人类水平;在模拟律师考试方面,GPT-4可以进入应试者前10%左右,而GPT-3.5则在应试者倒数10%左右;在USABO Semifinal Exam 2020(美国生物奥林匹克竞赛)、GRE口语等多项测试项目中,GPT-4也取得了接近满分的成绩,几乎接近了人类水平 。参见如下图1 。
文章插图
图1 GPT-4各项考试结果(按GPT-3.5性能排序)(数据来源:https://openai.com/research/gpt-4)
6、安全性和可靠性 。GPT-4改进了对抗生成有毒或不真实内容的策略,以减少误导性信息和恶意用途的风险,提高其安全性和可靠性 。特别地,GPT-4在事实性、可引导性和拒绝超范围解答(非合规)问题方面取得了有史以来最好的结果(尽管它还不够完美) 。与GPT-3.5相比,在生成的内容符合事实测试方面,GPT-4的得分比GPT-3.5高40%,对敏感请求(如医疗建议和自我伤害)的响应符合政策的频率提高29%,对不允许内容的请求响应倾向降低82% 。
推荐阅读
- 看动图学算法:冒泡排序算法的原理和Java讲解
- 深拷贝和浅拷贝:如何选择最适合你的对象复制技术?
- 冲泡普洱茶时用什么茶具,其香气和汤汁层次感强?
- 焙火工艺——足焙火和轻焙火制作的乌龙茶有何品质区别?
- 盗墓笔记|重温盗墓笔记:吴邪和齐羽到底什么关系,他们之间藏着什么阴谋
- 雕刻|什么岫玉?岫玉产自哪里?岫玉与和田玉有什么区别呢?
- 谭松韵|林子善黄嘉乐都带着太太为唐诗咏庆生 郑嘉颖和马国明缺席生日饭局
- 蒋雯丽|56岁“晚节不保”,再多的名和利,都救不了蒋雯丽
- 董洁|陈辰:和胡歌是圈内好友,倾情出席其爱女小茉莉的出生“百日宴”
- 邓文迪|邓文迪:嫁巨富默多克,和首相传绯闻,如今和马斯克母亲处成闺蜜