一文读懂什么是AIGC、ChatGPT、大模型

昨天有读者私信我,能否解释一下AIGC和ChatGPT是什么样的关系?
确实,在短短的6个月时间里,AIGC、ChatGPT、大模型等新词汇一下成为媒体热词,加上所谓“人工智能将取代你的工作”之类的焦虑,张栋伟觉得有必要写这样一篇科普 。

一文读懂什么是AIGC、ChatGPT、大模型

文章插图
本文将力求简单化的说明这次人工智能浪潮带来的新词汇和它的意义,带你一文读懂什么是AIGC、ChatGPT、大模型 。
1、什么是AIAI,人工智能(Artificial Intelligence)的英文缩写 。
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学 。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等 。
工厂里的自动生产线,小米公司的“铁蛋”机器狗,火车站的人脸识别通道,科大讯飞的语音输入法,都是属于AI系统的应用 。
2、什么是AIGCAIGC,全名“AI Generated Content”,中文直译就是“人工智能生成内容”,也可以称为“生成式AI” (Generative AI) 。例如AI文本续写,文字转图像的AI图、AI数字化主持人等,都属于AIGC的范畴 。
3、什么是大模型首先解释,什么是GPT 。
GPT的全称,是Generative Pre-Trained Transformer(生成式预训练转换器)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型 。
GPT是AIGC的一个种类 。
在ChatGPT之前,被公众关注的AI模型是用于单一任务的,比如全球所知的“阿尔法狗”(AlphaGo)可以基于全球围棋棋谱的计算,打赢所有的人类围棋大师 。谷歌进一步开发的“AlphaZero”在围棋、国际象棋和日本象棋等项目上,都是所向无敌 。
一文读懂什么是AIGC、ChatGPT、大模型

文章插图
这种专注于某个具体任务建立的AI数据模型,叫“小模型” 。
ChatGPT与这种“小模型”不同,GPT大模型更像人类的大脑 。它兼具“大规模”和“预训练”两种属性,可以在海量通用数据上进行预先训练,能大幅提升AI的泛化性、通用性、实用性 。
基于GPT机制建立的AI数据模型,就叫“大模型” 。
4、什么是ChatGPTChatGPT是由美国OpenAI公司发布的大模型 。
由于ChatGPT 3.5展现了超出现实预期的智能数据能力,引发了一场新的全球人工智能竞赛 。2023年3月,ChatGPT -4进一步提高了AI的能力 。
5、中国有ChatGPT吗?首先再次强调,ChatGPT是特指美国OpenAI公司的大模型 。这是一个产品名称 。
但是,领先的产品,往往会成为行业代名词,比如我们说搜索的时候,会简单的说“百度一下” 。但实际上,搜索引擎还有360、Bing、谷歌等其他方式 。
目前,我们把与ChatGPT类似的产品,暂时叫“类ChatGPT”产品或者直接叫“大模型”产品 。
在ChatGPT火爆以后,中国的科技企业纷纷“赶上潮流”,推出了自己的大模型产品 。以下是《中国企业家》杂志统计出的一些知名公司的产品列表 。
一文读懂什么是AIGC、ChatGPT、大模型

文章插图
但是,这种复杂的技术模型,显然不是一朝一夕就能实现 。多个国内的大模型被国外技术人员质疑,是用ChatGPT进行“套壳”,用以提升品牌形象和股价 。
中国的GPT大模型要成熟,还需要比较多的时间和机会,本文后面部分会继续说明 。
6、ChatGPT有什么用途ChatGPT是一种能生成文本、图像等内容的复杂系统 。
OpenAI的战略伙伴微软(Microsoft)已将该技术添加到其office MS 365办公套件及搜索引擎必应(Bing)等产品中 。
微软的竞争对手谷歌(google)也推出了类似的搜索工具Bard 。
ChatGPT可以进行从历史到哲学等话题的对话,生成不同风格的文案、文章、歌词、诗歌,甚至直接生成计算机代码,或者对已有的计算机程序代码提供修改建议 。ChatGPT也能处理视觉信息,诸如回答关于照片内容的问题 。
ChatGPT是基于从互联网上搜罗的大量文章、图像、网站和社交媒体内容,以及与OpenAI人类雇工的实时对话(主要是英语)进行训练的 。实际上,早在2014年微软公司面向中国推出了AI聊天机器人小冰,目前不知道小冰的对话内容是否也是ChatGPT学习的数据来源之一 。


推荐阅读