一文读懂什么是AIGC、ChatGPT、大模型( 二 )


ChatGPT学着模仿写作的语法和结构,输出常用表达 。它还学习识别图像中的形状和图案,如一只猫、一个孩子或一件衬衫的轮廓 。它还可以将单词和短语与这些形状和图案相匹配,允许用户询问图像的内容,如猫在做什么或衬衫的颜色是什么 。
因为ChatGPT的原始数据来自于公开的互联网,而互联网上的信息并不总是准确的 。因此,ChatGPT给出的答案结果,并没有经过事实核查,不能100%保证准确,甚至有些完全是“一本正经的胡说八道” 。
ChatGPT需要依靠人类员工的反馈来提高准确性 。
其他类似的大模型,同样如此,都需要非常海量的人工能力,来帮助大模型提升准确性 。这就是类似于在中国,虽然大家觉得高德地图、百度地图、腾讯地图很智能,但是实际上,它们不仅仅是在调用卫星数据、交通部门数据,还有数以万计的人工“标记员”在帮助和辅助数据修正工作 。
7、ChatGPT之类的大模型是如何工作的?前面已经说过,GPT的意思是“生成式预训练转换器(Generative Pre-trained Transformer),这是大模型的核心技术 。
转换器是在数据序列中寻找长程模式的专门算法 。转换器不仅能学会预测一个句子中的下一个词,还能学会预测一个段落中的下一个句子以及一篇文章中的下一个段落 。这就是为什么它能够在长文本中紧扣主题 。
由于转换器需要大量的数据,它的训练分为两个阶段:首先,它用通用数据进行预训练,这种数据更容易大量收集;然后,根据它要执行的具体任务,再利用定制的数据进行微调 。
张栋伟在最近的两篇文章中多次强调,大模型的核心取决于三个因素:数据、算力和场景 。
所有的大模型都要受制于该公司所能合法获得的数据量,还要具备能支撑这些数据的算力 。最后,还需要有可以商业化的场景,形成投资-产出的正循环 。
8、ChatGPT这样的大模型收费吗?目前,包括美国的ChatGPT,以及国内的各种大模型,都是免费的 。需要个人去官网注册申请 。
大模型产品都会提供一个API(应用程序编程接口),允许各公司将该技术整合到自家产品或后端解决方案中 。这种企业定制版本,以及面向个人的高级版本,会收费 。
需要再次提示的是,上文已经说过,目前大模型都还需要人工进行优化,因此你在大模型输入的内容,以及大模型给你输出的答案结果,这些信息都会被开发者公司阅读到 。
所以,请不要输入隐私数据或敏感的公司信息 。
9、政府对AIGC的态度世界各国政府正在探索规范生成式AI工具的方式,担心它们可能被滥用于犯罪、传播虚假信息或威胁国家安全等情况 。
4月11日,国家互联网信息办公室(简称“网信办”)发布通知,就《生成式人工智能服务管理办法(征求意见稿)》向社会公开征求意见,意见反馈截止时间为5月10日 。
网信办表示,“国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源” 。
网信办定义,所谓“生成式人工智能”,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术 。网信办明确研发、利用生成式人工智能产品,面向中华人民共和国境内公众提供服务的,适用本办法 。
在服务提供者的准入资格方面,《意见征求稿》要求利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》(2018年11月发布)向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》(2021年12月发布)履行算法备案和变更、注销备案手续 。
《意见征求稿》详细地分别对提供生成式人工智能产品或服务,对用于生成式人工智能产品的预训练、优化训练数据提出明确要求 。
10、AI会抢人类饭碗吗?任何最新发明的技术,都会对当下的岗位和未来的工作产生重大影响 。
在此前的计算机、互联网、移动互联网的技术浪潮中,都会蓝领阶层产生了重大影响 。
当前业内普遍认为,AIGC将对白领职业产生较大影响 。
但是,回首往事,会发现计算机、互联网、移动互联网三大革命性的新技术,使得社会经济变得更加生机勃勃 。
这是因为,经济学家已经发现,新技术的相关影响往往包含三个方面:
(1)一些劳动者提高了生产力;
(2)部分岗位实现自动化或被合并;


推荐阅读