关于ChatGPT的七个关键问题和技术思考( 二 )


关于强大的对话能力 , 除了在“大模型、高算力、算法调优”方面的优势外 , 数据侧的整理、清洗、人工标注等工程化细节启到了关键核心作用 。ChatGPT的训练语料主要来自Common Crawl、各类网页、书籍及维基百科 , 而目前OpenAI公司并未公布更多数据处理和工程化过程 , 包括(1)数据筛选方法 , 如何在海量网页文本进行数据的质量判断和选取;(2)数据收集设置细节 , 如何确定网页文本、代码、公式和论文的比例 , 以用于第一步训练大语言模型;(3)粗加工技术 , 例如对千亿级tokens的编码技术;(4)精加工技术 , 例如如何在第二步训练中选择和确定进行人工标注的1.5万个问题 。
由此 , ChatGPT的知识来源于数据库语料 , 回答的准确性以及是否合乎伦理道德都会受到训练数据的影响 , 并且难以完成训练数据库以外的任务 。
总的来说 , GPT和BERT针对的任务和场景不同 , 但在各自方向中都有很好的表现 , 都是非常强大的语言模型 , 
四、ChatGPT进步的关键技术之一是基于人工反馈的强化学习 , 但 “强化学习”在工业界复活的判断还为时过早
基于人工反馈的强化学习使ChatGPT的类人表现更进一步 , 但这并不意味着强化学习将立刻在工业界重新获得广泛运用 。主要出于以下几点原因:一是虽然OpenAI在强化学习上做了大量工作 , 但是强化学习的两个应用核心痛点尚未有效解决:数据使用效率仍旧不高 , 强化学习仍有太多超参数需要调节;二是对于现在强化学习在ChatGPT中起到作用的相关效果评价还不够完整 , 需要剔除仅由增加数据带来的增益;三是强化学习模型的必要性仍需验证 , 在增加第二步训练中数据量的情况下 , 第三步训练是否仍然必要 , 或是可以用更简单直接的算法利用第三步中的增量标注数据去迭代优化原模型的参数 , 都还有待进一步验证 。

关于ChatGPT的七个关键问题和技术思考

文章插图
图:各阶段训练在ChatGPT模型上产生的效果评价
图表来源:openAI的官方博客
五、AI技术演化不会趋于单一化 , 而是“分久必合 , 合久必分”
人工智能技术作为数字时代新一轮科技革命和产业变革的重要战略引擎 , 整体呈现“分久必合 , 合久必分”的动态上升趋势 。
从机器学习的模型训练来讲 , 目前经历“有监督学习→自监督学习→有监督学习”的技术演变过程 , 也就是从“标注数据→海量无标注数据+大模型→高质量标注数据” , 技术发展从追逐模型大小回归到提升数据质量 , 这并不是全盘否定自监督学习的技术意义 , 简单回归机器学习的技术原点 , 而是技术的螺旋式上升过程 。
从整个AIGC(人工智能生成内容)技术的发展来讲 , 已经进入即分又合的时代 。从开始“多头并进”演变为“多点发力” , 同时在“文本→文本”、“文本→图片”、“文本→代码”、“文本→声音”、“文本→视频”五个领域同时探索 , 但是共性关键技术有一致性 , 等于同一技术在同时做五个试验 , 技术迭代成功率增加至五次方倍 , 所有这些方面的技术进步将助推AIGC技术的成熟 , 丰富人们的数字生活 。
六、机器和未来人类的关系会出现重大转变 , 且更加以人为中心
数字时代下 , 以ChatGPT为代表的人工智能生成内容(AIGC)将不断革新数字内容的生产方式和消费模式 , 呈现人工智能强大的生产力变革效能 。
首先是信息交互方式将发生重大改变 , 目前信息的交互以搜索引擎为主 , ChatGPT将成为人工智能行业的基础设施 , 带来信息处理能力和内容生成能力的极大提升 , 致使文本理解、知识挖掘和表征、知识存储和检索等方面产生根本性的成本效率改善 。
其次 , 人工智能行业将会发生生态颠覆 , 部分传统人工智能产业将展现新的生命力 , 但同时部分行业也将面临淘汰的威胁 。智能客服将受到最为直接的影响 , 其灵活性和人性化服务能力显著提升 , 在非深度专业服务方面能力接近于或超过真人客服 , 而且是所有公司都将会低成本普遍获得的一种能力 。相应地 , 对于垂直但领域的行业特性不强的公司 , 以及没有数据和行业壁垒、仅提供通用文本处理能力的公司 , 都会受到降维打击 , 例如“根据标题+关键词生成营销文案”、“邮件自动填写”、“AI写作助手”等 。


推荐阅读