“怪胎”ChatGPT的前世今生,以及未来( 四 )


【“怪胎”ChatGPT的前世今生,以及未来】自美国时间12月2日上线以来 , ChatGPT已经拥有超过一百万的用户 。用户们在社交媒体上晒出来的对话例子表明ChatGPT这款模型与GPT-3类似 , 能完成包括写代码 , 修bug(代码改错) , 翻译文献 , 写小说 , 写商业文案 , 创作菜谱 , 做作业 , 评价作业等一系列常见文字输出型任务 。ChatGPT比GPT-3的更优秀的一点在于 , 前者在回答时更像是在与你对话 , 而后者更善于产出长文章 , 欠缺口语化的表达 。有人利用ChatGPT与客服对话 , 要回了多交了的款项(这或许意味着ChatGPT在某种意义上通过了图灵测试) , 或许ChatGPT能成为社恐人士的好伙伴 。
4. 问题警告
OpenAI的研发团队在推出ChatGPT时 , 警告用户该款模型存在一些问题 , 而经过全球网民们的反复试探 , 大家也已证实了这些问题的存在 。
首先 , ChatGPT背后的大型语言模型的训练集最近数据截止于2021年底 , 所以任何关于过去一年里发生的事件 , 它无法给出准确的答案 。其次 , 当用户想利用ChatGPT获取准确信息(例如写代码 , 查菜谱)时 , ChatGPT回答的准确度是不稳定的 , 用户需要具有鉴别回答质量与准确性的能力 。由于准确性问题 , 代码交流网站StackOverflow已经禁止用户在其网站上引用ChatGPT生成的代码 。
对此 , 亚马逊AWS上海人工智能研究院院长张峥老师评价道:ChatGPT模型的训练方法有个致命的问题 , 训练好的模型在回答问题时 , 对于各种可能的答案的打分机制用的是排序 , 也就是说第二步是粗打分 。这就造成了模型瞎想的错误被混入(例如(排名更靠前的)A句比(排名靠后的)B句好不等于A句里没有犯常识或事实错误) 。问答不仅因为场景是开放性的 , 更重要的是每一步无理还是有理可以是灰色的 , 需要细分 。这问题并不是无解了 , 这里还有很多基础性的工作要做 。
最后 , 提问者对于问题的描述也会影响ChatGPT回答的准确性 。这个问题可能会产生意想不到的影响 。今年早些时候 , OpenAI推出了最新的人工智能绘画系统DALL·E 2(同期还有不少类似的产品 , 例如Midjourney等) 。用户只需要提供语言描述 , DALL·E 2 就能够根据该描述生成一幅画 。不夸张地说 , 这些图画的质量、风格、均可与专业画家创作的作品媲美 。

“怪胎”ChatGPT的前世今生,以及未来

文章插图
DALL·E 2 生成的一副现代画(图片来源:openai.com)
于是 , 在美术界为此感到震惊的同时 , 提示语生意(prompt engineering)悄然升起:好的提示语能引导人工智能模型生成更符合要求、更赏心悦目的作品;而不够好的提示语 , 则往往导致不伦不类的学生习作级别(甚至更糟糕)的作品 。所以 , 如何写好提示语、与人工智能模型高质量的进行对话 , 成了新的创业热点 。美国旧金山的初创公司PromptBase推出了$1.99美元一条提示语的服务 , 主要用于针对DALL·E 2 , GPT-3等内容创作模型 。或许他们很快也会把ChatGPT也加到自己的业务范畴里 。
根据之前提到的小样本学习和引入人类反馈的原理 , 我们已经知道 , 如果我们先给ChatGPT模型提供几个例子 , 然后再提出语言任务 , 或者通过不断给出反馈而引导ChatGPT , ChatGPT的回答会更符合我们的要求 。所以 , 写一个好的提示语 , 能让ChatGPT给你更多的惊喜 。
5. 人工智能进化 , 终点在哪里?
从2017年的Transformer到今天的ChatGPT , 大型语言模型经历了如此多的迭代 , 一代比一代性能更强 。未来 , OpenAI会继续给我们带来GPT-4、GPT-5 , 甚至GPT-100 。而我们此时与ChatGPT火热的、奇葩的、脑洞大开的聊天记录 , 也会全部变成下一代模型的训练数据 。
2016年 , OpenAI公司创立时初衷是要开发对人类有益的人工智能技术 。在过去的六年里 , 没有任何线索显示他们违背了初衷——相反 , ChatGPT及其背后的大型语言模型看起来就是一项面向未来的先进生产力 。我们有理由相信 , 以大型语言模型为例子的人工智能技术能帮助我们更好的完成学习与工作 , 过上更美好的生活;我们也有理由相信 , 我们应该继续支持、开发、推广人工智能 , 使其能惠及大众 。但是 , 我们已经无法忽视人工智能技术进化、迭代的速度远高于人类、生物体的进化速度 。


推荐阅读