AIGC会是下一个万亿级AI风口吗( 二 )


黄民烈认为,ChatGPT 出现对 AI 界来说,有着十分重要的意义:“它宣示着无缝人机交互时代的来临 。过去我们讲 conversation as a service (caas)还停留在纸面,但实际上今天,无论是开放域聊天,还是通用任务助理(ChatGPT)都在强烈地表明这一点” 。
从信息检索的角度看,ChatGPT 也取得了很大突破 。达摩院基础视觉负责人赵德丽在接受 InfoQ 采访时表示,以前谷歌等搜索引擎做搜索和检索,只是找已经存在的信息,ChatGPT 的应用,实现了从信息的搜索到信息的创造这样一个范式的转变,从算法能力上看,它取得了一个质的飞跃 。短期来看,ChatGPT 有望成为或者辅助像谷歌这种传统信息检索的强有力的工具;长期来看,它有望发展成为 AI 系统级的服务 。
但至于它最终会不会取代搜索引擎 。黄民烈认为,ChatGPT 取代谷歌搜索还比较遥远,原因主要有,受限于训练数据,ChatGPT 的信息实效性较弱,缺乏很多新的信息;在信息的可信度上,搜索引擎只“搬”东西,不创造内容 。ChatGPT 虽然会创造内容,但创造的东西多大程度上“有用、可信、无害”,还没有统一的定论;再就是成本问题,现在大模型的生成成本还是太高了,需要持续下降 。
现阶段的 ChatGPT 并不完美 。通俗地说,它还存在“一本正经地胡说八道”的问题,这本质上是对信息可信性的度量和评估 。解决这一问题,技术上需要有信息验证的手段;从应用上来说,需要深入结合应用的场景和特点,针对性优化和解决 。
但整体而言,ChatGPT 还是让人非常惊喜 。黄民烈非常看好 ChatGPT 接下来的发展方向 。他认为这是一个正确的方向,现在还比较粗糙,但假以时日,一定会催生很多应用 。
赵德丽同样对 ChatGPT 抱有大期待 。虽然还有各种瑕疵,但 ChatGPT 短时间内出现了各式各样的不同方向上解决问题的能力,展现了 AI 算法的巨大潜力 。从技术发展和解决方案的角度看,它将来可能会成长为一个超级 App,就像是一个无所不知的虚拟体 。“ChatGPT 这种应用的出现,从长远来看的影响力,其实不亚于阿尔法狗曾经在人工智能界带来的影响力,它将会是一个影响非常深远的技术和应用” 。
AIGC 为什么突然火了?
AIGC 并不是一个新概念 。AIGC,通常还有另一种叫法 — AI Creation(人工智能创造),大致从 2016 年—2017 年开始,其应用不断增加,尤其是在自然语言领域,广泛应用在生成文本、作诗句、写对联等方向,近几年,逐渐延伸到作画、作曲等领域 。
凭何而火?
今年,AIGC 突然在全球蹿红,成为人人口中的流行词 。究其原因,主要由多项技术上的关键突破推动,总结来说:
一,算法上:从今年 4 月开始,在文生图视觉方向上,视觉效果生成的效果取得了突破性的进展,文生图的质量得到了很大改善 。OpenAI 的文本生成图像模型 DALL·E 2 算法发布后,在算法效果上取得了和以往相比实质性的突破,成为一个现象级的算法,其在文本生成图像生成的效果、真实度表现上,让大家看到了大规模商用的前景 。AI 作画任务十分直观,给人的视觉冲击强烈,使得 AIGC 逐渐破圈,快速传播 。
二,预训练大模型是 AIGC 的底座,没有大模型学到的丰富知识,就无法实现如此丰富的 AI 内容生成能力 。AIGC 最重要的是一种融会贯通的能力,要做领域的泛化,需要学习海量的数据,大模型的规模直接决定了 AIGC 创作力的广度 。多模态大模型的应用,使得 AIGC 的质量得到了较为明显的进步 。
三,扩散模型的发展 。扩散生成的算法取得了突破,这个算法能够对图像做像素级别的建模,学习效率更高 。Stable Diffusion 是文本生成图像模型完全开源的第一个算法,它跑起来的效率相当高,其开源也带动了相关生态快速的发展,让人们看到,基于这种生成式基础模型,能够带来无限的创造和想象空间 。特别是在一些国外社区里,基于 Stable Diffusion 做的各种创新式的应用发展快速,展现了商业化潜力 。
四,算力降低 。深度学习计算能力的快速发展 。在大算力的基础上,AI 作画能够实现在海量数据上进行大参数模型的训练 。相比之前的 AIGC 算法,算力上有了很大降低 。要训练一个基础的预训练模型,需要很多算力 。一些专注于基础的大模型的机构,将模型训练好后,可以供很多小企业使用,只需用消费级的网卡就可以做微调,也可以直接基于 API 调用 。预训练大模型加上微调可以很好地进行文生图生成风格的改变,派生出了大量的二次开发者,屡屡破圈 。


推荐阅读