AIGC会是下一个万亿级AI风口吗( 四 )


小冰公司 CEO 李笛认为,整体来看,AI 作画在生成质量上有了大幅提高,但仍然需要解决一些单点的问题,例如模型本身的迭代,一个人类设计师在和雇主的工作过程中,可以根据雇主的喜好,对设计初稿的某一局部做精细调整 。但 AI 无法做到这一点,AI 画作一旦生成,如果想让它修改,往往是用重画的方式来进行 。而现有的技术 — 多模态大模型,注定有这类问题 。它只能在一定程度上,提高作品与需求的相关性,但无法从根本上提高良品率 。
AI 生成视频,是 AI 生成图像的一种延伸 。从技术本质上看,视频可以认为是多张“图片”,即视频帧构成的序列,且序列上各帧之间有画面、逻辑等层面的关联 。因此,从生成质量上来说,AI 生成视频相对更难 。
当前文生图技术可以通过简单的技术组合,例如分步骤扩散生成等方式,将生成图像扩展到生成视频,但效果还不能令人满意 。此外,受限于数据规模和质量,AI 生成视频的生成效果和现在的文本生成图像的效果相比,有较大差距 。
不过,相对图像,视频内容具有其独特属性 。例如,在互联网视频内容消费场景中,经常会以“随便截一张图都是壁纸”作为对视频质量的极高赞誉 。由此可见,相对于图片,视频对单个帧的质量要求相对较低,更强调传递信息等功能 。因此,AI 生成视频可以采用其他技术方案完成,在降低技术难度的同时,更符合特定应用场景的要求,例如基于图文输入生成视频、基于数据生成视频等 。
总结来说,AI 按照生成图像的方式生成视频,仍处于前沿探索阶段 。
商业想象力几何?
赵德丽认为,现阶段,AIGC 的生成效果已经非常惊艳了,它已经达到了广泛应用的基础性能,虽然在使用上还有较大门槛,但通过大模型的开源开放等,有助于将门槛降下来 。
商业模式在探索中
而且可喜的是,现在,AIGC 已经有不少可行的商业模式发生了 。
例如在设计、艺术创作、电商、娱乐、金融等领域 。具体在文本生成上,在一些商业非严肃性文书的辅助编写上已产生了不错的模式;在文生图方向,已经看到,面向设计师,面向教育行业的 AI 辅助画作生成等正在探索商业用途的路上 。
最近几年,“数字人 +AIGC”成为不少企业的探索方向 。小冰从几年前就开始探索 AIGC 。李笛表示,AIGC 对于 AI Being 来说的作用在于,在和人交互的过程中,它不光要能从数字世界中获取知识内容和服务提供给人,它自己也应该相应地随机应变地去创造相应的内容提供给人 。
在互联网应用之外,AIGC 在实体经济领域,也蕴含着不少机会 。
实体经济对内容生产的需求很大 。“我们以前认为实体经济的瓶颈在于生产、产能,其实不是,实体经济的很多瓶颈在于设计,在于内容 。” 李笛说 。以小冰为例,小冰的 AIGC 内容很早就应用在纺织设计领域 。小冰与中国纺织信息中心、国家纺织产品开发中心推出的 AI 图案设计平台,可按需定制 100% 原创的图案纹样,目前已有超过 400 家企业注册,并在生产中使用 。
北京智源人工智能研究院总工程师林咏华向 InfoQ 谈到,工业生产、制造、仓储、物流等实体行业,近几年一直在探索如何用计算机视觉来进行智能化升级,但实际落地并不容易 。原因在于,现有的模型质量还未能满足产业落地的质量要求 。其中一个重要原因是,训练模型时所用的训练数据十分局限 。因此,可以考虑通过 AIGC 的方式来产生这些场景里的训练数据 。例如在仓储、物流或更多的工业场景,用 AI 来辅助产生一些少见的场景数据,作为训练数据的补充,提升整个模型的质量 。但这需要更精准的图片生成的控制能力,比较起现有的 AIGC 模型能力,其可控性需要大大提升 。
AIGC 在自动驾驶场景下也有着不错的应用潜力 。现在自动驾驶场景存在训练数据不足的问题,例如针对恶劣天气、事故等突发状况,视觉模型在真实场景中很难捕捉,也难以进行模拟,因此,目前业内在尝试用数字孪生和仿真的方式来模拟 。也可以尝试用大模型的方式,通过给出描述,生成相应的精确场景,缓解某些场景下自动驾驶数据难获得的问题 。
“整体来看,AIGC 现在已经开始在探索向实体经济的应用发展,但目前还在一个比较早期的阶段” 林咏华判断 。
向 B 端收费还是 C 端?
然而,AIGC 的商业化落地,不得不面临的一个尴尬的问题是 —— 如何避免走向 “廉价” 。


推荐阅读