像做PPT一样做短视频和直播?( 二 )


2021年开始 , 与元宇宙概念相关的虚拟偶像率先出圈 , 如A-soul、柳夜熙和狐璃璃等 , 他们往往有大平台扶持的背景 , 且都吸引了不小的声量 , 其中 , A-soul主要成员“嘉然今天吃什么”是B站百大UP主 , 柳夜熙在抖音拥有超800万粉丝 , 狐璃璃在快手拥有超400万粉丝 , 均是平台头部创作者 。
不过 , 这批3D数字人IP , 在商业化路径上仍然走的是传统流量经济的老路 , 收入来源以直播打赏或者广告代言为主 , 这与其制作方成本的投入并不匹配 。 而且 , “中之人”的存在 , 也让这批数字人IP面临一定的“塌房”风险 , 难以成为真正的“数字”偶像 。 行业中也曾有过专为直播带货而生的IP , 如遥望科技旗下的数字偶像“孔襄” , 不过该数字人目前已经停更 , 鲜有新动向 。
行业中更加广泛存在的 , 则是数量庞大的2D数字人 , 在更早的时间段主要服务于政府、金融等行业 , C端用户则无明显感知 。 2023年开始 , 在生成式AI技术的加持下 , 有了爆发性的增长 。
一批公司也因此吃到了行业增长的红利 , 在抖音平台 , 虚拟人创业公司硅基智能已经服务了上万个客户 , 主要聚集在本地生活和直播电商领域 , 也进入了C轮融资阶段 , 是数字人直播领域的头部公司 。
此外 , 行业内还有定位SaaS版本视频剪辑工具 , 专门服务于地方电视台 , 银行 , 国家机关和地方政企的腾讯智影 , 以及主要给政务 , 金融客户提供定制化解决方案的百度灵犀和给短视频账号公司服务的闪剪等等 。
除了定位于营销场景的政企、传媒、金融行业之外 , 短视频和直播带货的数字人需求往往聚焦于垂类 , 比如短视频中的口播场景以及直播带货中的标品店播场景 , 这部分内容对人的表现力需求不强 , 因此能够由数字人完美取代 。
基于此 , 快手自研的AIGC数字人解决方案快手智播有着天然优势 , 其与快手业务系统的深度打通 , 能更好的为快手生态服务 。 比如其完美匹配快手的直播系统和风控系统 , 还能自动挂车和切换讲解卡 , 同时回答观众的提问 , 和观众实时互动 , 这一过程又进一步节省了人力的使用 。
最低只需要3分钟的视频和音频素材 , 用时3天 , 就可以制作相应的数字孪生形象 , 同时快手还将提供整套的SaaS服务工具 , 不需要用户另外采购任何硬件设备 , 只需输入短视频文案或者直播稿 , 就可一键生成视频或开播 。 这套流程在当前的技术能力下 , 仅需千元即可完成 , 而此前传统数字人制作费用一般需10万元以上 。

据快手技术人员介绍 , 为了达到目前的拟真度 , 快手基于自研高精度3D面部重建算法进行了3D建模 , 还在数万小时的模特数据上进行了训练 , 又针对每个具体模特进行了微调 。
而为了实现实时性 , 快手还有自研的推理引擎、部署框架、以及在多个业务中得以迭代的流式的数字人生成框架 , 能够以秒级的低延迟实现数字人直播 。
数字人背后 , 快手布局全模态大模型AIGC?实际上 , 数字人产品只是快手AIGC系列部署中的一环 , 在光合大会上 , 王仲远强调了一个概念:全模态、大模型AIGC 。
他表示:创作本身是一件需要创意和专业度的事情 , 持续创作优质作品会让很多创作者感到压力 。 以一个美食创作者为例 , 分享一道或十道拿手菜并不是难事 , 但长期坚持下去 , 总会在创意、素材和视频制作等方面遇到难题 。

而所谓的全模态、大模型AIGC解决方案 , 就是为了解决创作者在创作过程中的各种痛点而生 。 据王仲远介绍 , 这套方案可以帮助创作者更好的激发创意 , 用户只需一个指令 , 就可以让大模型帮助自己完成故事撰写、脚本整理 , 并能够基于场景主题生成对应的图片和配乐 。 用户不用再绞尽脑汁反复脑暴 , 可以让大模型提供更多的灵感和创意 。
在大会上 , 王仲远还展示了大模型的素材绘制功能 , 针对周杰伦创作的歌曲《七里香》 , 大模型自动画出了相关画面 , 这也就意味着 , 创作者在使用快手大模型的时候 , 可以自由地提供场景描述来获得素材 , 最终简化创作视频的流程 。 在电商场景上 , 大模型也可以帮助B端创作者将所售商品进行3D化展示 , 进一步提升消费体验 。
甚至 , 传统视频直播中费时费力门槛颇高的剪辑工作 , 也可以由快手大模型的AIGC解决方案取代 。 创作者只要自行上传相关素材 , 就可以得到相应的短视频内容 。
此前 , 不少大模型产品都是针对某项具体的场景应用 , 譬如对话提供相应的文字解决方案或者AI智能生成图片 。 而快手的全模态、大模型AIGC , 不只定位于个别功能 , 而是聚焦于用户在快手的各种需求 , 让用户在创作视频和带货的每一步都能得到AI的帮助 。


推荐阅读