8款AI视频生成产品实测,谁将成为中国Sora?( 二 )


我们的测试和评比通过三个部分组成,分别是使用门槛,基础产品功能和内容生成能力 。
首先是使用门槛 。我们测试的8款产品,都已经支持通过网站使用产品(许多创业公司产品只能通过Discord使用),也都可以免费试用 。
但其中,仅有爱诗科技的PixVerse不限制免费试用次数,其他产品都有三到五次的试用限制 , 超过试用次数之后就需要开通会员或充值能量使用,价格从几元到几百元不等 。
除了PixVerse之外,其他产品在付费之前基本都有功能限制,比如艺映AI和Pixeling只能生成2s、4s的视频,更长的视频则需要付费 。
所以从使用门槛上综合考虑,PixVerse对用户要更加友好 , 在这一板块相对更有优势 。其他产品在使用门槛上则相对平均 。
具体情况如下图:

8款AI视频生成产品实测,谁将成为中国Sora?

文章插图
其次是产品基础功能 。
我们测试的8款产品 , 除了神采Promeal和6PenArt之外,都同时具备文生视频和图生视频的能力 。而神采Promeal和6PenArt只具备图生视频的能力,不具备直接文生视频的能力 。
除了这两家之外,其他厂家就比较成熟,但产品功能差异却比较大 。
其中 , 爱诗科技的PixVerse在基础功能之上还增加了丰富的辅助功能,比如除了正向提示词,用户还可以输入负向提示词,要求生成画面中不要出现某些元素 。
图片生成视频时,用户也可以撰写提示词控制输出效果 。可以选择视频风格,可以调节画面比例等等 。
同类产品中,只有Pixeling拥有负向提示词、图生视频提示词和视频比例调节 , 只有艺映AI可以调节视频风格、画面比例 。
大模型的技术水平决定视频生成的质量 , 而产品能力则决定了大模型是否能够被很好地利用 , 与应用场景相结合 。
对于视频生成产品而言,功能的丰富程度决定了用户上手的容易程度,对视频生成的掌控能力,并最终影响输出结果和用户体验 。
所以从产品的完善程度和功能完整度上 , PixVerse整体领先,智象未来的Pixeling排名第二,艺映AI第三,Vega AI第四 。其中布尔向量相对例外,作为专注跨境电商的视频生成工具 , 其在特定场景下功能更加齐全易用,但在视频生成方面相对缺乏竞争力 。
8款AI视频生成产品实测,谁将成为中国Sora?

文章插图
当然,基本功能之外,更核心还是视频生成效果 。所以第三部分是视频内容生成能力测试 。
首先是视频生成时长 。Sora目前能够生成60s的视频,但国内创业公司的视频生成大模型,时长大多集中在2s~4s左右,差距并没有特别大 。
其次是依据提示词的内容表现能力 。
Sora发布时,输出过这样一段视频,其提示词是:美丽,白雪皑皑的东京街道很繁华 。几个人在附近的小摊上享受着美丽的雪天并购物 。美丽的樱花花瓣和雪花在风中飞舞 。
▲Sora依据这段提示词生成的视频
依据这段提示词,我们也分别使用爱诗科技的PixVerse、右脑科技的Vega AI、MewXAI和智象未来的Pixeling生成了同样一段视频 。(由于生数科技的PixWeaver网页端暂停试用,故未纳入测评)
首先是爱诗科技的PixVerse 。
4s的内容基本还原了提示词中提到的所有关键词,同时体现了“繁华”和“小摊”的氛围 。镜头跟着画面缓缓推进 , 视频整体风格保持一致,建筑、灯光、路旁的树木、行人都比较真实,画面没有明显卡顿,除了人物行走稍有些不自然之外,没有出现元素扭曲 。
▲PixVerse依据这段提示词生成的视频
其次是右脑科技的Vega AI 。
同样4s的内容,同样只有一个镜头,顺着人流密集的街道缓缓推进 。但与PixVerse将场景放到华灯初上的傍晚不同,Vega AI选择的是白天 。
与爱诗科技的PixVerse相比,Vega AI的人物脚步混乱情况更加严重 , 部分人物在行走过程中从两只脚变成三只脚,然后又消失不见 。此外,部分人物的生成也非常模糊,只有一个人影且在不断变幻 。
▲Vega AI依据这段提示词生成的视频
然后是艺映AI 。
与PixVerse和Vega AI有一定的镜头运动不同  , 艺映AI生成的视频镜头是固定的,也是这几个视频中唯一一个选择了正面视角的视频 。
但选择正面视角也同样给艺映AI带来一个问题,即在人物的面部表情没有办法很好地处理 。视频中迎面走来的两个人面部一直没有稳定下来 。此外,艺映AI也同样存在人物移动的问题,但由于生成的视频只有2s,表现得并不明显 。


推荐阅读