8款AI视频生成产品实测，谁将成为中国Sora？( 二 ) _Sora

我们的测试和评比通过三个部分组成，分别是使用门槛，基础产品功能和内容生成能力。
首先是使用门槛。我们测试的8款产品，都已经支持通过网站使用产品（许多创业公司产品只能通过Discord使用），也都可以免费试用。
但其中，仅有爱诗科技的PixVerse不限制免费试用次数，其他产品都有三到五次的试用限制，超过试用次数之后就需要开通会员或充值能量使用，价格从几元到几百元不等。
除了PixVerse之外，其他产品在付费之前基本都有功能限制，比如艺映AI和Pixeling只能生成2s、4s的视频，更长的视频则需要付费。
所以从使用门槛上综合考虑，PixVerse对用户要更加友好，在这一板块相对更有优势。其他产品在使用门槛上则相对平均。
具体情况如下图：

文章插图
其次是产品基础功能。
我们测试的8款产品，除了神采Promeal和6PenArt之外，都同时具备文生视频和图生视频的能力。而神采Promeal和6PenArt只具备图生视频的能力，不具备直接文生视频的能力。
除了这两家之外，其他厂家就比较成熟，但产品功能差异却比较大。
其中，爱诗科技的PixVerse在基础功能之上还增加了丰富的辅助功能，比如除了正向提示词，用户还可以输入负向提示词，要求生成画面中不要出现某些元素。
图片生成视频时，用户也可以撰写提示词控制输出效果。可以选择视频风格，可以调节画面比例等等。
同类产品中，只有Pixeling拥有负向提示词、图生视频提示词和视频比例调节，只有艺映AI可以调节视频风格、画面比例。
大模型的技术水平决定视频生成的质量，而产品能力则决定了大模型是否能够被很好地利用，与应用场景相结合。
对于视频生成产品而言，功能的丰富程度决定了用户上手的容易程度，对视频生成的掌控能力，并最终影响输出结果和用户体验。
所以从产品的完善程度和功能完整度上， PixVerse整体领先，智象未来的Pixeling排名第二，艺映AI第三，Vega AI第四。其中布尔向量相对例外，作为专注跨境电商的视频生成工具，其在特定场景下功能更加齐全易用，但在视频生成方面相对缺乏竞争力。

文章插图
当然，基本功能之外，更核心还是视频生成效果。所以第三部分是视频内容生成能力测试。
首先是视频生成时长。Sora目前能够生成60s的视频，但国内创业公司的视频生成大模型，时长大多集中在2s~4s左右，差距并没有特别大。
其次是依据提示词的内容表现能力。
Sora发布时，输出过这样一段视频，其提示词是：美丽，白雪皑皑的东京街道很繁华。几个人在附近的小摊上享受着美丽的雪天并购物。美丽的樱花花瓣和雪花在风中飞舞。
▲Sora依据这段提示词生成的视频
依据这段提示词，我们也分别使用爱诗科技的PixVerse、右脑科技的Vega AI、MewXAI和智象未来的Pixeling生成了同样一段视频。（由于生数科技的PixWeaver网页端暂停试用，故未纳入测评）
首先是爱诗科技的PixVerse 。
4s的内容基本还原了提示词中提到的所有关键词，同时体现了“繁华”和“小摊”的氛围。镜头跟着画面缓缓推进，视频整体风格保持一致，建筑、灯光、路旁的树木、行人都比较真实，画面没有明显卡顿，除了人物行走稍有些不自然之外，没有出现元素扭曲。
▲PixVerse依据这段提示词生成的视频
其次是右脑科技的Vega AI 。
同样4s的内容，同样只有一个镜头，顺着人流密集的街道缓缓推进。但与PixVerse将场景放到华灯初上的傍晚不同，Vega AI选择的是白天。
与爱诗科技的PixVerse相比，Vega AI的人物脚步混乱情况更加严重，部分人物在行走过程中从两只脚变成三只脚，然后又消失不见。此外，部分人物的生成也非常模糊，只有一个人影且在不断变幻。
▲Vega AI依据这段提示词生成的视频
然后是艺映AI 。
与PixVerse和Vega AI有一定的镜头运动不同，艺映AI生成的视频镜头是固定的，也是这几个视频中唯一一个选择了正面视角的视频。
但选择正面视角也同样给艺映AI带来一个问题，即在人物的面部表情没有办法很好地处理。视频中迎面走来的两个人面部一直没有稳定下来。此外，艺映AI也同样存在人物移动的问题，但由于生成的视频只有2s，表现得并不明显。