MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军

近日 , 莫斯科国立大学(Moscow State University)举办的世界视频编码器大赛传来好消息 , 金山云自主研发的KAV1编码器在UGC赛道中拔得头筹 。
MSU视频编码大赛是全球盛宴 , 在视频编码领域具有极大的影响力 , 迄今已连续举办了15届 , 每年都会吸引众多国内外重量级企业和组织参加 。
本次 , 金山云KAV1在UGC赛道中斩获冠军 , 不仅证明了金山云在视频编码领域的团队实力与创新潜力 , 也让业界看到了AV1未来的广泛应用前景 。
在UGC赛道中排名问鼎
目前 , UGC(User Generated Content,用户原创内容)和PGC(Professionally Generated Content , 专业生产内容)是互联网视频的两大主要来源 。 作为一种泛众化的传播范式 , UGC拍摄的低门槛能满足普通人自我表达的诉求 , 因为每一个人都可以用短视频这种最为简要、直观的形式与他人和社会分享自己的观点与生活 。 事实上 , 在抖音、快手、B站等视频类社交平台 , 无论是长视频还是短视频 , 用户参与(UGC)都是更大的比重 。
除了内容来源不同 , PGC视频和UGC视频的区别更在于整体质量的差异 。 PGC视频在拍摄时就会选择更佳的光照对比度和合理的动静场景比例 , 在制作初期也会采用专业的编码手段来确保压制质量 。 与之相比 , UGC的拍摄制作、压制和后期效果都是由非专业人员完成 , 缺少对拍摄环境的把关 , 制作初期会存在对焦失真、模糊和噪声大等问题 , 在处理过程中也会经历多次视频转码 , 其难度也会随着转码次数的变多而增大 。
尽管如此 , 鉴于全球视频云服务中的主要流量是UGC , 因此关注UGC编码能够更贴合实际业务场景 , 这也是MSU大赛UGC赛道的初衷 。 本次UGC赛道视频取自数个互联网头部高自由度原创视频平台 , 通过沿用MSU一贯使用的时空复杂度聚类方法获得 , 它们覆盖了多种场景 。
本次UGC赛道结果显示 , 金山云KAV1在人工评测中压缩率较Reference(X265)提升41%(去年主观赛道冠军相较于X265的提升是33%) , 相对于svt-av1、VP9和x264分别提升45%、71%和73% , 这足以展示金山云KAV1在UGC赛道中相较于其他编码器的优势 。
MSU2020年度世界视频编码大赛 金山云斩获UGC赛道冠军文章插图
MSU大赛现有的主观、客观、4K等赛道主要集中在AV1、VVC中 , 这些编码器均是为了4K、8K等高清视频而生 , 在一些低清场景下 , 其优势可能不如目前流行的x265等编码器明显 。 金山云KAV1作为AV1标准的自研编码器 , 虽然是以“一切为了高清”为目标 , 却也能在UGC场景中优势明显 。 据悉 , 为了本次MSU赛事 , 金山云专业的视频编码器研发团队在编码器和AI两个方向上取长补短 , 研制出了贴合人眼感知模型的KAV1 。
金山云KAV1第一次参加编码器领域盛宴就能取得不俗的成绩 , 这表明 , 近年来金山云在AI和编解码方面的研发持续收获成效 。
KAV1的背后功臣:感知评价指标KPA
对焦失真、模糊、噪声、场景区分巨大等因素 , 导致UGC视频的主观优化成为较PGC视频更有挑战性的一环 。 为了更好地优化UGC场景的编码效果 , 金山云自主研发并且发布了图像视频感知评价指标Kingsoft Cloud Perceptual Assessment(KPA) 。
本次MSU大赛中 , 利用KPA强大的能力 , 金山云KAV1在继承经典视频混合框架的基础上 , 基于KPA重新设计了RDO目标函数 , 同时利用JND+KPA两者大幅度去除了人眼不感知的区域所占用的码率 , 包括时域空域的采集噪声、压缩带来的压缩噪声、暗场和高频集中等不敏感区域 。 同时 , 全面提升了预测、变换、量化、熵编码等各个流程的压缩效率 , 如采取 Warp Motion 技术提升对局部仿射运动的估计;增加 DCT-8/DST-7等变换提升残差的变换效率;精细调整每一个编码单元的QP以获得更为优良的码率分配;革新熵编码机制超越经典 CABAC 算数码 。 通过这些手段 , 金山云KAV1在确保压缩率的基础上大大提升了图像画质 。


推荐阅读