Maxine|视频会议卡成PPT?这套AI算法要帮用户化解这种尴尬 | 硬科技
_原题为 视频会议卡成PPT?这套AI算法要帮用户化解这种尴尬 | 硬科技
文章图片
图片来源:unsplash
【Maxine|视频会议卡成PPT?这套AI算法要帮用户化解这种尴尬 | 硬科技】采访人员 | 袁伟腾新冠疫情期间 , 人们更多地在网络上进行视频通话和会议 。 当通话进行时 , 模糊、卡顿、跳帧的现象却在网速不佳的情况下经常发生 。 英伟达(Nvidia)开发的一项新技术有望能够解决这些问题 , 为用户带来更为流畅的“云办公”体验 。
近日 , 英伟达宣布为开发者推出一款名为Nvidia Maxine的新视频会议平台 。 据英伟达官方网站消息 , 通过搭载神经元网络与人工智能技术 , Maxine能够更高效地处理通话过程中所生成的数据 , 将同等清晰度视频通话的宽带要求“降低到H.264流媒体视频压缩标准要求的十分之一” , 并在同等网络条件下生成更清晰、流畅的视讯影像 。
在英伟达公布的一项演示中 , 视频通话所需数据速率在使用Maxine后从97.28KB/骤降至0.1165KB/帧——节省了近99.9%的数据传输量 。 英伟达称 , Maxine技术在未来将会进一步降低通话过程中的流量消耗 。
“通过AI技术 , 我们能够为用户提供更好的视频通话体验 。 即使是在网络不佳的条件下 , 通话质量也能获得明显提升 。 ”一位英伟达的技术人员评价 。
文章图片
图片来源:英伟达
新算法背后的原理简单易懂 。 据研究人员介绍 , 系统会首先捕捉通话者的静态面部照片 , 以此为参考 , 软件不必再将整个视频的像素进行流式传输 , 只需要分析通话中每个人的关键面部点 , 便可以在另一边的视频中智能重现面部 。 英伟达高级产品总监安德鲁·佩奇(Andrew Page)称 , 他们的解决方案的本质是将带宽问题变成算力问题 , 相比于增加带宽 , 增加算力无疑更为容易 。
该技术在机器学习中采用了一种名为“对抗生成网络”(generative adversarial network , GANs)的工具 , 它的原理是让两个神经网络相互竞争 , 以生成与原始图像高度吻合的虚假图像 。 GANs能够有效地减少机器学习中所配置的人力资源 , 大幅提升机器的学习效率 。 GANs近年来在人工智能及深度学习等领域获得广泛应用 , 去年风靡一时的DeepFake软件也采用了这项技术 。
通过GANs , Maxine能够使用静态照片与面部关键点重建人物面部 , 智能地调整通话者的面部朝向 。 “我们能在一定角度内重构通话者的视觉影像 , ”研究人员表示 , “我们相信这能让用户在网络上的交流更加自然 。 ”
文章图片
图片来源:英伟达
Maxine并非一个直接面向消费者的软件 , 而是提供给第三方公司用以升级自家的视频通话系统 。 据英伟达官网显示 , 除了网络优化以外 , Maxine还能为开发者提供视频清晰度提升、噪音消除、实时翻译、字幕转录等功能 。
Maxine现已投入使用 。 此前 , 英伟达宣布与通信公司Avaya达成合作协议 , 后者将使用Maxine的部分功能 , 优化旗下多合一视频会议和协作应用程序Avaya Spaces的用户体验 。
推荐阅读
- 健身|体能提升打卡成功:增强体魄活力值升级,海联学子这样做……
- 经验教程|一款能做会议记录的视频会议软件
- 手机|手机被盗后,你的SIM卡成为了最大漏洞?
- 加密|苏州科达:拥有成熟的量子加密视频会议产品
- 防控|教育部召开教育系统疫情防控和学校传染病防控视频会议
- Zoom|ONE冠军赛:2020年第三季度合作伙伴公布,视频会议软件Zoom加入合作阵营!
- 直播|直播和短视频大火 让声卡成为行业新赛道
- 功能|NVIDIA宣布推出云AI视频流平台Maxine,让数百万远程工作与学习实现更好的连接