AI干掉声优？音频大模型追逐“图灵时刻” _AI

七十年前，“人工智能之父”图灵提出，如果人无法判断屏幕的另一侧究竟是人还是机器，就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般，指引着AI行业的工作者们不断前进。
AI对物理世界的探索无疑是当下的热门话题。以ChatGPT和Sora为代表的AIGC展现出了令人震撼的表达能力，Sora更被认为是AI感知物理世界的初步探索。不过，上海大学计算机科学与技术系教授武星在璞跃中国日前举办的以“AIGC赋能产业创新”为主题的Global Tech.NETwork活动上表示，“我更赞同图灵奖获得者杨立昆的观点：Sora提示词中生成的大部分看起来逼真的视频并不表明视频理解了物理世界。”
【AI干掉声优？音频大模型追逐“图灵时刻”】喜马拉雅珠峰AI科技产品研发总监吕睿韬也持类似的观点，“Sora的表达虽然很好，但它本质是假装出来的，并没有真正理解世界的规则。”
AI与物理世界交互一般可以通过视频与音频，相比之下，音频似乎能够更早达到图灵时刻。
“目前音频产业界达成了共识：第一，未来一定是实时跨语种语音交互，这件事情会提前发生；第二是语音表达的人格化，现在所有的AI都在装作是人，但是音频模型到30B以上的时候，真的可能超越人。”吕睿韬在活动上表示， “喜马拉雅每天播放量的10%是AI大模型做的，（大家已经）分不出是真人还是AI了，这是音频大模型能力的涌现。”
“2023年所有的行业里的音频大模型其实都只复刻了音色，但这只占30%，并不是完全复刻人。”吕睿韬介绍称，“我们现在在做的是15秒60个字能够实现从腔调、口吻、音色，包括情感信息都可以学习到、极速生成的大模型。”
音频大模型不仅可以做语音，同时可以做音效和音乐，目前喜马拉雅正围绕主营业务做语音，包括对话形式，以及多角色、多情感的演绎能力等。吕睿韬称，去年国内很多短剧出海都是喜马拉雅在做的配套，短剧是有声书的视觉版，去掉短剧里的视觉，其实就是有声书，“如何让AI把有声书演好，这是当前的命题。”

AI干掉声优？音频大模型追逐“图灵时刻”

推荐阅读

激光去除老年斑

广州日报|5G基站、智慧路灯…这里有7公里“聪明路”

白醋洗脸有什么好处呢

小户型|小户型怎么增加储物？小户型设计上要注意什么

佛法厚黑|派对与美女互动无视距离，“世界第一”成众矢之的，德约科维奇和妻子都阳性

鱼腌制多长时间可以晒鱼腌制24小时可以晒了吗

简单快速的从GitHub同步代码

央视|反击来了！央视“为国撑腰”，一个决定令英方“苦不堪言”！

农悦|买回来养了不到一年，如今颜色，状态都不错，一盆乙女心逆袭脱变

驴打滚|我国最受欢迎的几种小吃，很多人听过没吃过，你都吃过哪些呢

香菇豆角蒸饺▲花样蒸饺的10做法大全

暗黑破坏神2重制版怎么看ping-暗黑破坏神2重制版分辨率怎么调-

卧室养花的危害卧室养花对身体好不好

孤独的大卫|地量再现反弹还能延续？

1.特朗普的利器，对于互联网公司的封杀

乐观的小刚科技还有90Hz电竞屏+50W快充，友商无奈清仓，骁龙855+手机跌至2299

红茶为什么要放奶和糖,荔枝红茶泡法

bi是什么孩子是同性恋怎么办

央视网|共同社：菅义伟有意参选自民党总裁

满江红|《满江红》成了“满江湖”？海报书法被猛批，全是错字别字江湖字