肢体语言|研究动态｜语音驱动姿势生成模型来了，肢体语言比总统候选人还丰富( 三 ) |语音|姿势|

全身姿态的人体相似性评估结果。
缺陷
这项研究在 reddit 上引起了广泛关注和讨论。除了对模型效果表示赞叹以外，也有网友发现了其中需要改进的地方。
例如，有网友指出：「这个模型可以恰当地对节奏和语音强度做出反应，但它似乎并不怎么关注真实的语音信息内容。」
对此，作者之一 Gustav Eje Henter 表示同意：
你说的对！这个模型仅倾听语音（没有文本输入），但并不包含任何人类语言模型。我认为，使用这类模型生成具备语义意义的姿势（尤其还要与语音节奏保持一致）仍是一个未解难题。
该网友还提出了数据问题：「要想使模型达到合理的效果，可能需要大规模数据集。」
对于， Henter 也表示认同：
数据是目前的主要瓶颈。该模型基于同一个人的大约四小时的姿势和语音数据。我们很难找到足够的高质量语音和动作平行数据。一些研究者使用 TED 演讲，但是从此类视频中提取的姿势动作看起来不具备说服力，不够自然。（好的运动数据需要运动捕捉设置和仔细的数据处理。）因此，该研究目前使用的是较小型的高质量数据集。
参考链接：
https://www.reddit.com/r/MachineLearning/comments/hpv0wm/r_stylecontrollable_speechdriven_gesture/
https://www.reddit.com/r/MachineLearning/comments/hpv0wm/r_stylecontrollable_speechdriven_gesture/fxuytg1/
【肢体语言|研究动态｜语音驱动姿势生成模型来了，肢体语言比总统候选人还丰富】

肢体语言|研究动态｜语音驱动姿势生成模型来了，肢体语言比总统候选人还丰富( 三 )

推荐阅读

杭州|“我们就是鬼迷了心窍！”俩姑娘千里迢迢来杭州自首了

u1s2啥意思 u1s1是什么意思

使用浓替硝唑含漱液有哪些不良反应？

辨别|身体出问题了，嘴唇会给你“暗示”！教你如何从唇色辨别健康

朱之文|彩礼28万，婚车50万，法式豪宅，朱之文娶儿媳为啥这么舍得下本？

财经无忌谁将领跑中国功能饮料的下一个十年，答案在这里，千亿市场背后

【户籍】上海户籍人口期望寿命逾83岁

周樵夫|潜意识会有这些痕迹，藏不住的，有过关系的人

揭秘北上资金：连续5日加仓161只个股（附部分名单）

【小夜情感故事】世事漫随，一梦浮生，3星座再遇旧爱，人间温柔，2020年

湘湘爱美食|降温解暑还美容养颜，做一大锅都不够吃，高阶版西米露

#大表哥聊数码#游戏党们千万别入坑，公认续航最差的四款手机

如何写好高考作文(好的语文作文标题)

秧歌步怎么走?

杂技演员|沙宝亮英勇救人！路上遇车祸钻车将被困人员拉出，善举获赞无数

#冷炮历史飞虎#汉产防护服出口支援国际抗疫，供电保障按下“加速键”

亲朋|23桌婚宴放倒30多名亲友!岳父都进了医院,还有人发烧做核酸检测

大头聊娱室|吞并70个国家，差点成为中国统治者，中国一部落曾经被视为蛮夷

个人教学工作总结(个人教育教学经验总结)

怎样更改或取消GMAT考试