面网|天猫精灵发布了 3 款音箱,还带来了首个全场景、多模态的人机交互系统( 二 )


△ 天猫精灵事业部总经理库伟
AliGenie5.0 将唇动、手势、语音语义等多种形态的信息输入融合在一起 , 可通过多模态感知的方式理解人类的交流意图 , 并直接给出反馈 。
同时 , 支持分布式的微内核操作系统 , 能够覆盖更广阔的的应用场景 。
此外 , AliGenie5.0 还支持「云应用」技术 , 能够突破硬件的配置和性能限制 , 跨平台、跨终端 , 流畅使用 Windows、Linux、Android 等系统的丰富应用 , 用户甚至可以在天猫精灵上玩电脑游戏、上网课、体验 3D 渲染等 。
面网|天猫精灵发布了 3 款音箱,还带来了首个全场景、多模态的人机交互系统
文章图片
△ 全场景、多模态人机交互系统 AliGenie5.0
目前 , 这一系统已率先应用在此次发布的三款新品上 , 使天猫精灵具备了自然唤醒的能力 。
面网|天猫精灵发布了 3 款音箱,还带来了首个全场景、多模态的人机交互系统
文章图片

例如 , 用户在音箱端开启设置「自然唤醒」后 , 在 1 米左右的距离下 , 当机器识别到有人开始盯着它说话时 , 不用再喊出唤醒词 , 就能直接自然对话 。
值得一提的是 , 天猫精灵 CC Mini 还集成了阿里自研的微内核操作系统 , 也是全球首个搭载微内核系统的智能音箱 , 能够在小屏的产品上实现触屏交互 , 把生活常用的闹钟、日程、家居控制等功能进行整合 , 开发了晨起、睡眠等核心场景的极简模式 , 让生活中的微小需求也能被智能化 。
面网|天猫精灵发布了 3 款音箱,还带来了首个全场景、多模态的人机交互系统
文章图片

在应用层面 , 全是「云化」的 , 是用支付宝小程序的框架搭建出来的 , 本质上是一个微内核加小程序的数码产品 。
库伟强调说 。
而天猫精灵的下一步计划 , 则是将这一全场景、多模态人机交互系统开放出去 。
今年内会陆续支持汽车、房产、智能健康、儿童教育等领域的联合定制产品 , 覆盖 80 多个终端品类 。 未来在生态内的智能场景中 , 天猫精灵的用户只要使用同一个账号登录 , 就可以进入个人界面 , 无差别的使用智能助手 。
智能终端的设备量正处于快速爆发期 , 随身穿戴、车载、智能家居、智慧社区、酒店、养老院等需要终端设备来服务消费者的领域 , 都将逐步被智能化改造 。
库伟认为 , 智能音箱的形态 , 已经完成了「AI 智能助手」第一阶段的市场普及 , 未来将出现更多具备多种交互形态、提供 AI 助手能力的产品形态 , 天猫精灵也正在研发具备视觉交互、语音交互甚至行动能力的全场景智能设备 。
当智能场景越来越繁杂时 , 就需要一个可动态适配所有场景的人机交互系统 , 来确保消费者体验的一致性 , AliGenie 也将不断升级 , 为机器赋予认知、理解和行动力 , 让每个人、每个家庭都拥有一个专属的智能助手 。
微信号:shenzhenware
主笔:陈壹零 / 深圳湾
【面网|天猫精灵发布了 3 款音箱,还带来了首个全场景、多模态的人机交互系统】编辑:陈述 / 深圳湾


推荐阅读