研发|雷科技专访小米崔宝秋:技术研发的幕后推动者

小米成立十周年,技术研发已成外界评判这家明星公司未来发展的重要指标。
去年,小米成立技术委员会,这被视作其全力攻坚核心技术研发及前沿科创领域的一大标志性举动。
而作为小米技术委员会首任主席,崔宝秋开始为更多人所熟知。
崔宝秋,本科毕业于武汉大学计算机系,拥有纽约州立大学石溪分校计算机博士学位。2012年6月,崔宝秋回国加入小米,组建人工智能与云平台团队,其后主导“云计算-大数据-人工智能”技术发展路线。2019年2月,崔宝秋担任小米集团副总裁、小米技术委员会主席。2019年4月,小米技术委员会全阵容班底正式亮相。
 研发|雷科技专访小米崔宝秋:技术研发的幕后推动者
文章图片
在崔宝秋的带领下,成立一年半的小米技术委员会又交出了一份怎样的答卷?
近期,雷科技等平台对崔宝秋进行了专访。站在小米成立十周年的历史节点,崔宝秋分享了自己对小米技术研发、用户隐私安全及小米未来发展的思考和感悟。
小米的技术研发路线图
近年来,小米持续加码研发投入。雷军在小米十周年公开演讲中透露,2020年小米研发预算达到100亿元。如何用好小米愈加大额的研发预算,雷军要认真考虑,崔宝秋更要时刻思索。
而从最近一年半的各项动作来看,小米面向未来的技术研发路线图已然浮出水面。
一、在设备端,小米形成了“手机+AIoT”两大核心引擎的技术研发体系。
【 研发|雷科技专访小米崔宝秋:技术研发的幕后推动者】从拍照到快充,从“灵弦算法”到AI相机,小米手机这两年拿出了不少自研新技术。例如最新发布的小米10至尊纪念版,小米自研的虚化算法在DxOMark中取得了单项特性75分的好成绩,并助力其相机DxOMark总分达到130,排名世界第一。这是小米手机虚化特性的历史最高分,也是当前的业内并列最高分。
而在AIoT设备领域,不管是生态链的扫地机器人产品,还是最新推出的小米透明电视,无不展现出小米对引领更多设备领域技术发展的强烈渴望。
二、在技术平台搭建上,小米形成了以“小爱同学”为中心的AI技术平台体系。
按照崔宝秋的话讲,小爱同学是小米“手机+AIoT”双引擎的控制中心。
我一直强调小爱同学不仅仅是一个语音助理,更是小米的AI,“小爱”中的这个“爱”就是AI,未来小爱同学就是小米的AI系统能力。
而如何通过小米在AI、IoT、大数据以及生态链所有端上的这些优势,打造一个无处不在、无所不能的小米AI能力系统,正是崔宝秋在关注和思索的课题。
当然,小爱同学目前在技术上的主攻点依然是智能语音。崔宝秋认为,语音交互是未来多模态交互中最重要的一种交互方式,小爱同学设备需要更加敏锐、正确地感知用户的需求,在这背后则需要小米自然语言处理技术能够更好认知用户需求,包括更加智能地预测用户需求。故而围绕语音技术研发这条线,崔宝秋表示小米的布局会非常深。
前沿技术研发的快速推进,往往离不开技术大牛的带动作用。在小米技术委员会成立后八个月,崔宝秋就请来了国际语音识别和AI领域知名教授Daniel Povey。
 研发|雷科技专访小米崔宝秋:技术研发的幕后推动者
文章图片
Daniel Povey,为大众更熟知的身份是语音识别开源工具Kaldi之父。Kaldi集成了多种语音识别模型,被认为是业界语音识别框架的基石,不仅受到人工智能学习和应用者的强度关注,而且极大推进了全球语音识别领域的发展。
崔宝秋表示,Daniel Povey加入小米后正在助其语音技术进一步做大、做强和做深。
我们想围绕语音从唤醒、识别到理解,再到未来更智能的多轮对话,带来更有人情味的,甚至有智商,让人感受有情商的小爱同学,这是我们要做的。
而就目前发展情况而言,小爱同学拥有如下核心技能:
语音技术:高灵敏度的语音唤醒、多场景高精度的语音识别、针对不同使用人群的声纹识别、语音合成等;
自然语言处理技术:语言处理基础技术、文本审核、情感分析、机器翻译、智能聊天等;
声学技术:波束形成、声源定位、去混响、降噪、回声消除、分布式拾音等;
智能问答技术:智能场景、个性化回复、多轮交互、情绪识别等。
需要指出的是,小爱同学并不是小米AI技术平台体系的全部。小爱同学之外,小米AI技术平台体系还涉及深度学习、计算机视觉及知识图谱等领域。
在计算机视觉领域,小米已经把人脸算法、人体算法、图像识别、图像增强、OCR等技术应用在设备端。
在深度学习领域,小米已经推出了端云协同的组合开发工具:移动端深度学习框架MACE和深度学习云服务平台Cloud-ML。
AI发展愈加强调在设备端上的能力技术,而小米早在2017年底就在内部推出了自研的移动端深度学习框架MACE,同时支持CPU、GPU和不同底层芯片。而在最新的MIUI 12中,小米手机用户亦可体验到MACE带来的诸如健康领域的“灵弦算法”以及拍摄领域的“魔法换天”、AI相机等功能。
MACE同样可以帮助小爱同学提升技能。崔宝秋介绍,小爱音箱的一些智能能力,未来是可以在设备端实现的,不一定非要来到云平台处理。比如,你带音箱出去玩,在非联网环境下,你提出一些问题,小爱依然可以理解你的意思,并向你提供对应的服务。


推荐阅读