【DeepTech深科技|AI 思路解决社会痛点AI 营养师背后的技术积累与突破搜狗 AI 更大的想象空间,太逼真!自然交互+知识计算,搜狗打造首款AI营养师赋能万亿大健康市场用】( 二 )


此次搜狗通过AI分身打造的逼真形象与自然语言的交互方式 , 让AI营养师与人们的日常距离更加贴近 , 在拥有强大计算推理能力的同时 , 又能给人以亲近感和信服感 。
AI营养师背后的技术积累与突破一款好用的产品背后 , 往往是对技术的创新突破和融会贯通 , 对于搜狗AI营养师来说 , 能实现既逼真又智能的体验背后得益于搜狗的两大核心技术:AI分身和知识计算 。
直观层面 , 先说说AI营养师为什么会这么“真” 。 背后的搜狗AI分身技术其实主要由两大引擎组成 , 即语音合成引擎和形象合成引擎 , 基于少量目标说话人的音视频数据 , 通过行业领先的多模态合成技术 , 即可完成对目标说话人AI分身的定制 。 最后的呈现效果就是只要输入一段文本 , 就能生成与真人无异的播报效果 。
过去几年 , 搜狗在知识计算方面也一直持续积累保持业内优势 , 搜狗搜索开发的汪仔机器人登录江苏卫视的《一站到底》节目 , 成为中文的知识问答竞赛中首个战胜人类的机器人 。 此外 , 还曾在WMT、IWSLT、NTCIR、StanfordCOQA、NLPCC举办的机器翻译、人机对话、阅读理解、信息抽取等多个任务中取得第一的成绩 , 还开源了业内最全阅读理解工具集合 。
在推出AI营养师之前 , 搜狗基于AI分身技术还曾打造过AI合成主播、AI虚拟法官、AI客服等分身应用 , 都引起了不小的关注度 , 搜狗在这条技术路径上也独树一帜 。
在当下的人工智能行业 , 多数企业在AI形象方面都是采用3D技术塑造一个虚拟形象 , 但这跟真人比起来仍存在明显差异 , 难以实际应用起来 , 而真人驱动的AI技术 , 目前比较集中在人脸检测、面部追踪、实时渲染等诸多分散方面的能力 , 这些都尚不具备输入文本驱动虚拟形象的视频生成能力 。
搜狗AI分身研发团队找到了这样的市场切入点填补了技术空白 , 也成为了搜狗在AI战略层面的特色差异化打法 , 可以把人从重复性高和任务量大的工作中拯救出来 。
而此次搜狗AI营养师这一职业分身与此前分身相比最大的突破是 , 如果此前只有信息的输入和输出播报 , 那么本次推出的AI营养师则是真正具备自己的知识储备、交互能力和推理能力的 。
相比外观形象逼真 , 让机器人有智商 , 具备理解、推理能力显然是更难的一件事 , 尤其还要保障其推理结果的正确性和可靠性 。
图|AI营养师的知识计算和推理过程(来源:搜狗)
【DeepTech深科技|AI 思路解决社会痛点AI 营养师背后的技术积累与突破搜狗 AI 更大的想象空间,太逼真!自然交互+知识计算,搜狗打造首款AI营养师赋能万亿大健康市场用】
文章图片
以AI营养师的实际应用场景为例 , 比如一个生活中常见的问题:老年人得了高血压夏天能吃西瓜吗?对于用户来说 , 需要的并不是一个简单的判断结果 , 而是需要更多有针对性的解答和建议 。
所以在知识计算环节 , AI营养师首先要做的并不是武断地判断能不能吃 , 而是要先通过多轮交互精准理解用户的主需 , 充分掌握该用户更全面的基础疾病或慢性病情况 , 解析出“人群:老年人;疾病:高血压;主需:能不能吃西瓜 , 衍生:吃什么水果好”四大元素 , 从而构建起一个用户的整体画像 , 基于此 , 再将用户口语化的语言 , 与专业术语相关联 , 对问题做拆解和识别 , 综合多个知识库的知识计算推理过程 , 从而得出针对用户不同饮食需求问题的个性化膳食指导 。
在过去一年 , 搜狗通过与中国营养学会的合作 , 搭建了疾病人群膳食建议知识库和食物营养成分知识库 , 构建了目前国内饮食营养领域最全面最权威的营养健康知识图谱 。
据了解 , 搜狗AI营养师目前已覆盖18种不同人群的人群库、超过1800种食材营养素的食材库以及超过2000种疾病饮食建议的疾病库 , 这是AI营养师可信任的基础 , 对于整个大健康行业来说堪称一大创新成果 。 未来 , 希望通过人机对话的方式为公众营造沉浸式体验 , 较大程度提升医疗健康科普的有效性 。


推荐阅读