|大橘财经:科大讯飞的AI科技树——从直播场景识别到智能医疗( 三 )


例如我们在学习机里面 , 基于我们的虚拟形象技术、结合我们的语音评测等技术 , 我们设计了一个可以实时互动的英文主播的教学 , 让整个英文的教学变得特别有趣 。 我们也来看一下演示的视频 。 这里面所有的内容都是合成出来的 。 未来我们也非常欢迎各位合作伙伴可以想一下在我们各自场景有没有什么样的需求 , 可以用我们的这样一些虚拟形象的技术 , 让大家在一些场景当中交互变得更加有意思 。
行业认知智能
我们知道认知智能相对于以上语音图像等感知智能其实难度更大 。 在过去几年 , 讯飞在向教育、医疗、政法等行业的认知智能取得了不错的进展 。 以医疗认知为例 , 我们在2017年11月份 , 医考机器人以456的高分通过了国家职业医师资格考试 。
在接下来的时间里面 , 我们基于领先的核心技术 , 深入到医疗辅诊的各个核心的刚需场景 , 去解决实际问题 , 推出了我们的智医助理的产品 , 并结合我们的各个场景、各个的数据去进行迭代的优化 , 花了大概两年左右的时间 , 实现了从核心技术到应用落地、再到大规模价值兑现的过程 。
具体来看 , 我们可以看到在智能分诊、病历、质检等医生看病的核心场景 , 我们的核心指标有了大幅度的进步 。 我们针对基层医疗机构的复诊合理率从70%提高到90%以上 。 同时我们相应的产品成果也在全国11个多省100多个区县 , 形成了大规模落地的根据地和案例 , 相关的复诊次数使用超过8000万次 。
同时 , 我们还在多个行业持续取得新的进展 , 例如在教育 , 我们今年全面升级了面向多个学科的以人推题的方案 , 满意率超过95% 。 我们在政法行业的刑事辅助判案系统 , 也向民商事去拓展 , 节省了20%以上的人力 。 我们面向金融领域的要素审核 , 准确率达到95%以上 , 审核效率提高30% 。
我想行业认知智能之所以能持续的突破 , 既依赖于我们核心技术的持续提升 , 也依赖于我们对行业理解 , 以及在此过程当中经验和数据的积累 。
通用知识技术提升方面 , 我们除了机器阅读理解的权威评测SQUAD任务当中持续取得突破 , 今年也在难度更大的多部推理机器阅读理解和综合评测能力的GLUE任务上取得了突破 。
【|大橘财经:科大讯飞的AI科技树——从直播场景识别到智能医疗】今年8月27日 , 讯飞哈工大联合实验室以我们自主研发的MacALBERT模型 , 在这个任务上取得了综合第一 , 这一成绩代表讯飞在认知智能的通用技术上 , 持续保持业界一流的水平 。
我们也基于这样的技术 , 针对中文领域 , 训练了业界效果领先的中文模型 , 并开放给业界 , 给研究人员提供相关的服务 , 目前这也是最受欢迎的中文预测的模型之一 。
但是 , 我们看到认知智能的落地和感知智能还是有很大区别的 。 例如在语音识别当中 , 如果我有一个好的算法 , 我可能通过API(Application Programming Interface , 应用程序接口——观察者网注)的方式 , 很快的就可以让大家体验到 。 但是认知智能 , 如果要是实现大规模真正应用落地 。 核心技术只是其中一环 。 问题定义和持续的迭代优化的方式都至关重要 。 例如在问题定义当中 , 场景的定义非常重要 , 我们需要在熟悉行业的流程 , 对行业知识非常了解的情况下 , 做好场景分析 , 做好整个方案的选择 , 再设定合理的技术方法 。
举个例子 , 当我们要做一个作文评分的时候 , 我到底是应该把整篇作文一起输进去 , 用一个端到端模型的方案来解决 , 还是分别针对每一个评分点 , 先评了之后再结合在一起 , 这些都会影响最终的效果 。 对行业的认识浅 , 流程设计不合理 , 以及技术方案选择不对 , 都会影响最终的认知智能的效果 。
也正是因为这个原因 , 目前业界相关的能力一般只能以单点的API能力来提供一些的服务 。 而我们在各个行业持续落地的过程中也一直在想 , 能用什么样的方式可以让我们的开发者和合作伙伴可以更好地享用到认知智能落地的一些成果 。


推荐阅读