和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来( 二 )


和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来
本文插图
【和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来】

在堪称NLP底座的知识领域 , 百度打造了世界上最大规模知识图谱 , 拥有超过50亿实体和5500亿事实 , 并在不断演进和更新 。 百度知识图谱应用于各行各业 , 每天的调用次数超过400亿次 。
和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来
本文插图

在此基础上 , 百度不断强化堪称NLP核心的语义理解技术能力 。 2019年3月 , 百度提出知识增强的语义理解框架ERNIE , 在深度学习的基础上融入知识 , 具备人类一样的学习能力 , 曾一举登顶全球权威数据集GLUE榜单 , 首次突破90分大关 。 基于知识图谱和语义表示 , 实现了阅读理解、对话理解以及跨模态深度语义理解 。
为了让人机交互自然流畅 , 语言生成技术是NLP体验的关键 。 基于预训练技术的成功经验 , 百度提出基于多流机制的语言生成预训练技术 , 兼顾词、短语等不同粒度的语义信息 , 显著提升生成效果 。 百度也探索了多文档摘要生成 , 通过图结构语义表示引入篇章知识 , 在单文档和多文档摘要生成效果都有提升 。
这些技术蓝图流入产业谱系 , 就构成了百度NLP技术在应用层面的深耕与实践 。 在对话系统领域 , 百度提出了知识图谱驱动的对话控制技术 , 以及首个基于隐空间的大规模开放域对话模型PLATO等 , 并推出智能对话定制和服务平台UNIT , 可帮助开发者高效构建智能对话系统 , 实现规模化应用 。
在另一个重要的NLP应用机器翻译领域 , 百度翻译目前能够支持200多种语言 , 每日响应超过千亿字符的翻译请求 , 支持超过40多万家第三方应用 , 技术上 , 提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等 。
百度大脑语言与知识技术的探索 , 同时还以平台化的方式输出 , 赋能千行万业 , 提升社会生产的普遍智能化水准 。
和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来
本文插图

从这张根据公开数据整理的全球NLP巨头产业布局对比图中 , 我们可以发现百度NLP在核心技术、产品应用布局 , 以及研发力量储备上 , 都已经具备了国际一流水准 , 可以与谷歌、微软两大AI巨头一教高下 。 百度NLP的产业成绩 , 已经客观达成了国内最强、世界顶级 , 开启了代表中国NLP产业向未来航行的领军者态势 。
和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来
本文插图

十年蕴育成了百度NLP蓝图 , 同时也蕴育了百度在语言与知识领域的不断突破与创新能力 。 今天 , 百度NLP并没有停下脚步 , 而是为千行万业与广大AI开发者带来了最浪漫的七夕礼物 。
此刻的浪漫:5款新产品、2大计划 ,
推动NLP邂逅产业
推动NLP技术走向产业 , 融入智能化进程 , 是以深度学习为代表的AI第四次兴起周期中最重要的产业议题之一 。 而这一目标 , 是建立在大量可规模化复用、能够支撑工业级应用的NLP技术与产品基础上的 。 为此 , 百度在七夕这天带来了重磅的NLP礼物——百度集团副总裁吴甜接续发布文心(ERNIE)、TextMind、AI同传会议解决方案、智能创作平台、智能对话定制与服务平台UNIT等5款新产品:
百度推出的语义理解技术与平台文心(ERNIE) , 基于深度学习平台飞桨打造 , 提供一站式NLP开发与服务 , 将减少开发者90%数据标注量、90%算力投入、85%模型开发时长 , 进而全面降低NLP定制开发的成本 , 让开发者更简单、高效地定制企业级NLP模型 。
和讯名家|跨过语言银河,构筑智能鹊桥:百度NLP的十年、今夕与未来


推荐阅读