文心|百度世界2020大会NLP技术全面升级 文心ERNIE加速启动产业落地
_原题为 百度世界2020大会NLP技术全面升级 文心ERNIE加速启动产业落地
语言与知识技术的相关研究进展 , 影响着人工智能理解世界的方式 。 9月15日 , 一年一度的科技圈盛会百度世界2020大会于线上召开 , 总台央视主持人康辉 , 与百度创始人、董事长兼首席执行官(CEO)李彦宏的“虚拟人”在千万观众面前亮相 , 不仅动作自然、栩栩如生 , 更与真人进行多轮流畅交互 , 引发网友惊叹 , 满足了人们对未来时代“智能管家”的许多想象 。
而为虚拟人理解世界、理解语言起到关键作用的 , 正是语言与知识技术 。 在当天下午举办的百度大脑分论坛上 , 来自百度的杰出架构师、文心(ERNIE)负责人孙宇登台演说 , 介绍知识增强语义理解框架文心(ERNIE)在语言理解、语言生成和跨模态语义理解等能力上的重大突破 。 此外 , 百度大脑提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强跨模态语义理解技术ERNIE-ViL , 其中 , ERNIE-ViL首次将场景图知识融入到跨模态的预训练模型中 。 孙宇还介绍 , 百度文心语义理解技术平台可为企业提供一整套NLP定制与应用能力 , 目前已累计支持2万余名开发者 , 覆盖金融、通信、教育、电商等行业 。
文章图片
百度杰出架构师、文心(ERNIE)负责人孙宇
语义理解核心技术升级 , 文心多项NLP技术全球领先
据了解 , 知识增强语义理解框架文心(ERNIE)于去年发布 , 大幅提升机器理解语言的水平 , 更在国际权威的通用语言理解评估基准 GLUE上首次突破90大关 , 超越人类三个点 , 获得全球第一 。 文心的创新点在于 , 将大数据预训练与多源丰富知识相结合 , 持续学习海量文本中词汇、结构、语义等方面的知识 , 实现模型效果不断进化 , 如同人类持续学习一般 。
分论坛上 , 孙宇介绍 , 百度文心语义理解技术包括基于预训练的语义表示、文章理解、文本匹配、文本生成等技术 , 以及可识别理解法律、金融文本的领域语义理解技术 , 并布局了跨模态、多语言、图理解等前沿技术 , 形成了涵盖基础、应用、领域、拓展四大层面的全景图 。
在常识知识、多粒度语言知识、场景图知识等多源知识学习的支持下 , 文心语义理解能力、语言生成能力和多模态语义理解能力都得到了进一步提升和拓展 。 同时 , 基于海量数据 , 百度大脑构造了多粒度自编码任务和指代消解任务 , 推动文心在情感分析、文本分类、阅读理解等八项典型自然语言理解任务效果上获得进一步显著提升 。
文章图片
自然语言生成方面 , 文心提出了基于多流机制的预训练语言生成技术:ERNIE-GEN , 在摘要生成、问题生成、多轮问答等自然语言生成任务上效果突出 。 同时 , 文心设计了多流注意力机制 , 融合逐词生成和逐片段生成学习目标 , 学习语言中多粒度知识后 , 全面刷新了语言生成任务的世界最好效果 , 在学术界和产业界具备非常大的研究价值与应用价值 。
文心更在多模态语义理解上取得重大突破 , 视觉推理技术ERNIE-ViL可以通过物体识别体育运动图片中的运动场地及图中人物 , 进一步区分人员衣服颜色 , 根据知识判断穿出裁判和运动员的身份 。 理解细粒度语义的能力在这个推理的任务中发挥了关键的作用 。 ERNIE-ViL是业界首次将场景图知识融入到跨模态的预训练模型中 , 已广泛应用于工业场景 。
能力平台化 , 百度大脑文心实现语义理解技术工业级应用落地
在人工智能技术落地的进程中 , 实际需求往往呈现出应用复杂、成本高企、耗时过长、可迭代性差等痛点 。 对此 , 文心语义理解技术平台应运而生 。
孙宇介绍 , 文心平台基于领先的语义理解技术 , 可为企业提供一整套NLP定制与应用能力 , 让开发者更加简单高效地定制企业级NLP模型 。 在文心平台化服务中 , 提供了针对数据处理、模型训练、模型评估、模型部署等环节的“工具箱” , 一站式满足开发者各类应用需求 。 此外 , 文心还提供了零门槛AI开发平台EasyDL和全功能AI开发平台BML两种平台支持方式 。
【文心|百度世界2020大会NLP技术全面升级 文心ERNIE加速启动产业落地】
文章图片
一站式的NLP开发能力 , 既可以满足开发者的需求 , 也降低了定制开发的成本 。 在落地实践中 , 传统产品需要5100条数据标注以训练模型 , 而文心平均仅需220条 , 降低了90%的数据标注量 。 同时 , 文心通过预训练模型 , 降低了90%以上的算力投入 , 及86%的模型开发时长 , 周期从一周缩短为一天 , 这对企业开发者更加友好 。
文心的另一大优势在于经过真实场景淬炼 。 据介绍 , 文心已应用于百度内部包括搜索引擎、推荐系统、智能音箱、智能客服等几十条产品线 , 其工业级应用能力已得到验证 。 目前 , 文心已经将NLP技术输送到金融、通信、教育、电商等行业 , 显著提升了这些企业智能应用的效果和效率 。
推荐阅读
- 卫生|郑州市九院举办2020年“世界精神卫生日”宣传活动
- 环游世界的猫柠|国庆最热门景区,游客只要上去了就别想下来,不是西湖也非故宫
- 牛头人|魔兽世界中已经被遗忘的有趣设定,风怒无限触发,牛头人没有坐骑
- 科学|世界3大未解之谜:生命起源、地球内核、宇宙之谜,该如何解释?
- 德左|世界上仅存的苏维埃国家, 制度文化都没变, 跟中国八十年代差不多
- 华为|任正非谈面对美国要自强和开放,华为可做到综合优势世界第一
- 补贴|遭百度、嘀嗒围攻,焦虑的滴滴发“百亿补贴”求增长
- 技术升级|F5G+IPv6打破连接障碍,共同构建智能联接新世界
- 功能|手写方式只适合父母一辈?试试百度输入法,你会彻底改变想法
- Apollo|@所有北京市民,百度Apollo上线的这份出行福利请查收!