|观潮百度NLP十年:语言知识全布局,5款产品新发布、2大计划( 三 )


AI 同声传译方面 , 百度首次提出了基于语义单元的同传模型 , 结合全局话题及上下文信息进行翻译 , 实现了高质量低延时的同声传译系统 , 达到了与人类翻译相当的水平 。 针对很多语种数据稀缺的问题 , 百度提出了稀缺语种分组混合训练算法和多语言联合编码框架 , 实现了 200 多种语言之间的翻译 。 截至目前 , 百度的翻译系统已支持 200 多种语言 , 每天响应超过千亿字符的翻译请求 , 支持超过 40 多万家第三方应用 。
「复杂知识表示和快速构建技术 , 知识与深度学习进一步的融合 , 融合感知与认知的跨模态语义理解技术 , 模型可解释性和鲁棒性等方面 , 仍有很多技术难题需要研究和解决 , 」王海峰表示 。 「但我们对未来充满信心 , 百度会继续探索让机器掌握知识、理解语言、拥有智能的能力 。 」
5 款产品新发布、2 大计划
除了这些技术的总结和展望之外 , 在这次活动中 , 百度还一口气发布了文心、TextMind、AI 同传会议解决方案 3 款新产品 , 智能创作平台面向媒体的 3 个场景方案 , 智能对话定制与服务平台 UNIT 的 3 项全新升级以及数据共建和算力共享计划 。
|观潮百度NLP十年:语言知识全布局,5款产品新发布、2大计划
本文插图

语义理解技术与平台「文心」
首先是 NLP 的核心语义理解 。 目前使用机器做文本处理的需求广泛存在 , 通用算法 API 已无法满足一些场景 , 而传统深度学习处理特定任务的方法则需要专业人员花费大量时间打造 。 文心基于深度学习平台飞桨打造 , 其目标是帮助企业开发者更低成本、更方便地将最新的语义理解技术应用于自己的场景 。
今天所说的「文心」 , 「是以刷新各项 NLP 任务记录的 ERNIE 核心技术为依托 , 集成优秀的预训练模型、全面的 NLP 算法集、端到端开发套件和平台 , 提供一站式 NLP 开发与服务 。 」百度集团副总裁吴甜表示 。
使用这个工具有多方便?吴甜现场以一个情感分析任务为例 , 将标注好的 100 条商品评论倾向性数据导入到平台(文心也提供智能标注能力) , 随后选择预训练模型和算法 , 点击任务提交 , 模型开始训练 。 训练结束后 , 平台会对模型效果进行自动评估 。 最后 , 训练好的模型可一键发布 , 开发者可通过 API 服务直接进行调用 。
|观潮百度NLP十年:语言知识全布局,5款产品新发布、2大计划
本文插图

文心全面降低 NLP 定制开发成本 , 将减少开发者 90% 数据标注量、90% 算力投入、85% 模型开发时长 。
百度表示 , 文心在各类真实场景中淬炼 , 已具备领先的工业级应用实力 。 目前 , 文心广泛用于百度产品中 , 累计支持业界开发者超过 2 万名 , 应用场景覆盖金融、通信、教育、电商等各行各业 , 显著提升企业 NLP 应用效果和效率 。
智能文档分析平台 TextMind
有可供开发定制模型的平台 , 也有普通人直接可以上手的 AI 办公套件 。 百度发布的 TextMind 是一款企业文档分析平台 , 目前已提供包括文档解析、文档比对、文档审核在内的一站式解决方案 。
|观潮百度NLP十年:语言知识全布局,5款产品新发布、2大计划
本文插图

这款工具的特点简单说来就是「多快好省」:它支持多达 20 类文档、6 种格式;可以让之前需要 3-5 个工作日的工作 1 分钟完成;预置文档解析能力 , 企业开箱即用 , 实现零门槛定制;在文档规范化解析应用之后 , 公司相应的人力成本可以降低 80% 以上 。
除了语言理解 , 还有可以生成内容的产品 。 2019 年初 , 百度智能创作平台上线 , 目前在媒体等行业已有很多应用 。 本次平台的升级面向媒体推出 3 个场景方案 , 可以让 AI 帮媒体人更好地进行创作 。


推荐阅读