知识|解读布局、发布新品、共建数据集 百度AI七夕的硬核“浪漫”
_原题为 解读布局、发布新品、共建数据集 百度AI七夕的硬核“浪漫”
自然语言理解(NLP)素有“人工智能皇冠上的明珠”盛誉 , 这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展 。
8月25日 , 以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会举行 , 百度CTO王海峰发表主旨演讲 , 解读百度语言与知识技术的发展历程与最新成果 , 与产学研各界分享技术及产业发展趋势和展望 , 百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划 , 重磅推出5款产品的新发布 , 全面加速AI技术大规模应用 。 这是一场凝聚了百度在语言与知识领域十年技术积累和产业实践的盛会 , 必将带来深远影响 。
文章图片
(百度CTO王海峰)
十年:开拓者、深耕者、引领者
【知识|解读布局、发布新品、共建数据集 百度AI七夕的硬核“浪漫”】语言与知识技术是人工智能认知能力的核心 。 2010年 , 百度成立自然语言处理部 , 在前瞻技术与产业格局上不断引领、创新 , 十年间已成为中国NLP发展的一面旗帜 。
峰会上 , 王海峰回顾 , “在百度语言与知识技术的布局和发展中 , 我们始终在注意把握两个趋势 , 即技术发展趋势和产业发展趋势 , 并力争引领趋势 。 ”
纵览百度语言与知识技术发展历程 , 从研究方法、研究对象、研究方向、产业应用等各个层面 , 布局完整 , 不断打磨成熟 , 始终与应用的发展趋势、需求一脉相承 , 与产业接轨 。
十年来 , 百度大脑语言与知识技术成果丰硕 , 获得包括国家科技进步奖在内的20多个奖项 , 30多项国际竞赛冠军 , 发表学术论文超过300篇 , 申请专利2000多项 。 技术不断突破创新的同时 , 也在产品上创新探索 , 同时将领先的技术输出给开发者与合作伙伴 , 提升各行业智能化水平 。
全面分享语言与知识技术成果
王海峰全面分享了百度语言与知识技术完整布局和最新成果 。
首先 , 知识图谱是机器认知世界的重要基础 , 百度打造了世界上最大规模知识图谱 , 拥有超过50亿实体和5500亿事实 , 并在不断演进和更新 。 百度知识图谱应用于各行各业 , 每天的调用次数超过400亿次 。
其次 , 在融入知识的基础上 , 语言理解能力不断增强 。 2019年3月 , 百度提出知识增强的语义理解框架ERNIE , 在深度学习的基础上融入知识 , 同时具备持续学习能力 , 曾一举登顶全球权威数据集GLUE榜单 , 首次突破90分大关 , 刷新榜单历史 。 基于知识图谱和语义表示 , 突破了阅读理解、对话理解以及跨模态深度语义理解等技术 。
第三 , 语言生成是语言与知识技术中的重要组成部分 。 基于预训练技术的成功经验 , 百度提出基于多流机制的语言生成预训练技术 , 兼顾词、短语等不同粒度的语义信息 , 显著提升生成效果 。 百度也探索了多文档摘要生成 , 通过图结构语义表示引入篇章知识 , 在单文档和多文档摘要生成效果都有提升 。
应用系统层面 , 对话系统和机器翻译等成绩卓著 。 百度提出了知识图谱驱动的对话控制技术 , 以及首个基于隐空间的大规模开放域对话模型PLATO等 , 并推出智能对话定制和服务平台UNIT , 帮助开发者高效构建智能对话系统 , 实现规模化应用 。 百度翻译支持200多种语言 , 每天响应超过千亿字符的翻译请求 , 支持超过40多万家第三方应用 , 技术上 , 提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等 。
百度大脑语言与知识技术的持续探索和创新取得了令业界瞩目的成绩 , 同时这些技术以平台化的方式输出 , 赋能千行万业 , 持续提升产业智能化水平 。
重磅推出5款产品的新发布、2大计划
王海峰首次发布了百度大脑语言与知识产品全景图 。 百度集团副总裁吴甜接续发布语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品 , 同时发布了6项升级 , 包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项全新升级 。
吴甜表示 , “我们一直致力于将语言与知识技术凝聚成一系列技术平台和产品 , 在应用中产生大量价值 , 为广大开发者和产业实践者提供以语言与知识技术为核心驱动的系列产品 。 ”
百度推出的语义理解技术与平台文心 , 基于深度学习平台飞桨打造 , 依托领先的语义理解核心技术 , 集成优秀的预训练模型、全面的NLP算法集、端到端开发套件和平台 , 提供一站式NLP开发与服务 , 让开发者更简单、高效地定制企业级NLP模型 。 文心经过了大量真实应用场景的淬炼 , 具备优秀的工业级落地实力 。
全新发布的智能文档分析平台TextMind , 基于OCR、NLP技术 , 以文档解析为核心能力 , 支持文档对比与文档审核 , 具备“多快好省”的核心优势 , 促进企业办公智能升级 。
百度大脑智能创作平台针对媒体应用场景再升级 , 全新推出智能策划、智能采编、智能审校三大媒体场景方案 , 进一步助力媒体人更快、更好地创作 , 可谓切中媒体人的“痛点” 。
推荐阅读
- 知识百科|《送你一朵小红花》定档,我看出了易烊千玺的事业心
- 科学知识|「图片新闻」兰州市欣欣嘉园社区和倍豪智创科技中心联合开展“探索七彩世界·普及科学知识”实践活动
- 丽珠集团|券商晨会精要 | 8月28日,丽珠集团创新生物药+高端复杂制剂长远布局
- 大呼长|半岛亲子游首发活动“有味道”的旅行 小朋友们大呼长知识
- 之高科篇|高质量发展看淄博之高科篇丨行业制高点:布局四大主业 脚步不停歇
- 知识科普|幸芙手机消毒舱:手机专用黑科技消毒设备,快给你手机消个毒
- 审判庭|青岛知识产权法庭日照巡回审判庭揭牌成立
- [中国经营报]百度网盘:布局个人“云时代”中国经营报2020-08-29 06:46:310阅
- 基础知识|ui设计的基础知识,有哪些是你不了解的?
- 硬件|中国半导体投资解读:前7月投资总额达去年全年两倍