吴甜|百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进

_原题为 百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进
7月9日 , 题为“智联世界、共同家园”的2020世界人工智能大会以“云端峰会”形式准时呈现 。 本次大会 , 人工智能再次成为聚光灯下闪耀的“明星” , 它不仅被称为防控疫情的“援兵” , 也是经济复苏的“后手” 。 百度作为人工智能领域的资优生 , 与本次大会更有千丝万缕的联系:百度董事长兼CEO李彦宏在演讲中首次提出“AI发展三阶段”、以中文名“文心”亮相的ERNIE获得大会颁布的最高奖项SAIL奖 (Super AI Leader , 卓越人工智能引领者)、联合举办“开发者日百度公开课”……
7月11日下午 , 百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在开发者日中提出了AI平台与产业结合的最新思考、行业应用案例 , 吴甜表示:“现在正处于产业智能化全速推进的时代 , 一系列AI大生产平台可以更好地满足产业的多样化需求 , 开发者、企业无需从头学习难度高、迭代快的前沿科技 , 加速企业智能化转型 。 ”同时 , 吴甜还详细解析了获得本届世界人工智能大会最高奖的文心(ERNIE) , 揭开其背后的“神秘”技术 。
吴甜|百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进
文章图片

随着NLP预训练模型和迁移学习机制技术的突破 , 对于使用场景更加分散、场景本身更加复杂的NLP任务 , 百度推出了快速、高效实现开发需求的不同平台及技术解决方案 , 比如2019年首次提出的文心(ERNIE) 。 文心(ERNIE)是取得世界级突破的语义理解技术解决方案 , 基于百度的深度学习平台飞桨 , 文心将机器理解语言的水平提升到一个新的高度 , 为计算机带来了认知智能领域的巨大跨域 。
【吴甜|百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进】吴甜|百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进
文章图片

文心(ERNIE)的核心技术优势在于 , 它开创性地将大数据预训练与多源丰富知识相结合 , 通过持续学习技术 , 不断吸收海量文本数据中词汇、结构、语义等方面的新知识 , 实现模型效果不断进化 , 如同人类持续学习一样 。 这让它在16个中英文典型NLP任务上显著超越当时世界最好效果 。
目前 , 文心已预置各类预训练模型 , 涵盖医疗、金融、法律等行业 , 并集成了轻量级模型和全系列NLP算法 , 满足不同企业开发者需求 。 以金融行业为例 , 该领域各场景对NLP技术都有较强的依赖 , 尤其是金融文档的信息抽取、金融信贷的风控等方面 。 度小满金融结合文心的预训练模型 , 对各种信息进行语义层面的深度建模 , 有效提升风控识别效果 。 此外 , 在用户更容易感知的百度搜索中也有文心的身影 , 且大幅提升了搜索体验 。
其实 , 不管是何领域 , 针对场景的快速部署都离不开一系列AI大生产平台 , AI大生产平台打通了人工智能产业应用落地相关的全流程 , 实现了AI技术的标准化、自动化、模块化 。 AI大生产平台可以避免企业开发者“重复造轮子” , 有效降低开发者使用AI的门槛 , 实现低成本、快速应用 。
吴甜提到 , 飞桨深度学习平台是AI大生产平台的重要基础底座 , 它能为AI应用生产提供核心框架、工具组件、服务平台等全方位的支撑 。 针对企业强烈的应用需求 , 百度推出飞桨企业版 。 企业版基于企业级需求 , 增强了相应的特性 , 包括提供更全面和强大的功能、更易用的可视化界面、预置更丰富的场景模型 , 以及更强化的安全权限管理等 。
现阶段 , 飞桨已悄然应用到各类行业场景中 , 吴甜在分享中带来垃圾自动分类方案的实践案例 。 目前 , 垃圾处理分类工作由机器和人协同完成 , 人工垃圾分类效率低、易分错 , 还存在想象不到的健康风险 。 在飞桨的加持下 , 垃圾分类的许多问题已取得令人欣喜的进展 。 基于飞桨平台 , 通过目标检测、图像分割、高效部署等过程 , 结合知识蒸馏算法与飞桨的分布式训练 , 以及智能云平台上的AI算力支持 , 垃圾分类解决方案集成在生产线后可以有效减少4到6个操作工人的人力成本 , 将分拣的效率从93%左右提升到了97%以上 。
吴甜|百度集团副总裁吴甜:AI大生产平台帮助产业智能化快速推进
文章图片

从2020年开始 , 疫情的突发给人们的生产和生活带来了巨大改变 , 人工智能的重要性也再一次引起社会各界的关注 。 在这场疫情防控攻坚战中 , 人工智能凭借高效、精准的技术应用成为当之无愧的“智慧”担当 。 在这场与时间赛跑的竞赛中 , 百度为合作伙伴技术赋能 , 6天推出基于百度OCR的社区疫情防控系统 , 迅速摸清社区居民的健康状况及流动情况;14天为中国疾控中心的公众号和小程序上线疫情问答机器人 , 全天候解答关于疫情和复工复产等问题;3天实现北京地铁口罩人脸监测系统的快速部署 , 并在7天内进行两次模型升级……
不难看出 , 深度学习技术已成为开发者的“利器” , 为了让开发者能使用到更多、更好的预训练加迁移学习机制 , 飞桨不断增加预训练模型库等数据 , 对比2019年11月数据 , 目前飞桨的预训练模型库数量增长137% , 模型的下载量增长了17% 。 Fune-tune的任务数量增长了124% 。 与此同时 , 这个不断强大的“开发利器”也吸引了更多开发者使用 , 据吴甜透露 , 目前飞桨平台整体已经支持超过190万的开发者 , 服务了有超过8万家企业 , 基于飞桨平台产生了23万以上的模型 , 全面覆盖通信、电力、城市管理、民生、工业、农业、林业、工艺等众多行业 。 为推进AI人才发展 , 百度开设了一系列相关课程 , 帮助开发者更快上手企业实际开发任务 。


推荐阅读