科技小辛辛|30年,《AI已来:让中国AI走向世界的王海峰》独特视角讲述中国AI( 四 )


王海峰下决心改变现状 , 没人写申报材料 , 他自己来写 。
在成果上 , 王海峰也和团队取得了飞速的成就 。
当时百度参加了国家高技术研究发展计划中的机器翻译项目 。 在立项时 , 王海峰表示他们可以在中英机器翻译上超过谷歌 , 当时在场的很多专家都表示难以置信 。
事实是最好的证明 , 这一项目的执行周期原本为三年 , 而百度翻译在一年多的时间里 , 就在中译英准确率上超过了谷歌 。
在百度“种植”AI
2010年王海峰在百度正式开启工作时 , 所做的第一件事就是成立了“自然语言处理部” 。
以服务搜索引擎中产生的相关需求 , 进而又在语音、图像技术上推进当时名为“多媒体部”的诞生 , 以及敲定了百度在知识图谱技术上的研发投入 。
对于今天的百度来说 , 这三个方向的累积可以说是为后续AI技术从无到有、深入发展奠定了至关重要的基础 。
例如2011年 , 百度推出的基于机器翻译技术的产品“百度翻译” , 就是在NLP部门的支持下完成 , 随后不断在这一产品框架下进行技术的更新迭代 。
科技小辛辛|30年,《AI已来:让中国AI走向世界的王海峰》独特视角讲述中国AI
文章图片
正是这种高频应用场景和先进技术的碰撞 , 让百度在2015年推出了世界上第一款互联网神经网络翻译系统 , 跑赢了谷歌、微软等企业 。
但王海峰对自己在百度的定位 , 远不止于NLP , 应当是把基础的学术能力泛化输出 。
于是几乎在成立了NLP部门的同一时期 , 王海峰就已开始着手布局语音技术和视觉技术 , 牵头组建了当时的“多媒体部” 。
在王海峰的极力推动下 , “多媒体部”很快就取得了大量的研发成果:
在语音方面 , 有围绕语音识别的复杂声学建模、海量语言模型和高速解码等关键技术;在图像方面 , 则进一步推进了图像识别、图像分类、图像搜索以及OCR等技术的完善 。在这一时刻 , 百度也在某种程度上完成了从产品需求引领技术更新 , 到技术进化推动产品革新的发展 。
在2012年年中 , 百度多媒体部门开始推动这些技术的产品化 , 使其进入了用户的视野 。
建立在图像的智能化理解能力之上 , 多媒体部门推出了一款图片搜索引擎“百度识图” 。 语音的智能化理解则被整合到了移动端 , 在手机百度、百度输入法、百度地图等产品中加入了语音输入功能 。2017年 , 百度股价再创巅峰 , AI成了最重要的功臣 。
其中很大一部分原因在于 , 百度不仅用AI技术对原有业务进行了提升 , 还进入了自动驾驶、语音交互硬件等全新的领域 。 业务范围的拓展 , 显然和技术能力的拓展不无关系 。
科技小辛辛|30年,《AI已来:让中国AI走向世界的王海峰》独特视角讲述中国AI
文章图片
建立在这一基础之上 , AI技术能力的累积 , 让百度在AI发展方向上 , 可以直接走向C端市场而不是仅仅向B端提供技术赋能 。
如今从百度AI的全面布局来看 , 王海峰建立的多媒体部 , 以及带领多媒体部所累积下的基础 , 可以说是确定了百度AI未来的发展轨迹 。
与此同时 , 在从学界到产业的不断探索中 , 王海峰发现了一个很有趣的问题 , 即“开源”和“开放”两个概念的异同 。
在科技企业的开发者生态中 , 开源是一种很普遍的文化 , 开发者们彼此分享源代码 , 通过对代码的修改编译来完善产品 。
很快王海峰就发现 , 对于AI来说 , 仅仅开源是不够的 。 大部分渴求应用AI技术的产业中并不具备专业的技术人才 , 对于它们来说 , 需要的是一个操作简便的平台 , 提交数据后就能直接获得结果 。
于是在机器翻译、NLP等领域取得突破成就的同一时期 , 他开始向前推进百度更大图景的技术平台化政策 。
直到如今 , 我们仍能够看到百度技术平台化的第二步工作——不断打造可供产业全流程使用的平台和工具接口 , 深入细节场景 , 最终形成了我们所看到的百度大脑AI开放平台 。


推荐阅读