数据|专访澳鹏田小鹏博士:以AI数据服务,赋能各行业AI商业化进程( 二 )


中国的人工智能舞台更是潜力巨大 。 我国《新一代人工智能发展规划》提出:到2030年 , 中国人工智能核心产业规模将超过1万亿元 , 带动相关产业规模超过10万亿元 。
AI算法是车 , 数据是油
根据国际数据公司(IDC)2018年末的测算 , 2018年至2025年 , 全球的数据总量将由33ZB增加至175ZB 。 其中 , 中国的数据增长量将保持30%的增长速度 , 将是所有地区中增长速度最快的 。 同样 , 数据量的激增也催生出了数据服务行业这一庞大的市场 。
机器强于人的地方在于它能够存储、处理大量数据 。 过去 , 机器得到的数据是人类获取并选择性录入 , 它所产出的结论充满局限性 。 而现在 , 在人工智能的帮助下 , 机器能够自己听、自己看 , 海量数据(603138,股吧)信息的记录与分析为各行各业的日常决策与长远发展带来前所未有的改变 。
但问题来了——机器存储、处理的大量数据 , 从何处获取 , 如何获取成了关键 。 人工智能商业化在算力、算法和技术方面基本达到阶段性成熟 , 想要加速落地 , 解决行业具体痛点 , 就需要大量经过标注处理的相关数据做算法支撑 。
数据决定了AI的落地程度 , 是商业化过程中重要的一环 。
田博士举了一个生动的例子 。 同样是看月亮 , 在不同的经度 , 不同的纬度中 , 会有差异 。 如果采用在一个国家的不同地方所观察到的月亮 , 而不是在全球各个地方实地观察 , 那么其标注的数据一旦应用于全世界数据中 , 错误的数据将会给后续一系列应用带来错误的结果 。
用AI来服务AI , 赋与AI最初始的、准确的数据是基础 。 “如果把AI中的算法比作是车 , 那么数据便是油 , 想要车跑得更快、更好 , ‘喂’给它高质量的油必不可少 。 ”田博士称 。
智能化转型的机遇与挑战
今年6月 , 在澳鹏(Appen)全球发布的2020年AI现状年度报告《AI与机器学习的现状》中 , 近四分之三的调研企业组织表示AI对他们的业务而言至关重要 , 越来越多的企业开始将负责任的初始数据作为其实现业务成功的因素之一 , 这是机遇 。
然而 , 人工智能项目的成功部署并没有那么容易 。 据研究机构Gartner的调研显示 , 在2019年 , 只有不到20%的人工智能项目成功部署 。 其中 , 数据问题正是部署失败的主要原因之一 , 这对于企业而言是一个无法避免的挑战 。
随着技术的不断发展 , 传统企业一定会走向AI的道路 , 在这条道路上 , 他们对于数据的需求相较于以往提出了更高的要求:第1是需要大量的高质量数据;第2是数据的安全性、保密性、私密性及无歧视要求;第3是要求采标一体化 。
田博士指出 , 企业自己完成这些数据任务是具有挑战性的 , 并且成本高昂 , 处理不当时甚至可能弊大于利 。 对于希望高效完成AI部署的企业而言 , 与专业的数据伙伴开展合作尤为重要 。
“20多年以来 , 澳鹏与全球领先的AI公司合作 , 提供高质量的多样化可扩展标注选择 , 包括:先进的人工智能辅助数据标注平台、遍布全球的多语言专家、全球超过一百万的众包资源 , 满足180多种语言、方言和多样化安全需求 , 以及符合道德规范的数据来源及公平的众包报酬 , 降低品牌可能面临的潜在风险 。 我们的部署速度比市场平均速度快三倍以上 。 ”田博士如是说 。
澳鹏的未来
关于澳鹏未来的战略规划 , 田博士称 , 澳鹏将对其人工智能辅助数据标注平台的几个重点领域加大投入:
1. 标注工具箱 , 继续优化部分高复杂度的数据交付场景 , 比如自动驾驶2D、3D标注;
2. 模型辅助平台 , 研发行业一流的基于迁移学习和主动学习框架的在线预标注平台 , 大幅提升人机协同效率 , 为客户创造价值;
3. 企业级数据API和可视化分析平台 , 研发企业级数据API和可视化分析平台 , 将平台无缝接入客户的模型研发流程 , 进一步提升数据+模型的迭代效率 。


推荐阅读