行业互联网|景联文科技:数据标注是AI实现智能的关键


导语:在人工智能时代 , 数据作为一种信息战略资源 , 被赋予了极为重要的意义 , 新的黄金、新的石油、新的货币……但数据本身是没有意义的 , 只有通过采集、清洗、标注 , 数据才具有市场价值 。

行业互联网|景联文科技:数据标注是AI实现智能的关键
本文插图

新基建浪潮呼啸而来 , 人工智能产业乘风而上 。 AI作为许多领域数字化与智能化转型的基础与关键 , 在这场时代风口前迎来了新腾飞 。
这场自上而下的变革中 , 大量AI需求被释放 , 直接刺激了源头产业 , 站在人工智能产业链上游的数据服务商 , 首先吃到了红利 。
据国内知名AI数据服务商景联文科技透露 , 近几个月来 , 公司接洽的客户量明显上升 , 有几个科技大厂订单进入了合同阶段 , 其中一个“万人采集”的项目已经启动 。
对于人工智能产业而言 , 应用层AI产品的落地发展离不开数据的支撑 , 在智能化大潮来临之时 , AI数据产业进入了新一轮加速期 。
数据是AI智能化的关键
“没有数据 , 就没有人工智能 。 ”这是行业内普遍认同的观点 。
目前主流的深度学习算法 , 本质是在神经网络系统中 , 调节和优化各个层级之间的权重和阈值 , 当层数越多 , 对输入特征的抽象层次就越高 , 这也意味着算法模型能够处理更复杂、抽象的任务 , 同时 , 对数据的需求也就越大 。

行业互联网|景联文科技:数据标注是AI实现智能的关键
本文插图

Facebook AI研究院负责人、深度学习三巨头之一的Yann LeCun曾坦言 , “你需要数据来训练你的系统 , 你的数据越多 , 你的系统就会越精准 。 所以 , 从技术目标和商业角度来看 , 数据越多越好 。 ”
低质量数据 , 掣肘AI发展落地
在智能化成为时代趋势的今天 , 许多领域都在积极拥抱AI 。 从随喊即应的智能音箱 , 到能够辅助诊断的智能医疗系统 , 利用AI为自身赋能 , 升级迭代的领域与企业越来越多 , 数据需求如雨后春笋般冒出 , 前所未有地旺盛 。
面对这一蓝海市场 , 大批竞争者涌入 , 乱象频发 。 因为定制采集成本过高 , 有中小型供应商直接在网络上抓取或者购买灰产数据 , 而标注业务则是经过一层层转包 , 中间商赚得盆满钵满 , 交付的数据一塌糊涂 。
据景联文科技总经理刘云涛介绍 , 这种行业“默认”做法隐患其实非常大 , 一是数据质量堪忧 , 二是隐私、安全问题 。

行业互联网|景联文科技:数据标注是AI实现智能的关键
本文插图

AI技术要实现商业化落地 , 进入到我们的生活 , 这个过程必然需要大量高质量、能被机器识别理解的结构化数据投入训练 。 因此 , 无论出于技术还是商业需求 , 都需要景联文科技这类品牌数据服务提供商介入 , 通过输送合理、安全、干净的标注数据 , 助力人工智能快速实现落地 。
景联文科技:高质量数据为AI赋能
杭州景联文科技有限公司成立于2012年 , 早期专注于指纹防伪技术 , 算法发家 , 连续两届拿下LivDet:Fingerprint Liveness Detection Competition(国际活体指纹检测大赛)第一名 , 在该领域拥有多项自主知识产权专利及软件著作权 , 曾三次参与国家标准制定 , 与华为、阿里巴巴、海康威视、群晖科技、浙江省公安厅、公安部物证鉴定中心等企业、机构达成了深入合作 。
2016年 , 景联文敏锐嗅到了AI数据市场的巨大潜力 , 带着多年处理敏感数据的经验 , 以及长期深耕To B市场的流程管理经验积累 , 全力投入AI数据采集标注产业 。
经过四年的沉淀 , 景联文已经发展出了一套完整的标准化流程体系 , 从前期需求沟通 , 到数据质检交付 , 流程规范可追溯 , 并且还上线了自有标注平台 , 覆盖多类标注工具 , 确保数据安全 。


推荐阅读