数据|如何看待人工智能未来十年的发展?
图片
图片
本文由公众号“苏宁金融研究院”原创 , 作者为苏宁金融研究院金融科技研究中心主任助理王元 , 首图来自壹图网 。
2020年是不寻常的一年 , 全球的健康、贸易、经济、文化、政治和科技领域 , 无不发生着深刻的变化 。 笔者所在的科技领域 , 也恰逢现代人工智能(简称AI)发展10周年 。 前10年 , 人工智能技术得到了长足的发展 , 但也留下许多问题有待解决 。 那么 , 未来AI技术将会如何发展呢?本文将结合学术界、工业界的研究成果 , 以及笔者个人研究见解 , 从算力、数据、算法、工程化4个维度 , 与读者一起探索和展望AI发展的未来 。
一
数据
我们首先分析数据的发展趋势 。 数据对人工智能 , 犹如食材对美味菜肴 , 过去10年 , 数据的获取无论是数量 , 还是质量 , 又或者是数据的种类 , 均增长显著 , 支撑着AI技术的发展 。 未来 , 数据层面的发展会有哪些趋势呢 , 我们来看一组分析数据 。
首先 , 世界互联网用户的基数已达到十亿量级 , 随着物联网、5G技术的进一步发展 , 会带来更多数据源和传输层面的能力提升 , 因此可以预见的是 , 数据的总量将继续快速发展 , 且增速加快 。 参考IDC的数据报告(图1) , 数据总量预计将从2018年的33ZB(1ZB=106GB) , 增长到2025年的175ZB 。
图片
其次 , 数据的存储位置 , 业界预测仍将以集中存储为主 , 且数据利用公有云存储的比例将逐年提高 , 如图2、图3所示 。
图片
图片
以上对于未来数据的趋势 , 可以总结为:数量持续增长;云端集中存储为主;公有云渗透率持续增长 。 站在AI技术的角度 , 可以预期数据量的持续供给是有保证的 。
另一个方面 , AI技术需要的不仅仅是原始数据 , 很多还需要标注数据 。 标注数据可分为自动标注、半自动标注、人工标注3个类别 。
那么 , 标注数据未来的趋势会是怎样的?
我们可从标注数据工具市场的趋势窥探一二 , 如图4所示 。 可以看到 , 人工标注数据在未来的5-10年内 , 大概率依然是标注数据的主要来源 , 占比超过75% 。
图片
通过以上数据维度的分析与预测 , 我们可以得到的判断是 , 数据量本身不会限制AI技术 , 但是人工标注的成本与规模很可能成为限制AI技术发展的因素 , 这将倒逼AI技术从算法和技术本身有所突破 , 有效解决对数据特别是人工标注数据的依赖 。
二
算力
我们再来看看算力 。 算力对于AI技术 , 如同厨房灶台对于美味佳肴一样 , 本质是一种基础设施的支撑 。
算力指的是实现AI系统所需要的硬件计算能力 。 半导体计算类芯片的发展是AI算力的根本源动力 , 好消息是 , 虽然半导体行业发展有起有落 , 并一直伴随着是否可持续性的怀疑 , 但是半导体行业著名的“摩尔定律”已经经受住了120年考验(图5) , 相信未来5-10年依然能够平稳发展 。
图片
不过 , 值得注意的是 , 摩尔定律在计算芯片领域依然维持 , 很大原因是因为图形处理器(GPU)的迅速发展 , 弥补了通用处理器(CPU)发展的趋缓 , 如图6所示 , 从图中可以看出GPU的晶体管数量增长已超过CPU , CPU晶体管开始落后于摩尔定律 。
推荐阅读
- Spacex|卫星互联网轨道资源稀缺,中国航天如何与国际卫星界大亨竞争?
- 数据|智领云荣登“中国大数据企业50强” | 2020大数据产业生态大会盛大召开
- iQOO手机|毕业想换5G手机不知如何选?别犹豫了,iQOO Z1x适合你
- 大数据|华云数据荣获中国大数据50强、2020数字赋能先锋企业30强,入选大数据产业发展白皮书及百佳案例
- 蓝橡树|牛娃爸爸分享: 孩子如何通过学习编程, 激活大脑, 提升成绩, 逆袭名校?
- 驱动中国|即信Fintech智研中心:银行践行社交化运营的要诀--渠道通 交互通 数据通
- 行业互联网|华云数据荣获中国大数据50强、2020数字赋能先锋企业30强,入选大数据产业发展白皮书及百佳案例
- 技术编程|数据结构001之简介
- 行业互联网|爱数亮相第八届医药健康论坛,以数据赋能药企数字化
- 行业互联网|智领云荣登“中国大数据企业50强”| 大数据产业生态大会