原创 清华教授陈国青:大数据带来的冲击、挑战和机遇( 三 )

陈国青教授介绍 , 从商务形态的角度看 , 大数据时代可以分为两个阶段 。 第一个阶段是数据商务阶段 。 这个阶段不断地把现实生活中的要素 , 人财物都进一步数据化 , 同时根据这些数据化的人财物进行算法的应用 。

第二个阶段是算法商务阶段 。 当我们像素足够高的时候 , 我们的重点就变成了成像了 , 即重点变成算法应用 。

数据商务阶段就像做菜一样 , 数据化的过程就是不断准备材料的过程 , 不停地增加和丰富材料 , 然后根据已有的材料提供不同的菜品 。 但是算法商务阶段是材料已经足够丰富了 , “这个时候要比的就是手艺了 , 你是不是能够做得更好、更多 。 这就是我们所说的算法进阶及应用创新 , 如‘智能+’ , 我们可以用更加高尖的智能技术 , 包括人工智能的很多技术在现有的大规模数据下进行应用 。 ”

大数据的数据特征

陈国青教授指出大数据的数据特征可以从4个维度来理解 , 即4V:volume(容量)、variety(种类)、velocity(速度)、value(价值) 。

第一 , 大数据意味着超规模(Volume) 。 大数据的规模从一般意义上讲具有大规模、海量的含义 , 但是没有绝对的量纲标准 , 而是和领域及其问题相关 。 超规模是指超出了原有领域和问题规模边界的大规模 。 比如企业大数据 , 与之前不同的一个地方在于 , 此时的数据规模常常超越了企业本身传统的内部数据边界 , 而是延伸到了企业外部 , 成为一种社会化的企业数据 。

第二 , 大数据意味着多样性(Variety) 。 富媒体(RichMedia)大大扩展了人们的数字化生活体验 , 全球数据和数字流量中80%-90%都是文本、视频、语音、图像 , 而不是过去以二维的、规范化的、非常简单数据形式为主的结构化数据 。


推荐阅读