|探索图数据库在数据资产可视化中的应用( 二 )


图数据库是基于图模型的数据库 。 相比较于关系型数据库 , 图数据库是真正注重“关系”的数据库 。 图数据库的主要职能是管理图数据 , 因此需要支持高效的对顶点/边的查询与更新;为了方便用户的使用 , 通常还需要增加对事务(transaction)的支持 , 从而保证并发操作下的正常运作 。
图广泛存在于现实世界中 , 从社交网络到金融关系 , 都会涉及大量的高度关联数据 。 这些数据构成了庞大的图 , 图数据库就是呈现和查询这些关联的方式 。 这种联系形成了一种互相关联的数据 , 联系才是数据的本质所在 。 传统的关系型数据库并不能很好地表现数据的联系 , 而一些NoSQL(Not Only SQL , 非关系型数据库)数据库又不能表现数据之间的联系 。 同样属于NoSQL范畴的图数据库是以图的结构形式来存储数据的 , 它所存储的就是联系的数据 , 是关联数据本身 。
然而关联数据中的联系本来就很复杂 , 若要在关系型数据库中使用结构化形式来表现这种联系 , 则一般不能直接表示 , 处理起来既繁琐又费事 , 并且随着数据的不断增长 , 其访问性能将日趋下降 。 无数的开发人员和数据库管理人员都或多或少地使用过关系型数据库 , 在其应用的规模化进展过程中 , 对于数据库的性能优化往往捉襟见肘、陷入窘境 。 图数据库没有模式结构的定义 , 也不需要这些定义 , 它使用非结构化的方式来存储关联数据 , 所以能够直接表现数据的关联特性 。
图数据库的发展趋势
|探索图数据库在数据资产可视化中的应用
本文插图

在众多不同的数据模型里 , 关系数据模型自20世纪80年代就处于统治地位 , 而且出现了不少巨头 , 如Oracle、MySQL , 它们也被称为:关系数据库管理系统(RDBMS) 。 然而 , 随着关系数据库使用范围的不断扩大 , 也暴露出一些它始终无法解决问题 , 其中最主要的是数据建模中的一些缺陷和问题 , 以及在大数据量和多服务器之上进行水平伸缩的限制 。 同时 , 互联网发展也产生了一些新的趋势变化:用户、系统和传感器产生的数据量呈指数增长 , 数据量不断增加 , 大数据的存储和处理;新时代互联网形势下的问题急迫性 , 这一问题因互联网+、社交网络 , 智能推荐等的大规模兴起和繁荣而变得越加紧迫 。 而在应对这些趋势时 , 关系数据库产生了更多的不适应性 , 从而导致大量解决这些问题中某些特定方面的不同技术出现 , 它们可以与现有RDBMS相互配合或代替它们 。 过去的几年间 , 出现了大量新型数据库 , 它们被统称为NoSQL数据库 。 其中图数据库从最近十年的表现来看已经成为关注度最高 , 也是发展趋势最明显的数据库类型 。
NoSQL数据库分为四种类型 , 分别是:

  • 键值(key/value)数据库
  • 列存储数据库
  • 文档型数据库
  • 图数据库
上图就是db-engines.com对从2013年来所有数据库种类发展趋势的分析结果如图展示 。 图(Graph)是非常强大的工具 , 因为它们通过以简洁的形式表示数据关系 , 帮助商业世界和其他机构中的人们理解数据集 。 有了合适的图数据库 , 企业可以以关系图的形式可视化数据 , 并对其进行管理 , 以提高整体效能 。 比起传统数据库的数据存储 , 图数据库能够清晰的展现点与点之间的关系 。 许多组织之所以接受图数据库 , 是因为越来越多的行业认识到这种数据库技术的重要性 , 尤其在复杂的场景下 , 如物流 , 金融风控 , 社交网络管理 , 媒体传播分析等行业正在发挥不可或缺的作用 。
图数据库是分析数据间关联的最佳技术
图数据库对于可以在不同场景下发挥作用 , 从企业应用角度 , 业务用户使用角度 , 数据开发者应用角度都发挥着作用 。
|探索图数据库在数据资产可视化中的应用


推荐阅读