数据平台的4个阶段:从数据库到数仓再到中台,超详细的架构全解( 四 )


【数据平台的4个阶段:从数据库到数仓再到中台,超详细的架构全解】2、在数据层面上
数据仓库的数据来源主要来源于RDBMS , 其中存储的数据格式以结构化数据为主 , 这些数据并非企业全量数据 , 而是根据企业业务需求做针对性整合、抽取 。数据平台和数据中台的数据来源的期望都是全域级的数据 , 主要有结构化数据、半结构化数据、非结构化数据等
3、在目标层面上

  • 数据仓库基于单机的 , 一旦数据量变大 , 会受单机容量、计算以及性能等方面的限制 。主要用来做报表分析 , 目的性相对来说单一 , 只是针对相关分析报表用到基础数据 , 进行抽取、整合、数据清洗和分析 。比如 , 新增一张报表 , 就要从底层到上层再做一次 , 流程上相对来说繁琐;
  • 数据平台建立是为了解决数据仓库不能处理非结构化数据和报表开发周期长的问题以及计算和性能等问题 。汇集整合打通数据 , 数据清洗后 , 当业务提出需求的时候 , 把业务方需要的若干个小数据集单独提取出来 , 以数据集的形式提供给业务方去使用;
  • 数据中台通常会对来自多方面的基础数据进行数据清洗后 , 然后按照主题域的概念建立多个以事物为主的主题域;和数据平台在底层建设上都是基于分布式计算平台和存储平台 , 理论上可以通过无限扩充平台的计算和存储能力 。目标是都是为了融合整个企业的全域级数据 , 打通数据之间的隔阂 , 消除数据标准和口径不统一的问题 。
4、在应用层面上
建立在数据中台上的数据应用场景 , 不仅仅只是面向于数据报表开发分析与展示处理 , 更多是将数据变成服务化的方式 , 然后提供给业务系统 。




推荐阅读