【数据平台的4个阶段:从数据库到数仓再到中台,超详细的架构全解】2、在数据层面上
数据仓库的数据来源主要来源于RDBMS , 其中存储的数据格式以结构化数据为主 , 这些数据并非企业全量数据 , 而是根据企业业务需求做针对性整合、抽取 。数据平台和数据中台的数据来源的期望都是全域级的数据 , 主要有结构化数据、半结构化数据、非结构化数据等
3、在目标层面上
- 数据仓库基于单机的 , 一旦数据量变大 , 会受单机容量、计算以及性能等方面的限制 。主要用来做报表分析 , 目的性相对来说单一 , 只是针对相关分析报表用到基础数据 , 进行抽取、整合、数据清洗和分析 。比如 , 新增一张报表 , 就要从底层到上层再做一次 , 流程上相对来说繁琐;
- 数据平台建立是为了解决数据仓库不能处理非结构化数据和报表开发周期长的问题以及计算和性能等问题 。汇集整合打通数据 , 数据清洗后 , 当业务提出需求的时候 , 把业务方需要的若干个小数据集单独提取出来 , 以数据集的形式提供给业务方去使用;
- 数据中台通常会对来自多方面的基础数据进行数据清洗后 , 然后按照主题域的概念建立多个以事物为主的主题域;和数据平台在底层建设上都是基于分布式计算平台和存储平台 , 理论上可以通过无限扩充平台的计算和存储能力 。目标是都是为了融合整个企业的全域级数据 , 打通数据之间的隔阂 , 消除数据标准和口径不统一的问题 。
建立在数据中台上的数据应用场景 , 不仅仅只是面向于数据报表开发分析与展示处理 , 更多是将数据变成服务化的方式 , 然后提供给业务系统 。
推荐阅读
- linux内核驱动第1讲:带你编写一个最简单的字符设备驱动
- 印度尼西亚吃的特产有哪些?
- 淘宝买的与实物不符 淘宝材料与商品不符
- Java 分布式任务调度平台:PowerJob 快速开始+配置详解
- 淘宝店铺体检中心在哪里 淘宝的体检中心在哪
- 北京43所学校入选2020年度“全国青少年人工智能活动特色单位”!快来看看有你的学校吗?
- 开淘宝c店的流程 c店可以升级企业店铺
- 淘宝卖家怎么找店小二申诉 对淘宝小二的判定结果不服如何申诉
- SpringBoot下使用定时任务的方式全揭秘
- 枸杞菊花百合茶的功效,百合枸杞金银花茶的做法