Dataphin-数据中台利器

Dataphin(智能数据构建与管理)是阿里巴巴数据中台团队研发的数据中台产品,它用于阿里集团(含蚂蚁科技)内部的数据中台建设,即它是阿里巴巴集团自己使用的数据中台产品 。。
Dataphin遵循阿里巴巴集团多年实战沉淀的大数据建设体系(OneData、OneID、OneService),集产品、技术、方法论于一体,一站式为用户提供集数据引入、规范定义、数据建模研发、数据资产管理、数据服务等的全链路智能数据构建及管理服务 。助力政府机构和企业打造属于自己的标准统一、资产化、服务化和闭环自优化的智能数据体系,以驱动创新 。主要功能模块包括:

  • 平台管理平台管理是Dataphin的基础功能,主要包含全局化功能设置、首页引导 。该功能模块帮助用户系统地了解和熟悉整个产品、快速开始工作,并进行必要的系统管理与控制,保障各模块正常运转 。

Dataphin-数据中台利器

文章插图
 
  • 全局设计基于业务全局,从顶层自下规划设计业务数据总线,包括:划分命名空间、定义主题域及相关名词、划分管理单元(即项目)、定义数据源及计算引擎源 。
  • 数据引入数据引入是基于全局设计定义的项目空间与物理数据源,将各业务系统、各类型的数据抽取加载至目标数据库 。这个过程可以实现数据同步与集成,完成各业务数据集成后的基础数据中心建设,为后续进一步加工数据奠定基础 。

Dataphin-数据中台利器

文章插图
 
  • 规范定义基于全局设计定义的业务总线、数据引入构建的基础数据中心,根据业务数据需求,结构化地定义数据元素(例如维度、统计指标),保障数据无二义性地标准化、规范化生产 。

Dataphin-数据中台利器

文章插图
 
  • 建模研发基于规范定义的数据元素,设计与构建可视化的数据模型 。数据模型提交发布后,系统智能自动化地生成代码与调度任务,完成公共数据中心的全托管建设 。

Dataphin-数据中台利器

文章插图
 
  • 编码研发基于通用的代码编辑页面,灵活地进行个性化的数据编码研发,完成任务发布 。
  • 资源及函数管理
    • 支持管理各种资源包(例如Jar、文本文件),以满足部分数据处理需求 。
    • 支持查找与使用内置的系统函数 。
    • 支持用户自定义函数,以满足数据研发的特殊加工需求 。
  • 调度运维对建模研发、编码研发生成的代码任务进行基于策略的调度与运维,确保所有任务正常有序地运行 。调度运维操作包括:部署数据生产任务、查看任务运行情况、管理及维护任务之间的依赖关系 。

Dataphin-数据中台利器

文章插图
 
  • 元数据中心支持采集、解析和管理基础数据中心、公共数据中心、萃取数据中心的元数据 。
  • 资产分析
    • 在元数据中心基础上,深度分析元数据,实现数据资产化管理 。
    • 为用户可视化地呈现资产分布、元数据详情等,方便用户快速查找、深度了解数据资产 。

Dataphin-数据中台利器

文章插图
 
  • 即席查询支持用户通过自定义SQL等方式,查询数据资产中的数据 。同时,通过查询分析引擎,快速获取物理表、逻辑表(即数据模型,或逻辑模型)的数据查询结果 。
 
为什么选择Dataphin?Dataphin在阿里巴巴内部管理EB级别数据、数以千万级别的表,本身产品能力已经在阿里巴巴海量数据的环境中得到验证 。
Dataphin致力于屏蔽不同计算与存储环境差异,帮助用户快速引入数据、标准规范化构建数据 。用户可以通过建模化方式自动开发数据、萃取以实体对象为中心的标签数据体系,沉淀业务数据知识与数据资产、治理数据问题 。同时,Dataphin还支持数据表查询、智能语音查询等多种类型的数据服务 。
【Dataphin-数据中台利器】选择Dataphin,用户可以轻松构建具有以下优势的数据体系: