科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxCompute( 五 )


科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxCompute现代化的数据仓库 + 数据湖解决方案数据湖成为了云上数据存储和交换的中心 , 大量的非结构化数据存放在OSS上 , 通过外表或者Spark直接与云上数据湖进行很好的打通 , 做联邦外表的查询 , 通过load命令将OSS上的数据快速的加载到数据仓库中 。 MaxCompute可以连接企业多种外部数据源 , 通过统一、一致的数据管理体系(MaxCompute统一元数据) , 多种来源的数据可在统一的计算环境中跨孤立存储系统进行无缝数据的访问和处理 。
科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxComputeBI+AI集成的一体化数据平台真实的人工智能场景依赖大数据平台提供数据供给 , 进行数据预处理 。 如何在企业统一的数据资产及安全体系之上 , 同时开展BI分析和AI分析 , 充分挖掘数据价值? 最理想的状态是不移动数据 , 将计算与数据解耦合 , 在一套平台上处理大数据AI的分析 。MaxCompute+PAI是大数据与人工智能融合的分析平台 , 利用PAI可以很好的处理MaxCompute中的数据 , 从而支持智能化分析 。
科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxCompute高性能低成本的技术底座数据平台发展到目前为止都是在解决性能、成本、效能等几方面的问题 , 若对比分析自建平台和MaxCompute中成本的比重 , 自建平台成本结构主要包括一次性软硬件成本、扩容、管理 , 运维等等方面的成本 。 MaxCompute成本结果包括云服务使用成本 , 但系统管理成本是非常低的 。 MaxCompute可以极大的减少前期投入 , 快速验证价值 。 其次 , MaxCompute在30TB及100TB数据级上都可以得到很好的性能 , 相比于Hadoop自建 , 成本低一半 , 性能快一倍 , 得到了TPC组织的官方认可 。 MaxCompute可以提供高性能、低成本的大数据分析服务 。 通过对比IDC自建平台与MaxCompute的成本 , MaxCompute可以节省1/3的真实TCO成本 。
科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxCompute
科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxComputeMaxCompute不止在离线仓上有很强的算力的能力 , 同时面向BI和集成分析场景 , 支持弹性并发加速的能力 。 从下图可以发现 , MaxCompute在不同的规模的测试集上都有非常优秀的表现 。
开放生态的数据平台抛开独立的技术平台 , 离不开周边系统的配套 , 离不开与企业环境的集成 。 MaxCompute拥有开放生态的服务 , 支持与众多服务集成 , 包括开放的一方服务接口 , 如MaxCompute Studio IDE、JDBC、SDK、开源Spark Connector、开源Kafka Connector、MMA迁移工具等 。 同时MaxCompute可以融入企业已有的IT环境中 , 与阿里云众多的服务进行深度的集成 , 包括DataWorks、PAI、Quick BI、Datahub、DTS、日志服务、阿里云Kafka等 , 最大化降低数据链路集成工作 。 MaxCompute 还集成了很多第三方的服务 , 包括Tableau、R、Python、Python SDK等 , 最终提升开发效率 。 阿里云提供了完整的大数据产品解决方案 , 包括数据的采集 , 实时离线一体化计算、数据应用的展示 , 以MaxCompute 作为数据仓库的底座可以快速的与阿里云多个产品集成 , 满足企业的智能化应用需求 。
科技报道|飞天大数据产品价值解读—SaaS模式云数据仓库MaxCompute企业级可治理的数据管理平台当企业发展到一定规模后 , 必然会遇到数据治理问题 。 数据与业务增长并不是线性关系 , 数据是指数级增长 , 业务是平滑增长 。 各个数据平台打通之后 , 数据治理的成本越来越高 。 阿里巴巴大数据治理最佳实践 , 提供数据发现机制 , 支持统一元数据采集与数据资产目录构建支持数据探查与数据分析、联邦查询以及资源优化服务 , 让企业更方便地探查数据价值 , 更有效的统一元数据管理 , 更安全的生产数据 , 更智能的优化大数据成本 。 以数据存储为例 , 很多数据存储在数据仓库中但无法使用 , 有些作业没有计算 , 有些作业重复计算 , 阿里通过自动化方式 , 围绕引擎采集第一手数据 , 提供多领域多视角优化视图 。


推荐阅读