天擎|海纳百川 风云际会——气象大数据云平台“天擎”
中国气象报采访人员 刘钊 谷星月
集亿兆数据于一体 , 聚业务系统于一身 , 硬件、数据、流程、平台、监控全部集约化管理 , 数据秒级同步、需求秒级响应……长期以来 , 这样一个能够整合气象部门信息化资源 , 极大提高业务科研效率的平台 , 都存在于构想中 。 而如今 , 这个梦想正在照进现实 。
它 , 就是正在建设中的气象大数据云平台“天擎” 。
今年年初 , 中国气象局一号文件印发 , 聚焦推进气象业务技术体制重点改革 , 明确要求构建以气象大数据云平台为“云”、气象业务系统为“端”的“云+端”气象业务技术体制 。 “天擎”的建设关系到研究型业务试点、气象业务集约化发展、业务技术体制改革等党组重点工作任务 , 可谓是中国气象局关键共性核心技术平台 。 那么该平台建成后将给现有业务带来怎样的变化?让我们共同走近“天擎” , 一览“云上风景” 。
“天擎”因何而来?——适应大数据时代 , 推进气象业务系统转型升级
大数据时代的序幕已经开启 。 当前 , 气象部门已积累海量数据资源 , 随着监测更加精密化和多源数据广泛汇集 , 气象数据持续爆炸式增长 。 初步预计 , 部门内外气象数据到2022年将达到45PB , 日增量40TB 。 与此同时 , 海量数据快速汇聚和加工、长序列数据在线分析、部门内外多源数据综合应用、基于数据挖掘和机器学习而发展的智能预报和服务算法等都需要大数据技术支撑 。
当前的气象业务体制机制急需对接时代快轨 。 此前 , 全国综合气象信息共享平台(CIMISS)解决了国省应用统一数据源的问题 , 但各业务单位、业务系统间的“信息孤岛”“应用烟囱”问题仍未根本解决 , 建设气象大数据云平台是推动气象数据资源整合共享、促进气象业务集约化发展、推进业务流程优化再造的重要抓手之一 。
在这样的背景下 , “天擎”应运而生 , 它将负责解决数据集约、业务集约问题 , 有效支撑气象业务系统和各类数据应用 , 推进气象业务和政务管理技术体系的转型升级 。 “天擎”将采用云计算、大数据、人工智能等新型信息技术 , 提供“数算一体”的云上计算服务 , 支持智能预报和服务系统研发 , 全面支撑“云+端”生态运行 。 而与其同期建设的基础设施云平台 , 将为“天擎”提供硬件支撑 。
“天擎”将带来哪些改变?——全链条效能提升 , 全流程业务优化
从继承标准化建设成果、革新技术水平方面 , “天擎”脱胎自CIMISS , 但它大大扩展了业务范围 , 以一个更加开放的“数算一体”和“云+端”的姿态 , 成为气象业务的总引擎 。
“天擎”的本质特征是“云+端” , 也是气象业务技术体制的发展方向 。 “云”即气象大数据云平台 , 统筹管理观测、预报、服务、政务、行业、社会等完整权威的地球系统大数据 , 集成质量控制、统计加工、预报预警等全流程业务产品算法 , 统一产品加工流水线 , 提供“数据、算力、算法”三统一的平台化服务 。
【天擎|海纳百川 风云际会——气象大数据云平台“天擎”】“端”包括各类观测、预报预测、服务、管理等业务系统 , 也包括计算机、手机、各种传感器等硬件终端及其软件终端程序 。 通过推进气象业务系统与气象大数据云平台深度融合 , 减少中间环节 , 优化流程 , 实现数据、技术、业务融合 , 促进观测、预报、服务、管理业务高效协同 , 推进气象事业高质量发展 。
“数算一体”是“天擎”最大的特色 。 “数”即气象数据资源 , “算”即算法资源 , “数算一体”则是将数据和算法资源整合到一起 。 以往 , 各个气象业务系统各自调用其所需数据 , 重复存储、重复传输的现象非常普遍 。 而“数算一体”使得算法向数据靠拢 , 从而减少数据在网络上的传输 。 算法开发和运行者不用关心数据在哪里 , 只需开发和提交算法 , 就可运行出产品 。 “数算一体”的算力支撑和流水线调度运行 , 将使全局业务流程最优化 , 促进应用协同 。
未来 , “天擎”建设完成后 , 随着气象领域的数据孤岛连成一体、应用烟囱逐个打破 , “大”与“快”不再是“鱼与熊掌不可兼得” 。 在100PB级海量数据在线存储的同时 , 国省核心实时数据可实现秒级同步;全业务流程的加工算法将得到统一集成 , 可按业务自然时序 , 流水线调度运行;实时交互应用可实现亚秒级响应 , 历史长序列分析和多维空间分析秒级响应;新的信息技术支撑 , 可带动气象预报和服务模型的智能化发展 。
在这样一个开放、应用融入、知识产权清晰的平台上 , 气象部门将形成共建共享的良性业务生态 , 极大降低研发门槛和工作量 , 促进研究型业务发展 。
“天擎”如何拥抱未来?——开放架构 , 接纳新技术新需求
2019年7月 , 初具规模的1.0版“天擎”在国家级气象业务中上线测试运行 。 2020年7月 , 省级“天擎”完成部署 , 今年年底将在全国试运行 。
这个版本的天擎虽然还不是“完全体” , 但已经全面覆盖CIMISS的数据管理和服务功能 , 并实现全流程提速 。 在此基础上 , “天擎”增设了算法库与加工流水线 , 延长关键数据的历史序列 , 提升实时和历史数据质量 。 1.0版的“天擎”已经具备海量数据存储、全业务贯通、数据高效应用的能力 , 可直接支撑天气、气候预测 , 大气探测、公共服务、人工影响天气等各类气象业务应用的云化融入 , 形成“云+端”的生态环境 。