「遥感」21世纪地球都有哪些变化?AI“天眼”带您回溯

◎科技日报记者 张佳星
卫星虽被形象地称为“天眼” , 事实上卫星数据的应用 , 却难以做到“尽收尽用” 。
中国工程院院士杨小牛就曾经表示 , 卫星在天上飞来飞去 , 效能其实并不高 , 每天只有几十分钟时段内采集到的数据是地面需要的 。
那些大量的被认为是无效数据的“废片” , 有没有可能被利用起来?
“我们利用高性能的云计算和建模的方法 , 构建了全中国范围内2000年1月1日到2018年12月31日逐日的无缝数据立方体 , 基本上填补了同时实现高空间分辨率和高时间频率遥感观测的空白 。 ”4月15日 , 清华大学理学院院长、地球系统科学系主任宫鹏在线介绍 , 清华大学地球系统科学系通过公共数据资源和时空遥感技术 , 制作完成首套中国30米逐日无缝遥感观测数据集 , 以及逐季节土地覆盖和逐年土地利用的数据集 。
「遥感」21世纪地球都有哪些变化?AI“天眼”带您回溯
文章图片

首套中国30米分辨率逐季节土地覆盖图
人工智能深度“补片”
“传统的对地卫星观测 , 拍下来的一景一景的照片是不同时间采集的数据 , 拼在一起并不完整 , 使用门槛很高 。 ”宫鹏解释 , “卫星直接获得的图片不能拿来直接用的 , 因为卫星图片不会是自然连续的 , 很可能像100块的拼图 , 少了50块的效果 , 但也有可能同样的拼图来了好几块 。 ”
不止如此 , 卫星轨道的偏差会造成同一地方不同时间拍摄的图片难以重叠 , 云彩的遮挡、雾气不均匀的散射都会导致大量的卫星遥感数据难以反映地表的真实情况 , 而成为难用的“废片” 。
「遥感」21世纪地球都有哪些变化?AI“天眼”带您回溯
文章图片

卫星获取的图像不能直接拿来用
基于此前完成的世界上唯一一个10米分辨率全球地表覆盖制图数据处理过程中积累的经验 , 清华大学地球系统科学系团队自主研发了时空数据融合重建的技术 。
“我们构建了人工智能需要的知识库 , 其中包括世界首套全球全季节普适样本库和相关领域知识 。 库中分为训练样本库和完全独立的验证样本库 。 ”清华大学博士生刘涵介绍 , 结合亚马逊云服务(AWS)上面一整套完善的人工智能和机器学习的套件和服务 , 团队设计和训练了一套适应遥感大数据的深度遥感特征学习和分类模型 。
运用大量计算和图像时空融合技术 , 把不完整的“拼图”重建成时空一致的图像库 , 应用人工智能技术识别例如路面是沥青、土路还是水泥路面等地表覆盖类型 , 通过模型训练 , 完成高性能的推理 , 建立起这一深度遥感制图模型的“超能力” 。 这个模型根据知识库不断学习 , 利用人工智能算法 , 能够完成不合格“废片”的补片工作 , 甚至可以补足缺失的部分 。
“所得到的结果 , 最后经过遥感专业化的变化检测和时空一致性后处理方法 , 最终得到了中国30米逐日无缝遥感观测数据集和这套全国逐季节土地覆盖和逐年土地利用图 。 ”刘涵说 , 团队从原始数据到多维时空数据库以及最终的制图产品中的所有数据都统一存放在云服务平台的遥感数据湖中 , 方便进行数据统一的处理和分析 。
云上高性能计算 ,
提供超高算力
“地球系统科学使用和产生的数据是极其巨大的 , 例如气候模拟和预测会生成时间间隔在小时级、地面分辨率是3公里的气候数据 , 产生的数据量和卫星遥感数据类似 , 量级都在PB级以上 , 相当于数百万集高清电影的量级 。 ”宫鹏介绍 , 因此需要超强算力来完成 。
如果进行数据中心建设的话 , 需要三、四百个机柜 , 占地成本和时间成本都是巨大的 。 据介绍 , 亚马逊云服务(AWS)为项目的完成提供了10万核左右的云上高性能计算资源 。


推荐阅读