数据|干货|数据中台安全体系构建方法论

一、为何要构建数据中台安全
近几年来 , “中台”一词在企业社会数字化转型中被不断提起 , 今天 , 绿盟君将与大家一起讨论如何构建中台的数据安全体系 。 数据安全聚焦数据 , 那么中台的数据安全聚焦的便是在数据中台下如何构建数据安全体系 , 或者直接称之为“数据安全中台” 。
首先我们从数据中台的业务逻辑入手 , 共同找寻数据中台中数据和安全的结合点 。
1.1数据中台通用业务逻辑
数据|干货|数据中台安全体系构建方法论
图片

图 1.1数据中台通用业务逻辑
上图中没有出现任何“中台”字眼 , 那么它和数据中台有什么关系呢?顾名思义 , 数据中台必然是聚焦在数据层面提供中台能力的存在 , 但只论“存在”二字难免有些狭隘的把数据中台静态化了 , 数据安全更关注的是动态的数据流转 , 所以我们关注数据中台业务逻辑 , 是因为“以数据中台价值为目标的建设过程和场景应用”才是安全建设防护的核心对象 。
???????这也是我们为什么在“中台数据安全”概念中为何不圈定业务中台进来 。 本质上数据中台和业务中台就是紧耦合的关系 , 数据中台提供“数据业务化”的支撑给业务中台 , 业务中台提供“业务数据化”反哺给数据中台 , 相互促进优化 。 防护好了数据中台的数据安全 , 业务中台的数据安全随之明朗 。
1.2数据中台安全关注点
???????数据安全固然聚焦数据的流转 , 但在体系化的理念加持下防护的对象必然涉及数据中台建设和应用过程中的一切 , 基础设施安全、运维过程安全、数据处理安全、数据应用安全以及数据价值发挥的过程安全 。
???????接下来我们将从这些关注点逐步剖析数据中台业务过程中的安全风险和诉求 。
二、数据中台常见风险识别2.1 基础设施
???????数据中台的建设 , 通常始于数据的汇聚 , 汇聚的过程中先暂且不关注各数据源的原始数据库和汇聚方式 , 但到了数据湖区 , 归集数据的存储则是不能绕开的核心环节 。
???????数据湖区的中心库源于各种开源组件架构的大数据平台、关系型数据库、文件存储服务器等基础设施 , 甚至在一些特定行业领域会应用各种多媒体存储设施 。 除此之外存储服务宿主的服务器、运维管理的主机等设施都必不可少 。
???????硬件服务器、主机、开源组件、数据库以及数据导入导出的传输通道和过程 , 通常容易出现漏洞、弱口令、主机木马、病毒、拖库、撞库等风险 , 这些风险并不会因为进入数字化时代而消弭 , 而是每时每刻都不能被忽略 。
2.2 数据运维
???????数据进入湖区 , 经过治理后形成各种主题库/专题库的数据仓库 , 针对数据湖区、数据仓库中存放数据的日常运维 , 数据治理过程的编目、梳理等服务介入 , 处处都是大量数据访问行为和数据外流的真实现状 , 大量的人员深度接触数据的场景中 , 业务的需要致使数据治理、维护在得到人工服务推进的同时也给人员提供了大量获取数据的便利 。
数据治理是提升数据质量和价值的必经之路 , 但是如果完全因业务需要而驱动数据在“外人”面前裸奔是有极大风险的 , 所以针对不同人员、不同级别/类别的数据 , 应用必要的安全措施也是必不可少的 。
2.3 数据处理及应用
???????数据在治理过程中、在BI分析过程中、在数据开发测试中、在应用到人工智能、机器学习等使用过程中 , 数据的流转是否合理、是否在有效权限下被使用、是否被有效监控和检测等 , 这些场景中在未发现数据泄露之前很可能在上面的一系列过程中无论数据owner还是服务提供方谁都说不清到底发生过什么 , 和会发生什么 。
??????????????所以在数据的处理和应用过程中 , 每个场景、每个对数据的访问行为和每个数据流转的去向都是不可信的 。


推荐阅读