新京报|姚静:空间分析在公共卫生服务中的应用


新京报|姚静:空间分析在公共卫生服务中的应用
本文插图
简介:姚静 , 英国格拉斯哥大学城市大数据研究中心(UBDC)高级讲师、博士生导师 , 主要从事空间分析与优化方面的教学科研 。
空间分析在公共卫生服务中的应用历史 , 最早可以追溯到1854年伦敦霍乱的爆发 , 当时的专家们做了各种分析以了解霍乱发生的原因 。 Dr John Snow绘制了一幅地图 , 将死亡病例、街道数据和当地的水泵信息叠加到一起 , 观察到大部分死亡病例分布在水泵周围 。 经过对当地的水源采样分析 , 人们发现导致霍乱的原因是当地的水源污染 。 这是GIS中的叠加分析在疾病数据分析中最早的应用 。
空间分析技术用于公共卫生服务数据的分析和建模 , 相关的方法主要可以分为四类 。
第一个是空间数据探索性分析 , 一般用来观察疾病案例的空间分布 。 第二个是回归分析 , 可以检验疾病案例和相关因素的关系 , 比如年纪、性别、生活环境 。 第三个是时间序列方法 , 可以预测短期疾病对医疗资源的需求 。 第四个是空间优化方法 , 主要用于医疗卫生设施的位置评价和选址 。
空间分析技术方法的应用案例
第一个例子是疾病的空间分布 , 我们利用非洲莫桑比克的数据 , 分析与艾滋病相关的健康状况的空间分布 , 主要考虑两个变量:一是否做了艾滋病检测;二是否采取了计划生育的手段 。 方法上主要使用了空间点模式分析 , 包括K function , spatial scan statistic和local Moran’s I三种方法 。 点模式分析主要关注数据在空间上的分布是随机的、集聚的还是分散的 。
对于K function结果的解读:如果实际值在置信区间以上 , 我们认为该分布具有聚集现象;如果实际值在置信区间以下是分散分布;如果实际值在置信区间内为不显著 , 不显著的情况不予考虑 。 研究发现上述两个变量在大部分空间尺度上都存在空间聚集现象 , 分布不是随机的 。
为了研究聚集的空间位置 , 可以选择另外两种识别方法 。 首先是spatial scan statistic, 这个方法是用圆形或者椭圆形的扫描窗口沿着整个研究区域扫描 , 判断窗口内的案例数是否显著高于或低于窗口外的数目 。 另外一个方法是局部莫兰指数 , 用以检测局部空间相关性 。
第二个案例是医疗卫生设施的可达性分析 , 还是使用与上述案例相同的研究区域和数据 。 研究使用了三种方法 , 首先基于重力模型定义一个可达性指标 , 分子为供(诊所)需(村庄)双方的属性 , 分母为距离衰减函数 。
研究使用诊所的属性来综合定义它的服务水平 , 包括医院护士、床位数、是否存在干净水源等 。 得到可达性指标后 , 我们利用kernel density estimation方法生成一个连续表面 , 以显示可达性在连续地理空间上的分布 。 最后 , 使用回归分析检验了可达性与Health outcome之间的相关性 。 研究发现 , 可达性与Health outcome是显著相关的 。
第三个案例是关于公共卫生服务设施选址和资源分配的问题 , 同样还是使用莫桑比克的数据 。 公共卫生服务设施的位置也是非常重要的 , 可以决定可达性和服务效率 。 研究使用空间优化方法 , 模型是p-median problem (PMP)和Extended PMP 。
在研究区一共有53家诊所 , 但只有32家提供艾滋病检测 。 研究通过优化模型 , 考虑最大化可达性(最小化加权距离和) , 来分析是否选择现存的32家诊所是较为合理的?如果需要另选诊所以替代现存的 , 或需新增诊所提供艾滋病检测服务 , 应该如何选择?
优化模型主要包括三个部分:目标函数(最小化平均加权通行距离和) , 限制条件(每户人家去最近的诊所做检测)和决策变量 (某家诊所是否被选中提供艾滋病检测) 。 结果表示目前提供艾滋病检测的32个诊所保留21个的时候(将服务分配给另外的11家诊所)对目标函数值的提高是最大的 , 即可以最大程度上减少平均通行距离 。


推荐阅读