『』表格改变字段时,该如何兼容历史数据?

当原有产品无法满足当前业务发展时 , 有时候我们会通过改动表格中的字段设计满足业务新需要、服务新场景 。而改动“数据表格”的字段很容易引发数据冲突的情况 , 所以我们有必要去解决“表格改变字段”后产生的数据冲突 , 去兼容历史数据 , 减少改动对数据产生的负面影响 。那么问题来了 , 我们该怎么去兼容历史数据呢?
『』表格改变字段时,该如何兼容历史数据?
文章图片

文章图片

业务是不断变化发展的 , 产品也是会随之不停迭代的 , 数据表格作为基本组件也常常需要变动 , 这在我们的日常工作中是非常常见的 。
比如下面这个例子 , 一款分析淘宝商家移动端店铺数据的产品 , 其中菜单“流量来源”是对店铺流量的分析 , 在店铺发展初期“淘内免费”、“付费流量”、“自主访问”能够支撑业务方对于店铺数据的分析 , 但是随着店铺业务不断发展做大做强 , 对于流量分析的颗粒度要求越来越细 , 只是对流量的简单划分已经无法满足业务方的需求 。希望能对于淘内流量能有更细的分类 , 帮助业务方对店铺流量有更细致的了解 , 从而根据不同流量大小调整运营策略 , 促进店铺销售数据的发展 。现状:淘内免费 付费流量 自主访问期望:手淘搜索 我的淘宝 淘内免费其他 手淘微淘 手淘扫一扫等需求:改动“流量来源”数据表格中的字段
当原有产品无法满足当前的业务发展时 , 为了满足业务的新需要 , 服务于新的场景 。不得不要求我们去改变最初的产品设计 , 改动表格中的字段设计 。而改动“数据表格”的字段很容易引发数据冲突的情况 , 包括数据类型冲突、数据格式冲突等 。
如果在改动表格字段时 , 不去考虑数据冲突的影响 , 不去考虑如何兼容历史数据 , 会导致产品内的数据在完整性和一致性上出现问题 , 比如上文中案例如果不进行历史数据兼容处理 , 选择在3.19号上线新的统计功能 , 关于流量的划分就会存在两种不一样的统计方式 , 19号前的流量数据划分方式和19号之后不一致 , 按月维度下没有办法对3月的流量数据做一个统一划分 。
历史数据一定意义上成为了“脏数据” , 有句话说的好叫“垃圾数据进垃圾数据出” , 数据质量对于分析结果的重要性甚至高于分析方式和模型 。混入脏数据后产出的结果对业务造成严重的影响 , 甚至做出了错误的决策 , 带来不可磨灭的损失
因此 , 我们有必要去解决“表格改变字段”后产生的数据冲突 , 去兼容历史数据 , 减少改动对数据产生的负面影响 。那么问题来了 , 我们该怎么去兼容历史数据呢?
01 历史数据都是需要保留的吗
表格改变字段出现数据冲突的情况后 , 在我们去兼容历史数据之前可以先思考一个问题:历史数据都是需要保留的吗?一起来看下下面的两个场景 。
场景1
某电商to b产品 , 在一次迭代中 , 对“店铺销售”菜单增加了“客单价”字段 , 那么历史数据中的客单价对我们有意义吗?
『』表格改变字段时,该如何兼容历史数据?
文章图片

文章图片

场景2
我们设计了一套问卷用于统计“国内大学生的不同专业的就业情况” , 投放问卷一段时间后对问题就行了修改 , 那么收集的历史数据对我们还有意义吗?
『』表格改变字段时,该如何兼容历史数据?
文章图片

文章图片

通过两个具体的场景 , 我们可以发现“历史数据”在不同的场景下的保留策略是不同的:
场景1中的“客单价”能帮助复盘店铺历史的客单价情况 , 和当前时间的“客单价”进行对比 , 对店铺策略起到数据指导作用 , 在此场景下历史数据具有重要意义 , 需要保留 。


推荐阅读