人工合成数据是啥意思

把数据脱敏,如用工资要保密,可以用个函数映射后再发布,如减去1593,再剩3,再减856。别人无法知道你的函数不能还原,相当于加密了。Python中可以使用faker库来进行数据的模拟和伪造。通过预置规则来识别常见敏感数据,比如信用卡号,身份证号, 手机号,电子邮箱,IP地址,住址等。数据脱敏理论有k匿名,l多样性,抑制,扰动等。


    推荐阅读