AI的下一站
我们处在一个智能变革的时代 , 人工智能技术正在“赋能”各行各业 。 大数据就像新能源 , AI算法就像发动机 , 装载了大数据和人工智能技术的企业就像搭上了一班通往未来的快速列车 , 把竞争对手远远地甩在后面 。一隐私然而 , 这样的快速发展不是没有代价的 。 我们每个人的手机号、电子邮箱、家庭地址和公司地址经纬度坐标、手机识别码、消费记录、APP使用记录、上网浏览记录、搜索引擎结果的点击习惯、刷脸记录、指纹、心跳等等这些信息都是我们不愿意轻易给出的隐私数据 , 但在AI时代 , 这很可能已经成为某个公司用来训练AI算法的数据集中的一条 。正是众多不起眼的一条条个人隐私数据 , 构成了足够多的训练集 , 让AI从中学习到认知能力 , 让从未跟我们谋面的AI算法认识、了解我们 , 知道我们的喜好和动机 , 甚至还认识我们的家人、朋友 。 我们的隐私便是实现这些智能的“代价” 。当然 , 这个代价并不一定是你愿意拱手付出的 。那如何保护隐私?我不用行吗?你以为关闭手机GPS就无法定位你的位置?你的手机还有陀螺仪、内置罗盘、气压计等装置 , 还是可以用来定位你的位置 。 只要使用手机 , 就不存在绝对的隐私保护 。对于很多手机应用来说 , 要么不用 , 用了就很难避免泄露隐私 , 比如很多APP必须用手机号注册 , 或者需要手机验证才能继续使用 , 还有的需要刷脸验证等等 。 那么 , 个人想保护隐私能做什么?什么也做不了 , 加上AI算法的黑盒性质 , 我们甚至对于AI背后的逻辑和动机一无所知 。一监管隐私保护靠个人防护真的很难实现 , 需要强有力的法律法规来限制 。2018年5月25日 , 欧盟的《通用数据保护条例》(GDPR)正式生效 , 这是在欧盟范围内的一个数据保护监管框架 , 这是目前最完善、最严格的隐私保护规定 。 根据DLA Piper公布的数据 , 在不到两年的时间内 , GDPR已产生1.14亿欧元的罚款 , 其中开出的最大罚单是法国依据GDPR对谷歌罚款5000万欧元 , 理由是谷歌在向用户定向发送广告时缺乏透明度、信息不足 , 且未获得用户有效许可 。 下图是GDPR生效以来至2020年1月份欧盟各个国家罚款的金额分布图 。
对于企业 , GDPR要求在收集用户的个人信息之前 , 必须以“简洁、透明且易懂的形式 , 清晰和平白的语言”向用户说明将收集用户的哪些信息、收集到的信息将如何进行存储、存储的信息将会被如何使用 , 并告知企业的联系方式 。对于个人 , GDPR赋予数据主体七项数据权利:知情权、访问权、修正权、删除权(被遗忘权)、限制处理权(反对权)、可携带权、拒绝权 。 目前GDPR在真实地影响到我们每个人的生活 , 最直观的影响就是当你浏览网页的时候 , 你会发现经常遇到网站弹出类似下图的提示 , 这是网站基于信息透明性的规定 , 向你征询信息收集的许可 。
欧盟的GDPR具有全球影响力 , 它让用户对自己的个人数据有绝对的掌控权 , 让全球在发展新技术的同时必须开始关注隐私问题 , 世界各国已经纷纷出台自己的数据保护法规 。关于隐私保护 , 一切才刚刚开始 。欧盟在上个月正式启动了称为“打造欧洲数字未来”的新战略 , 打算通过制定一系列针对AI、隐私和安全的法规 , 成为AI发展的全球领导者 。 该战略的启动也被看成是在应对美国和中国的AI崛起 。可以预见 , 关于AI的隐私安全与监管将逐渐成为重点话题 , 实际上 , 就像欧盟委员会副主席Margrethe Vestager说的:“人工智能本身并没有好坏之分 , 而是完全取决于人们为什么以及如何使用它 。 让我们尽可能做到最好 , 控制人工智能可能给我们的价值观带来的风险——不伤害 , 不歧视 。 ”保护隐私已经成为AI发展不可绕过的“槛” , 是AI技术的难题 , 也是AI良性发展的契机 。三趋势可以说 , 保护隐私的各种法规的出台必然是未来不可避免的趋势 , 这势必让企业的数据收集、使用及流通的合规成本大幅增加 , 也容易让企业内部或者企业间形成数据孤岛问题 , 制约企业获取数据价值 。 因此 , 保护隐私的AI技术的落地使用成为AI领域最亟待实现的目标 。保护隐私的AI主要通过数据加密、分布式计算、边缘计算、机器学习等多种技术的结合来保护数据安全 , 近期比较热门的有Differential Privacy(差分隐私)、FederatedLearning(联邦学习 , 也叫联盟学习、联合学习、共享学习) 。保护隐私不是说完全不收集数据 , 而是要通过技术的手段防止个人隐私数据的泄露 。 差分隐私是一种数学技术 , 比如 , 假设要分析数据集并计算其统计数据(例如数据的平均值、方差、中位数、众数等) , 如果通过查看输出 , 我们无法分辨原始数据集中是否包含了任何个体的数据 , 那么这种算法就被称为差异私有 。举个非常简单的例子 , 假设你的工作部门每个月都会用一个表格统计部门每个人的工资发放金额 , 除了制表人 , 别人无法查看这个表格 , 只能通过一个查询函数S知道这个表的总额 , 某个月你调去了别的部门 , 那么别人就可以通过上个月表格A , 和这个月表格B来知道你的工资 , 道理很简单 , 只需用S(A)减去S(B) 。 B表格称为A表格的相邻数据集 , 它俩只相差一条数据 , 差分隐私技术就是要让相邻数据集的查询结果差不多 , 从而无法推出个人的信息来 , 这个差不多的程度可以看作隐私保护的力度 。 苹果和Facebook已经使用这种方法来收集聚合数据 , 而不需要识别特定的用户 。 MITTechnology Review将差分隐私技术列为2020全球十大突破性技术之一 。联邦学习采用了分布式机器学习方法 , 近年来越来越受欢迎 , 该技术假设用户数据不会被存储到中心化的服务器 , 而是私有的、保密的 , 仅存储在个人的边缘设备上 , 比如手机 , 因此与传统机器学习方法相比 , 联邦学习从根本上增强了用户隐私 。 联邦学习不依赖从用户设备端收集的数据来训练 , 而是在用户移动设备端训练AI模型 , 然后将训练得到的参数信息传输回一个全局模型 , 这个过程不需要用户数据离开个人设备 。
推荐阅读
- 「国内」当我们谈"这辈子不可能打工男子”时,我们在谈什么
- 快乐1062:?聚焦 | 昨晚,我们和深圳交警一起“抓醉猫”!结果…
- 田立萍:“有她在,我们很安心”——北京社工田立萍抗疫一线勇担当
- #风筝#风筝事故频发 拥挤的城市空间我们还能放风筝吗?
- 「搜狐新闻」新晃铁警开展防洪应急演练大练兵
- 「离家出走」梦想仗剑走天涯!10岁双胞胎离家出走,并留下一张纸条…
- 「杭州网」风雨书店:每本书都在这里 等待下一个落脚处
- 『此时红河』起诉离婚老婆不对?红河这起“离奇”案件给我们一个警醒
- 「威海市妇联」威海市妇联举办信息化、智能化知识培训
- 【城市头条】“桥哥,是我们贫困户的贴心人!”安康市 汉滨区洪山镇牛山村驻村帮扶工作队队长易长桥帮扶事迹侧记