数据|温昱:搜索引擎数据痕迹处理中权利义务关系之反思( 七 )


这里便有了用户行动理由的冲突 , 即用户是否同意的“特权”形式的一阶理由与百度“明示告知”命令用户行动的排他性理由之间的冲突 。 这种理由的冲突是不同位阶间理由的冲突 。 与一阶理由相冲突时 , 排他性理由总是优先 。 因为一阶理由依据权衡、比较来决定应当如何行动;而排他性理由可以直接取代、排除一阶理由的权衡 。 结果就是用户只能依据百度的“明示告知”而行动 , 不存在用户自己同意与否的自由空间 。
由次可知 , 朱烨案二审裁判思路否认数据痕迹与朱烨之间存在关联 , 拒斥朱烨的同意权 , 肯定了百度搜集数据痕迹的“特权”地位 。 二审判决书表述与其裁判思路存在些许出入 , 但落脚点均在赋予百度不受朱烨干涉的收集朱烨自生型数据痕迹的权利 。 相较之下 , 本案一审法院将“数据痕迹”定位为朱烨的个人信息的做法 , 以此为基础承认了朱烨同意权的“特权”面向 。 此种对百度处理“自生型数据痕迹”的权利义务关系的定位 , 对于平衡用户与搜索引擎之间的权利冲突、保护双方合法利益而言 , 更为妥当 。
(二)任甲玉诉百度案
本案存在三方主体———“他生型数据痕迹”制造者、百度和任甲玉;以及两段法律关系———“他生型数据痕迹”制造者和百度之间的权利义务关系 , 百度和任甲玉之间的权利义务关系 。 笔者试将这两段权利义务关系及被遗忘权给两段权利义务关系带来的预期影响分别阐述如下:
1.百度与“他生型数据痕迹”制造者
本案中“他生型数据痕迹”指的是百度收集的 , 非由任甲玉自身网络活动产生、但指向任甲玉的 , 由任甲玉之外的第三方网络活动产生的数据痕迹 。 搜索引擎从第三方处爬取、收集“他生型数据痕迹”是整个工作过程的第一步 。 搜索引擎利用HTML文档之间的链接关系 , 派出机器人在web上一个网页一个网页地抓取 , 将那些网页抓到本地后进行分析 。
百度抓取网页数据是否需要网站的同意?这个问题又可分为两个子问题:第一 , 百度抓取任一网页是否基于其自愿;第二 , 百度抓取网页具体内容数据是否需要网站同意 。
第一个子问题关涉百度为何行为 。 百度在恒河沙数的网络数据中 , 选择爬取、收集某一网页的数据内容或者不收集某一网页的数据内容完全取决于自身先前的算法设定 , 我们可将之理解为取决于百度自己的目的和衡量 。 百度抓取、收集网页数据内容是基于自己意愿的行为 , 其没有必须抓取、收集某一网页数据内容的义务 , 也没有必须不抓取、收集某一网页数据内容的义务 。 因此 , 百度抓取、收集数据的权利是霍菲尔德意义上的“特权” , 是全凭自己决断行动与否的自由 。 权利本身就是权利主体的行动理由 , 百度抓取、收集有关任甲玉的“他生型数据痕迹”的自由是其一阶行动理由 。
第二个子问题关涉百度如何行为 。 是否抓取、收集某一网页数据是百度自己决定的自由 , 而抓取、收集该网页的具体数据内容是否需以网站的同意为前提 。 这取决于Robots Exclusion Protocol , 即robots.txt文件的设置 。 robots.txt的作用在于为搜索引擎蜘蛛程序爬行本网站提示路径 。 蜘蛛程序根据robots.txt的内容 , 来确定它访问权限的范围 。 如果robots.txt为空 , 那么网站内容对搜索引擎蜘蛛程序就是全部开放 。 可见robots.txt是类似于“请求权”设置 , 对百度如何行为具有强制性 , 即百度必须以robots.txt设置的权限和路径完成自己的抓取、收集 。 也就是说 , 百度的抓取、收集有关任甲玉“他生型数据痕迹”必须以符合robots.txt设置规定的方式进行 。 同一个行为 , 在相关网站来说是权利 , 在百度来说就是义务 。 百度必须依网站的强制性要求行为 。 相关网站robots.txt设置也是百度抓取、收集相关网站内有关任甲玉的“他生型数据痕迹”行为的排他性理由 。
2.百度和任甲玉
百度收集任甲玉的“他生型数据痕迹”后 , 经过自身算法的整理与排序 , 归档、建立相应数据库 。 任甲玉搜索到的关键词是百度算法整理的结果 , 而非任甲玉直接与和自身有关的“他生型数据痕迹”制造者之间关联 。 任甲玉输入“任甲玉”作为关键词进行搜索 , 百度自动显示的是与“任甲玉”相关联的搜索频率最高的关键词 。 任甲玉点击相关的关键词 , 得到的是百度业已收集到的与其相关的“他生型数据痕迹” 。


推荐阅读