做资讯、知识库类型的网站咋防止竞争对手抓数据

我觉得信安工程里面多边安全中对用户搜索数据结果的控制模型应该对你有用。
■网友
做信息水印,加入假数据。如果你连假数据都抄,是吧.
■网友
最简单的就是不支持空查询的分页浏览。比如,论坛、博客之类的,不需要查询就能通过分页看到全部数据(非公开的除外),也就是我所说的空查询,即不指定查询关键字。你要想浏览,只能通过查询某些关键字得到过滤后的数据,当然,这些查询结果支持分页。我觉得,这是目前比较好的,因为你几乎无法枚举出所有的查询关键字。如果留心一下,很多网站都是这种模式了。
■网友
从产品设计的角度来说,跟小说站防爬一样,可以把正文中的部分文字图片化,如数字、标点,还可以在段落间插入和背景颜色同色的版权声明文字。但是这么做,用户copy信息也不方便了,好在这种站一般都不太重视用户体验,更怕竞争对手爬数据。另外如果是产品库设计,最好详情页的URL也不要有规则,不要直接后边参数id=1可以简单+1把从最初到最新的信息都全部列到爬虫计划里。技术端的做法不清楚,产品端能想到的就这些。
■网友
那得看您做成什么样的了。好多的方法。我的产品推出后,你可以模仿。


    推荐阅读