史上最全Python反爬虫方案汇总( 四 )


  • 对JS加密
  • 使用多个不同的字体文件 , 然后约定使用指定字体文件方式 , 比如时间戳取模 , 这样每次爬取到的数据映射方式都不一样 , 映射结果就不一样 , 极大提高了破解的难度 。
该种方式相比使用加密算法方式难度更高 , 因为加密算法是固定的几种 , 对方很容易获取并破解 , 而字体文件映射可以按任意规则映射 , 正常的数据使之错误显示 , 爬虫不容易察觉 。
缺点:需要生成字体文件 , 增加网站加载资源的体量 。
实现难度:★★★★非可视区域遮挡此方式主要针对使用senlium进行的爬虫 , 如果模拟界面未进入可视区域 , 则对未见数据进行遮挡 , 防止senlium的click()操作 。 这种方式只能稍稍降低爬虫的爬取速度 , 并不能阻止继续进行数据爬取 。
实现难度:★最后 , 小编想说:我是一名python开发工程师 , 整理了一套最新的python系统学习教程 ,
想要这些资料的可以关注私信小编“01”即可 , 希望能对你有所帮助 。


推荐阅读