8个零代码数据爬取工具，不会Python也能轻松爬数！（附教程）( 二 )

本文插图
附注：如果网站有防屏蔽采集机制（如数据很多但只能采集一部分下来，或提示多久才能打开一次页面），则适当调小a值和调大b的值；
第8步：保存、勾选并开始任务（如果是同一分组的，可以在分组上批量选中）

本文插图
Google Sheet
使用Google Sheet爬取数据前，要保证三点：使用Chrome浏览器、拥有Google账号、电脑已翻墙。
步骤如下：
（1）打开Google Sheet网站：http://www.google.cn/sheets/about/

本文插图
（2）在首页上点击“转到Google表格” ，然后登录自己的账号，可以看到如下界面，再点击“+”创建新的表格

本文插图
（3）打开要爬取的目标网站，一个全国实时空气质量网站http://www.pm25.in/rank ，目标网站上的表格结构如下图所示

本文插图
（4）回到Google sheet页面，使用函数=IMPORTHTML(网址, 查询, 索引) ， “网址”就是要爬取数据的目标网站， “查询”中输入“list”或“table” ，这个取决于数据的具体结构类型， “索引”填阿拉伯数字，从1开始，对应着网站中定义的哪一份表格或列表
对于我们要爬取的网站，我们在Google sheet的A1单元格中输入函数=IMPORTHTML(''http://www.pm25.in/rank'',''table'',1) ，回车后就爬得数据啦

本文插图

本文插图
（5）将爬取好的表格存到本地

本文插图
八爪鱼采集器
网站：https://www.bazhuayu.com/
八爪鱼采集器是用过最简单易用的采集器，很适合新手使用。采集原理类似火车头采集器，用户设定抓取规则，软件执行。八爪鱼的优点是提供了常见抓取网站的模板，如果不会写规则，就直接用套用模板就好了。
它是基于浏览器内核实现可视化抓取数据，所以存在卡顿、采集数据慢的现象。不过整体来说还是不错的，毕竟能基本满足新手在短时间抓取数据的场景，比如翻页查询， Ajax 动态加载数据等。
操作步骤：
（1）登陆后找到主页面，选择主页左边的简易采集，如图：

本文插图
（2）选择简易采集中淘宝图标，如图红框：

本文插图
（3）进入到淘宝版块后可以进行具体规则模板的选择，根据楼主截图，应该手提包列表的数据信息采集，此时我们选择“淘宝网-商品列表页采集” ，如图：

本文插图
（4）然后会进入到信息设置页面，根据个人需要设置相关关键词，例如此处我们输入的商品名称为“手提包” ，如图：

8个零代码数据爬取工具，不会Python也能轻松爬数！（附教程）( 二 )

推荐阅读

南极科考有了中国自主智慧财产权的“充电宝”，设计者却没能看到

游戏电竞王者圈|搞笑GIF：这样的打牌方式真的是劳逸结合啊

[亮剑君]怀才不遇，终被我国赏识，这位美国教授为我国天网贡献巨大！，

做法|教你几道家常菜, 真够味, 吃着过瘾, 做法简单，值得一试

「江苏」江苏“最干净”的城市，环境整洁堪比日本，不是无锡也不是南京！

#军武观察#美英不吱声了，不顾人权？欧洲又一国封城奏效！14天后死亡率下降

吃喝攻略|能让你活得多洒脱? 在全国属于富豪么?，当下社会中100万存款,

《跑男》生态篇定档，7人回归沙溢站C位，郑恺李晨对杨颖态度明确

环球网|国际航协：疫情将导致全球航空业全年损失4190亿美元

心底的小城|直接倾斜30度，很多人吓到腿软，世界上最刺激的观景台

『罗平县』罗平县选聘中小学卫生健康副校长和心理健康教育专家，这些聘任名单已定

酸菜鱼，为何饭店做的开胃又下饭，自己做肉散腥味重？原因在这里

3d电影的产生3d眩晕能说明这部电影的3d效果好么

叶舞翩翩|电影《党的女儿》上映62年，陈戈李林都已离去，主演田华依然健在

##人类竟对20000℃的高温没感觉，不会被烫伤，这是怎么回事？

美国|2天内，特朗普2次威胁对华出手！不料一个噩耗传来，美国先输了

着凉鼻塞怎么办

初二下册的这些英语语法八年级下册英语语法

秋冬饮食养生 5种体质选对药膳

登革热|登革热病例逼近2万例新加坡展开2周全国灭蚊行动