8个零代码数据爬取工具，不会Python也能轻松爬数！（附教程）

前天给大家整理了免费数据源网站合集，看大家的反馈很积极，有粉丝留言说，她还想要爬取一些网页的数据进行分析，不知道该如何下手
目前的用的比较多数据爬取方法是用python爬虫，这两年python很火，网上关于python爬虫的教程也很多，大家可以自行学习，但是对没有代码基础的朋友来说，短期上手python还是很困难的。
于是我就连日整理8个零代码数据爬取的工具，并附上使用教程，帮助一些没有爬虫基础的同学获取数据
1.Microsoft Excel
没错，第一个要介绍的就Excel ，很多知道Excel可以用来做数据分析，但很少有人知道它还能用来爬数
步骤如下：
1）新建Excel ，点击“数据”——“自网站”

本文插图
（2）在弹出的对话框中输入目标网址，这里以全国实时空气质量网站为例，点击转到，再导入

本文插图
选择导入位置，确定

本文插图
（3）结果如下图所示

本文插图
（4）如果要实时更新数据，可以在“数据”——“全部更新”——“连接属性”中进行设置，输入更新频率即可

本文插图

本文插图
缺点：这种方式虽然很简单，但是它会把页面上所有的文字信息都抓取过来，所以可能会抓取一部分我们不需要的数据，处理起来比较麻烦
火车头采集器
官网地址：http://www.locoy.com/
火车头是爬虫界的元老了，是目前使用人数最多的互联网数据抓取软件。它的优势是采集不限网页，不限内容，同时还是分布式采集，效率会高一些。不过它规则和操作设置在我看来有一些死板，对小白用户来说上手也有点困难，需要有一定的网页知识基础
操作步骤：（以火车头8.6版本为准）
第1步：打开—登录
第2步：新建分组

本文插图
第3步：右击分组，新建任务，填写任务名；

本文插图
第4步：写采集网址规则（起始网址和多级网址获取）

本文插图
第5步：写采集内容规则（如标题、内容）

本文插图
第6步：发布内容设置勾选启用方式二(1)保存格式：一条记录保存为一个txt;(2)保存位置自定义;(3)文件模板不用动;(4)文件名格式：点右边的倒立笔型选[标签:标题];(5)文件编码可以先选utf-8 ，如果测试时数据正常，但保存下来的数据有乱码则选gb2312;

本文插图
第7步：采集设置，都选100； a.单任务采集内容线程个数：同时可以采集几个网址； b.采集内容间隔时间毫秒数：两个任务的间隔时间； c.单任务发布内容线程个数：一次保存多少条数据； d.发布内容间隔时间毫秒数：两次保存数据的时间间隔；

8个零代码数据爬取工具，不会Python也能轻松爬数！（附教程）

推荐阅读

5G小基站部署处在初级阶段，今年是铺垫年

古时候的元宵节是情人节吗古时候的元宵节又被称为

可口可乐|可口可乐旗下魔爪龍茶能量饮料清仓：3.3元/罐

关闭|手机只剩20%电量？别慌！用了这几招，多用2小时

公路互通匝道，凸形和凹形曲线极限最小半径，满足停车视距要求吗

【央视新闻】美媒曝特朗普拟提名的大法官人选

回国找工作，和留在日本工作，到底咋取舍。

德扑flop是什么意思 flop是什么意思

如果没读高中咋样才能进音乐学院读书呀本人很热爱音乐但是家庭条件差父母没有让我读高中

老美|与老美十年官司了结！北新建材净利暴涨，律师详解企业出海有哪些坑

琳琳说历史|郭嘉排倒数第一，司马懿甚至没上榜！，三国时期曹操的五大谋士

「参考消息」韩媒：美对韩最大限度施压只为让日韩继续“在一起

虫草的吃法食谱

洛阳打造“客家祖源地”：客家之源纪念馆预计明年9月建成

文梦洋|谁还记得《丑女无敌》的小艾？跟错导演成网红，沦为十八线形象大变

杭州女子失踪案后续|【后续来了】杭州女子失踪案后续是怎么回事?具体是什么情况？

计划|健帆生物：董事兼副总经理唐先敏减持约168万股，减持计划时间已过半

生活要酷|大内存+麒麟处理器，这才是荣耀真香千元机！，不到1400元

周传雄谈商演说走穴太难听，我会成为伟大艺术家，今被网红点评

搞笑段子趣图|矫健的身姿，这才是真正的女拳大师，搞笑gif-看这灵活的身手