『天津冯十一』我决定开启爬虫之旅，学了41天python基础知识针对我要学爬虫的目的

针对我要学爬虫的目的，很多朋友都给出了一个简单干脆的学习路径：
别怂，直接干！
什么基础知识、函数、对象，扯这些都没用，在干中学，才是最快的成长办法。
可是，找什么项目呢？
一上来弄个爬豆瓣、爬淘宝肯定不现实，别说我不会，就是看代码都未必能看懂。
最终，我从网上找了一段最短的代码。

文章图片
这代码是干啥的？有啥用？
说实话，除了百度的网址我知道，其他我也说不好。
一步步试吧。
然而，在PyCharm里并不能运行，提示我没有安装requests这个模块。
找到度娘，虎躯一震，散发出我的王霸之气，度娘一阵娇羞之后，终于老实了。
成功找到模块安装方法，非常简单：
在命令窗口，直接输入pipinstallrequests ，即可安装。
这里多说一句，我是windows系统，有使用linux的，请自己找度娘。

文章图片
安装成功，兴冲冲的进入PyCharm ，竟然还是不行？
【『天津冯十一』我决定开启爬虫之旅，学了41天python基础知识】哎，继续找可爱的小度娘吧。
哦，原来光安装还不行，还要设置好才可以，真麻烦。
进入file—>setting—>Project:***—>ProjectInterpreter ，点击右边的“+”号，在再搜索栏输入requests（千万别输错），成功导入！

文章图片
退出导入界面， ProjectInterpreter的界面是酱紫的。

文章图片
这时候，再运行这四行代码，成功！

文章图片
好了，下一步开始好好研究下这几行代码啥意思吧。
第一行，不用说，导入requests模块。
第二行，我理解这个get方法就是模拟用户访问百度呗。
使用Ctrl+Q查看一下requests吧。

文章图片
get使用是一样的，看来括号里面放网址是固定用法。
后面那个status_cod得出的200是什么鬼？
扭头看度娘冲我招手：“大爷，来玩啊。 ”
哎，按摩下腰，过去看看吧。
原来status_cod的意思就是获取返回状态， 200（称为响应码）意为成功响应。
下一行content的意思是获取页面内容。
再说回自己的程序：res.encoding='utf-8'
encoding是获取网页编码， utf-8前几天学廖雪峰教程时候见过，是针对Unicode的一种可变长度字符编码。
但是上面这行代码貌似没啥用呢，因为我把他删了，完全不影响最后的运行结果啊。

文章图片
最后一行：print(res.text)
通过text来获取网页的内容。
所以最后的输出结果就该是百度首页源代码，这个我大概能猜到。
但是，为什么不是全部呢？
只显示了一部分啊，难道是跟浏览器有关系嘛。。。
今天学习至此结束，这种跟度娘上上下下、九浅一深的学习，还真蛮有意思的。

『天津冯十一』我决定开启爬虫之旅，学了41天python基础知识

推荐阅读

深圳■深圳抗疫十问① | 深圳为什么那么早就发现新冠肺炎“人传人”？

没有办法面对曾经的自己咋办

「医学观察」江夏新增300张发热床位，2月3日启用

u19|长春女足队员入选U19大名单

八卦君说事内置北斗导航，外形酷似悍马，东风首款HUV将上市

搞笑街区|客人点鱼的时候，小二总会把活鱼拿上来！，开心笑话：有一个饭店

王者荣耀|E星3-1TTG：纵情疯狂军训绑兔，老林真有点东西，TTG被大乔打哭

汽车贴膜要多久(汽车贴膜哪个品牌好)

新华网|德国法兰克福“跳蚤市场”重新开放[组图]

DNF心情咖啡屋|DNF：旭旭宝宝再创奇迹！首把+20神之意象诞生，账号价值已翻倍

奥沙利文|世锦赛第6冠在招手！奥沙利文8-2连丢4局，仍10-7占先机

清秀凉鞋贵吗

美的薄盐电压力锅测评

河北疫情?HEB文件要怎麽打開?

【小儿】小儿发烧物理降温 7种降温方式有效退烧

分居期间一方谈恋爱算出轨吗离婚分居期间可以找男朋友吗

达米安·利拉德|2K魔咒再现？利拉德或离开，那些年这六位球员成封面人物后离队

80年代的绿皮火车和赶火车人：原来那时候乘火车是这个样子

体坛克卜勒|为何蓝黑球迷隐隐担忧，一诡异魔咒太可怕，国米5球大胜挺进决赛

健身|坚持练腿有多重要？健身多练腿，你会有什么益处？