Python怎样保存网页的全部内容那需要抽取cs

那需要抽取css,js文件的超级链接，再次访问这些超级链接，写文件。
■网友
谢邀，试了一下，可以用urllib模块的urlretrieve方法可以来保存文件，以百度为例：1.获得主页html：import urllibdef callBack(a,b,c): \u0026#39;\u0026#39;\u0026#39;回调函数 @a:已经下载的数据块 @b:数据块的大小 @c:远程文件的大小 \u0026#39;\u0026#39;\u0026#39; per = 100.0 * a * b / c if per \u0026gt; 100: per = 100 print \u0026#39;%.2f%%\u0026#39; % perurl = \u0026#39;百度一下，你就知道\u0026#39;local = \u0026#39;d://baidu.html\u0026#39;urllib.urlretrieve(url, local, callBack)用谷歌浏览器打开是这个样子：图1

图片没有显示出来2.再获取图片，再用这个方法def getFileData(addr): try: splitPath = addr.split(\u0026#39;/\u0026#39;) fName = splitPath.pop() print fName urllib.urlretrieve(addr, \u0026#39;d://\u0026#39;+fName) except Exception,e: print "Cant\u0026#39;t download: %s:%s" %(fName,e)url0 = \u0026#39;http://www.baidu.com/img/bd_logo1.png\u0026#39;getFileData(url0)print \u0026#39;结束\u0026#39;再再建立如下图D：下就出现了这样的图2 【Python怎样保存网页的全部内容】

图3

把baidu.html源文件的这个 src="https://www.zhihu.com//http://www.baidu.com/img/bd_logo1.png"--\u0026gt;src="http://www.baidu.com/img/bd_logo1.png"刷新就便成了这样子：图4

3.我又尝试了抓jsurl1 = \u0026#39;http://s1.bdstatic.com/r/www/cache/static/global/js/all_async_search_7e03689b.js\u0026#39;getFileData(url1)结果图见图2小结一下，python做爬虫确实强，抓css应该也是没什么问题吧！再依据对应路径配置一下，应该就能达到你想要得效果了。我也好奇你这是要干什么用呢？额，这算是偷取网站的源码吗？
■网友
可以用scrapy框架，里面有个函数可以直接保存图片。或者在html中找到图片的链接，保存下来。

Python怎样保存网页的全部内容

推荐阅读

“闺蜜一条未发草稿短信，让我看清婚姻真相，离婚不再欺骗自己”

雪博会|太阳岛“雪博会”“神龙”出“雪”

环球火力点|美海军佛罗里达号潜艇女兵现况如何？，艇上曾被曝出性丑闻

旅行的路上有哪些靠谱的挣钱路子

鸡蛋、小麦过敏的小朋怎样吃饭啊对他的幼儿园生活产生深深担忧~

精心搭配行家|鞋跟都往后移了好远？真怕踩断了，钟祺走路也太用力了吧

哈雷尔|刷爆3大纪录！哈雷尔当选最佳第六人，快船7年5次夺奖造新神迹

神雕侠侣|《神雕侠侣》开拍：“杨过小龙女”都是新人，59岁罗嘉良演杨康？

电玩网游圈|月光：跟梦泪没法比，老帅为何成最卑微FMVP？错过AG最低谷

『数评时代』钻石排列VS周冬雨排列：三星Galaxy S20 5G系列手机屏幕性能解密，原创

付辛博|当初坚持AA制的付辛博，5年过去了，如今和颖儿的婚姻怎么样了？

莫小帅|数码博主实测，iQOO5 Pro为充电最机，只要15分钟

农村人都爱吃的小炒菜，农家一碗香，香辣过瘾，简单一做很下饭

钟南山是那个地区的人

山河旅行者|单位交社保，老家又交新农合，是双重获益还是白浪费钱？

#社会谈资#男生给她的备注抢镜，这也太甜了，林小宅与男友聊天记录曝光

[驾照]C1驾驶证若达成以下几个要求，终身不用再年检，请车主们互相转告

影帝■成本3.3亿，票房0.7亿，这部烂片成功把“百亿影帝”拉下神坛

阿里巴巴|从一路亏损到赚247亿！被低估的王兴，是如何扭转美团败局的

三一集团总部为什么搬到北京?