Python爬取lol英雄联盟全阵容皮肤 1、结果展示将每一个英雄保存一个文件

1、结果展示将每一个英雄保存一个文件夹下，把他所有的皮肤保存在他对应的文件夹下(自动生成的你运行爬虫就好了)
私信小编01即可获取大量Python学习资料
文章插图
文章插图
2、代码解释2.1用到第三方的模块有些自带，有些需要你自己安装， pip install 模块名就好了，如果有问题可以看我的第三方库导入大全那篇文章，有详细解释
import requests # 请求数据import os # 操作系统模块，用于创建文件夹import jsonpath # 用于提取json类型的数据import re # 正则表达式模块，用于获取皮肤名称import time # 时间模块，防止爬的太快被封idimport random # 随机数模块，配合time使用2.2请求头以及主页面js地址user-agent：故名思意，用户代理，你设置了这个相当于把爬虫程序伪装成浏览器，如果不设置，服务器就会发现你是爬虫，这是最基本的反爬手段之一hero_list_url：这是通过分析lol官网页面从中提取hero_id的url ，如果想学页面分析可以留言我在写一篇分析页面的文章，这个主要教如何爬取
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'}hero_list_url = ''2.3获得详情页面的函数【Python爬取lol英雄联盟全阵容皮肤】写一个获得hero_id的函数找到每一个英雄的详情url为下载做准备，这里我用了列表推导式作为返回值将所有英雄的详情url返回出来方便下载函数调用
def get_id(url):response = requests.get(url, headers=headers).json()hero_Id = jsonpath.jsonpath(response, '$..heroId')time.sleep(random.randint(1, 3))base_url = '{}.js'return [base_url.format(every_id) for every_id in hero_Id]2.4定义函数一个提取及下载数据我直接再代码中进行解释
def get_skin(li1):for url in li1: # 遍历列表推导式response = requests.get(url, headers=headers)result = response.json()['skins'] # 得到关于皮肤的所有信息skin_name = [] # 设置空列表用来存储提取到的皮肤名skin_url = [] # 设置空列表用来存储提取到的皮肤下载地址time.sleep(random.randint(1, 3)) # 随机休眠1到3秒防止被封for skin_json in result:skin_name.append(skin_json['name']) # 将英雄名保存到上面的空列表之中skin_url.append(skin_json['mainImg']) # 将英雄下载地址保存到上面的空列表之中hero_folder = 'allhero/' + response.json()['hero']['name'] + response.json()['hero']['title']#设置保存的路径if not os.path.exists(hero_folder):os.mkdir(hero_folder)# 判断路径是否存在不存在就创建一个for i in range(len(skin_url)):if not skin_url[i]=='':image_path = hero_folder +'/' + re.findall('\w+',skin_name[i])[0] + '.png' # 具体设置图片的下载路径以及名称和格式with open(image_path,'wb')as file:print('正在下载{}'.format(skin_name[i])) # 打印下载进度file.write(requests.get(skin_url[i],headers=headers).content) #下载图片3、完整代码如果遇到问题可以留言，我看到了就会解答，喜欢的话可以关注我呀，我基本每天都会更新有趣的东西
import requestsimport osimport jsonpathimport reimport timeimport randomheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'}def get_id(url):response = requests.get(url, headers=headers).json()hero_Id = jsonpath.jsonpath(response, '$..heroId')time.sleep(random.randint(1, 3))base_url = '{}.js'return [base_url.format(every_id) for every_id in hero_Id]def get_skin(li1):for url in li1:response = requests.get(url, headers=headers)result = response.json()['skins']skin_name = []skin_url = []time.sleep(random.randint(1, 3))for skin_json in result:skin_name.append(skin_json['name'])skin_url.append(skin_json['mainImg'])hero_folder = 'allhero/' + response.json()['hero']['name'] + response.json()['hero']['title']if not os.path.exists(hero_folder):os.mkdir(hero_folder)for i in range(len(skin_url)):if not skin_url[i] == '':image_path = hero_folder + '/' + re.findall('\w+', skin_name[i])[0] + '.png'with open(image_path, 'wb')as file:print('正在下载{}'.format(skin_name[i]))file.write(requests.get(skin_url[i], headers=headers).content)if __name__ == '__main__':hero_list_url = ''li1 = get_id(hero_list_url)get_skin(li1)


上一页
1
2
下一页
		  	





























推荐阅读

           
                  
              
                  女子|女子怀孕后，狗狗总是用鼻子蹭她肚子，医院一检查，当场被吓呆 
                
                   
                
              
            

                  
              
                  喜大普奔，长安欧尚率先响应”汽车下乡”，购车享双重补贴 
                
                   
                
              
            

                  
              
                  开心麻花|院线为什么疯狂讨好开心麻花？看到明日战记的单日票房后，我懂了 
                
                   
                
              
            

                  
              
                  HR在工作中是不是应该对员工坦诚相对 
                
                   
                
              
            

                  
              
                  哆咖医生|早期身体会有6个异常！若一个也不占，恭喜，肝脏还好，肝若癌变 
                
                   
                
              
            

                  
              
                  金字塔|神奇的四方山，科学家发现地球通过金字塔持续向外太空提供能量 
                
                   
                
              
            

                  
              
                  怎样教育女孩子才是正确的方法 
                
                   
                
              
            

                  
              
                  新华网|王毅：打造各方普遍接受的全球数据安全规则 
                
                   
                
              
            

                  
              
                  作品|@全国游客，“学习强国”正在征集“惠游湖北”主题游记与短视频 
                
                   
                
              
            

                  
              
                  中国|新三板精选层将“试水”融资融券业务 
                
                   
                
              
            

                  
              
                  俄罗斯首个5G牌照发放 俄5G市场华为战况如何？ 
                
                   
                
              
            

                  
              
                  青岛人员进京须持7日内核酸阴性证明 确定青岛病例在京密切接触者5人 
                
                   
                
              
            

                  
              
                  虎哥说衣不二■简单的小技巧，教你如何穿出大长腿，好身材是穿出来的 
                
                   
                
              
            

                  
              
                  郭丽岩|猪价同比首降 CPI涨幅回落 
                
                   
                
              
            

                  
              
                  余承东|余承东：现在买燃油车就像智能手机时代买功能机 
                
                   
                
              
            

                  
              
                  Java线程池的管理方法论 
                
                   
                
              
            

                  
              
                  北宋李清照 李清照家破人亡 
                
                   
                
              
            

                  
              
                  小米|米家直流变频循环落地扇电池版图赏：5+7双层扇叶 三扇合一 
                
                   
                
              
            

                  
              
                  青柠檬檬哒|Linux下Shell日期的格式，你知道几种？ 
                
                   
                
              
            

                  
              
                  怀孕初期可以下蹲吗 
                
                   
                
              
            

          

计算机专业大一下学期，该选择学习Java还是Python 

想自学Python来开发爬虫，需要按照哪几个阶段制定学习计划 

未来想进入AI领域，该学习Python还是Java大数据开发 

2021年Java和Python的应用趋势会有什么变化？ 

非计算机专业的本科生，想利用寒假学习Python，该怎么入手 

用Python制作图片验证码，这三行代码完事儿 

历时 1 个月，做了 10 个 Python 可视化动图，用心且精美... 

为何在人工智能研发领域Python应用比较多 

对于非计算机专业的同学来说，该选择学习Python还是C 

学习完Python之后，如何向人工智能领域发展

Python爬取lol英雄联盟全阵容皮肤

推荐阅读

女子|女子怀孕后，狗狗总是用鼻子蹭她肚子，医院一检查，当场被吓呆

喜大普奔，长安欧尚率先响应”汽车下乡”，购车享双重补贴

开心麻花|院线为什么疯狂讨好开心麻花？看到明日战记的单日票房后，我懂了

HR在工作中是不是应该对员工坦诚相对

哆咖医生|早期身体会有6个异常！若一个也不占，恭喜，肝脏还好，肝若癌变

金字塔|神奇的四方山，科学家发现地球通过金字塔持续向外太空提供能量

怎样教育女孩子才是正确的方法

新华网|王毅：打造各方普遍接受的全球数据安全规则

作品|@全国游客，“学习强国”正在征集“惠游湖北”主题游记与短视频

中国|新三板精选层将“试水”融资融券业务

俄罗斯首个5G牌照发放俄5G市场华为战况如何？

青岛人员进京须持7日内核酸阴性证明确定青岛病例在京密切接触者5人

虎哥说衣不二■简单的小技巧，教你如何穿出大长腿，好身材是穿出来的

郭丽岩|猪价同比首降 CPI涨幅回落

余承东|余承东：现在买燃油车就像智能手机时代买功能机

Java线程池的管理方法论

北宋李清照李清照家破人亡

小米|米家直流变频循环落地扇电池版图赏：5+7双层扇叶三扇合一

青柠檬檬哒|Linux下Shell日期的格式，你知道几种？

怀孕初期可以下蹲吗