国内代理ip地址大全 代理ip池的实现原理( 二 )
Q5:IP代理软件怎么使用?
1. 建立本地IP池自由使用
一般来说直接从代理IP服务商处所获取的API接口并不能高效的提取IP,所以一些有条件的用户可以通过程序将这些服务商处提取出的IP经过验证后放入自己建立的本地IP池当中,在使用时就可以不受提取限制的自由使用了 。
2. 通过API接口直接调用
通过付费代理IP服务商例如IPIDEA处购买IP后就可以从后台登陆账号,生成API接口,连接后就可以调用API接口来提取IP,不过这种方式也会受到提取规则的限制 。
3. 使用动态转发自动切换
用户们可以将自己的固定IP和IP端口设定为代理服务器,然后通过动态转发的方式实现IP代理 。这种方式可以解放用户,每次完成请求后自动通过API接口调用IP切换到新的IP 。
Q6:怎么使用ip池导用爬小说
1、利用IP代理池技术,每次从IP代理池中随机选择一个IP代理来爬取数据 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import urllib.request
import random
#构建IP代理池
ip_pool = [
'58.221.55.58:808',
'120.198.248.26:8088',
'221.229.166.55:8080',
'139.196.214.67:8080'
]
def ip(ip_pool, url):
#从IP代理池中随机选一个IP代理
ip = random.choice(ip_pool)
print(ip)
#格式化IP代理格
proxy = urllib.request.ProxyHandler({'http': ip})
#装入IP代理
opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)
return urllib.request.urlopen(url).read().decode('utf-8', 'ignore')
data = https://www.08ts.cn/ip(ip_pool,'https://www.baidu.com/?tn=98010089_dg&ch=15')
print(data)
2、使用IP代理池和用户代理的组合来增加访问量,更安全 。利用ip代理的动态ip构建自己的代理ip池,可以保证ip的质量 。
因为ip代理的ip资源是独立有效的 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
import urllib.request
import random
import urllib.error
#自定义UA_IP类,用来随机得到
def UA_IP(thisUrl):
#构建用户代理池
ua_pool = [
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.89 Safari/537.36',
'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/13.0.782.41 Safari/535.1 QQBrowser/6.9.11079.201',
'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.3; .NET4.0C; .NET4.0E)',
'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0'
]
#构建ip代理池
ip_pool = [
'139.196.196.74',
'112.124.47.21',
'61.129.70.109',
'221.229.166.55'
]
thisUA = random.choice(ua_pool) #从用户代理池中随机选择一个用户代理
thisIP = random.choice(ip_pool) #从IP代理池中随机选择一个IP代理
headers = ('User-Agent', thisUA)#构造报头
#将IP格式化
proxy = urllib.request.ProxyHandler({'http': thisIP})
#装入IP代理
opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)
#装入代理
opener.addheaders = [headers]
#将opener设置为全局
urllib.request.install_opener(opener)
#从网页爬取信息
data = https://www.08ts.cn/urllib.request.urlopen(thisUrl).read().decode('utf-8', 'gnore')
return data
#网页池,后面从网页池中选择一个进行该网页信息的爬取
urls = [
'https://mp.csdn.net/mdeditor/88323361#',
'https://mp.csdn.net/mdeditor/88144295#',
'https://mp.csdn.net/mdeditor/88144295#',
'https://mp.csdn.net/mdeditor/88081609#'
]
#爬取1000次
for i in range(0, 1000):
try:
thisUrl = random.choice(urls)
data = https://www.08ts.cn/UA_IP(thisUrl)
print(len(data))
except urllib.error.HTTPError as e:
if hasattr(e, 'code'):
print(e.code)
if hasattr(e, 'reason'):
print(e.reason)
以上就是爬虫使用ip代理池的方法,推荐大家使用品易http代理ip,千万ip资源百兆带宽,保证爬虫数据传输安全 。提供高匿稳定代理ip服务,方便快捷获取网站数据,流量免费测试正在进行!
推荐阅读
- 国内怎么买狗狗币 怎么买狗狗币
- 威锋源地址最新—iphone 如何给cydia添加中文源和威锋源?
- 中国十大家居拖鞋品牌排行榜 国内拖鞋什么牌子的质量好
- 国内燕麦片品牌排行榜 西麦燕麦片
- 海外资金|外资工厂招聘人抢着去,国内工厂却招工难!两者区别在哪里
- 魔鬼代言人漫画 灵魂代理人
- 工人|外资工厂招聘工人抢着去,国内工厂反而招工难!两者有何区别
- 亚马逊购物中国;国内购物中心有哪些?
- 监狱电影排行榜前十名国内 监狱的电影
- mac地址过滤是禁止还是允许 如何设置无线路由器mac地址过滤