源码用python一天爬取20万条企业信息( 三 ) _python

brand = brand[0].text
area = soup.select('tr:nth-child(9) > td:nth-child(2) > span')
area = area[0].text
industry = soup.select('tr:nth-child(1) > td:nth-child(4)')
industry = industry[0].text.strip()
address = soup.select('#main > div.aside > div.info > div.info_c > p:nth-child(9)')
address = address[0].text.split('：')[1]
jingying = soup.select('#main > div.aside > div.info > div.info_c > p:nth-child(8)')
jingying = jingying[0].text.split('：')[1]
date = soup.select('tr:nth-child(5) > td:nth-child(4) > span')
date = date[0].text
wangzhi = soup.select('tr:nth-child(12) > td:nth-child(4) > p > span > a')
wangzhi = wangzhi[0].text
data = https://www.isolves.com/it/cxkf/yy/Python/2019-08-14/[company, date, name, legal_person, shouji, dianhua, chuanzhen, company_type, jingying, industry,
product, wangzhi, area, brand, address, main_address] # 将以上数据放入列表中打印在命令框
print(data)
with open('服装1.csv', 'a', newline='', encoding='GB2312') as csvfile:
w1 = csv.writer(csvfile)
w1.writerow(data)
except:
with open('服装2.csv', 'a', newline='', encoding='utf-8-sig') as csvfile:
w1 = csv.writer(csvfile)
w1.writerow(data)
print('utf解码成功')
# 利用并发加速爬取，最大线程为50个，本文章中一共有50个网站，可以加入50个线程
# 建立一个加速器对象，线程数每个网站都不同，太大网站接受不了会造成数据损失
executor = ThreadPoolExecutor(max_workers=10)
# submit()的参数：第一个为函数，之后为该函数的传入参数，允许有多个
future_tasks = [executor.submit(parser, url) for url in wzs1]
# 等待所有的线程完成，才进入后续的执行
wait(future_tasks, return_when=ALL_COMPLETED)
print('全部信息抓取完毕')

源码用python一天爬取20万条企业信息( 三 )

推荐阅读

豪门明星|男网红晒账单炫富！买110万铂金包订300万家具，打扮女性化惹争议

国际茶价走高印度茶出口产量均呈负增长

蓝科技网|世界第一个AI图像传感器又是索尼制造

煤气炉什么牌子好(什么牌子的煤气灶好用又省气)

用文艺照进现实《故事里的中国》第二季致敬新时代最闪亮的星

军武阅读：能造几个航母？，如果我国每人出100块

小熊议情感|“逆商，让你的人生更高级”，原创

上岸人的独白|清华重返榜首，哈工大第六，复旦跌至第十，双一流大学评选收官

烹饪|洋葱焖猪排，快手焗鱼，涝汁凉拌金针菇，干煸菜花的做法

洋葱|全美洋葱中毒事态进一步扩大

win10系统如何共享打印机共享

BAT|没错，互联网进入到了下半场

中国历史上第一位女诗人，以女子身拯救母国于存亡之际

健康王医师|排毒养颜，延缓衰老，脸部皮肤白皙光滑，每天晚上吃3种食物

马来西亚|马来西亚出现超强变异毒株：传染性是原来10倍，现有疫苗或对其无效

陈凯歌|原创《演员2》郭敬明又任性？跟李成儒又舌战，陈凯歌飙英文表达不满

“欢乐春节·中国印象”演出在希腊雅典大学举办

公交车|这一脚，太暖心……

|接连“盯上”十几家企业，卖冰箱也不放过？，美国又开始“作妖”

历史劲爆点：缘分与桃花情意绵绵，主动去挽回幸福爱情的4大生肖！，两周之内

源码 用python一天爬取20万条企业信息( 三 )

推荐阅读

源码用python一天爬取20万条企业信息( 三 )