python爬虫一般用哪个模块

1、http 的部分
先通过标准库练习基本功夫。
21.6. urllib.request - Extensible library for opening URLs - Python 3.6.4 documentation以后工作建议用 requests
Requests: HTTP for Humans2、 信息抽取的部分
大的方向是从html 树 中抽取信息。
【python爬虫一般用哪个模块】 用到的模块或第三方库有:正则、lxml 、Beautiful Soup Documentation 等



■网友
请求 : requests/aiohttp解析 : beautifulsoup/lxml/pyquery/requests-html


    推荐阅读