【我用了三个月整理了Python所有库!覆盖所有,建议收藏文末附资料】缓存数据的库 。
- Beaker – 一个缓存和会话库,可以用在 web 应用和独立 Python脚本和应用上 。
- django-cache-machine – Django 模型的自动缓存和失效 。
- django-cacheops- 具有自动颗粒化事件驱动失效功能的 ORM 。
- django-viewlet – 渲染模板,同时具有额外的缓存控制功能 。
- dogpile.cache – dogpile.cache 是 Beaker 的下一代替代品,由同一作者开发 。
- HermesCache – Python 缓存库,具有基于标签的失效和 dogpile effect 保护功能 。
- johnny-cache – django应用缓存框架 。
- pylibmc – libmemcached 接口的 Python 封装 。
用来发送和解析电子邮件的库 。
- django-celery-ses – 带有 AWS SES 和 Celery 的 Django email 后端 。
- envelopes – 供人类使用的电子邮件库 。
- flanker – 一个 email 地址和 Mime 解析库 。
- imbox – Python IMAP 库
- inbox.py – Python SMTP 服务器 。
- inbox – 一个开源电子邮件工具箱 。
- lamson – Python 风格的 SMTP 应用服务器 。
- mailjet – Mailjet API 实现,用来提供批量发送邮件,统计等功能 。
- marrow.mailer – 高性能可扩展邮件分发框架 。
- modoboa – 一个邮件托管和管理平台,具有现代的、简约的 Web UI 。
- pyzmail – 创建,发送和解析电子邮件 。
- Talon – Mailgun 库,用来抽取信息和签名 。
用来进行国际化的库 。
- Babel – 一个Python 的国际化库 。
- Korean – 一个韩语词态库 。
解析URLs的库
- furl – 一个让处理 URL 更简单小型 Python 库 。
- purl – 一个简单的,不可变的URL类,具有简洁的 API 来进行询问和处理 。
- pyshorteners – 一个纯 Python URL 缩短库 。
- shorturl- 生成短小 URL 和类似 http://bit.ly 短链的Python 实现 。
- webargs – 一个解析 HTTP 请求参数的库,内置对流行 web 框架的支持,包括 Flask, Django, Bottle, Tornado和 Pyramid 。
处理 HTML和XML的库 。
- BeautifulSoup – 以 Python 风格的方式来对 HTML 或 XML 进行迭代,搜索和修改 。
- bleach – 一个基于白名单的 HTML 清理和文本链接库 。
- cssutils – 一个 Python 的 CSS 库 。
- html5lib – 一个兼容标准的 HTML 文档和片段解析及序列化库 。
- lxml – 一个非常快速,简单易用,功能齐全的库,用来处理 HTML 和 XML 。
- MarkupSafe – 为Python 实现 XML/HTML/XHTML 标记安全字符串 。
- pyquery – 一个解析 HTML 的库,类似 jQuery 。
- untangle – 将XML文档转换为Python对象,使其可以方便的访问 。
- xhtml2pdf – HTML/CSS 转 PDF 工具 。
- xmltodict – 像处理 JSON 一样处理 XML 。
爬取网络站点的库
- Scrapy – 一个快速高级的屏幕爬取及网页采集框架 。
- cola – 一个分布式爬虫框架 。
- Demiurge – 基于PyQuery 的爬虫微型框架 。
- feedparser – 通用 feed 解析器 。
- Grab – 站点爬取框架 。
- MechanicalSoup – 用于自动和网络站点交互的 Python 库 。
- portia – Scrapy 可视化爬取 。
- pyspider – 一个强大的爬虫系统 。
- RoboBrowser – 一个简单的,Python 风格的库,用来浏览网站,而不需要一个独立安装的浏览器 。
用于进行网页内容提取的库 。
- Haul – 一个可以扩展的图像爬取工具 。
- html2text – 将 HTML 转换为 Markdown 格式文本
- lassie – 人性化的网页内容检索库 。
- micawber -一个小型网页内容提取库,用来从 URLs 提取富内容 。
- newspaper – 使用 Python 进行新闻提取,文章提取以及内容策展 。
- opengraph – 一个用来解析开放内容协议(Open Graph Protocol)的 Python模块 。
- python-goose – HTML内容/文章提取器 。
- python-readability- arc90 公司 readability 工具的 Python 高速端口
- sanitize – 为杂乱的数据世界带来调理性 。
推荐阅读
- 我的新开店铺没有销量怎么办 店铺没有销量的原因
- 跑步呼吸调整方式
- 跑步穿什么运动服呢
- 爆发力训练计划有哪些
- 勿忘我花茶的功效与作用及禁忌,菊花茶的功效与作用
- 健身上瘾的九种可行方法
- 果园|我老伴跳入你家鱼塘捞东西被淹死,你必须赔108万,不然走着瞧!结果却让人咬牙切齿
- 两分钟教你做一个高情商的人,如果学不会就过来找我,简单粗暴
- 15个去渍小技巧,衣服脏了也不怕,太实用了
- 灵活就业人员,自己可测算退休后的养老金,精准快捷