历时100天终于整理了所有Python库!助你成为年薪百万大佬( 七 )

  • Demiurge – 基于PyQuery 的爬虫微型框架 。
  • feedparser – 通用 feed 解析器 。
  • Grab – 站点爬取框架 。
  • MechanicalSoup – 用于自动和网络站点交互的 Python 库 。
  • portia – Scrapy 可视化爬取 。
  • pyspider – 一个强大的爬虫系统 。
  • RoboBrowser – 一个简单的 , Python 风格的库 , 用来浏览网站 , 而不需要一个独立安装的浏览器 。
  • 网页内容提取
    用于进行网页内容提取的库 。
    • Haul – 一个可以扩展的图像爬取工具 。
    • html2text – 将 HTML 转换为 Markdown 格式文本
    • lassie – 人性化的网页内容检索库 。
    • micawber -一个小型网页内容提取库 , 用来从 URLs 提取富内容 。
    • newspaper – 使用 Python 进行新闻提取 , 文章提取以及内容策展 。
    • opengraph – 一个用来解析开放内容协议(Open Graph Protocol)的 Python模块 。
    • python-goose – HTML内容/文章提取器 。
    • python-readability- arc90 公司 readability 工具的 Python 高速端口
    • sanitize – 为杂乱的数据世界带来调理性 。
    • sumy – 一个为文本文件和 HTML 页面进行自动摘要的模块 。
    • textract – 从任何格式的文档中提取文本 , Word , PowerPoint , PDFs 等等 。
    表单
    进行表单操作的库 。
    • Deform – Python HTML 表单生成库 , 受到了 formish 表单生成库的启发 。
    • django-bootstrap3- 集成了 Bootstrap 3 的 Django 。
    • django-crispy-forms – 一个 Django 应用 , 他可以让你以一种非常优雅且 DRY(Don’t repeat yourself) 的方式来创建美观的表单 。
    • django-remote-forms- 一个平台独立的 Django 表单序列化工具 。
    • WTForms – 一个灵活的表单验证和呈现库 。
    • WTForms-JSON- 一个 WTForms 扩展 , 用来处理 JSON 数据 。
    数据验证
    数据验证库 。多用于表单验证 。
    • Cerberus – A mappings-validator with a variety of rules, normalization-features and simple customization that uses a pythonic schema-definition.
    • colander – 一个用于对从 XML, JSON , HTML 表单获取的数据或其他同样简单的序列化数据进行验证和反序列化的系统 。
    • kmatch – 一种用于匹配/验证/筛选 Python 字典的语言 。
    • schema -一个用于对 Python 数据结构进行验证的库 。
    • Schematics – 数据结构验证 。
    • valideer – 轻量级可扩展的数据验证和适配库 。
    • voluptuous – 一个 Python 数据验证库 。主要是为了验证传入 Python的 JSON , YAML 等数据 。
    反垃圾技术
    帮助你和电子垃圾进行战斗的库 。
    • django-simple-captcha – 一个简单、高度可定制的Django 应用 , 可以为任何Django表单添加验证码 。
    • django-simple-spam-blocker- 一个用于Django的简单的电子垃圾屏蔽工具 。
    标记
    用来进行标记的库 。
    • django-taggit – 简单的 Django 标记工具 。
    管理面板
    管理界面库 。
    • Ajenti – 一个你的服务器值得拥有的管理面板 。
    • django-suit – Django 管理界面的一个替代品 (仅对于非商业用途是免费的) 。
    • django-xadmin – Django admin 的一个替代品 , 具有很多不错的功能 。
    • flask-admin – 一个用于 Flask 的简单可扩展的管理界面框架 。
    • flower – 一个对 Celery 集群进行实时监控和提供 web 管理界面的工具 。
    • Grappelli – Django 管理界面的一个漂亮的皮肤 。
    • Wooey – 一个 Django 应用 , 可以为 Python 脚本创建 web 用户界面 。
    静态站点生成器
    静态站点生成器是一个软件 , 它把文本和模板作为输入 , 然后输出HTML文件 。
    • Pelican – 使用 Markdown 或 ReST 来处理内容 ,  Jinja 2 来制作主题 。支持 DVCS, Disqus. 。AGPL 许可 。
    • Cactus – 为设计师设计的静态站点生成器 。
    • Hyde – 基于 Jinja2 的静态站点生成器 。
    • Nikola – 一个静态网站和博客生成器 。
    • Tinkerer – Tinkerer 是一个博客引擎/静态站点生成器 , 由Sphinx驱动 。
    • Lektor – 一个简单易用的静态 CMS 和博客引擎 。
    进程
    操作系统进程启动及通信库 。