来源丨法纳 常用库
Chardet字符编码探测器,可以自动检测文本、网页、xml的编码 。
colorama主要用来给文本添加各种颜色,并且非常简单易用 。
Prettytable主要用于在终端或浏览器端构建格式化的输出 。
difflib,[Python]标准库,计算文本差异
Levenshtein,快速计算字符串相似度 。
fuzzywuzzy,字符串模糊匹配 。
esmre,正则表达式的加速器 。
shortuuid,一组简洁URL/UUID函数库 。
ftfy,Unicode文本工具7
unidecode,ascii和Unicode文本转换函数 。
xpinyin,将汉字转换为拼音的函数库
pangu.py,调整对中日韩文字当中的字母、数字间距 。
pyfiglet,Python写的figlet程序,使用字符组成ASCII艺术图片
uniout,提取字符串中可读写的字符
awesome slugify,一个Python slugify库,用于处理Unicode 。
python-slugify,转换Unicode为ASCII内码的slugify函数库 。
unicode-slugify,生成unicode内码,Django的依赖包 。
ply,Python版的lex和yacc的解析工具
phonenumbers,解析电话号码,格式,存储和验证的国际电话号码 。
python-user-agents,浏览器的用户代理(user-agents)的解析器 。
sqlparse,SQL解析器 。
pygments,一个通用的语法高亮工具 。
python-nameparser,解析人名,分解为单独的成分 。
pyparsing,通用解析器生成框架 。
tablib,表格数据格式,包括,XLS、CSV,JSON,YAML 。
python-docx,docx文档读取,查询和修改,微软word 2007 / 2008的docx文件 。
xlwt/xlrd,读写Excel格式的数据文件 。
xlsxwriter,创建Excel格式的xlsx文件 。
xlwings,利用Python调用Excel
csvkit,CSV文件工具包 。
marmir,把Python[数据结构],转化为电子表格 。
pdfminer,从PDF文件中提取信息 。
pypdf2, 合并和转换PDF页面的函数库 。
Python-Markdown,轻量级标记语言Markdown的Python实现 。
Mistune,,快速、全功能的纯Python编写的Markdown解释器 。
dateutil,标准的Python官方datetime模块的扩展包,字符串日期工具,其中parser是根据字符串解析成datetime,而rrule是则是根据定义的规则来生成datetime 。
arrow,更好的日期和时间处理Python库
chronyk,一个Python 3版函数库,用于解析人写的时间和日期 。
delorean,清理期时间的函数库 。
when.py,为见的日期和时间,提供人性化的功能 。
moment,类似Moment.js的日期/时间Python库
pytz,世界时区,使用tz database时区信息[数据库]
BeautifulSoup,基于Python的html/XML解析器,简单易用, 功能很强大,即使是有bug,有问题的html代码,也可以解析
lxml,快速,易用、灵活的HTML和XML处理库,功能超强,在遇到有缺陷、不规范的xml时,Python自带的xml处理器可能无法解析 。报错时,程序会尝试再用lxml的修复模式解析 。
htmlparser,官方版解析HTML DOM树,偶尔搞搞命令行自动表单提交用得上 。
pyyaml,Python版本的YAML解释器 。
html5lib,-标准库,解析和序列化HTML文档和片段 。
pyquery,类似[jQuery]的的HTML解释器函数库 。
cssutils,Python CSS库 。
MarkupSafe,XML或HTML / XHTML安全字符串标记工具 。
cssutils - ACSS library for Python., MarkupSafe - Implements a XML/HTML/XHTML
bleach,漂白,基于HTML的白名单函数库 。
xmltodict,类似JSON的XML工具包 。
xhtml2pdf,HTML / CSS格式转换器,看生成pdf文档 。
untangle,把XML文档,转换为Python对象,方便访问 。
文件处理
库名称简介Mimetypes,Python标准库,映射文件名到MIME类型 。
imghdr,Python标准库,确定图像类型 。python-magic,libmagic文件类型识别库,Python接口格式 。path.py,os.path模块的二次封装 。
watchdog,一组API和shell实用程序,用于监视文件系统事件 。
Unipath,面向对象的文件/目录的操作工具包 。pathlib,-(Python 3.4版已经作为Python标准库),一个跨平台,面向path的函数库 。
pickle/cPickle,python的pickle模块实现了基本的数据序列和反序列化 。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象 。
cPickle是[C语言]实现的版本,速度更快 。
ConfigParser,Python标准库,INI文件解析器 。
configobj,INI文件解析器 。config,分层次配置,logging作者编写 。
profig,多格式配置转换工具 。
logging,Python标准库,日志文件生成管理函数库 。
推荐阅读
- 朱棣登基后没有子女,朱棣为什么没有把皇位给儿子
- 固肾锁精丸有什么作用
- 紅絲毛酒的功效与作用
- 怎样煮银耳汤,把芍药花瓣怎样晒制
- 厕所修在房子的什么地方最好?
- 雍正把康熙害死,康熙被雍正杀了吗
- 明末宦官魏忠贤,魏忠贤真的能有效控制所谓阉党吗
- 谁是三国第一猛将,三国三大猛将分别是
- 王莽是刘秀所灭还是刘玄,刘玄之后谁做了皇帝
- 杠铃卧推的作用是什么