最详细的Python库总结( 四 )


ScientificPython , 一组经过挑选的Python程序模块 , 用于科学计算 , 包括几何学(矢量、张量、变换、矢量和张量场) , 四元数 , 自动求导数 , (线性)插值 , 多项式 , 基础统计学 , 非线性最小二乘拟合 , 单位计算 , Fortran兼容的文本格式 , 通过VRML的3D显示 , 以及两个Tk小工具 , 分别用于绘制线图和3D网格模型 。此外还具有到netCDF , MPI和BSPlib库的接口 。
NumPy科学计算库 , 提供了矩阵 , 线性代数 , 傅立叶变换等等的解决方案, 最常用的是它的N维数组对象. NumPy提供了两种基本的对象:ndarray(N-dimensional array object)和 ufunc(universal function object) 。ndarray是存储单一数据类型的多维数组 , 而ufunc则是能够对数组进行处理的函数 。
Cvxopt , 最优化计算包 , 可进行线性规划、二次规划、半正定规划等的计算 。
Numba , 科学计算速度优化编译器 。
pymvpa2 , 是为大数据集提供统计学习分析的Python工具包 , 它提供了一个灵活可扩展的框架 。它提供的功能有分类、回归、特征选择、数据导入导出、可视化等 。
NetworkX , 复杂网络的优化软件包 。
zipline , 交易算法的函数库 。
PyDy ,  Python动态建模函数库 。
SymPy,符号数学的Python库 。
statsmodels,Python的统计建模和计量经济学 。
astropy,天文学界的Python库 。
orange , 橙色 , 数据挖掘 , 数据可视化 , 通过可视化编程或Python脚本学习机分析 。RDKit,化学信息学和机器学习的软件 。
Open Babel , 巴贝尔 , 开放的化学工具箱 。
cclib , 化学软件包的计算函数库 。
Biopython , 免费的生物计算工具包 。
bccb , 生物分析相关的代码集 。
bcbio-nextgen , 提供完全自动化、高通量、测序分析的工具包 。
visvis, 可视化计算模块库 , 可进行一维到四维数据的可视化 。
MapReduce是google提出的一个软件[架构] , 用于大规模数据集(大于1TB)的并行运算 。概念“Map(映射)”和“Reduce(归纳)” , 及他们的主要思想 , 都是从函数式编程语言借来的MapReduce函数库 。
Framworks and libraries for MapReduce.,PySpark , [Spark]的Python API 。dpark , Spark的Python克隆 , Python中的MapReduce框架 。
luigi , 为批量工作 , 建立复杂的管道 。
mrjob , 运行在[Hadoop] , 或亚马逊网络服务的 , MapReduce工作 。
人工智能与机器学习
库名称简介NLTK(natural language toolkit) , 是python的自然语言处理工具包 。2001年推出 , 包括了大量的词料库 , 以及自然语言处理方面的算法实现:分词 ,  词根计算 ,  分类 ,  语义分析等 。
Pattern , 数据挖掘模块 , 包括自然语言处理 , 机器学习工具 , 等等 。
textblob , 提供API为自然语言处理、分解NLP任务 。基于NLTK和Pattern模块 。
jieba , 结巴 , 中文分词工具 。
snownlp , 用于处理中文文本库 。
loso , 中文分词函数库 。
genius , 中文CRF基础库 , 条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列 。
Gensim , 一个相当专业的主题模型Python工具包 , 无论是代码还是文档 , 可用于如何计算两个文档的相似度LIBSVM,是台湾大学林智仁(Lin Chih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包 , 他不但提供了编译好的可在windows系列系统的执行文件 , 还提供了源代码 , 方便改进、修改以及在其它[操作系统]上应用;该软件对SVM所涉及的参数调节相对比较少 , 提供了很多的默认参数 , 利用这些默认参数可以解决很多问题;并提供了交互检验(Cross Validation)的功能 。该软件可以解决C-SVM、ν-SVM、ε-SVR和ν-SVR等问题 , 包括基于一对一算法的多类模式识别问题 。


推荐阅读