2019 年度 Python 类库 Top 10( 二 )


Streamlit 提供了一种从 Python 脚本跳到生产级应用程序的快速方法,只需在代码中添加几行即可 。
Streamlit 能与各种数据科学相关的工具一起工作,TensorFlow 、 Keras 、 PyTorch 、 Pandas,凡是你能想到的,它都可以 。
8. Transformers如果你正在从事任何与机器学习相关的工作,那么你可能已经听说了在过去一年中围绕自然语言处理 (NLP) 方面的重要进展 。
许多新的和高性能的模型,如 BERT 、 XLNet 或者 roBERTa,已经被开发出来,通过各种 NLP 任务 (如文本分类、机器翻译、命名实体识别等) 来显著提高技术水平 。
对于实践者来说,重要的是拥有能够使用这些模型来支撑生产应用程序的工具,这些用起来并不复杂 。对于研究人员来说,重要的是拥有能够调整内部机制的类库,这样就可以更轻巧地开发和试验新的模型,而不必浪费太多时间编写样板代码 。
Hugging Face 有一帮杰出的人,他们为我们带来了 transformers,它是一个类库,其中包括打包、预先训练,并已经为使用最现代的 NLP 模型的实现做好了准备 。TensorFlow 2.0 和 PyTorch 之间的互操作性帮助该类库迅速成为行业标准,支撑着研究和生产应用程序 。它们的发展速度也非常快,随着研究人员的开发,经常有新的模型引入到这个类库中 。
蛋糕上的樱桃: Hugging Face 团队开发了 DistilBERT,它是一个体积更小、速度更快、价格更低、重量更轻的纯净版 BERT 。
你还在犹豫要不要使用 Hugging Face / Transformer 以切换到现代的 NLP?那么择日不如撞日,今天就是你的幸运日,看看他们伟大的在线演示,可不要吝惜你的大姆指哟 。
9. Detectron2Facebook 的人工智能研究团队 (FAIR) 一直在推动计算机视觉 (CV) 的极限,他们开发了新的模型,用于像对象检测、姿式预估、语义 / 实例划分,以及最近的全景分割等任务 。
解决这些问题的可能性就像几年前的科幻小说一样 。我们对 FAIR 抱有最好的期望,这一次他们设法再次震撼全场 。
Detectron2 是备受期待的 Detectron 续作,它是用 PyTorch 从头开始构建的,装满了最先进的计算机视觉算法 。
这样的类库尤其难于进行工程设计,因为它们必须支持不同类型的用例 。就像 Hugging Face 的 Transformers 一样,费尔团队也很好地完成了 Detectron2 的设计,它采用了一种非常灵活和模块化的方式,使得它非常适合 CV 的研究应用 。同时,它的使用极其简单,对于那些只想快速获得结果而不想干预内部机制的人来说非常理想 。是的,你可以使用 Detectron2,让你的软件只用几行 Python 代码就能“理解”图像 。
时间将会告诉我们,Detectron2 能否成功地营造一个充满活力的社区,而到目前为止,情况看来很有希望 。它很可能成为 CV 应用程序的“首选”解决方案,因为在 CV 应用程序中,新的、更快、更好的模型是由研究人员创建的 。如果你正在做任何类型的 CV 工作,一定要密切保持关注!
10. Metaflow前方出现一个新生儿,一幅新面孔勉强挤进了 2019 年的名单!但是赞成别不把它当回事:尽管它才是在几周前刚刚发布的,但已经经过了 Netflix 的内部测试,历经两年时间的改进,他们才决定开放源代码 。
Metaflow 是一个 Python 类库,用于帮助数据科学家和工程师构建用于现实世界的真实项目 。它主要专注于减轻非技术数据科学家的技术负担,例如计算资源、并行执行、体系结构设计和版本控制等 。Netflix 与 AWS 的合作,使你能够轻松定义复杂的数据流,同时对分布式计算提供开箱即用的支持 。
我们已经在为 Tryolabs 内部的一些关键项目做了 Metaflow 评估 。如果你有兴趣更多地了解这款工具,请查看 Netflix 的公开博客 。
总结这一年又过去了,它为开源世界留下了非凡的贡献,这些贡献在未来几年仍将具有重要意义 。你可以查看我们之前榜单:看看 2015 年、 2016 年、 2017 年、 2018 年来类库的演变 。
如果我们漏掉了你最喜欢的 Python 类库,请在下面发表评论 。我们很想听听你的意见 。
作者介绍Fabián Torres,全栈开发人员 。电气工程学士学位;Elias Masquil,全栈开发人员;Alan Descoins,首席技术官和合作伙伴,计算机工程学士学位;German Hoffman,全栈开发和研究工程师,计算机工程学士学位 。




推荐阅读