要开始为开源项目做贡献,有一些先决条件:
1. 学习一门编程语言:由于在开源贡献中你需要编写代码才能参与开发,你需要学习任意一门编程语言 。根据项目的需要,在后期学习另一种语言很容易 。
2. 熟悉版本控制系统:这些软件工具有助于将所有更改保存在一个地方,以便在需要时在稍后阶段调用它们 。基本上,它们会跟踪在源代码中随时间所做的每一次修改 。一些流行的版本控制系统是 Git、Mercurial、CVS 等 。其中,Git 是业界最流行和广泛使用的 。今天我们来介绍适合AI程序员入门的10个开源机器学习项目 。
1. Caliban这是科技巨头google的机器学习项目 。它用于在隔离且可重现的计算环境中开发机器学习研究工作流和笔记本 。它解决了一个大问题 。当开发人员在构建数据科学项目时,很多时候很难构建一个可以在现实生活中展示项目的测试环境 。因此,Caliban 是解决此问题的潜在解决方案 。
文章插图
Caliban 可以轻松地在本地开发任何 ML 模型,在机器上运行代码,然后在云端环境中尝试完全相同的代码以在大型机器上执行 。因此,Dockerized 研究工作流在本地和云端都变得简单 。
2. KorniaKornia 是 PyTorch 的计算机视觉库 。它用于解决一些通用的计算机视觉问题 。Kornia 建立在 PyTorch 之上,依靠它的效率和 CPU 能力来计算复杂的函数 。
文章插图
Kornia 是一组用于训练神经网络模型和执行图像变换、图像过滤、边缘检测、对极几何、深度估计等的库 。
3. Analytics ZooAnalytics Zoo 是一个统一的数据分析和人工智能平台,它将 TensorFlow、Keras、PyTorch、Spark、Flink 和 Ray 程序整合到一个集成管道中 。这可以有效地从笔记本电脑扩展到大型集群以处理大数据的生产 。该项目由 Intel-analytics 维护 。
Analytics Zoo 通过以下方式帮助 AI 解决方案:
- 帮助轻松制作 AI 模型原型 。
- 缩放得到有效管理 。
- 有助于将自动化流程添加到您的 ML 管道中,例如特征工程、模型选择等 。
文章插图
Mljar 有效地训练用于二元分类、多类分类、回归的模型 。
它提供两种接口:
- 它可以在您的网络浏览器上运行 ML 模型
- 在 Mljar API 上提供 Python 包装器 。
文章插图
【程序员10 个入门级的机器学习开源项目】
从 Mljar 收到的报告包含表格,其中包含有关每个模型分数和训练每个模型所需时间的信息 。性能显示为散点图和箱线图,因此很容易直观地检查哪些算法在所有算法中表现最佳 。
5.DeepDetectDeepDetect 是一个用 C++ 编写的机器学习 API 和服务器 。如果想使用最先进的机器学习算法并希望将它们集成到现有应用程序中,那么 DeepDetect 很适合你 。
文章插图
DeepDetect 支持各种各样的任务,如分类、分割、回归、对象检测、自动编码器 。它支持图像、时间序列、文本和更多类型数据的有监督和无监督深度学习 。但是 DeepDetect 依赖于外部机器学习库,例如:
- 深度学习库:Tensorflow、Caffe2、Torch 。
- 梯度提升库:XGBoost 。
- 使用 T-SNE 进行聚类 。
Dopamine 的设计原则是:
- 轻松实验:Dopamine 使新用户可以轻松运行实验 。
- 它紧凑而可靠 。
- 它还有助于结果的重现性 。
- 它很灵活,因此使新用户可以轻松尝试新的研究思路 。
推荐阅读
- 打造一个好看又实用的Windows终端
- 交农保一年交3000元到60岁每个月领多少钱?农保交3000,到60岁一年能开多少钱
- 2021年最值得推荐的13个提高开发效率工具,程序员必备
- 单个表上亿行数据的主键、索引设计,及分页查询
- 阿里P8面试官:如何设计一个扛住千万级并发的架构?
- 简述网络编程中的Socket
- 五宝茶哪个牌子好,五宝茶什么牌子的好
- 鳄鱼皮包是哪个国家的?
- 卫星发射基地有哪些?
- 保鲜膜瘦腿正确方法有哪些