21 个必须知道的机器学习开源工具


21 个必须知道的机器学习开源工具

文章插图
作者 | SebastianScholl
译者 | 刘静,责编 | 郭芮
出品 | CSDN(ID:CSDNnews)
以下为译文:
你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等 。但是,除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方 。这些并不像他们的同行那样出色,但可以成为许多机器学习任务的救星 。
21 个必须知道的机器学习开源工具

文章插图
在本文中,我们将介绍21种用于机器学习的开源工具 。我强烈建议你花一些时间浏览我提到的每个类别 。除了我们通常在课程和视频中学到的东西之外,还有很多需要学习的地方 。
1.向非程序员的开源机器学习工具
对于来自非编程和非技术背景的人来说,机器学习看起来很复杂 。这是一个广阔的领域,我可以想象第一步可能会多么令人生畏 。没有编程经验的人能否在机器学习中取得成功?
事实证明,你可以!这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界:
  • 优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码 。您需要提供的只是一个包含数据的CSV文件,一个用作输入的列的列表,以及一个用作输出的列的列表——Ludwig将完成剩下的工作 。
  • KNIME:KNIME允许您使用拖放界面创建整个数据科学工作流程 。这种可视化实现整个模型工作流的方法非常直观,在处理复杂的问题陈述时非常有用 。

21 个必须知道的机器学习开源工具

文章插图
  • Orange:您不必知道如何编码以便能够使用Orange挖掘数据,处理数据并获得洞察力 。
有许多有趣的免费和开源软件可以提供很好的机器学习功能,而无需编写(大量)代码 。
【21 个必须知道的机器学习开源工具】另一方面,你可以考虑一些开箱即用的付费服务,例如google AutoML、Azure Studio、Deep Cognition和Data Robot 。
 
2.用于模型部署的开源机器学习工具
部署机器学习模型是最容易被忽视但重要的任务之一,它几乎肯定会在采访中出现,所以你可能也很熟悉这个话题 。
以下是一些框架,可以更轻松地将你的项目部署到现实世界的设备中 。
  • MLFlow:MLFlow被设计用于使用任何机器学习库或算法,并管理整个生命周期,包括实验、重现性和机器学习模型的部署 。

21 个必须知道的机器学习开源工具

文章插图
  • Apple的CoreML:CoreML是一个流行的框架,它可用于将机器学习模型集成到你的IOS / Apple Watch / Apple TV / macOS应用程序中 。关于CoreML的最好的部分是你不需要有关神经网络或机器学习的广泛知识,双赢!

21 个必须知道的机器学习开源工具

文章插图
  • TensorFlow Lite:TensorFlow Lite是一组工具,可帮助开发人员在移动设备(Android和iOS),嵌入式和物联网设备上运行TensorFlow模型 。
  • TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选 。它是一个开源库,可让你在浏览器中构建和训练机器学习模型 。

21 个必须知道的机器学习开源工具

文章插图
 适用于大数据的开源机器学习工具
大数据是一个研究如何分析、系统地从数据集中提取信息,或者处理传统数据处理应用软件无法处理的太大或太复杂的数据集的领域 。想象一下,每天处理数百万条推文进行情感分析 。这是一项艰巨的任务,不是吗?
别担心!这里有一些工具可以帮助你处理大数据 。
  • Hadoop:使用大数据最重要和最相关的工具之一是Hadoop项目 。Hadoop是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集 。

21 个必须知道的机器学习开源工具

文章插图