文章插图
作者 | SebastianScholl
译者 | 刘静,责编 | 郭芮
出品 | CSDN(ID:CSDNnews)
以下为译文:
你肯定已经了解流行的开源工具,如R、Python、Jupyter笔记本等 。但是,除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方 。这些并不像他们的同行那样出色,但可以成为许多机器学习任务的救星 。
文章插图
在本文中,我们将介绍21种用于机器学习的开源工具 。我强烈建议你花一些时间浏览我提到的每个类别 。除了我们通常在课程和视频中学到的东西之外,还有很多需要学习的地方 。
1.向非程序员的开源机器学习工具
对于来自非编程和非技术背景的人来说,机器学习看起来很复杂 。这是一个广阔的领域,我可以想象第一步可能会多么令人生畏 。没有编程经验的人能否在机器学习中取得成功?
事实证明,你可以!这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界:
- 优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码 。您需要提供的只是一个包含数据的CSV文件,一个用作输入的列的列表,以及一个用作输出的列的列表——Ludwig将完成剩下的工作 。
- KNIME:KNIME允许您使用拖放界面创建整个数据科学工作流程 。这种可视化实现整个模型工作流的方法非常直观,在处理复杂的问题陈述时非常有用 。
文章插图
- Orange:您不必知道如何编码以便能够使用Orange挖掘数据,处理数据并获得洞察力 。
【21 个必须知道的机器学习开源工具】另一方面,你可以考虑一些开箱即用的付费服务,例如google AutoML、Azure Studio、Deep Cognition和Data Robot 。
2.用于模型部署的开源机器学习工具
部署机器学习模型是最容易被忽视但重要的任务之一,它几乎肯定会在采访中出现,所以你可能也很熟悉这个话题 。
以下是一些框架,可以更轻松地将你的项目部署到现实世界的设备中 。
- MLFlow:MLFlow被设计用于使用任何机器学习库或算法,并管理整个生命周期,包括实验、重现性和机器学习模型的部署 。
文章插图
- Apple的CoreML:CoreML是一个流行的框架,它可用于将机器学习模型集成到你的IOS / Apple Watch / Apple TV / macOS应用程序中 。关于CoreML的最好的部分是你不需要有关神经网络或机器学习的广泛知识,双赢!
文章插图
- TensorFlow Lite:TensorFlow Lite是一组工具,可帮助开发人员在移动设备(Android和iOS),嵌入式和物联网设备上运行TensorFlow模型 。
- TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选 。它是一个开源库,可让你在浏览器中构建和训练机器学习模型 。
文章插图
适用于大数据的开源机器学习工具
大数据是一个研究如何分析、系统地从数据集中提取信息,或者处理传统数据处理应用软件无法处理的太大或太复杂的数据集的领域 。想象一下,每天处理数百万条推文进行情感分析 。这是一项艰巨的任务,不是吗?
别担心!这里有一些工具可以帮助你处理大数据 。
- Hadoop:使用大数据最重要和最相关的工具之一是Hadoop项目 。Hadoop是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集 。
文章插图
- Spark:Apache Spark被认为是Hadoop用于大数据应用程序的自然继承者 。这个开源大数据工具的关键点在于它填补了Apache Hadoop在数据处理方面的空白 。有趣的是,Spark可以处理批量数据和实时数据 。
- Neo4j:对于所有与数据相关的大问题,Hadoop可能不是明智的选择 。例如,当你需要处理大量网络数据或图形相关问题(如社交网络或人口统计模式)时,图形数据库可能是最佳选择 。
推荐阅读
- 5 个用于在 Linux 终端中查找域名 IP 地址的命令
- 快速理解色彩搭配的三个配色知识
- 分析:网络中的各种互通与不通
- 什么是MVC开发,及MVC开发规则
- 只要输入网址,就知道网站所有信息
- 首个厦门产区生产的茶品莲花高山茶即将诞生
- 虚拟主机和云服务器哪个对网站seo优化有利
- 登入月亮的有哪些国家 离月亮最近的国家是哪个
- 梦见弟媳妇生了个男孩我抱着呢 梦见弟媳妇生了个男孩会说话
- 惊蛰你吃梨了吗?如果不知道这4个讲究 吃了也是白搭