200 个工具分析机器学习十年:前途未卜、工程师是核心( 四 )


200 个工具分析机器学习十年:前途未卜、工程师是核心

文章插图
开源与开放核心
在 202 个工具中 , 其中有 109 个是开源软件(OSS) 。即使有些工具不是开源的 , 它们大多数也会附带一些开源的工具 。
这里有几个开源软件的原因:一是所有支持开源的人多年来一直都在说的原因 , 透明、协作、灵活 , 但这一个原因似乎只是一个道德上的约束 。另一个是 , 客户并不想在看不到源代码的情况下使用新的工具 , 因为在看不到源代码的情况下 , 如果这个工具被关闭 , 他们将不得不重写代码 , 实现这个功能 。
开源并不意味着不盈利 , 也不意味着免费 。开源的维护很费时 , 并且成本也很高 。据说 , TenserFlow 团队有接近 1000 人 。公司不会在没有商业目标的情况下提供开源软件 。如果有更多的人使用他们的开源工具 , 就会有更多的人了解他们 , 信任他们的技术 , 并且会购买他们的专有工具 , 并且也能让更多的人希望加入他们公司 。
Google 通过推广 TenserFlow , 希望能够让更多的人使用他们的云服务 。NVIDIA 维护 cuDF 库也是希望有更多的人来买他们的 GPU 。Databricks 免费提供 MLflow , 但出售他们的数据分析平台 。Netflix 最近成立了专门的机器学习团队 , 发布他们自研的 Metaflow 框架 , 用以吸引人才 。自然语言处理工具 SpaCy 是免费的 , 但是 Prodigy 却是收费的 。
开源已经变成了一种行业标准 , 创业公司很难从中找到一种可行的商业模式 。任何一个刚起步的公司 , 都必须与现有的开源工具进行竞争 。如果你也仅仅只开放核心 , 你需要仔细思考 , 哪些特性是要包含在开源软件中 , 而哪些是要放在付费的版本中 。既要让用户不觉得你贪婪 , 也要能够让免费用户付费 。
200 个工具分析机器学习十年:前途未卜、工程师是核心

文章插图
总结
关于人工智能的泡沫是否会破灭 , 人们也是议论纷纷 。现在 , 人工智能上很大一部分投资都在自动驾驶上 , 但是到现在仍然没有一款完全自主驾驶的汽车出现 。一些人认为投资者将会对人工智能失去希望 , Google 也冻结了在机器学习上的人员招聘 , Uber 解雇了一半的人工智能研究团队 。有传闻说 , 学习机器学习相关的人员远多于机器学习相关的工作岗位 。
现在是进入人工智能领域的好时机吗?我相信 , 现在是有在炒作人工智能的概念 , 但在某一个时刻 , 会冷静下来 。有可能这个时间点已经发生了 。我不相信机器学习会消失 , 有能力进行机器学习研究的公司会越来越少 , 但是绝不会缺乏将机器学习现有的工具引入产品的公司 。
如果必须在人工智能专家和工程师之间做一个选择 , 那么请选择工程师 。对于工程师来说 , 学习人工智能相关知识会很容易 , 但是对于人工智能专家来说 , 成为一个很好的工程师要困难得多 。如果你是一个优秀的工程师 , 并且能够为构建人工智能工具而努力 , 我会由衷地感谢你 。
致谢:感谢 Andrey Kurenkov 在我撰写本文时所做出的指导 。感谢 Luke Metz 的审校 。
英文:What I learned from looking at 200 machine learning tools
链接:
https://huyenchip.com/2020/06/22/mlops.html
作者:Chip Huyen , 计算机科学家 , 现就职于硅谷的一家人工智能初创公司 , 专注于机器学习生产流程 。
译者:罗昭成




推荐阅读