InfoQ为什么我劝你不要当数据科学家?


作者丨Chris
译者丨Sambodhi
策划丨陈思
数据科学家这一职位越来越火热 , 人人都想从事数据科学 , 这不仅因为这份工作听上去高大上 , 更重要的是 , 它真的是一份高薪的工作 。 但是 , 数据科学家是人人都能做得来的吗?
本文系一篇观点文章 , 我很乐意听到读者的反驳意见 。
成为一名数据科学家是每个人的梦想 。 甚至连奶奶级的人也想当数据科学家 。 但是 , 尽管数据科学可能是 21 世纪最性感的工作 , 但另一个报酬也同样丰厚的高薪职业——软件工程师 , 却被低估了 。
我经常会收到写刚毕业的学生和想改行的人写来的信 , 向我寻求从事数据科学的建议 。 我给他们回信说应该要去做软件工程师 。
鉴于我在数据科学家和软件工程师都有经验 , 我会试着说服你去成为软件工程师 。
软件工程的工作岗位更多
与数据科学相比 , 软件工程领域的工作岗位要多上一个数量级 。
下面是我在 Google 上搜索 Indeed(一家招聘网站)上的 “数据科学家” (Data Scientist)和 “软件工程师” (Software Engineer)岗位的截图 。
从搜索结果来看 , 数据科学岗位有 7616 个 , 而软件工程的岗位有 538893 个!这还只是美国的就业情况 , 但其他国家也显示出类似的结果 。
据 Glassdoor 的调查结果称 , 数据科学家的收入更高 , 但以我未经验证的假设是 , 数据科学领域的工作平均而言也更高级 。
也就是说 , 如果你得到了 Open AI 给的 100 万美元薪水的工作机会 , 我会建议你要抓住这个机会 。
“数据科学” 的含义还没有达成共识
管理层对 “数据科学” 的含义往往没有达成共识 。 也有可能是由于业务上的限制 , 他们没有办法生搬硬套一个角色框架 。
这意味着 “数据科学家” 的职责因公司而异 。
虽然从软件工程师到数据科学家之间的理想角色有可能存在 , 但在现实中却不大可能实现 。 这点对于那些仍在建设基础设施的初创公司来说尤为如此 。
被录用的应聘者最终都是为了解决公司目前需要解决的问题 , 而不是他们可能被录用的 “角色”。
来自该领域同事的轶事证据是 , 许多数据科学家发现 , 自己像软件工程师一样也要编写后端代码 。 我还认识其他所谓的 “数据科学家”, 他们是用 Excel 处理财务数据 。
而这与参加过 Kaggle 的你的期望大相径庭 。
数据科学是孤军奋战的工作
大多数公司并不像软件工程师那样需要那么多的数据科学家 。 其他公司正在招聘他们的第一位数据科学家 。
由于这个原因 , 许多数据科学家最终都将是孤军奋战 , 即使他们和开发人员在同一张桌子上工作 , 也是如此 。
这可能会导致很难获得反馈和第二种意见 。 软件工程师要么不懂预测建模 , 要么忙于处理完全不同的问题 。
相比之下 , 在软件工程团队的好处之一就是能够对同事们说:“我认为我们应该用 XYZ 的方式实现 ABC 。 你有什么看法?”。
要从事数据科学的工作 , 请做好和你自己或者一只橡皮鸭进行这样的对话的准备 。
InfoQ为什么我劝你不要当数据科学家?
本文插图
【InfoQ为什么我劝你不要当数据科学家?】

数据科学是探索性的工作
你要做好与管理层进行尴尬对话的准备 , 解释为什么你花了两个礼拜的时间做的东西还不能用 。
致力于解决已解决的问题与未解决的问题 , 是软件开发与人工智能的根本区别之一 。
撇开错误和约束不谈 , 在开始任何工作之前 , 你就应该知道大多数软件工程项目是否可行 。 但在机器学习领域就不能这样说了 , 因为你只有在构建模型之后才会知道模型是否有效 。
公司还没有为人工智能做好准备


推荐阅读