大数据文摘■从全栈工程师到数据科学家,入职第一年我都做了些什么?( 四 )


在计划方面 , 我喜欢将开发工作视为线性的——你知道自己在做什么以及如何做 。 数据科学工作我觉得是分叉树 , 可能需要试不同的道路 , 可能会碰到死胡同 。
数据科学家做短期工作计划还是可行的 , 比如你正在训练和测试的模型之类的——接下来一两周的工作 , 但是 , 长期计划很难做 。 你不可能总是提前知道什么会起作用 , 什么不会 。 所以我们才要进行实验和测试 , 这是数据科学家工作的核心价值 。
最后 , 花点时间去做不一定会有成果的工作 , 即使不起作用 , 也没什么大不了的 。
回答正确的问题
在过去一年中(这让我栽过很多跟头) , 我发现数据科学工作的关键部分是回答问题 , 但更重要的是回答正确的问题 。
正如我所说 , 我栽过几次跟头 , 当时我正在回答一个问题 , 但并没有回答业务方实际想要回答的问题 , 之所以发生这种情况 , 是因为业务方使用的业务语言跟我用的的技术语言有差异 , 有时候我们用一样的词但要表达的意思却不同 。
针对这问题我的解决方法是在做项目的实际工作(现在称为“项目前”工作)之前先做准备性工作 , 在这个阶段 , 我会从业务方那里收集初始需求和信息 。 做一些初步分析 , 然后给业务方展示 。
运用敏捷的工作思路 , 我希望在每个sprint实现一个可交付的成功 , 并向业务方展示该成果 。 这样 , 我与业务方建立了一个有效的循环反馈机制 , 向他们展示一些东西并询问他们的意见 , 这可以建立一个有效对话 , 从而更清晰地定义真正要解决的问题 。 这个方法在项目各个阶段都有效 , 不仅仅是初始阶段 。 当你向业务方展示你的工作结果时 , 可能会激发他们不同的想法以及他们之前没有考虑过的思路 。 从而你能找到他们真正的痛点 。
所以过去一年来我发展的一项关键技能是与业务方的互动交流 , 深入挖掘他们真正想要的东西 。
总结
Python比R更容易学习 , 因为对于程序员来说python与其他编程语言更接近 。

  • 边执行边做文档
  • 学习如何使用关系数据库 , 比如SQL , 用数据库来查询 , 操纵和存储数据 。
  • 你需要准备很多展示 , 不仅是向项目业务方的报告 , 还要向公司其他同事报告 , 甚至是公司外面的人 。
  • 你需要提高演讲能力以满足不同受众(技术或非技术)的需求 。
工作计划不是一帆风顺的 , 因为你无法预知什么起作用什么无效 , 要有心理准备有时候花了时间不一定取得预想的结果 。
花时间找你真正要解决的问题 , 不要不加思考就埋头开始做 , 与业务方建立反馈闭环是很有必要的 。
相关报道:
【大数据文摘■从全栈工程师到数据科学家,入职第一年我都做了些什么?】https://codebuildrepeat.blogspot.com/2020/03/my-first-year-as-data-scientist.html


推荐阅读