数据科学家的开源社区分析指南


数据科学家的开源社区分析指南

文章插图
 
在数据分析的黄金时代 , 开源社区也不能免俗 。大家都热衷于将一些华丽的数字放到演示幻灯片上 , 但如果你掌握了正确的分析方法 , 这些信息可以为你带来更大的价值 。
或许你认为作为一名 ??数据科学家?? , 我会告诉你数据分析和自动化能为你的社区决策提供信息 。但实际上 , 情况恰恰相反 。利用数据分析来构建你现有的开源社区知识 , 吸收其他的知识 , 并发现潜在的偏见和没有思考过的观点 。你或许是实施社区活动的专家 , 而你那些同事则是代码方面的专家 。当你们每个人都在自己的知识背景下将信息可视化时 , 你们都可以从这些信息中受益 。
让我们来面对现实吧 。每个人都有一千零一件事情要做 , 而且总感觉一天的时间永远不够用 。如果需要几个小时才能得到你的社区的答案 , 你就不可能有足够的精力去解决这些事情 。但是 , 花时间创建一个全面发展的可视化项目 , 可以帮助你时刻掌握你所关心的社区的不同方面 , 这就将你从精疲力尽中解放了出来 。
随着“数据驱动”思维的盛行 , 围绕开源社区的信息宝库可能是一种祝福 , 也可能是一种诅咒 。下面我将分享一些方法 , 告诉你如何从数据干草堆中挑出有价值的信息 。
你的预期是什么?当考虑一个指标时 , 首先要明确你想提供的观点 。以下是几个可能涉及的概念:
告知性和影响性的行动: 你的社区是否存在某个领域尚未被理解?你是否已迈出第一步?你是否试图确定特定方向?你是否正在衡量现有倡议的效果?
暴露需要改进的领域和突出优势: 有时你想宣传你的社区 , 突出它的优势 , 特别是在试图证明商业影响或为项目宣传时 。然而 , 当涉及到向社区内部传递信息时 , 你通常需要从一堆指标中精准的找到你们的缺点 , 以此来帮助你们改进 。虽然突出优点并非不可取 , 但需要在适当的时间和地点 。不要把优势指标作为社区内部的拉拉队 , 告诉每个人都有多棒 , 而是要与外界分享 , 以获得认可或推广 。
社区和商业影响: 数字和数据是许多企业的语言 。但是这可能使得为你的社区进行宣传并真正展示其价值变得异常困难 。数据可以成为用他们的语言说话的一种方式 , 并展示他们想看到的东西 , 以使你数据背后的潜在含义能够被有效转达 。另一个角度是对开源的整体影响 。你的社区是如何影响他人和生态系统的?
这些观点并非非此即彼 , 而是相互关联的 。适当的框架将有助于创造一个更深思熟虑的衡量标准 。
 
数据科学家的开源社区分析指南

文章插图
 


    推荐阅读