|面向初学者的数据分析知识,让你快速了解数据分析( 三 )
6. Excel
此工具是数据分析中使用最广泛的工具之一 。 该工具通常用于客户的内部数据 , 它 通过透视表的预览来分析汇总数据的任务 。
7. RapidMiner
一个功能强大的集成平台 , 可以与任何数据源类型(例如Acess、Excel、Microsoft SQL、Tera数据、Oracle、Sybase等)集成 。 该工具主要用于预测分析 , 例如数据挖掘、文本分析、机器学习 。
8. KNIME
Konstanz Information Miner(KNIME)是一个开放源数据分析平台 , 可让您分析和建模数据 。 利用可视化编程的优势 , KNIME通过其模块化数据管道概念提供了一个报告和集成平台 。
本文插图
9. OpenRefine
也称为GoogleRefine , 此数据清理软件将帮助您清理数据以进行分析 , 用于清除凌乱的数据 , 转换数据以及从网站解析数据 。
10. Apache Spark
最大的大型数据处理引擎之一 , 该工具在Hadoop群集中执行应用程序的内存速度快100倍 , 磁盘速度快10倍 , 该工具在数据管道和机器学习模型开发中也很流行 。
五、数据分析历史故事分享
伦敦霍乱的数据追踪:
本文插图
图片来自网络
约翰·斯诺(John Snow)(不是权力游戏的角色)是一位英国医生 , 他使用数据收集和数据分析来追踪伦敦市中心霍乱暴发的根源 , 得出的结论是霍乱是由“水中的媒介”传播的” , 而不是通过“不良空气”传播的公认理论 。
斯诺利用数据收集来追踪霍乱的暴发 , 原因是两家自来水公司从泰晤士河中抽取了水 , 而这些水几乎没有经过过滤 。
他指出 , 一个巨大的双盲实验落入了他的大腿:
“不分男女 , 从各个年龄段 , 各个阶层 , 不同阶层 , 到三十万 , 从绅士到穷人分为两组 , 没有他们的选择 , 并且在大多数情况下 , 没有他们的知识;一组被供应含有伦敦污水的水 。 其中 , 任何可能来自霍乱患者的东西 , 另一组的水中完全不含这种杂质 。 ”
斯诺对后续数据和其他工作的分析导致伦敦和其他城市的水和废物管理发生根本变化 , 挽救了许多生命 , 并为全球公共卫生做出了重大贡献 。
六、如何成为一名数据分析师?
数据分析师收集 , 处理和执行大型数据集的分析 。 无论大小 , 每个企业都会生成并收集数据 , 这些数据可以采用客户反馈、客户、物流、市场研究等形式 。
我认为作为一名数据分析师 , 至少得具备以下这些技能:
- 数据分析师首要的就是用数字说话:因此很明显 , 数学是成为数据分析师的重要组成部分 , 线性代数和微积分的知识是将业务问题转换为数学表达式所必需的 。
- 概率和统计:这些事想要成为数据分析师的必备技能 , 为了得出准确的结论 , 我们需要知道事件发生的可能性 , 也就是概率 。 为了进行推论和解释数据 , 我们必须了解如何应用各种统计测试和技术 。
- 编程:绝对是数据分析的最重要组成部分之一 。 因此 , 学习一种或多种编程语言 , 例如Python、Java、SQL、R来进行数据管理和探索是必要的 。
从根本上讲 , 学习如何成为数据分析师与在任何行业中谋求职业生涯一样——努力工作与成功成正比 , 仅仅靠天赋是不够用的 。 一旦你成为了一名数据分析师 , 你将可能体验以下职责:
- 与技术团队 , 管理层和/或数据科学家一起制定目标;
- 从主要和次要来源挖掘数据;
- 清理和解剖数据以摆脱不相关的信息;
- 使用统计工具和技术分析和解释结果;
推荐阅读
- 猎云网|医疗大数据分析服务商“脉兴医疗”获树兰俊杰资本千万级投资
- 微信|如何搭建面向高端人群的微商城会员体系
- |LG将面向中端市场推三款Q系列智能手机
- |6种数据分析实用方法,终于有人讲明白了
- 币圈卫道士|面向中国用户重启的“门头沟”要跑路了?
- 美舆世界|数据分析还不够,三彩家SaaS助力企业数据可视化管理
- 融资并购|微生物测序及微生物基因组大数据分析服务商“予果生物”完成2.18亿元A轮融资
- cnBeta|三星推出Galaxy Tab Active3 这是一款面向企业的三防平板电脑
- ZHotel|面向“Z世代”人群,亚朵旗下首家ZHotel在京开业
- 数据|数据分析入门:8个超实用数据可视化工具,菜鸟也能轻松上手