不同的数据挖掘工具,各自能够解决啥独特的问题
我就是做数据挖掘的,凡是不要看工具用什么,说实话工具都一样的,因为读写分离的原因,我们不可能在生产环境上写大量复杂的sql查询来拖慢生产环境性能,所以才会用一些ETL工具抽取数据副本到另一个环境,具体选什么工具实话无所谓。看你自己用什么环境,选择对应的就OK。这个网上翻翻不难,而且工具都差不多。数据挖掘还有一个包含是数据分析,数据分析简单的有写纯sql查询来获取结果的,然后会创建cube来做数据切片分析结果。最后有专业的数据挖掘算法来分析数据,比如贝叶斯分组,遗传算法等。 所以工具不是重点。
■网友
工具对一般人来说绝不仅仅是工具,只有能创造工具的大神才能认为自己的思想比工具更重要,而对于普通人来说思想实际上是经常受限于工具的。sql具有强大的数据处理能力,并且有着简单的语法,普通人也能使用它方便的处理较大规模的数据,在处理能力上SAS,R,clementine都差很远;但是sql不能拿来建立模型。python同时具备强大的数据处理能力和建模能力以及比较简单的语法,因此个人认为是数据挖掘上来说最强大的单个工具;只要数据量没有上tb级别,你都可以单纯依靠python在单机上完成数据挖掘的全部流程。weka是java的一个库,weka虽然也有针对大规模数据的部分,但不成熟,因此不算很强大;但是java,也包括c++,在功能上这两个编程语言是非常强大的,只是没那么容易学。如果你很少用上面那些工具,你可能还没有关注到数据的处理能力这方面,包括时间上(速度)和空间上(内存)
■网友
楼主提到的这些“工具”根本不是一个层面的东西,本身没什么可比性:python, ruby, R是编程语言,SQL-server是关系型数据库,Weka是机器学习或数据挖掘的库与工具。核心是充分掌握机器学习、数据挖掘的那些算法,然后根据算法来选择称手兵器。
■网友
之前也用过别的工具,如果你是需要全平台数据抓取、文本采集方面比较有针对性的,推荐simplyAnalytics
介绍一下这个工具,全采集互联网UGC)数据。自定义采集任务,后台帮助自动完成数据采集、清洗、加工、存储等处理服务,前台提供友好操作管理界面进行项目及任务管理,根据分析需求进行图表、数据内容的查询。支持BI输出,可提供专业灵活的数据配置及生成可视化报表服务。
大致是这样的
【不同的数据挖掘工具,各自能够解决啥独特的问题】
■网友
ETHINK数据智能分析平台有数据挖掘的功能模块,可免费申请试用的
推荐阅读
- 长春评选“网络奋斗者”:互联网成更多普通人创业工具
- 趣头条|【为什么300万人都选帝豪GL】因为有你,每个周末都与众不同
- 概念车|历久弥新 与众不同-B级家轿 英诗派
- 陆毅|三部大戏相继开播“观众缘”各不同
- 大学要开始查文献le,求问有哪些中英文的文献网站或下载工具(最好是医药,生命科学类的),多谢啦?
- 长寿|同样都是吸烟,为啥日本人能够长寿?医生说出几点不同,值得思考
- 趣头条|实用的代步工具,第三代哈弗H6!
- 喃喃话车|丰田亚洲龙怎么样,级别高性价比偏低,两种人看法不同
- 为啥会有多种通信协议
- QQ在pc端同时登录两个为啥不会发生ip地址冲突