对爬虫抓取的数据进行分析该用MySQL还是mogodb

mongo吧
■网友
数据库选型的依据太多了,比如业务、资金、机房剩余机架位等等。
■网友
数据量才这么点,完全可以存在mysql里。分析时先随机抽出100万条用excel分析,得出基础的结果。而后在根据初步分析的思路,写sql来进行完整数据的统计。觉得sql能做的事儿太少,那就把数据放到hive里,聚合函数能帮你完成复杂统计分析,或者直接码代码。这么少的数据,还是不要在性能上纠结,执行速度差那几分钟都不是事儿。----------------------------------------------------------------------------------------------------------补充一下,我说的聚合函数不是mysql的group by min max之类的,是说hive或者impala里lead() rank()这种的,统计分析基本不需要写代码了。


    推荐阅读