数据挖掘、分析、可视化,现在大一咋走

首先,数据挖掘和数据可视化属于完全不同的方向吧= = 如果立志把机器学习的算法学好,学数理统计必然是有用的。至少在研究生级别的靠谱的机器学习课程,一定的概率论,数理统计,线性代数以及泛函基础是要有的。其次,编程也不能落下。国内的统计教育体系还是有很大问题的,回过头来看,在不兼顾效率的情况下,Python和R是做机器学习必修的语言了(各有各的优点,建议都学)。如果数据量大和模型够复杂,可能需要考虑上C++。国内情况不清楚,科技公司更青睐招CS的人(可能是因为算法层面交给PhD来做研究生的话更多是打下手,所以效率更加重要),挺多面试都是先要过算法题,然后再是机器学习方面的东西。数据可视化的话,和统计的关系并不大了。虽然,ggplot2的作者是学统计出身,但是大部分做可视化方向的仍然是CS系以及偏CS的design(参考NYU ITP)。做InforViz方向用javascript以及js的拓展d3.js,做ScientificViz方向有用C++的。现在Large Scale Visualization是个非常热门的话题,基本上没一个好的CS基础是不行的,做得好的话基本上就是$$$。 如果培养计划以及个人能力允许的话,主修统计辅修个CS?这样研究生想继续做CS或者读统计都很方便? 无论做data哪个方面,现在编程都很重要。重要。要。。。最后,做Risk的话安安心心读统计或者数学吧 = = 。


    推荐阅读