有关于机器学习及实战的疑问?

你需要用什么,就去学什么。我的经历对你不太有借鉴价值。我是从生物专业转进数据分析,和你正好反过来。
■网友
貌似现在搞机器学习大家用的都是python,matlab,和R,很少有用c++的。我建议题主学一下python,如果只是为了搞机器学习的话,应该一两天就可以上手。python有一套很齐全的科学计算库,结合起来使用,功能很强大。numpy,scipy,pandas,matplotlib,ipython,scikit-learn等等。要实战的话,有一本《机器学习实战》,代码用的python,不过这本书上基本没有数学,有时候看起来会很纳闷,完全搞不懂在干什么(特别是logistic回归部分,数学没讲清就直接上代码了)。stanford的cs229不错,可以看他们的notes,数学部分就讲的很好。至于hadoop,后期如果要处理很大数据的话,应该是必须的。我曾经一次运算程序算了整整21小时(当然也有python太慢,算法没优化的原因),而且数据量还不算太大,真要应用的话,处理的数据量比这大一百倍。这时hadoop就有用武之地了。


    推荐阅读