学习hadoop，理论知识看了遍，但是实战咋去做有没有比较好的书籍或网站另外实习或者工作的要求先写wordcoun

先写wordcount terasort写完能跑就行然后找到运行log 系统log看看怎么调试hadoop程序
■网友
关于实践方面：1 平台方面的熟悉，可以使用自己的电脑或者实验室的环境部署一些少量节点的集群玩玩；2 关于数据应用挖掘方面，可以找一些网上的实例，跑跑，改改；3 可以尝试自己爬取一些实际的互联网数据，尝试去挖掘或者提取有用的数据；关于知识的扩展的话，大数据领域对于知识的扩展以及学习能力是要求很高的，因为这个领域的变化太快，所以需要快速的进行新技术的响应，以及解决问题的能力锻炼等。如果你是在校学生，建议参加一些有实际项目的实验室，但更建议是找机会出来实习，在真实的环境中才能真正接触到数据，接触到实际的生产架构。此外，就是多关注一些社区，关注一些大数据方面的公众号，多参与一些在线上线下的技术交流，有帮助的。
■网友
我记得在学校时上了云计算的课程，老师让搭建一个文献管理系统，除了搭建网站的部分有些坑爹，学习如何用hadoop MR处理数据还是学到了不少。基础的部分看了Hadoop_The_Definitive_Guide_ThirdEdition, 然后有另外一门课程要求写一个分布式系统的review，当时就写了hadoop，Hadoop Overview。实践上，学校里学习了基本的word count，写MR处理数据，比如自己实现partitioner，实现secondary sort等等，这是课程项目https://github.com/lgrcyanny/PaperBook-MapReduce在这个项目中有一个把数据搬迁到HBase的实践，然后就看了HBase，并写了些架构分析HBase Architecture Analysis Part1(Logical Architecture)基本上是对大数据感兴趣，然后选择这方面的课程，选一到两个开源项目多看看。后来，就来到百度了，然后觉得自己在学校学的只能算是基础，这边的基础大数据平台实力很强。跟着几位大牛开始写一个分布式QueryEngine System, 大数据自己学习准备基础的就行，企业里的环境是自己的mac和虚拟机器上难以模拟的。对于找工作还是基本的算法，编程能力和熟悉一到两个开源大数据系统。比如Spark现在很火，可以多研究些streaming，和machine learning方面的。学习材料1. 官方文档就很不错，比如spark的http://spark.apache.org/docs/latest/2. paper, 看hadoop和spark的paper，比如http://dl.acm.org/citation.cfm?id=22283013. 业界动态： http://www.infoworld.com/category/big-data/4. 编程学习：Coursera | Online Courses From Top Universities. Join for Free(Functional Programming Principles in Scala)

学习hadoop，理论知识看了遍，但是实战咋去做有没有比较好的书籍或网站另外实习或者工作的要求

推荐阅读

怎样才是跑步减肥的正确方法你知道跑步的正确姿势吗？

『北京市民』北京市民900多项服务可支付宝上办

明星|杨紫琼回忆与成龙合作：用实力改变了他的看法

人民日报海外网|加拿大一渔船在纽芬兰和拉布拉多省遇险致1死1伤

长期酗酒者股骨头坏死危险增加近10倍

「走在城长的旅途」幽默的的十则小笑话，给你带来一天的愉悦好心情，生活需要放松

高材生|出生在一个没有希望的乡镇与家庭，他却成耶鲁高材生

嫁对人|嫁没嫁对人，那其实很好判断

大MU的世界：原来商细蕊第一人选不是尹正而是他，《鬓边不是海棠红》热播

lo圈破产娘1|何炅身材娇小却时尚，条纹长西装配黑衬衫，正装都能穿出文艺气息

董明珠|“牵手门”董小姐背景被扒：原来毁掉她的，根本不是这次牵手

3000年前的木乃伊

汽车达人小猪|体验全新迈锐宝XL，四缸搭配9AT真香，改变只为迎合

名将|文人之笔威力有多大？杜甫三首诗让三位名将羞愧

在家能做的工作有哪些？

前哨迷彩|除了没装电子战设备，名字也是亮点，它是世界上最大战斗机

怎么瘦腿最快最有效？如何瘦腿最快最有效！

直观视界|除了价格，处理器是亮点，华为新平板被曝光

茶水先生读《诗经》295：赉——昭告天下分封诸侯

旅行为啥要找旅行社