大数据基础架构Hadoop( 六 ) _Hadoop

2）ZooKeeper 。ZooKeeper主要用于保证集群各项功能的正常进行，并能够在功能出现异常时及时通知集群进行处理，保持数据一致性。ZooKeeper是对整个集群进行监控，可解决分布式环境下的数据管理问题。
3）HBase 。HBase是一个针对非结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。HBase提供了对大规模数据的随机、实时读写访问。同时， HBase中保存的数据可以使用MapReduce进行处理。HBase将数据存储和并行计算很好地结合在一起。
4）Spark 。Spark是一种快速、通用、可扩展的大数据处理引擎，继承了MapReduce分布式计算的优点并改进了MapReduce明显的缺点。Spark的中间输出结果可以保存在内存中，因此能更好地适用于数据挖掘与机器学习中迭代次数较多的算法。
5）Flume 。Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输系统，适用于日志文件的采集。
6）Kafka 。Kafka是一个分布式的基于发布/订阅模式的消息队列，主要应用于大数据实时处理领域。Kafka是一个事件流平台，能够连接其他数据源进行持续的数据导入或导出，并且可以根据需求持久可靠地存储数据。
本文转载于http://blog.itpub.NET/70024420/viewspace-2928855/ ，作者摘编于《Hadoop与大数据挖掘》。

大数据基础架构Hadoop( 六 )

推荐阅读

吆唱娱乐菌：somi迷之自信成全申宥娜的幸运

『手机大魔王』小米新系统引发恐慌，如果系统不安全，你还会继续用吗？

陈萌|陈萌自曝被闺蜜劝分，为朱小伟跟其断绝来往，称防火防盗防闺蜜

涂涂画画就能和阿尔法蛋互动游戏，发散孩子思维，轻轻松松学编程

花同学爱拍照|1.78m美女的牛仔优雅风穿搭，腿长一米不是梦

「特种兵」现实版的“士兵突击”：他打败欧美13支特种兵，获2次个人一等功

高考|高考试卷一公布，就知道原来初中这么重要，扎实基础按这四点做起

美国|确诊病例上升100万仅用17天，美国专家反思疫情应对

荣耀手机|6400万广角长焦微距四摄，8+128GB+40W华为中端机已降至2099

井冈翠绿茶叶传说典故,井冈翠绿

itMode|马丁靴＋裙子，马丁靴＋工装裤：又酷又撩，时髦炸了！

科技天天侃华为无奈接受现实，后路还有一条，雪上加霜！联发科突然宣布

功夫红茶喝了能减肥吗,姜红茶能减肥吗

【北京办公窗帘】北京办公窗帘制作公司哪个好

Sora到底怎么样？第一批试用者这样说！

黎贝卡的异想世界|谁说鼻子塌就不好看了！她们刷新了我对鼻子美的认知

山西逾68万名学生受益农村义务教育营养改善计划

时尚|赌王葬礼：原配家成员打扮最随意，有人红头发有人穿背心，究竟哪来的底气？

娱乐掮客|前面一美女点了一碗水饺。，幽默笑话：在快餐店排队

淘宝|提前过双11？淘宝突然崩了引热议官方回应