年薪50万都难招的大数据工程师,凭什么?( 四 )


2. 推荐系统中的个性化推荐 - 召回算法
3. 推荐系统中的个性化推荐 - 排序算法
4. 基于Spark mllib回归算法、分类算法,协同过滤算法
5. 大规模机器学习平台(Angle)
十三.Storm (分布式实时数据计算系统)
Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流 。而且支持水平扩展,具有高容错性,保证每个消息都会得到处理 。Storm处理速度很快(在一个小集群中,每个结点每秒可以处理数以百万计的消息) 。
Storm的部署和运维都很便捷,更为重要的是可以使用任意编程语言来开发应用 。
1.Storm 简介
2.Storm 原理和概念
3.Storm 与 Hadoop 的对比
4.Storm 环境搭建
5.Storm API 入门
6.Storm Spout
7.Storm Grouping策略及并发度
8.Storm 优化引入zoolkeeper锁控制线程
9.Storm 去重模式
10.Storm shell脚本开发
11.Storm 批处理事务
12.Storm 普通事务分区事务
13.Storm 按天计算
14.Storm 不透明分区事务
15.Storm 事务
16.Storm Trident
十四、Java性能优化和分布式中间件探析
1.再谈JVM 内存模型
2.JVM算法和垃圾回收机制
3.JVM生产环境监控命令和指标
4.JVM面试常考点分析
5.Java多线程实战
6.Java锁机制分析和优化
7.Kafka 和 ZooKeeper 的分布式消息队列原理
8.5.ZK在kafka的作用,分布式环境中Leader机制和算法研读
 




推荐阅读