01 大数据时代的新挑战:实时流计算社会需求和科技进步是螺旋式相互促进和提升的 。“大数据”一词最早由Roger Mougalas在2005年提出,所以我们姑且认为2005年是大数据时代的元年吧 。
大数据技术之所以出现,是因为社会发展的程度已经开始要求我们具备处理海量数据的能力 。之后,大数据技术逐渐发展和日趋完善的过程又反过来进一步促进社会产生更多、更丰富的数据 。
随着大数据技术的普及,IBM公司为我们总结了大数据的五大特点(也称为5V特点),即Volume(大量)、Velocity(快速)、Variety(多样)、Veracity(真实)和Value(价值),如图1-1所示 。
文章插图
▲图1-1 大数据的五大特点
大数据时代为人们带来了丰富多彩的生活方式,让人们充分享受着从大数据中挖掘而来的价值 。但也正因为大数据产生得太多太快,让我们开始疲于对正在发生的事情做出及时反应 。
是的,面对无穷无尽的数据洪流,我们急需一种手段来帮助我们抓住并思考那些一闪而逝的瞬间 。在这样的背景下,实时流计算技术应运而生 。
虽然不能像电影《超体》中女主角直接用手抓住并分析电磁波信息那样,但至少实时流计算技术能够帮助我们抓住数据流的瞬间,分析并挖掘出数据的实时价值 。
千万不要小瞧了数据的实时价值 。据说在很久以前的欧洲战场上,每次最先知道战争结果的不是后方的政府机构,而是股票交易所里的那些股票投资者 。
俗话说,时间就是金钱,效率就是生命 。所有实时流计算的目的都是为了获得数据的实时价值 。如果数据没有实时价值,那么实时流计算也就失去了它存在的意义 。
02 实时流计算使用场景话说有一句至理名言:“天下武功,无坚不摧,唯快不破!”由此足可见“快”的重要性 。更快、更完整地获取数据,更快、更充分地挖掘出数据价值,已成为大数据时代各行各业的共识 。
在线系统监控、移动数据和物联网、金融风控、推荐系统等,虽然行业各不相同,但是它们有个共同点——实时流计算技术在这些领域发挥着越来越重要的作用 。
1. 在线系统监控
互联网行业蓬勃发展的背后,是各家企业机房里成千上万的服务器 。服务器在7×24小时(传说中的007工作制)的作业过程中产生大量监控数据 。
这些数据包含着服务器本身的健康状况,如硬件状态、资源使用情况和负载压力等 。第一时间知道服务器的健康状况是非常重要的,可以避免因为一台服务器宕机而后续造成的各种雪崩效应 。
除了服务器本身以外,复杂的线上业务系统产生着更多的数据 。如今一个每天亿万级别访问量的系统已经司空见惯,产品花样更是层出不穷 。业务系统产生日志的数量级由GB变TB,再由TB变PB 。
将线上日志导入实时流计算系统,我们可以实现一系列有实时价值的功能 。
- 最基本的功能是监控业务是否运营正常,如监控业务关键指标、发现故障模式等 。
- 高级些的功能是最大程度优化业务使用服务器的成本,如根据CPU、内存和I/O等资源的使用率动态扩展或缩减业务使用的服务器数量 。
- 更高级的功能是挖掘和探索新的业务模式,如CEP(Complex Event Processing,复杂事件处理)和在线统计学习或机器学习模型的各种运用等 。
2. 移动数据和物联网
移动终端、智能交通、共享单车、5G、工业4.0……如今在我们生活的时代,一波又一波的新名词层出不穷 。“移动”和“物联”让数据变得随时随地可得 。数据越来越多,单位数据自身的价值却越来越小 。实时处理海量数据洪流,已成为移动和物联网领域的当务之急 。
例如,对于智能交通系统,传统智能交通系统采用离线方式对交通数据做分析,交通决策不能及时做出;而通过对交通数据流进行实时分析,实时展现交通热点路段、优化信号灯配时、指导行车线路,可实实在在减轻当前热点路段压力、缩减平均行车时间,如图1-2所示 。
文章插图
【分布式系统ID的生成方法之UUID、数据库、算法、Redis、Leaf方案】
推荐阅读
- 君山银针如何鉴别,教你如何鉴别君山银针的品质
- 温州黄汤品质特点,蒙顶黄芽的功效特点
- 黄茶中的君山银针,君山银针的保质期
- 君山黄茶功效,君山银针的功效
- 北港毛尖的冲泡方法,北港毛尖茶的储藏方法
- 小鹅花钱是什么
- 苹果笔记本电脑怎么装Windows双系统
- 黄茶具有减肥的功效吗,细说最适合喝黄茶的5类人
- 分布式系统架构落地与瓶颈突破 进阶架构师必读,人人都是架构师
- 君山银针的作用有哪些,君山银针的特征