InfoQ|重新思考日志：业务系统竟然是一个大数据库？( 二 ) 《IHeartLogs》出版于2014年

实践中，为了解决特定领域问题的数据系统层出不穷，主要原因在于要构建一个通用的分布式数据库难度巨大，将问题投影到具体的某个场景上能减小系统设计的复杂度，使得系统的构建变得容易。
拆分还是合并？这个巨型分布式数据库的未来会向什么方向发展？作者认为有3种可能：
当前状态的延续，不同的系统继续处于割裂发展的状态，用非系统性的方案解决系统之间的数据集成问题
所有系统逐渐走向一统，也就不存在系统之间的数据集成问题
将开源项目视作乐高积木，每个团队根据需求构建自己的巨型分布式数据库
重要的积木：日志在构建企业独特的巨型分布式数据库时，如果有了日志这块积木，其它系统的设计复杂度将得到降低。具体地说，日志系统可以用来：
序列化并发更新，处理数据一致性问题
支持节点间数据复制
向外部系统提供事务提交的语义
向外部系统提供日志订阅功能
向故障节点提供故障恢复能力
解决数据负载在节点间的平衡问题
…
解决了这些问题，巨型分布式数据库的查询层就只需要完成索引构建、暴露统一API的工作。抽象地思考，这个系统可以简单地分为两部分， Log和ServingNodes：

文章图片
所有的数据直接写入Log(或被ServingNodes代理) ，然后所有的ServingNodes通过订阅Log来建立索引，向外提供数据服务。这种设计就是以日志为中心(log-centric)的设计：

文章图片
这个系统本身可以直接通过流处理器(streamprocessor) ，将日志流直接或与其它数据结合，一同提供给其它索引服务。尽管Kafka、BookKeeper、Pulsar这些都是日志服务的候选，但这里所述的以日志为中心的设计仅仅是一种思想，你甚至可以利用类似DynamoDB来构建这样的日志服务，只不过你可能需要做一些额外的工作来支持日志应该提供的功能和保证。
日志与流处理、批处理数据集成数据集成(DataIntegration)的意思是：
让企业中的所有服务和系统能访问其需要的任意企业数据
我们可以类比马斯洛需求层次理论，将企业对数据的需求也看作是一个金字塔状的结构：

文章图片
最底层是数据的收集和查询，让所有上层服务能够以简单、标准的形式读写。一旦数据的最基本需求得到满足，就可以基于此进一步做数据语义解析、数据理解和自动化。
数据集成的难点主要在以下两个方面：
数据的多元化：用户行为数据、机器指标统计、IoT相关数据等
数据系统的爆炸式增长：OLAP、搜索引擎、对象存储、批处理系统、图数据库等
解决问题的方式有很多种，作者认为最自然的一种方案就是采用日志：

文章图片
每个数据源都可以按照它的日志来建模，将数据源上发生的事件看作是连续的日志事件，即所谓的日志流。所有需要这些数据的系统就各自去订阅日志流，各自按照自己的需求、节奏来选择消费数据的量和速度。
批处理与流处理书中提到一个很不错的例子：人口普查。人口普查的做法很像归并排序，先在最低级别的行政区域内挨家挨户搜集信息，聚合数据，然后逐层向上汇报，最终得到人口估计值。但这个过程通常十分漫长，每一层级人口数据的聚合都需要等待下级汇报的结果，等到最终得到人口普查结果时，其实又已经有很多人口出生了。这是典型的批处理场景。如果是流式处理该怎么做？每当有一个人出生或死亡，就直接上报到统计中心，由统计中心动态地聚合数据，理想情况下可以得到人口在每个时刻的规模。这就是典型的流处理场景。

InfoQ|重新思考日志：业务系统竟然是一个大数据库？( 二 )

推荐阅读

羽豪谈娱乐|真的太显年轻了！，宁静留金色短发穿字母外套像个帅气的假小子

游戏圈那点事|炉石传说：最不受待见关键词？新玩家都不认识，狂野也见不到

傅菁：《命中注定我爱你》翻拍效果被赞！男女主是第3次合作，傅菁演技太惊喜

游泳时腿抽筋怎么办呢？

4年前，因吃奶太用力被妈妈用剪刀划伤的男婴现状如何？让人感慨

央视|中央气象台：立冬日再迎冷空气东北华北大风降温

红茶带给我们什么,金骏眉红茶的功效

刘涛|刘涛，激动发文！

工业互联网赋能“中国制造”转型升级

上海地铁将禁手机外放-地铁手机外放规定

「人生阅历分享」通透睿智，值得一读，充满正能量的短语

你知道吃牛排刀叉的正确拿法吗？吃西餐刀叉怎么拿

男生找女朋友除了看感觉还看啥比较多一点

雷军为啥任正非、雷军都会用iPhone手机，而不是自家的华为、小米？

海外网|日本奈良小鹿暴瘦？当地保护团体披露真相

测谎结果不属于合法证据形式究竟怎么回事？测谎结果不属于合法证据形式令人震惊

贪吃的骆驼|他会成为司马懿，还是诸葛亮，如果周瑜像孙权一样长寿

佳人时代|秘诀在她的穿衣搭配上，能驾驭各种风格，杨紫28岁依然少女感十足

茹文历史说|勇士队格林跨界电视节目ＰＫ巴克利自称再打６－７年退役

2021款奇瑞捷途x90plus,2020奇瑞捷途x90价格-