高并发服务遇Redis瓶颈引发的事故( 二 ) _Redis瓶颈

文章插图

发现问题，那么就要解决问题，redis 的 qps 优化方案有两步：
• 扩容 redis 节点，迁移 slot 使其分担流量 • 尽量把程序中 redis 的请求改成批量模式
增加节点容易，批量也容易。起初在优化推送系统时，已经把同一个逻辑中的 redis 操作改为批量模式了。但问题来了，很多的 redis 操作在不同的逻辑块里面，没法合成一个 pipeline 。
然后做了进一步的优化，把不同逻辑中的 redis 请求合并到一个 pipeline 里，优点在于提高了 redis 的吞吐，减少了 socket 系统调用、网络中断开销，缺点是增加了逻辑复杂度，使用 channal 管道做队列及通知增加了 runtime 调度开销，pipeline worker 触发条件是满足 3 个 command 或 5ms 超时，定时器采用分段的时间轮。
对比优化修改前，cpu开销减少了 3% 左右，redis qps降到 7w 左右，当然概率上消息的时延会高了几个ms 。
实现的逻辑参考下图，调用方把redis command和接收结果的chan推送到任务队列中，然后由一个worker去消费，worker组装多个redis cmd为pipeline，向redis发起请求并拿回结果，拆解结果集后，给每个命令对应的结果chan推送结果。调用方在推送任务到队列后，就一直监听传输结果的chan 。

文章插图

这个方案来自我在上家公司做推送系统的经验，有兴趣的朋友可以看看 PPT，内涵不少高并发经验。分布式推送系统设计与实现
总结推送系统设计之初是预计 15w 的长连接数，稳定后再无优化调整，也一直稳定跑在线上。后面随着业务的暴涨，长连接数也一直跟着暴涨，现在日常稳定在 35w，出问题时暴到 50w，我们没有因为业务暴增进行整条链路压测及优化。
话说，如果对推送系统平时多上点心也不至于出这个问题。我曾经开发过相对高规格的推送系统，而现在公司的推送系统我是后接手的，由于它的架子一般，但业务性又太强，看着脑仁疼，所以就没有推倒来重构。一直是在这个架子上添添补补，做了一些常规的性能优化。嗯，看来不能掉以轻心，免得绩效离我远去。

高并发服务遇Redis瓶颈引发的事故( 二 )

推荐阅读

冰可诺|云顶金刚不坏蛇女 4盾4星4秘绝对防御

普通二本学校本科毕业生，是该留在本地的省会城市还是去上海找工作 ?

皮面鞋和绒面哪个老气绒面牛皮鞋怎么保洁

布洛芬可以退烧吗布洛芬缓释胶囊的作用与功效

#大头娃娃#郴州再现大头娃娃事件，家长得知真相后崩溃：我女儿喝了2年饮料

半月谈网|当网暴变成黑色“生意” 吃瓜谨防变“帮凶”

华为|14亿！华为或再次“血洗”全球？日媒：5G仅仅是个开始

对公司|两连板东宝生物收函：上半年净利降六成，股价却13天涨92%

痤疮大如鹌鹑蛋 (口服)中药1月看不见——烟台中西医肛肠医院中医科张伟先主任妙手回春

发生交通事故后应做什么，发生交通事故后第一时间怎么办

周三|欧美股市全线上涨，黄金一举收复1960美元关口

苹果手机直角边框复古设计iPhone 12系列，iPhone8价格底线持续下降

喝桂花茶的禁忌,桂花茶的采制技巧和保健功效

打响湖南黑茶产业借鉴福建走精品茶叶发展之路

新泰市行政审批服务局|窗口服务再提升——市行政审批服务局召开第二季度表扬会，创先争优勇担当

智能电视两大系统UI对比，原来系统体验好和无广告才是重中之重

汽车|净资产仅剩1亿！汽车行业洗牌，力帆历经“至暗时刻”

电容单位的换算和表示方法电容的单位是什么

钟表上当分针和时针重合和180度时分别都是啥时刻

湖南匡老五辣业干辣椒种植产地调差大解析