面试官竟然问我消息队列为啥会丢失消息?幸亏我总结了全套八股文

一个挺着啤酒肚,身穿格子衫,发际线严重后移的中年男子,手拿着保温杯,胳膊夹着macBook向你走来,看样子是架构师级别 。
面试开始,直入正题 。
面试官: 我看到你的简历上写着项目中用到了消息队列,还用的是kafka,你有遇到过消息队列丢失消息的情况吗?
我: 消息队列还能丢失消息?那谁还用消息队列!你是不是搞错了?我没遇到过丢失消息的情况,也没考虑过这个问题 。
面试官: 嗯...,小伙子,看来有些面试套路,你还是不太懂 。今天面试就先到这里吧!给你的简历,我送你下楼 。
我去!面试还有啥套路?
能不能少一点套路,多一点真诚!
难道都要去背一遍八股文才能参加面试?
好吧,我去瞅一眼一灯总结的面试八股文 。

面试官竟然问我消息队列为啥会丢失消息?幸亏我总结了全套八股文

文章插图
【面试官竟然问我消息队列为啥会丢失消息?幸亏我总结了全套八股文】 
我: 消息队列发送消息和消费消息的过程,共分为三段,生产过程、服务端持久化过程、消费过程,如下图所示 。
 
面试官竟然问我消息队列为啥会丢失消息?幸亏我总结了全套八股文

文章插图
 
这三个过程都有可能弄丢消息 。
面试官: 嗯,消息丢失的具体原因是什么?怎么防止丢失消息呢?
我: 我详细说一下这种情况:
一、生产过程丢失消息丢失原因:一般可能是网络故障,导致消息没有发送出去 。
解决方案:重发就行了 。
由于kafka为了提高性能,采用了异步发送消息 。我们只有获取到发送结果,才能确保消息发送成功 。有两个方案可以获取发送结果 。
一种是kafka把发送结果封装在Future对象中,我可以使用Future的get方法同步阻塞获取结果 。
Future<RecordMetadata> future = producer.send(new ProducerRecord<>(topic, message));try {RecordMetadata recordMetadata = https://www.isolves.com/it/cxkf/bk/2022-04-27/future.get();if (recordMetadata != null) {System.out.println("发送成功");}} catch (Exception e) {e.printStackTrace();}另一种是使用kafka的callback函数获取返回结果 。
producer.send(new ProducerRecord<>(topic, message), new Callback() {@Overridepublic void onCompletion(RecordMetadata metadata, Exception exception) {if (exception == null) {System.out.println("发送成功");} else {System.out.println("发送失败");}}});如果发送失败了,有两种重试方案:
  1. 手动重试 在catch逻辑或else逻辑中,再调用一次send方法 。如果还不成功怎么办? 在数据库中建一张异常消息表,把失败消息存入表中,然后搞个异步任务重试,便于控制重试次数和间隔时间 。
  2. 自动重试 kafka支持自动重试,设置参数如下,当集群Leader选举中或者Follower数量不足等原因返回失败时,就可以自动重试 。
  3. # 设置重试次数为3
    retries = 3# 设置重试间隔为100msretry.backoff.ms = 100
  4. 一般我们不会用kafka自动重试,因为超过重试次数,还是会返回失败,还需要我们手动重试 。
二、服务端持久化过程丢失消息为了保证性能,kafka采用的是异步刷盘,当我们发送消息成功后,Broker节点在刷盘之前宕机了,就会导致消息丢失 。
当然我们也可以设置刷盘频率:
# 设置每1000条消息刷一次盘flush.messages = 1000# 设置每秒刷一次盘flush.ms = 1000先普及一下kafka集群的架构模型:
kafka集群由多个broker组成,一个broker就是一个节点(机器) 。一个topic有多个partition(分区),每个partition分布在不同的broker上面,可以充分利用分布式机器性能,扩容时只需要加机器、加partition就行了 。
 
面试官竟然问我消息队列为啥会丢失消息?幸亏我总结了全套八股文

文章插图
 
 
一个partition又有多个replica(副本),有一个leader replica(主副本)和多个follower replica(从副本),这样设计是为了保证数据的安全性 。
发送消息和消费消息都在leader上面,follower负责定时从leader上面拉取消息,只有follower从leader上面把这条消息拉取回来,才算生产者发送消息成功 。
kafka为了加快持久化消息的性能,把性能较好的follower组成一个ISR列表(in-sync replica),把性能较差的follower组成一个OSR列表(out-of-sync replica),ISR+OSR=AR(assigned repllicas) 。如果某个follower一段时间没有向leader拉取消息,落后leader太多,就把它移出ISR,放到OSR之中 。如果某个follower追上了leader,又会把它重新放到ISR之中 。如果leader挂掉,就会从ISR之中选一个follower做leader 。


推荐阅读