如何设计百万级的用户ID

前言【如何设计百万级的用户ID】我们在进行平台账号体系设计的时候,遇到这么一个需求:在平台注册的用户ID以n位的数字展现 。
乍一看,这个需求很简单,就一句话 。但仔细思考后,发现这里面还是有很多地方需要思考的:

  • 用户ID是随机生成还是顺序自增?
  • 如果是随机生成的:
    • 如何保证每次生成的ID都是唯一的?
  • 如果是顺序自增的:
    • 是不是会泄露平台用户规模,增加安全隐患?
    • 如何保证分布式高并发下的ID顺序自增?
  • 如果用户数量达到n位数上限后,如何自动扩展ID?
思路首先,先确定ID是自增还是随机,从上面的思考中,可以发现用户ID自增会带来一些安全隐患:如当系统存在某种bug,可以通过用户ID查询用户信息时,就会面临通过遍历用户ID,达到获取平台全量用户信息的隐私泄露问题 。另外,自增也会暴露平台用户规模,不利于商业行为 。所以,用户ID必须是随机生成 。
那么,用户ID随机生成,如何保证每次都是一个唯一值呢?这里有两个思路:
  • 设计一种算法,通过数学运算,以一定的入参,得到一个一一映射的出参,该出参的范围在n为数字的大小范围内 。数学表达式为:
y = f(x_0,x_1,...,x_m,n)其中,m=入参个数,由m个入参确定唯一性,n=y的范围大小 。
  • 借助于工程思想,利用各种中间件实现该需求 。如借助与MySQL+redis 。
方案针对第一个思路,可以参考唯一随机数映射算法
这里主要展开下使用工程思想,借助MySQL+Redis+定时器的实现方式 。
在MySQL里创建一张表t_user_id_pool, 该表中放入所有符合条件的用户id,如000000-999999 。
设计定时器逻辑为:每隔1小时,去redis中读取key为id_pool的键,
  • 如果id_pool不存在,则随机地从数据库中读取1000个用户id,以队列的形式存入redis的id_pool里;
  • 如果id_pool存在但队列里id数量小于等于200时,从数据库随机获取1000个用户id,push到redis的id_pool里 。
业务侧生成用户id的时候,从redis的id_pool里pop一个值出来作为用户id 。因为redis天然单线程结构,所以不用担心,高并发情况下会获取相同的id 。
如何设计百万级的用户ID

文章插图
 




    推荐阅读