分布式唯一ID方案

2024-03-20 1187阅读

温馨提示：这篇文章已超过438天没有更新，请注意相关的内容是否还可用！

背景

　　在复杂的分布式系统中，往往需要对大量的数据和消息进行唯一标识。

　　如对大量的订单做分库分表后，需要有一个唯一的ID来标识一条数据或消息，数据库的自增ID显然不能满足需求。

　　业务系统对分布式唯一ID的要求：

　　　　①：全局唯一性，不能重复

　　　　②：趋势递增，在MySQL InnoDB引擎中使用的是聚集索引，由于多数RDMS使用B-tree的数据结构来存储索引数据，在主键的选择上面应该尽量使用有序的主键保证写入性能

　　　　③：单调递增，保证下一个ID一定大于上一个ID

　　　　④：信息安全，如果ID是连续的，恶意用户的扒取工作就非常容易做了，直接按照顺序下载指定URL即可；如果是订单号就更危险了，竞对可以直接知道我们一天的单量。所以在一些应用场景下，会需要ID无规则、不规则

常用方案

　1、UUID

　　优点：生成简单，本地生成，没有网络消耗，性能非常高

　　缺点：

　　　　1）每次生成的ID是无序的，无法保证趋势递增，不能作为数据库主键，否则会引起索引数据位置频繁变动，严重影响性能

　　　　2）UUID的字符串存储，查询效率慢

　　　　3）存储空间大

　　　　4）ID本身无业务含义，不可读

　2、Redis

　　利用redis的原子性自增，具体实现为：

　　年份 + 当天距当年第多少天 + 天数 + 小时 + redis自增

　　优点：

　　　　有序递增，可读性强

　　缺点：

　　　　占用带宽，每次要向redis进行请求

　3、雪花snowflake算法

　　snowflake是Twitter开源的分布式ID生成算法，结果是一个long型的ID。

　　其核心思想是：使用41bit作为毫秒数，10bit作为work ID（5个bit是数据中心，5个bit的机器ID），12bit作为毫秒内的流水号（意味着每个节点在每毫秒可以产生 4096 个 ID），最后还有一个符号位，永远是0。

　　snowflake算法生成64位的二进制正整数，然后转换成10进制的数。

　　64位二进制数组成部分如下：

　　优点：

　　　　1）此方案每秒能够产生409.6万个ID，性能快

　　　　2）时间戳在高位，自增序列在低位，整个ID是趋势递增的，按照时间有序递增

　　　　3）灵活度高，可以根据业务需求，调整bit位的划分，满足不同的需求

　　缺点：

　　　　只能保证work id相同的情况下生成的id是递增的

　　　　依赖机器的时钟，如果服务器时钟回拨，会导致重复ID生成　　

　　时钟回拨问题的解决方案：

　　　　1）回拨之后更换work id

　　　　2）等时间追上来再去生成id

Mongo的ObjectId与snowflake类似，12 字节的ObjectId包括：

一个 4 字节的时间戳，表示 ObjectId 的创建，以 Unix 纪元以来的秒数为单位。

每个进程生成一次的 5 字节随机值。这个随机值对于机器和过程是唯一的。

一个 3 字节递增计数器，初始化为随机值

　4、美团Leaf

https://tech.meituan.com/2017/04/21/mt-leaf.html

Snowflake代码：

1）系统时钟 SystemClock：

import java.sql.Timestamp;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;
/**
 * 系统时钟

 * 高并发场景下System.currentTimeMillis()的性能问题的优化
 * System.currentTimeMillis()的调用比new一个普通对象要耗时的多（具体耗时高出多少我还没测试过，有人说是100倍左右）
 * System.currentTimeMillis()之所以慢是因为去跟系统打了一次交道
 * 后台定时更新时钟，JVM退出时，线程自动回收
 *
 * see： http://git.oschina.net/yu120/sequence
 * @author lry,looly
 */
public class SystemClock {
	/** 时钟更新间隔，单位毫秒 */
	private final long period;
	/** 现在时刻的毫秒数 */
	private volatile long now;
	/**
	 * 构造
	 * @param period 时钟更新间隔，单位毫秒
	 */
	public SystemClock(long period) {
		this.period = period;
		this.now = System.currentTimeMillis();
		scheduleClockUpdating();
	}
	/**
	 * 开启计时器线程
	 */
	private void scheduleClockUpdating() {
		ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor(runnable -> {
			Thread thread = new Thread(runnable, "System Clock");
			thread.setDaemon(true);
			return thread;
		});
		scheduler.scheduleAtFixedRate(() -> now = System.currentTimeMillis(), period, period, TimeUnit.MILLISECONDS);
	}
	/**
	 * @return 当前时间毫秒数
	 */
	private long currentTimeMillis() {
		return now;
	}
	//------------------------------------------------------------------------ static
	/**
	 * 单例
	 * @author Looly
	 *
	 */
	private static class InstanceHolder {
		public static final SystemClock INSTANCE = new SystemClock(1);
	}
	/**
	 * @return 当前时间
	 */
	public static long now() {
		return InstanceHolder.INSTANCE.currentTimeMillis();
	}
	/**
	 * @return 当前时间字符串表现形式
	 */
	public static String nowDate() {
		return new Timestamp(InstanceHolder.INSTANCE.currentTimeMillis()).toString();
	}
}

Snowflake：

import java.io.Serializable;
import java.util.Date;
/**
 * Twitter的Snowflake 算法
 * 分布式系统中，有一些需要使用全局唯一ID的场景，有些时候我们希望能使用一种简单一些的ID，并且希望ID能够按照时间有序生成。
 *
 * snowflake的结构如下(每部分用-分开):
 *
 * 符号位（1bit）- 时间戳相对值（41bit）- 数据中心标志（5bit）- 机器标志（5bit）- 递增序号（12bit）
 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
 *
 * 第一位为未使用(符号位表示正数)，接下来的41位为毫秒级时间(41位的长度可以使用69年)
 * 然后是5位datacenterId和5位workerId(10位的长度最多支持部署1024个节点)
 * 最后12位是毫秒内的计数（12位的计数顺序号支持每个节点每毫秒产生4096个ID序号）
 *
 * 并且可以通过生成的id反推出生成时间,datacenterId和workerId
 *
 * 参考：http://www.cnblogs.com/relucent/p/4955340.html

 * 关于长度是18还是19的问题见：https://blog.csdn.net/unifirst/article/details/80408050
 *
 * @author Looly
 * @since 3.0.1
 */
public class Snowflake implements Serializable {
    private static final long serialVersionUID = 1L;
    /**
     * 默认的起始时间，为Thu, 04 Nov 2010 01:42:54 GMT
     */
    public static long DEFAULT_TWEPOCH = 1288834974657L;
    /**
     * 默认回拨时间，2S
     */
    public static long DEFAULT_TIME_OFFSET = 2000L;
    private static final long WORKER_ID_BITS = 5L;
    // 最大支持机器节点数0~31，一共32个
    @SuppressWarnings({"PointlessBitwiseExpression", "FieldCanBeLocal"})
    private static final long MAX_WORKER_ID = -1L ^ (-1L > WORKER_ID_SHIFT & ~(-1L > DATA_CENTER_ID_SHIFT & ~(-1L > TIMESTAMP_LEFT_SHIFT & ~(-1L

VPS购买请点击我

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

分布式唯一ID方案

相关阅读

怎么把织梦的模板替换?

dedecms怎么调用特定的栏目文档?

怎么抓包一个网页?

wap怎么封装app?

目录[+]