ULID :Universally Unique Lexicographically Sortable Identifier(通用唯一詞典分類(lèi)標(biāo)識(shí)符)
UUID :Universally Unique Identifier(通用唯一標(biāo)識(shí)符)
為什么不選擇UUID?
UUID 目前有 5 個(gè)版本:
版本1:在許多環(huán)境中是不切實(shí)際的,因?yàn)樗枰L問(wèn)唯一的,穩(wěn)定的MAC地址,容易被攻擊;
版本2:將版本 1 的時(shí)間戳前四位換為 POSIX 的 UID 或 GID,問(wèn)題同上;
版本3:基于 MD5 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
版本4:基于隨機(jī)數(shù)或偽隨機(jī)數(shù)生成,除了隨機(jī)性外沒(méi)有提供其他信息;
版本5:通過(guò) SHA-1 哈希算法生成,生成隨機(jī)分布的ID需要唯一的種子,這可能導(dǎo)致許多數(shù)據(jù)結(jié)構(gòu)碎片化;
這里面常用的就是 UUID4 了,但是,即使是隨機(jī)的,但是也是存在沖突的風(fēng)險(xiǎn)。
和 UUID 要么基于隨機(jī)數(shù),要么基于時(shí)間戳不同,ULID 是既基于時(shí)間戳又基于隨機(jī)數(shù),時(shí)間戳精確到毫秒,毫秒內(nèi)有1.21e + 24個(gè)隨機(jī)數(shù),不存在沖突的風(fēng)險(xiǎn),而且轉(zhuǎn)換成字符串比 UUID 更加友好。
ULID特性
與UUID的128位兼容性
每毫秒1.21e + 24個(gè)唯一ULID
按字典順序(也就是字母順序)排序!
規(guī)范地編碼為26個(gè)字符串,而不是UUID的36個(gè)字符
使用Crockford的base32獲得更好的效率和可讀性(每個(gè)字符5位)
不區(qū)分大小寫(xiě)
沒(méi)有特殊字符(URL安全)
單調(diào)排序順序(正確檢測(cè)并處理相同的毫秒)
ULID規(guī)范
以下是在python(ulid-py)中實(shí)現(xiàn)的ULID的當(dāng)前規(guī)范。二進(jìn)制格式已實(shí)現(xiàn)
組成
時(shí)間戳
48位整數(shù)
UNIX時(shí)間(以毫秒為單位)
直到公元10889年,空間都不會(huì)耗盡。
隨機(jī)性
80位隨機(jī)數(shù)
如果可能的話(huà),采用加密技術(shù)保證隨機(jī)性
排序
最左邊的字符必須排在最前面,最右邊的字符必須排在最后(詞匯順序)。必須使用默認(rèn)的ASCII字符集。在同一毫秒內(nèi),不能保證排序順序
編碼方式
如圖所示,使用了Crockford的Base32。該字母表不包括字母I,L,O和U,以避免混淆和濫用。
二進(jìn)制布局和字節(jié)順序
組件被編碼為16個(gè)八位位組。每個(gè)組件都以最高有效字節(jié)在前(網(wǎng)絡(luò)字節(jié)順序)進(jìn)行編碼。
應(yīng)用場(chǎng)景
替換數(shù)據(jù)庫(kù)自增id,無(wú)需DB參與主鍵生成
分布式環(huán)境下,替換UUID,全局唯一且毫秒精度有序
比如要按日期對(duì)數(shù)據(jù)庫(kù)進(jìn)行分區(qū)分表,可以使用ULID中嵌入的時(shí)間戳來(lái)選擇正確的分區(qū)分表
如果毫秒精度是可以接受的(毫秒內(nèi)無(wú)序),可以按照ULID排序,而不是單獨(dú)的created_at字段
用法(python)
安裝
創(chuàng)建一個(gè)全新的ULID。
時(shí)間戳記值(48位)來(lái)自 time.time(),精度為毫秒。
隨機(jī)值(80位)來(lái)自 os.urandom()。
根據(jù)現(xiàn)有的128位值(例如UUID)創(chuàng)建新的ULID 。
支持ULID值類(lèi)型有 int,bytes,str,和UUID。
從現(xiàn)有時(shí)間戳值(例如datetime對(duì)象)創(chuàng)建新的ULID 。
支持時(shí)間戳值類(lèi)型有int,float,str,bytes,bytearray,memoryview,datetime,Timestamp,和ULID
根據(jù)現(xiàn)有的隨機(jī)數(shù)創(chuàng)建一個(gè)新的ULID。
支持隨機(jī)值類(lèi)型有int,float,str,bytes,bytearray,memoryview,Randomness,和ULID。
一旦有了ULID對(duì)象,就有多種與之交互的方法。
timestamp()方法將為您提供ULID的前48位的時(shí)間戳快照,而randomness()方法將為您提供后80位的隨機(jī)數(shù)快照。