如何通過雪花演算法用Python實現乙個簡單的發號器

2022-09-28 09:36:08 字數 2410 閱讀 7832

實現乙個簡單的發號器

根據snowflake演算法的原理實現乙個簡單的發號器,產生不重複、自增的id。

1.snowflake演算法的簡單描述

這裡的snowflake演算法是用二進位制的,有64位。其中41位的時間戳表示:當前時間戳減去某個設定的起始時間,10位標識表示:不同的機器、資料庫的標識id等等,序列號為每秒或每毫秒內自增的id。

我做的時候沒有用位運算去實現,而是做了乙個十進位制的,16位的(當時專案要求是16位的)。但是實現發號器的基本策略是一樣的,通過時間戳和標識來防止重複,通過序列號實現自增。當然啦,重點不是發號器多少位,而是根據專案的實際情況,利用snowf程式設計客棧lake演算法的原理,實現乙個適合自己專案的發號器。

2.python實現

時間戳:9位,起始時間為2018-01-01 00:00:00 ,時間戳為當前時間減去起始時間。時間戳有9為,可用時間為 999999999/(606024*365)≈31(年)。

標識id:2位,我用的時候比較簡單,只是涉及乙個資料庫的情況,所以用一張資料表對應乙個標識id,可用100張表。

序列號:5位,我時間戳用的是秒級www.cppcns.com的,但是5位是10萬個序列號,經過測試在一秒內是完全夠用的。

所以時間戳、標識id、序列號的位數也沒規定說一定要多少,根據自己專案的實際來即可。

**如下:

import time

class mysnow:

def __init__(self,dataid):

self.start = int(time.mktime(time.strptime('2018-01-01 00:00:00', "%y-%m-%d %h:%m:%s")))

self.last = int(time.time())

self.countid = 0

self.dataid = dataid # 資料id,這個自定義或是對映

def get_id(self):

# 時間差部分

now = int(time.time())

temp = now-self.start

if len(str(temp)) < 9: # 時間差不夠9位的在前面補0

length = len(str(temp))

s = "0" * (9-length)

temp = s + str(temp)

if now == self.last:

self.countid += 1 # 同一時間差,序列號自增

else:

self.countid = 0 # 不同時間差,序列號重新置為0

self.last = now

程式設計客棧 # 標識id部分

if len(str(self.dataid)) < 2:

length = len(str(self.dataid))

s = "0" * (2-length)

self.dataid = s + str(self.dataid)

# 自增序列號部分

if self.countid == 99999: # 序列號自增5位滿了,睡眠一秒鐘

time.sleep(1)

countiddata = str(self.countid)

if len(countiddata) < 5: # 序列號不夠5位的在前面補0

length = len(countiddata)

s = "0"*(5-length)

countiddata = s + countiddata

id = str(temp) + str(self.dataid) + cou程式設計客棧ntiddata

return id

使用方法:

snow = mysnow(dataid="00")

print(snow.get_id())

其中dataid即為標識id,countid為自增序列號。da可以乙個通過自定義的對映表獲得,這個視實際的專案情況而定。

3.關於併發

首先,直接用這個發號器是不能進行併發操作,會產生重複的id。如果真的要進行併發,那麼就要權衡一下併發和位數的哪個更重要了!

拿實際例子來說吧,比如我併發的目的是為了節省時間,讓程式更快的跑完,這時候為了併發,我把dataid中拿出一位來,標識不同的子程序,這樣可以防止產生重複的id。但是實際上這用了位數去換取時間,如果是id位數比較少的情況,比如16位的,dataid比較少,我個人認為這樣是不值得的,有些奢侈。這時候便是位數比併發重要啦。

當時如果位數充裕,比如20位的,需要併發就併發啦。

還有一種實現併發的方法,就是給發號器加鎖,發號的時候加鎖,發完了解鎖。這個我沒有試過,有興趣的可以試一下哈哈。但是我有個疑惑啊,就是不斷加鎖和解鎖切換,帶來的時間和資源開銷會不會很大呢。

本文標題: 如何通過雪花演算法用python實現乙個簡單的發號器

本文位址:

如何通過Python實現標籤雲演算法

實現原理 標籤雲最終展現出來的效果其實是由兩個html引數來控制的,分別是 font size和color,如 django 標籤關聯的文章越多,表示這個標籤被引用的次數越大,font size的值也越大,color的顏色越深。考慮到體驗效果,font size不能隨著的標籤的引用次數的增大而無限增...

如何通過python連線sqlserver

coding utf 8 import pymssql server 127.0.0.1 連線伺服器位址 user sqluser 連線帳號 password password 連線密碼 with pymssql.connect server,user,password,yourdatabase c...

用python通過139郵箱傳送Email

1.註冊139郵箱,在設定中開啟郵箱協議設定,如圖所示 2.編寫 本人在anaconda的jupyter notebook中測試成功。如下 coding utf 8 無法成功,需要第三代申請密碼保護 import smtplib from email.mime.text import mimetex...