分布式系統session一致性解決方案

2021-08-21 18:01:35 字數 3176 閱讀 4227

1.什麼是session?

伺服器為每個使用者建立乙個會話,儲存使用者的相關資訊,以便多次請求能夠定位到同乙個上下文。這樣,當使用者在應用程式的 web 頁之間跳轉時,儲存在 session 物件中的變數將不會丟失,而是在整個使用者會話中一直存在下去。當使用者請求來自應用程式的 web 頁時,如果該使用者還沒有會話,則 web 伺服器將自動建立乙個 session 物件。當會話過期或被放棄後,伺服器將終止該會話。

web開發中,web-server可以自動為同乙個瀏覽器的訪問使用者自動建立session,提供資料儲存功能。最常見的,會把使用者的登入資訊、使用者資訊儲存在session中,以保持登入狀態。

2.什麼是session一致性問題?

只要使用者不重啟瀏覽器,每次http短連線請求,理論上服務端都能定位到session,保持會話。

3.分布式session

單伺服器web應用中,session資訊只需存在該伺服器中,這是我們前幾年最常接觸的方式,但是近幾年隨著分布式系統的流行,單系統已經不能滿足日益增長的百萬級使用者的需求,集群方式部署伺服器已在很多公司運用起來,當高併發量的請求到達服務端的時候通過負載均衡的方式分發到集群中的某個伺服器,這樣就有可能導致同乙個使用者的多次請求被分發到集群的不同伺服器上,就會出現取不到session資料的情況,於是session的共享就成了乙個問題。

如上圖,假設使用者包含登入資訊的session都記錄在第一台web-server上,反向**如果將請求路由到另一台web-server上,可能就找不到相關資訊,而導致使用者需要重新登入。

1.session複製(同步)

思路:多個web-server之間相互同步session,這樣每個web-server之間都包含全部的session

優點:web-server支援的功能,應用程式不需要修改**

不足:session的同步需要資料傳輸,佔內網頻寬,有時延

所有web-server都包含所有session資料,資料量受記憶體限制,無法水平擴充套件

有更多web-server時要歇菜

2.客戶端儲存法

思路:服務端儲存所有使用者的session,記憶體占用較大,可以將session儲存到瀏覽器cookie中,每個端只要儲存乙個使用者的資料了

優點:服務端不需要儲存

缺點:每次http請求都攜帶session,佔外網頻寬

資料儲存在端上,並在網路傳輸,存在洩漏、篡改、竊取等安全隱患

session儲存的資料大小受cookie限制

「端儲存」的方案雖然不常用,但確實是一種思路。

3.反向**hash一致性

思路:web-server為了保證高可用,有多台冗餘,反向**層能不能做一些事情,讓同乙個使用者的請求保證落在一台web-server上呢?

方案一:四層**hash

反向**層使用使用者ip來做hash,以保證同乙個ip的請求落在同乙個web-server上

方案二:七層**hash

反向**使用http協議中的某些業務屬性來做hash,例如sid,city_id,user_id等,能夠更加靈活的實施hash策略,以保證同乙個瀏覽器使用者的請求落在同乙個web-server上

優點:只需要改nginx配置,不需要修改應用**

負載均衡,只要hash屬性是均勻的,多台web-server的負載是均衡的

可以支援web-server水平擴充套件(session同步法是不行的,受記憶體限制)

不足:如果web-server重啟,一部分session會丟失,產生業務影響,例如部分使用者重新登入

如果web-server水平擴充套件,rehash後session重新分布,也會有一部分使用者路由不到正確的session

session一般是有有效期的,所有不足中的兩點,可以認為等同於部分session失效,一般問題不大。

對於四層hash還是七層hash,個人推薦前者:讓專業的軟體做專業的事情,反向**就負責**,盡量不要引入應用層業務屬性,除非不得不這麼做(例如,有時候多機房多活需要按照業務屬性路由到不同機房的web-server)。

4.後端統一集中儲存

思路:將session儲存在web-server後端的儲存層,資料庫或者快取

優點:沒有安全隱患

可以水平擴充套件,資料庫/快取水平切分即可

web-server重啟或者擴容都不會有session丟失

不足:增加了一次網路呼叫,並且需要修改應用**

對於db儲存還是cache,個人推薦後者:session讀取的頻率會很高,資料庫壓力會比較大。如果有session高可用需求,cache可以做高可用,但大部分情況下session可以丟失,一般也不需要考慮高可用。

保證session一致性的架構設計常見方法:

1.session同步法:多台web-server相互同步資料

2.客戶端儲存法:乙個使用者只儲存自己的資料

3.反向**hash一致性:四層hash和七層hash都可以做,保證乙個使用者的請求落在一台web-server上

4.後端統一儲存:web-server重啟和擴容,session也不會丟失

web層、service層無狀態是大規模分布式系統設計原則之一,session屬於狀態,不宜放在web層

讓專業的軟體做專業的事情,web-server存session?還是讓cache去做這樣的事情吧。

分布式session一致性

在多台後台伺服器的環境下,我們為了確保乙個客戶只和一台伺服器通訊,我們勢必使用長連線。使用什麼方式來實現這種連線呢,常見的有使用nginx自帶的ip hash來做,我想這絕對不是乙個好的辦法,如果前端是cdn,或者說乙個區域網的客戶同時訪問伺服器,導致出現伺服器分配不均衡,以及不能保證每次訪問都粘滯...

分布式SESSION一致性

session是伺服器為客戶端建立的乙個會話,儲存使用者的相關資訊,用以標識使用者身份等。在單伺服器環境下是不需要考慮會話的一致性的問題的,但是在集群環境下就會出現一些問題,假如乙個使用者在登入請求時負載均衡到了a伺服器,a伺服器為其分配了session,下次請求資料時被分配到了b伺服器,此時由於b...

分布式系統session一致性的問題

伺服器為每個使用者建立乙個會話,儲存使用者的相關資訊,以便多次請求能夠定位到同乙個上下文。這樣,當使用者在應用程式的 web 頁之間跳轉時,儲存在 session 物件中的變數將不會丟失,而是在整個使用者會話中一直存在下去。當使用者請求來自應用程式的 web 頁時,如果該使用者還沒有會話,則 web...