Beanstalkd乙個高效能分布式記憶體佇列系統

高效能離不開非同步，非同步離不開佇列，內部是producer-consumer模型的原理。

設計中的核心概念：

job：乙個需要非同步處理的任務，是beanstalkd中得基本單元，需要放在乙個tube中；

tube：乙個有名的任務佇列，用來儲存統一型別的job，是producer和consumer操作的物件；

producer：job的生產者，通過put命令將乙個job放入乙個tube中；

consumer：job的消費者，通過reserve/release/bury/delete命令來獲取job或改變job的狀態；

job的生命週期

乙個job有ready, reserved, delayed, buried四種狀態。當producer直接put乙個job時，job就處於ready狀態，等待consumer來處理，如果選擇延遲put，job就先到delayed狀態，等待時間過後才遷移到ready狀態。

consumer獲取了當前ready的job後，該job的狀態就遷移到reserved，這樣其他的consumer就不能再操作該job。當consumer完成該job後，可以選擇delete, release或者bury操作。

delete之後，job從系統消亡，之後不能再獲取;release操作可以重新把該job狀態遷移回ready(也可以延遲該狀態遷移操作)，使其他的consumer可以繼續獲取和執行該job;有意思的是bury操作，可以把該job休眠，等到需要的時候，再將休眠的job kick回ready狀態，也可以delete buried狀態的job。

正是有這些有趣的操作和狀態，才可以基於此做出很多意思的應用，比如要實現乙個迴圈佇列，就可以將reserved狀態的job休眠掉，等沒有ready狀態的job時再將buried狀態的job一次性kick回ready狀態。

幾個很nice的特性

優先順序：支援0到2^32的優先順序，值越小，優先順序越高，預設優先順序為1024。

持久化：可以通過binlog將job及其狀態記錄到檔案裡面，在beanstalkd下次啟動時可以通過讀取binlog來恢復之前的job及狀態。

分布式容錯：分布式設計和memcached類似，beanstalkd各個server之間並不知道彼此的存在，都是通過client來實現分布式以及根據tube名稱去特定server獲取job。

超時控制：為了防止某個consumer長時間占用任務但不能處理的情況，beanstalkd為reserve操作設定了timeout時間，如果該consumer不能在指定時間內完成job，job將被遷移回ready狀態，供其他consumer執行。

不足：在使用中發現乙個beanstalkd尚無提供刪除乙個tube的操作，只能將tube的job依次刪除，並讓beanstalkd來自動刪除空tube。還有就是beanstalkd不支援客戶端認證機制(開發者將應用場景定位在區域網)。

Beanstalkd乙個高效能分布式記憶體佇列系統

高效能mysql（一）建立高效能索引

如何高效能的設計乙個測試用例？

Yaconf 乙個高效能的配置管理擴充套件

Beanstalkd乙個高效能分布式記憶體佇列系統

高效能mysql（一） 建立高效能索引

如何高效能的設計乙個測試用例？

Yaconf 乙個高效能的配置管理擴充套件

相關推薦

高效能mysql（一）建立高效能索引