控制 ceph 集群中 osd 記憶體使用量

測試 ceph 集群的效能

可以在修改前後，做 ceph 集群效能測試，進行對比

新增 uat pool

ceph osd create uat 128 128

write 測試（先測試 write，不然 seq 會報錯）

rados -p uat -t 30 bench 30 write --no-cleanup --run-name ***

seq 測試

rados -p uat -t 30 bench 30 seq --run-name ***

清除 uat pool 中 benchmark 資料

rados -p uat cleanup

控制 ceph 集群中 osd 記憶體使用量

使用 ansible-ceph 部署的 luminous 版本的 ceph，預設採用 automatic cache sizing，bluestore 嘗試通過 osd_memory_target 配置選項將 osd 堆記憶體使用率保持在指定的目標大小一下。

本集群中 osd memory target = 18925868810，使用時間長了，導致 osd 使用記憶體超過 60%。每個 osd 伺服器有 20 塊硬碟，對應 20 個 osd，500gb 記憶體。由於 ceph 集群和 openstack 集群在一套伺服器上，導致最終openstack 分配虛擬機器到達一定數量後，集群記憶體不夠用。

[osd]
#osd memory target = 18925868810
osd memory target = 644245094418925868810

修改 ceph 配置檔案 /etc/ceph/ceph.conf，設定 osd memory target = 6442450944，每塊 osd 最大使用 6gb 記憶體

[osd]
#osd memory target = 18925868810
osd memory target = 644245094418925868810

重啟 c***3 上的 osd

systemctl list-units -t service | grep osd | grep active | awk '' | xargs systemctl restart

檢視 c***3 上記憶體使用率

ps aux | grep osd | grep -v grep | awk 'end'

檢視 c***3 上記憶體使用量，單位 kb

ps aux | grep osd | grep -v grep | awk 'end'

修改 ceph 生產集群所有節點的配置檔案 /etc/ceph/ceph.conf 中 osd memory target = 6442450944，依次執行systemctl list-units -t service | grep osd | grep active | awk '' | xargs systemctl restart，每次等 ceph health 恢復到 health_ok 在繼續下乙個節點

參考文章：

控制 ceph 集群中 osd 記憶體使用量

ceph儲存 ceph集群osd故障自我檢測

我所了解的各公司使用的Ceph儲存集群

linux中記憶體使用原理

控制 ceph 集群中 osd 記憶體使用量

ceph儲存 ceph集群osd故障自我檢測

我所了解的各公司使用的Ceph儲存集群

linux中記憶體使用原理

相關推薦