大資料集群調優

場景1：

在datanode開始工作（通電）的時候，會上報本地的資料塊給namenode的客戶端進行註冊，這時候客戶端個數比較關鍵，如果太少，datanode在連線namenode的時候會出現總是超時或者連線被拒絕；如果設定太大，則記憶體開銷會增大，造成不必要的浪費，最終可能導致記憶體溢位。

引數：dfs.namenode.handler.count

namenode 有乙個工作執行緒池，用來處理不同 datanode 的併發心跳以及客戶端併發的元資料操作，執行緒池的大小就是根據該引數指定的，預設值 10，該值的一般設定原則是將其設定為集群大小的自然對數乘以20，即

20logn，n為集群大小。

#配置檔案hdfs-site.xml dfs.namenode.handler.count

10

具體計算可以使用python，以下示例以8個節點為例

[root@fan102 ~]# python -c 'import math ; print int(math.log(8) * 20)'
41

場景1:總共 7 臺機器，每天幾億條資料，資料來源->flume->kafka->hdfs->hive

面臨問題：資料統計主要用 hivesql，沒有資料傾斜，小檔案已經做了合併處理，開啟的 jvm 重用，而且 io 沒有阻塞，記憶體了不到 50%。但是還是跑的非常慢，而且資料量洪峰過來時，整個集群都會宕掉。基於這種情況有沒有優化方案。

分析：記憶體利用率不夠。這個一般是 yarn 的 2 個配置造成的，單個任務可以申請的最大記憶體大小，和 hadoop 單個節點可用記憶體大小。在yarn-site.xml檔案中調節這兩個引數能提高系統記憶體的利用率。

引數1：yarn.nodemanager.resource.memory-mb

表示該節點上 yarn 可使用的物理記憶體總量，預設是 8192（mb），一般128g伺服器配置為100g，64g伺服器配置50g，我們的伺服器是188g的，所以這個值我設定的是120g。注意，如果你的節點記憶體資源不夠 8gb，則需要調減小這個值，而 yarn 不會智慧型的探測節點的物理記憶體總量。

引數2：yarn.scheduler.maximum-allocation-mb

表示單個任務可申請的最多物理記憶體量，預設是 8192（mb），該值需要根據任務的資料量的大小來確定，128mb對應1gb記憶體

大資料集群調優

HBase集群調優

Kafka 集群調優

大資料開發之調優

大資料集群調優

HBase集群調優

Kafka 集群調優

大資料開發之調優

相關推薦