per CPU變數的靜態和動態分配原理

per-cpu是2.6核心中引入的，訪問per-cpu變數幾乎不需要鎖，每個處理器都在其自己的副本上工作。這些副本是如何生成的呢？本文嘗試解答這個問題。

靜態per-cpu結構設計思路大體可以分為兩個階段：編譯階段和執行時階段

在編譯階段，實際上只生成了乙個cpu原本。系統中所有per-cpu結構都放到了乙個叫做"data.percpu"的section中，在ld.s鏈結指令碼有如下內容：

. = align(32);

__per_cpu_start = .;

.data.percpu :

__per_cpu_end = .;

. = align(4096);

__init_end = .;

由這個鏈結指令碼知道，

.data.percpu section是處於init資料段的，在系統初始化結束後將被**。那麼，系統如何維持per-cpu資料呢？這個任務在執行時完成。在系統初始化階段有乙個函式會分配 nr_cpu * （

__per_cpu_end -

__per_cpu_start）大小的記憶體，然後將 data.percpu段中的cpu原本拷貝nr_cpu份到這塊記憶體中。從此以後系統通過get_cpu_var訪問per-cpu變數的時候就會根據自己的cpu_id找到對應的拷貝。

可見，靜態per-cpu變數的locality非常好，cpu之間在cache級都不彼此干擾。對於靜態生成的per-cpu變數需要使用get_cpu_var來訪問。

在講述動態per-cpu結構之前不妨思考下，如何能把動態per-cpu的locality設計得跟靜態的一樣呢？由於不知道系統中將會有多少動態結構出現，所以不宜採用預留記憶體的方式，這為我們的設計帶來了很大挑戰。實際上，linux也沒有完全解決這個問題，但還是做了最大程度的優化，手法也比較贊。考慮到per-cpu變數的訪問模式，效率應該和靜態方式不相上下。下面看看linux的處理方式。

int node = cpu_to_node(cpu); bug_on(pdata->ptrs[cpu]); if (node_online(node)) pdata->ptrs[cpu] = kmalloc_node(size, gfp|__gfp_zero, node); else pdata->ptrs[cpu] = kzalloc(size, gfp);

對於動態生成的per-cpu變數需要用per_cpu_ptr來訪問。

ref:

per CPU變數的靜態和動態分配原理

kernel中的per cpu變數

靜態變數和動態變數

靜態儲存動態儲存靜態變數與動態變數

per CPU變數的靜態和動態分配原理

kernel中的per cpu變數

靜態變數和動態變數

靜態儲存 動態儲存 靜態變數與動態變數

相關推薦

靜態儲存動態儲存靜態變數與動態變數