快取行對齊

快取記憶體控制器是針對資料塊，而不是位元組進行操作的。從程式設計的角度講，快取記憶體其實就是一組稱之為快取行(cache line)的固定大小的資料塊，其大小是以突發讀或者突發寫週期的大小

為基礎的。

快取基本上來說就是把後面的資料載入到離cpu自己進的地方，對於cpu來說，它是不會乙個位元組乙個位元組的載入的，因為這非常沒有效率，一般來說都是要一塊一塊的載入的，在cpu的快取技術中，這個術語叫「cacheline」（有的中文編譯成「快取行」），一般來說，乙個主流的cpu的cacheline是64bytes（也有的cpu用32bytes和128bytes），也就是16個32位的整型。也就是說，cpu從記憶體中撈資料上來的最小資料單位。

關於快取行介紹詳細可見：

由於乙個快取行是64位元組，所以我們設計如下**：

public
class
cachelinetest
private
static
volatile tclass[
] tclasses =
newtclass[2
];static
public
static
void
main
(string[
] args)
throws interruptedexception })
; thread thread2 =
newthread((
)->})
;final
long start = system.
nanotime()
; thread1.
start()
; thread2.
start()
; thread1.
join()
; thread2.
join()
; system.out.
println
((system.
nanotime()
- start)
/100_1000);}
}

當上面**內部類tclass不加上標記的那一行成員變數時，執行速度如下：

當加上時，執行速度如下：

由於快取行是64位元組，而乙個long型別為8位元組，當不加那一行**時，計算的總的位元組數為8+8=16位元組，所以這兩個變數在乙個快取行中。

於是這個快取行中就有資料1和資料2。

當兩個執行緒分別執行時，由於加了volatile關鍵字，執行緒1改變了快取行中的資料1，需要去通知執行緒2去更新快取行中的資料1（即使資料1執行緒2不需要用到），因此就降低了cpu的執行速度。

但是上面**如果加上

private volatile long a, b, c, d, e, f, g;

這時每個tclass有8個long型別的成員變數，即8 * 8 = 64個位元組，每個tclass都單獨在乙個快取行中。

因此兩個執行緒分別執行時都不需要通知對方，cpu執行速度就會增加。

快取行對齊

CPU快取記憶體行對齊

JVM快取行對齊效能優化

TLB cahce 快取對齊

快取行對齊

CPU快取記憶體行對齊

JVM快取行對齊效能優化

TLB cahce 快取對齊

相關推薦