Linux 記憶體對映 mmap 原理分析

2021-09-17 07:33:01 字數 3047 閱讀 6923

本文**部落格,我修改了一些筆誤,並劃了一些我自認為的重點。

首先,「對映」這個詞,就和數學課上說的「一一對映」是乙個意思,就是建立一種一一對應關係,在這裡主要是指 硬碟上檔案 的位置與 程序邏輯位址空間 中一塊大小相同的區域之間的一一對應,如 圖1中過程1 所示。這種對應關係純屬是邏輯上的概念,物理上是不存在的,原因是程序的邏輯位址空間本身就是不存在的。在記憶體對映的過程中,並沒有實際的資料拷貝,檔案沒有被載入記憶體,只是邏輯上被放入了記憶體,具體到**,就是建立並初始化了相關的資料結構(struct address_space),這個過程有系統呼叫mmap()實現,所以建立記憶體對映的效率很高。

既然建立記憶體對映沒有進行實際的資料拷貝,那麼程序又怎麼能最終直接通過記憶體操作訪問到硬碟上的檔案呢?那就要看記憶體對映之後的幾個相關的過程了。

mmap()會返回乙個指標ptr,它指向程序邏輯位址空間中的乙個位址,這樣以後,程序無需再呼叫readwrite對檔案進行讀寫,而只需要通過ptr就能夠操作檔案。但是ptr所指向的是乙個邏輯位址,要操作其中的資料,必須通過mmu將邏輯位址轉換成實體地址,如 圖1中過程2 所示。這個過程與記憶體對映無關。 

前面講過,建立記憶體對映並沒有實際拷貝資料,這時,mmu 在位址對映表中是無法找到與 ptr 相對應的實體地址的,也就是mmu失敗,將產生乙個缺頁中斷,缺頁中斷的中斷響應函式會在swap中尋找相對應的頁面,如果找不到(也就是該檔案從來沒有被讀入記憶體的情況),則會通過mmap()建立的對映關係,從硬碟上將檔案讀取到物理記憶體中,如 圖1中過程3 所示。這個過程與記憶體對映無關。

如果在拷貝資料時,發現物理記憶體不夠用,則會通過虛擬記憶體機制(swap)將暫時不用的物理頁面交換到硬碟上,如 圖1中過程4 所示。這個過程也與記憶體對映無關。

從**層面上看,從硬碟上將檔案讀入記憶體,都要經過檔案系統進行資料拷貝,並且資料拷貝操作是由檔案系統和硬體驅動實現的,理論上來說,拷貝資料的效率是一樣的。但是通過記憶體對映的方法訪問硬碟上的檔案,效率要比 read 和 write 系統呼叫高,這是為什麼呢?原因是read()是系統呼叫,其中進行了資料拷貝,它首先將檔案內容從硬碟拷貝到

核心空間的乙個緩衝區,如

圖2中過程1

,然後再將這些資料拷貝到

使用者空間,如 圖2中過程2 ,在這個過程中,實際上完成了 兩次資料拷貝 ;而mmap()雖然也是系統呼叫,如前所述,mmap()中沒有進行資料拷貝,

真正的資料拷貝是在缺頁中斷處理時進行的

,由於mmap()將檔案直接對映到

使用者空間,所以中斷處理函式根據這個對映關係,直接將檔案從硬碟拷貝到使用者空間,只進行了 一次資料拷貝 。因此,記憶體對映的效率要比read/write效率高

下面這個程式,通過readmmap兩種方法分別對硬碟上乙個名為 「mmap_test」 的檔案進行操作,檔案中存有 10000 個整數,程式兩次使用不同的方法將它們讀出,加1,再寫回硬碟。通過對比可以看出,read消耗的時間將近是mmap的兩到三倍

#include #include #include #include #include #include #include #include #include #define max 10000

int main()

for ( i = 0; i < max; ++i )

++array[i];

if ( sizeof(int) * max != write( fd, (void *) array, sizeof(int) * max ) )

free( array );

close( fd );

gettimeofday( &tv2, null );

printf( "time of read/write: %dms/n", tv2.tv_usec - tv1.tv_usec );

/*mmap*/

gettimeofday( &tv1, null );

fd = open( "mmap_test", o_rdwr );

array = mmap( null, sizeof(int) * max, prot_read | prot_write, map_shared, fd, 0 );

for ( i = 0; i < max; ++i )

++array[i];

munmap( array, sizeof(int) * max );

msync( array, sizeof(int) * max, ms_sync );

free( array );

close( fd );

gettimeofday( &tv2, null );

printf( "time of mmap: %dms/n", tv2.tv_usec - tv1.tv_usec );

return(0);

}

輸出結果:

time of read/write: 154ms

time of mmap: 68ms

mmap記憶體對映原理

mmap概念 mmap是一種記憶體對映檔案的方法,即將乙個檔案或者其它物件對映到程序的位址空間,實現檔案磁碟位址和程序虛擬位址空間中一段虛擬位址的一一對映關係。特點 實現這樣的對映關係後,程序就可以採用指標的方式讀寫操作這一段記憶體,而系統會自動回寫髒頁面到對應的檔案磁碟上,即完成了對檔案的操作而不...

mmap記憶體對映原理

mmap記憶體對映的實現過程,總的來說可以分為三個階段 一 程序啟動對映過程,並在虛擬位址空間中為對映建立虛擬對映區域 1 程序在使用者空間呼叫庫函式mmap,原型 void mmap void start,size t length,int prot,int flags,int fd,off t ...

linux記憶體對映mmap原理分析

一直都對記憶體對映檔案這個概念很模糊,不知道它和虛擬記憶體有什麼區別,而且對映這個詞也很讓人迷茫,今天終於搞清楚了。下面,我先解釋一下我對對映這個詞的理解,再區分一下幾個容易混淆的概念,之後,什麼是記憶體對映就很明朗了。首先,對映 這個詞,就和數學課上說的 一一對映 是乙個意思,就是建立一種一一對應...