C 字串的記憶體分配與駐留池

2022-08-24 08:51:16 字數 2356 閱讀 4299

**剛開始學習c#的時候,就聽說clr對於string類有一種特別的記憶體管理機制:有時候,明明宣告了兩個string類的物件,但是他們偏偏卻指向同乙個例項。如下:

string s1 = "hello";

string s2 = "hello"; //s2和s1的實際值都是「hello」

bool same = (object) s1 == (object) s2; //這裡比較s1、s2是否引用了同乙個物件例項

//所以不能寫作bool same = s1 == s2;

//因為string類過載了==操作符來比較string物件包含的實際值

這裡的same會被賦值為true。也就是說s1真的和s2引用了同乙個string物件。當然,應該注意到的是s1和s2都被統一賦值為同乙個字串「hello」,這才是出現上述情況的原因。

現在我們初步得出結論,當有多個字串變數包含了同樣的字串實際值時,clr可能不會為它們重複地分配記憶體,而是讓它們統統指向同乙個字串物件例項。(這裡我說了「可能」,是因為某些情況下,確實也會發生同乙個字串實際值在記憶體中有多份副本同時存在。請繼續往下看。)

我們知道,string類有很多特別的地方,其中之一就是它是「不會改變的」(immutable)。這說明在我們每次對乙個string物件進行操作時(比如說使用trim,replace等方法),並不是真的對這個string物件的例項進行修改,而是返回乙個新的string物件例項作為操作執行的結果。string物件的例項一經生成,到死都不會被改變了!

基於string類這樣的特性,clr讓表示相同的字串實際值的變數指向同乙個string事例,就是完全合理的了。因為利用任何乙個對string例項的引用所進行的修改操作都不會切實地影響到該例項的狀態,也就不會影響到其他所有指向該例項的引用所表示的字串實際值。clr如此管理string類的記憶體分配,可以優化記憶體的使用情況,避免記憶體中包含冗餘的資料。

為了實現這個機制,clr默默地維護了乙個叫做駐留池(intern pool)的表。這個表記錄了所有在**中使用字面量宣告的字串例項的引用。這說明使用字面量宣告的字串會進入駐留池,而其他方式宣告的字串並不會進入,也就不會自動享受到clr防止字串冗餘的機制的好處了。這就是我上文提到的「某些情況下,確實也會發生同乙個字串實際值在記憶體中有多份副本同時存在」的例子。請看這個例子:

stringbuilder sb = new stringbuilder();

string s1 = "hello";

string s2 = sb.tostring();

bool same = (object) s1 == (object) s2;

這時same就不是true了,因為雖然s1,s2表示的是相同的字串,但是由於s2不是通過字面量宣告的,clr在為sb.tostring()方法的返回值分配記憶體時,並不會到駐留池中去檢查是否有值為「hello」的字串已經存在了,所以自然不會讓s2指向駐留池內的物件。

為了讓程式設計者能夠強制clr檢查駐留池,以避免冗餘的字串副本,string類的設計者提供了乙個名為intern的類方法。下面是該方法的乙個示例:

stringbuilder sb = new stringbuilder();

string s1 = "hello";

string s2 = string.intern(sb.tostring());

bool same = (object) s1 == (object) s2;

好了,same又是true了。intern方法接受乙個字串作為引數,它會在駐留池中檢查是否存在引數所表示的字串。如果存在,則返回那個駐留池中的字串的引用;否則向駐留池中加入乙個新的表示相同值的字串,並返回這個字串的引用。不過要注意的是,就算intern方法在駐留池中找到了相同值的字串,也不能讓您省卻一次字串記憶體分配的操作,因為作為引數的字串已經被分配了一次記憶體了。而使用intern方法的好處在於,如果intern方法在駐留池中找到了相同值的字串,此時雖然在記憶體中存在兩份該字串的副本(乙份是引數,乙份是駐留池中的),但是隨著時間的流逝,引數所引用的那個副本會被垃圾**掉,這樣對於該字串記憶體中就不存在冗餘了。

當您的程式中存在某個方法,可以根據不同的上下文環境建立並返回乙個很長的字串,而在程式執行的過程中它有會經常返回同樣的字串時,您可能就要考慮考慮使用intern方法來提高記憶體的利用率了。

不過同樣值得注意的是,使用intern方法讓乙個字串存活於駐留池中也有乙個***:即使已經不存在任何其它引用指向駐留池中的字串了,這個字串仍然不一定會被垃圾**掉。也就是說即使駐留池中的字串已經沒有用處了,它可能也要等到clr終結時才被銷毀。當您使用intern方法的時候,也應該考慮到這個特殊的行為。

C 中字串的記憶體分配與駐留池

駐留池 是一張記錄了所有在 中使用字面量宣告的字串例項的引用的表,由clr維護 string s1 hello string s2 hello s2和s1的實際值都是 hello bool same object s1 object s2 這裡比較s1 s2是否引用了同乙個物件例項返回結果為true...

原來是這樣 C 中字串的記憶體分配與駐留池

剛開始學習c 的時候,就聽說clr對於string類有一種特別的記憶體管理機制 有時候,明明宣告了兩個string類的物件,但是他們偏偏卻指向同乙個例項。如下 string s1 hello string s2 hello s2和s1的實際值都是 hello bool same object s1 ...

小整數池以及字串駐留機制

在 5,256 這個區間的整數,在記憶體中僅僅會存放乙份。舉例說明 在python中,兩次重複宣告乙個內容一樣的變數的時候,其id 是不一樣的 但是如果在宣告整數的時候,數字是在 5,256 這個區間的整數,其在記憶體中就僅僅存放了乙份,所以id 是一樣的 但是僅僅限於整數,如果是小數則不會觸發 前...