C 中字串的記憶體分配與駐留池

2022-09-07 03:09:13 字數 2823 閱讀 6801

駐留池:是一張記錄了所有在**中使用字面量宣告的字串例項的引用的表,由clr維護

string s1 = "hello";

string s2 = "hello"; //s2和s1的實際值都是「hello」

bool same = (object) s1 == (object) s2; //這裡比較s1、s2是否引用了同乙個物件例項

返回結果為true。

我認為的是s1和s2位於棧上面的不同位置,但棧上儲存的引用位址卻是相同,都指向了同乙個堆位址。

說明在我們每次對乙個string物件進行操作時(比如說使用trim,replace等方法),並不是真的對這個string物件的例項進行修改,

而是返回乙個新的string物件例項作為操作執行的結果。string物件的例項一經生成,到死都不會被改變了!

string.intern()強制clr檢查駐留池,然後返回引用位址,和普通string引用相同,由於不明白垃圾**是怎麼一件事,所以文章說的引數引用的副本會**我覺的意思是原先引用的引數會被**,但這個**時間不確定,返回的新的引用位址就會節省記憶體空間。

原文:

剛開始學習c#的時候,就聽說clr對於string類有一種特別的記憶體管理機制:有時候,明明宣告了兩個string類的物件,但是他們偏偏卻指向同乙個例項。如下:

string s1 = "hello";

string s2 = "hello"; //s2和s1的實際值都是「hello」

bool same = (object) s1 == (object) s2; //這裡比較s1、s2是否引用了同乙個物件例項

//所以不能寫作bool same = s1 == s2;

//因為string類過載了==操作符來比較string物件包含的實際值

這裡的same會被賦值為true。也就是說s1真的和s2引用了同乙個string物件。當然,應該注意到的是s1和s2都被統一賦值為同乙個字串「hello」,這才是出現上述情況的原因。

現在我們初步得出結論,當有多個字串變數包含了同樣的字串實際值時,clr可能不會為它們重複地分配記憶體,而是讓它們統統指向同乙個字串物件例項。(這裡我說了「可能」,是因為某些情況下,確實也會發生同乙個字串實際值在記憶體中有多份副本同時存在。請繼續往下看。)

我們知道,string類有很多特別的地方,其中之一就是它是「不會改變的」(immutable)。這說明在我們每次對乙個string物件進行操作時(比如說使用trim,replace等方法),並不是真的對這個string物件的例項進行修改,而是返回乙個新的string物件例項作為操作執行的結果。string物件的例項一經生成,到死都不會被改變了!

基於string類這樣的特性,clr讓表示相同的字串實際值的變數指向同乙個string事例,就是完全合理的了。因為利用任何乙個對string例項的引用所進行的修改操作都不會切實地影響到該例項的狀態,也就不會影響到其他所有指向該例項的引用所表示的字串實際值。clr如此管理string類的記憶體分配,可以優化記憶體的使用情況,避免記憶體中包含冗餘的資料。

為了實現這個機制,clr默默地維護了乙個叫做駐留池(intern pool)的表。這個表記錄了所有在**中使用字面量宣告的字串例項的引用。這說明使用字面量宣告的字串會進入駐留池,而其他方式宣告的字串並不會進入,也就不會自動享受到clr防止字串冗餘的機制的好處了。這就是我上文提到的「某些情況下,確實也會發生同乙個字串實際值在記憶體中有多份副本同時存在」的例子。請看這個例子:

string s1 = "hello";

string s2 = sb.tostring();

bool same = (object) s1 == (object) s2;

這時same就不是true了,因為雖然s1,s2表示的是相同的字串,但是由於s2不是通過字面量宣告的,clr在為sb.tostring()方法的返回值分配記憶體時,並不會到駐留池中去檢查是否有值為「hello」的字串已經存在了,所以自然不會讓s2指向駐留池內的物件。

為了讓程式設計者能夠強制clr檢查駐留池,以避免冗餘的字串副本,string類的設計者提供了乙個名為intern的類方法。下面是該方法的乙個示例:

string s1 = "hello";

string s2 = string.intern(sb.tostring());

bool same = (object) s1 == (object) s2;

好了,same又是true了。intern方法接受乙個字串作為引數,它會在駐留池中檢查是否存在引數所表示的字串。如果存在,則返回那個駐留池中的字串的引用;否則向駐留池中加入乙個新的表示相同值的字串,並返回這個字串的引用。不過要注意的是,就算intern方法在駐留池中找到了相同值的字串,也不能讓您省卻一次字串記憶體分配的操作,因為作為引數的字串已經被分配了一次記憶體了。而使用intern方法的好處在於,如果intern方法在駐留池中找到了相同值的字串,此時雖然在記憶體中存在兩份該字串的副本(乙份是引數,乙份是駐留池中的),但是隨著時間的流逝,引數所引用的那個副本會被垃圾**掉,這樣對於該字串記憶體中就不存在冗餘了。 當您的程式中存在某個方法,可以根據不同的上下文環境建立並返回乙個很長的字串,而在程式執行的過程中它有會經常返回同樣的字串時,您可能就要考慮考慮使用intern方法來提高記憶體的利用率了。 不過同樣值得注意的是,使用intern方法讓乙個字串存活於駐留池中也有乙個***:即使已經不存在任何其它引用指向駐留池中的字串了,這個字串仍然不一定會被垃圾**掉。也就是說即使駐留池中的字串已經沒有用處了,它可能也要等到clr終結時才被銷毀。當您使用intern方法的時候,也應該考慮到這個特殊的行為。

C 字串的記憶體分配與駐留池

剛開始學習c 的時候,就聽說clr對於string類有一種特別的記憶體管理機制 有時候,明明宣告了兩個string類的物件,但是他們偏偏卻指向同乙個例項。如下 string s1 hello string s2 hello s2和s1的實際值都是 hello bool same object s1 ...

原來是這樣 C 中字串的記憶體分配與駐留池

剛開始學習c 的時候,就聽說clr對於string類有一種特別的記憶體管理機制 有時候,明明宣告了兩個string類的物件,但是他們偏偏卻指向同乙個例項。如下 string s1 hello string s2 hello s2和s1的實際值都是 hello bool same object s1 ...

C 中字串駐留技術

msdn概念 公共語言執行庫通過維護乙個表來存放字串,該錶稱為拘留池,它包含程式中以程式設計方式宣告或建立的每個唯一的字串的乙個引用。因此,具有特定值的字串的例項在系統中只有乙個。上面的概念不好理解,我們還是從基礎說起 一 眾所周知,c 中的string是乙個引用型別,string物件存放在堆上,而...