php和C語言陣列占用空間對比

2021-06-16 11:18:59 字數 3105 閱讀 1935

我們在前面的php高效寫法提到,盡量不要複製變數,特別是陣列。

一般來說,php陣列的記憶體利用率只有 1/10, 也就是說,乙個在c語言裡面100m 記憶體的陣列,在php裡面就要1g。下面我們可以粗略的估算php陣列占用記憶體的大小,

首先我們測試1000個元素的整數占用的記憶體:

<?php   

echo memory_get_usage() , '

';  

$start = memory_get_usage();  

$a = array();  

for ($i=0; $i

<1000; $i++)   

$mid =  memory_get_usage();  

echo memory_get_usage() , '

';  

for ($i=1000; $i

<2000; $i++)   

$end =  memory_get_usage();  

echo memory_get_usage() , '

';  

echo

'argv:', ($mid - $start)/1000 ,'bytes' , '

';  

echo

'argv:',($end - $mid)/1000 ,'bytes' , '

';  

輸出是:

353352

437848

522024

argv:84.416bytes

argv:84.176bytes

大概了解1000 個元素的整數陣列需要占用 82k 記憶體,平均每個元素占用 84 個位元組。而純 c 中整體只需要 4k(乙個整型占用4byte * 1000 )。memory_get_usage() 返回的結果並不是全是被陣列占用了,還要包括一些 php 執行本身分配的一些結構,可能用內建函式生成的陣列更接近真實的空間:

<?php   

$start = memory_get_usage();  

$a = array_fill(0, 10000, 1);  

$mid = memory_get_usage(); //10k elements array;

echo

'argv:', ($mid - $start )/10000,'byte' , '

';  

$b = array_fill(0, 10000, 1);  

$end = memory_get_usage(); //10k elements array;

echo

'argv:', ($end - $mid)/10000 ,'byte' , '

';  

得到:argv:54.5792byte

argv:54.5784byte

從這個結果來看似乎乙個陣列元素大約占用了54個位元組左右。

首先看一下32位機c語言各種型別占用的位元組:

在php中都使用long型別來代表數字,沒有使用int型別

大家都明白php是一種弱型別的語言,它不會去區分變數的型別,沒有int float char *之類的概念。

我們看看php在zend裡面儲存的變數,php中每個變數都有對應的 zval, zval結構體定義在zend/zend.h裡面,其結構:

typedef

struct _zval_struct zval;  

struct _zval_struct ;  

php使用一種union結構來儲存變數的值,即

zvalue_value 是乙個union,union變數所占用的記憶體是由最大

成員資料空間決定。

typedef

union _zvalue_value  str;   

hashtable *ht;              /* hash table value */

zend_object_value obj;      /*object value */

} zvalue_value;  

最大成員資料空間

是struct str,指標佔*val用4位元組,int占用4位元組,共8位元組。

struct zval占用的空間為8+4+1+1 = 14位元組,

其實呢,在zval中

陣列,字串和物件還需要另外的儲存結構,陣列則是乙個 hashtable

:hashtable結構體定義在zend/zend_hash.h.

typedef

struct _hashtable  hashtable;  

hashtable 結構需要 39 個位元組,每個陣列元素儲存在 bucket 結構中:

typedef

struct bucket  bucket;  

bucket 結構需要 33 個位元組,鍵長超過四個位元組的部分附加在 bucket 後面,而元素值很可能是乙個 zval 結構,另外每個陣列會分配乙個由 arbuckets 指向的 bucket 指標陣列, 雖然不能說每增加乙個元素就需要乙個指標,但是實際情況可能更糟。這麼算來乙個陣列元素就會占用 54 個位元組,與上面的估算幾乎一樣。

乙個空陣列至少會占用 14(zval) + 39(hashtable) + 33(arbuckets) = 86 個位元組,作為乙個變數應該在符號表中有個位置,也是乙個陣列元素,因此乙個空陣列變數需要 118 個位元組來描述和儲存。從空間的角度來看,小型陣列平均代價較大,當然乙個指令碼中不會充斥數量很大的小型陣列,可以以較小的空間代價來獲取程式設計上的快捷。但如果將陣列當作容器來使用就是另一番景象了,實際應用經常會遇到多維陣列,而且元素居多。比如10k個元素的一維陣列大概消耗540k記憶體,而10k x 10 的二維陣列理論上只需要 6m 左右的空間,但是按照 memory_get_usage 的結果則兩倍於此,[10k,5,2]的三維陣列居然消耗了23m,小型陣列果然是划不來的。

C 語言中快速排序陣列,不額外占用記憶體空間

include 確定乙個基準值的排序位置 int findposition int p,int low,int high 傳入陣列,最小下標,最大下標 p high mid 最後low high,讓基準值放回陣列,此時基準值的排序位置就確定了 return low 返回 low 和 high 相遇的...

C語言陣列與指標對比

前面兩篇博文分別介紹了陣列與指標的知識,本篇將主要介紹兩者的聯絡與區別。希望對初學者有所幫助。分別定義乙個陣列與乙個指標變數,如下 int sarr 10 char ptr abcdefghi 通過下標訪問 通過間接訪問運算子 訪問 指標是左值 除非宣告為const 其值可以更改,陣列名是右值,其值...

python和C語言小對比

因為過年耽誤了幾天和急性蕁麻疹住院了7天,耽誤了很多,住院時沒有電腦,只看書沒有實踐,感覺還是力不從心。在我看來,python的變數不需要事先定義變數型別,但是似乎如果等號右邊不是特定的格式 例如中括號 變數型別預設是字串的,如果要轉成別的型別需要轉換一下。python沒有使用 來分割,而是使用縮排...