資料結構基礎知識

2021-05-14 08:49:36 字數 3346 閱讀 6563

時間複雜度和空間複雜度

同一問題可用不同演算法解決,而乙個演算法的質量優劣將影響到演算法乃至程式的效率。演算法分析的目的在於選擇合適演算法和改進演算法。乙個演算法的評價主要從時間複雜度和空間複雜度來考慮。

1、時間複雜度

(1)時間頻度

乙個演算法執行所耗費的時間,從理論上是不能算出來的,必須上機執行測試才能知道。但我們不可能也沒有必要對每個演算法都上機測試,只需知道哪個演算法花費的時 間多,哪個演算法花費的時間少就可以了。並且乙個演算法花費的時間與演算法中語句的執行次數成正比例,哪個演算法中語句執行次數多,它花費時間就多。乙個演算法中的 語句執行次數稱為語句頻度或時間頻度。記為t(n)。

(2)時間複雜度

在剛才提到的時間頻度中,n稱為問題的規模,當n不斷變化時,時間頻度t(n)也會不斷變化。但有時我們想知道它變化時呈現什麼規律。為此,我們引入時間複雜度概念。

一般情況下,演算法中基本操作重複執行的次數是問題規模n的某個函式,用t(n)表示,若有某個輔助函式f(n),使得當n趨近於無窮大 時,t(n)/f(n)的極限值為不等於零的常數,則稱f(n)是t(n)的同數量級函式。記作t(n)=o(f(n)),稱o(f(n)) 為演算法的漸進時間複雜度,簡稱時間複雜度。

在各種不同演算法中,若演算法中語句執行次數為乙個常數,則時間複雜度為o(1),另外,在時間頻度不相同時,時間複雜度有可能相同,如t(n)=n2

+3n+4與t(n)=4n2 +2n+1它們的頻度不同,但時間複雜度相同,都為o(n2 )。

按數量級遞增排列,常見的時間複雜度有:

常數階o(1),對數階o(log2 n),線性階o(n),

線性對數階o(nlog2 n),平方階o(n2 ),立方階o(n3 ),...,

k次方階o(nk ),指數階o(2n )。隨著問題規模n的不斷增大,上述時間複雜度不斷增大,演算法的執行效率越低。

2、空間複雜度

與時間複雜度類似,空間複雜度是指演算法在計算機內執行時所需儲存空間的度量。記作:

s(n)=o(f(n))

我們一般所討論的是除正常占用記憶體開銷外的輔助儲存單元規模。討論方法與時間複雜度類似,不再贅述。

(3)漸進時間複雜度評價演算法時間效能

主要用演算法時間複雜度的數量級(即演算法的漸近時間複雜度)評價乙個演算法的時間效能。

【例3.7】有兩個演算法a1 和a2 求解同一問題,時間複雜度分別是t1 (n)=100n2 ,t2 (n)=5n3 。

(1)當輸入量n<20時,有t1 (n)>t2 (n),後者花費的時間較少。

(2)隨著問題規模n的增大,兩個演算法的時間開銷之比5n3 /100n2 =n/20亦隨著增大。即當問題規模較大時,演算法a1 比演算法a2 要有效地多。

它們的漸近時間複雜度o(n2 )和o(n3 )從巨集觀上評價了這兩個演算法在時間方面的質量。在演算法分析時,往往對演算法的時間複雜度和漸近時間複雜度不予區分,而經常是將漸近時間複雜度t(n)=o(f(n))簡稱為時間複雜度,其中的f(n)一般是演算法中頻度最大的語句頻度。

【例3.8】演算法matrixmultiply的時間複雜度一般為t(n)=o(n3 ),f(n)=n3 是該演算法中語句(5)的頻度。下面再舉例說明如何求演算法的時間複雜度。

【例3.9】交換i和j的內容。

temp=i;

i=j;

j=temp;

以上三條單個語句的頻度均為1,該程式段的執行時間是乙個與問題規模n無關的常數。演算法的時間複雜度為常數階,記作t(n)=o(1)。

如果演算法的執行時間不隨著問題規模n的增加而增長,即使演算法中有上千條語句,其執行時間也不過是乙個較大的常數。此類演算法的時間複雜度是o(1)。

【例3.10】變數計數之一。

(1) x=0;y=0;

(2) for(k-1;k<=n;k++)

(3)     x++;

(4) for(i=1;i<=n;i++)

(5)       for(j=1;j<=n;j++)

(6)         y++;

一般情況下,對步進迴圈語句只需考慮迴圈體中語句的執行次數,忽略該語句中步長加1、終值判別、控制轉移等成分。因此,以上程式段中頻度最大的語句是(6),其頻度為f(n)=n2 ,所以該程式段的時間複雜度為t(n)=o(n2 )。

當有若干個迴圈語句時,演算法的時間複雜度是由巢狀層數最多的迴圈語句中最內層語句的頻度f(n)決定的。

【例3.11】變數計數之二。

(1) x=1;

(2) for(i=1;i<=n;i++)

(3)       for(j=1;j<=i;j++)

(4)           for(k=1;k<=j;k++)

(5)               x++;

該程式段中頻度最大的語句是(5),內迴圈的執行次數雖然與問題規模n沒有直接關係,但是卻與外層迴圈的變數取值有關,而最外層迴圈的次數直接與n有關,因此可以從內層迴圈向外層分析語句(5)的執行次數:

則該程式段的時間複雜度為t(n)=o(n3 /6+低次項)=o(n3 )。

(4)演算法的時間複雜度不僅僅依賴於問題的規模,還與輸入例項的初始狀態有關。

【例3.12】在數值a[0..n-1]中查詢給定值k的演算法大致如下:

(1)i=n-1;

(2)while(i>=0&&(a[i]!=k))

(3)     i--;

(4)return i;

此演算法中的語句(3)的頻度不僅與問題規模n有關,還與輸入例項中a的各元素取值及k的取值有關:

①若a中沒有與k相等的元素,則語句(3)的頻度f(n)=n;

②若a的最後乙個元素等於k,則語句(3)的頻度f(n)是常數0。

(5)最壞時間複雜度和平均時間複雜度

最壞情況下的時間複雜度稱最壞時間複雜度。一般不特別說明,討論的時間複雜度均是最壞情況下的時間複雜度。

這樣做的原因是:最壞情況下的時間複雜度是演算法在任何輸入例項上執行時間的上界,這就保證了演算法的執行時間不會比任何更長。

【例3.19】查詢演算法【例1·8】在最壞情況下的時間複雜度為t(n)=0(n),它表示對於任何輸入例項,該演算法的執行時間不可能大於0(n)。

平均時間複雜度是指所有可能的輸入例項均以等概率出現的情況下,演算法的期望執行時間。

常見的時間複雜度按數量級遞增排列依次為:常數0(1)、對數階0(log2 n)、線形階0(n)、線形對數階0(nlog2 n)、平方階0(n2 )立方階0(n3 )、…、k次方階0(nk )、指數階0(2n )。顯然,時間複雜度為指數階0(2n )的演算法效率極低,當n值稍大時就無法應用。

類似於時間複雜度的討論,乙個演算法的空間複雜度(space complexity)s(n)定義為該演算法所耗費的儲存空間,它也是問題規模n的函式。漸近空間複雜度也常常簡稱為空間複雜度。演算法的時間複雜度和空間 複雜度合稱為演算法的複雜度。

資料結構基礎知識

一種資料的邏輯結根據需要可以表示成多種儲存結構,常用的儲存結構有順序儲存 鏈結儲存 索引儲存等,採用不同的資料結構,其資料處理的效率是不同的。線性表是一種常用的資料結構。在實際應用中,線性表都是以棧 佇列 字串 陣列等特殊線性表的形式來使用的。線性表是一種線性結構。線性表有順序儲存結構和鏈式儲存結構...

資料結構基礎知識

簡單的說,資料結構是一門研究非數值計算的程式設計問題中計算機的操作物件以及它們之間的關係和操作等的學科。描述一類非數值計算問題的數學模型不再是數學方程,而是諸如表 樹和圖之類的資料結構。資料結構 的研究不僅涉及到計算機硬體 特別是編碼理論 儲存裝置和訪問方法等 的研究範圍,而且和計算機軟體的研究有著...

資料結構基礎知識

1.鍊錶和陣列的區別 2.排序演算法 3.雜湊表原理,三個解決衝突的方式,雜湊函式的選擇,常用的雜湊函式 6.kmp 8.n 3 的空間用1 3的模板鋪滿,多少種方法?10.找出2000記錄 現最多前10條記錄 12.哈夫曼樹 p209 13.二維字首和 19.1千萬資料去重 21.二叉樹兩個節點的...