預習非數值資料的編碼方式

2022-05-28 11:03:09 字數 2007 閱讀 5979

正常情況下,每個字或其他可定址單位(位元組半字等)是作為乙個整體資料單元看待的。但是,某些時候還需要將乙個,位數掘看成由n個1位資料組成,每個取值為0或1.例如,有時需要儲存乙個布林或二講制資料陣列.陣列中的每項只能取值為1或0;有時可能需要提取乙個資料項中的某位進行諸如「置位」或「清零」等操作。當資料以這種方式看待時,就被認為是邏輯資料。因此n位二進位制數可表示n個邏輯值。邏輯資料只能參加邏輯運算,並且是按位進行的,如按位「與」按位「或」、邏輯左移、邏輯右移等。

邏輯資料和數值資料都是一串0/1序列,在形式上無任何差異,需要通過指令的操作碼型別來識別它們。例如,邏輯運算指令處理的是邏再雙始,異不運算指令處理的是數值資料。

西文由拉丁字母、數字、標點符號及一些特殊符號組成,他們統稱為字元,所有的字元集合叫做字符集。字元不能直接在計算機內部進行處理,因而也必須對其進行數位化編碼。

(1)字元0~9這10個數字字元的高3位編碼為011,低4位分別為0000~1001。當去48掉高3位時,低4位正好是0~9這10個數字的8421碼。這樣既滿足了正常的排序關係,又有利於實現ascii碼與十進位制數之間的轉換。

(2)英文本母字元的編碼值也滿足正常的字母排序關係,而且大、小寫字母的編碼之間有簡單的對應關係,差別僅在b,這一位上,若這一位為0,則是大寫字母;若為1,則是小寫字母。這使得大、小寫字母之間的轉換非常方便。

漢字系統必須處理一下幾種漢字**:輸入碼、內碼、子模和陣碼

漢字的輸入碼:漢字輸入碼也稱外碼,是為將漢字輸入到計算機設計的**。漢字輸入碼種類較多,選擇不同的輸入碼方案,則輸入的方法及按鍵次數、輸入速度均有所不同。綜合起來,漢字輸入碼可分為流水碼、拼音類輸入法、拼形類輸入法和音形結合類輸入法幾大類。

漢字被輸入到計算機內部後,就按照一種稱為內碼的編碼形式在系統中進行儲存、查詢、傳送等處理。對於西文字元,它的內碼就是ascii碼。

對於漢字內碼的選擇,必須考慮以下幾個因素:

1.不能有二義性,即不能和ascii碼有相同的編碼。

2.要與漢字在字型檔中的位置有關係,以便於與漢字的處理、查詢。

3.編碼應盡量短。

計算機內部任何資訊都被表示成二進位制編碼形式。二進位制資料的每一位(或1)是組成二進位制資訊的最小單位,稱為乙個位元(bit),或稱位元,簡稱位。位元是計算機中處理、儲存和傳輸資訊的最小單位。

字長等於cpu內部用於整數運算的運算器位數和通用暫存器寬度。

字和字長概念不同,字用來表示被處理資訊的單位,用來度量各種型別的寬度。

由此可見,同一型別的資料並不是所有機器都採用相同的資料寬度,分配的位元組數隨機器和編譯器不同而不同。

資料在計算機內部進行計算、訪問和傳送過程中,由於元器件故障或噪音干擾等原因會出現差錯。為了減少和避免這些錯誤,一方面要從計算機硬體本身的可靠性入手,在電路、電源、佈線等各方面採取必要的措施,提高計算機的抗干擾能力;另一方面要採取相應的資料檢錯和校正措施,自動地發現並糾正錯誤。

最簡單的校驗方法實現步驟如下:

海明校驗碼

海明效驗是分組奇偶效驗,單糾錯碼(sce)只能糾正一位錯,「糾一檢二」碼(sec-ded)可糾正一位錯並檢測兩位數

效驗位和故障字的位數是相同的

s5 s4 s3 s2 s1為00000時,無錯

s5 s4 s3 s2 s1僅一位不為0時,s指定位置上的效驗位出錯

s5 s4 s3 s2 s1兩位不為0時,資料和效驗位中有兩位同時出錯

s5 s4 s3 s2 s1三位不為0時,有乙個資料位發生了錯誤

s5 s4 s3 s2 s1四位或五位不為0時,出錯嚴重

校驗碼那裡沒怎麼看懂

預習非數值資料的編碼方式

1 邏輯值 邏輯資料和數值資料都是一串0 1序列,在形式上無任何差異,需要通過指令的操作碼型別來識別它們。2 字元 字元不能直接在計算機內部進行處理,因而也必須對其進行數位化編碼,字符集中每乙個字元都有乙個 構成了該字符集的 表,簡稱碼表。碼表中的 具有唯一性。用西文字元表示 由拉丁字母,數字,標點...

預習非數值資料的編碼方式

非數值資料的編碼表示 1.邏輯值 n位二進位制數可表示n個邏輯值。邏輯資料只能參加邏輯運算,並且是按位進行的,如按位 與 按位 或 邏輯左移,邏輯右移等。邏輯運算指令處理的是邏輯資料,算術運算指令處理的是數值資料。2.西文字元 西文由拉丁字母,數字,標點符號及一些特殊符號所組成,它們統稱為字元。所有...

預習非數值資料的編碼方式

邏輯值 n位二進位制數可表示n個邏輯值 邏輯數值和數值資料都是一串0 1序列 西文字元 西文由拉丁字母 數字 標點符號及一些特殊字元所組成,它們統稱為字元,所以字元的集合叫做字符集 字符集中每乙個字元都有乙個 即二進位制編碼的0 1序列 構成該字符集的 表 碼表 碼表中 具有唯一性 ascii字元表...