預習非數值資料的編碼方式

2022-05-30 12:03:10 字數 1637 閱讀 5605

(1)邏 輯 值:邏輯資料和數值資料都是一串0/1序列,在形式上無任何差異,需要通過指令的操作碼型別來識別它們。

(2)西文字元:1)西文由拉丁字母、數字、標點字元及一些特殊字元所組成,它們統稱為字元。

2)所有字元的集合叫做字符集。

3)字元主要用於外部裝置和計算機之間交換資訊。

(3)漢字字元: 漢字被輸入到計算機內部後,就按照一種稱為內碼的編碼形式在系統中進行儲存,查詢,傳輸等處理.

考慮因素:

1)不能有二義性,即不能和ascii碼有相同的編碼.

2)要與漢字在字型檔中的位置有關係,以便於漢字的處理,查詢.

3)編碼應盡量短.

漢字字形有兩種描述方法:字模點陣描述和輪廓描述.

(1)ascii碼:是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。它是現今最通用的單位元組編碼系統,並等同於國際標準iso/iec 646。

(2)gbk編碼:由於ascii編碼不支援中文,因此,當中國人用到計算機時,就需要尋求一種編碼方式來支援中文。

(3)unicode編碼:因為世界國家很多,每個國家都定義一套自己的編碼標準,結果相互之間誰也不懂誰的編碼,就無法進行很好的溝通交流,所以及時的出現了乙個組織iso決定制定一套編碼方案來解決所有國家的編碼問題。

(4)utf-8編碼:由於unicode比較浪費網路頻寬和硬碟,因此為了解決這個問題,就在unicode的基礎上,定義了一套編碼規則(將「碼位」轉換為位元組序列的規則(編碼/解碼 可以理解為 加密/解密 的過程)),這個新的編碼規則就是utf-8,採用1-4個字元進行傳輸和儲存資料。

(1)沒有檢測到錯誤,得到的資料位直接傳送出去。

(2)檢測到差錯,並可以糾錯。資料位和比較結果在目標部件出奇(偶)效驗位p'。

(3)計算最終的效驗位p*,並根據其值判斷有無奇偶錯。

b.海明效驗碼

(1)如果故障字各位全部是0,則表示沒有發生錯誤。

(2)如果故障字中有且僅有一位為1,則表示校驗位中有一位出錯,不需要糾正

(3)如果故障字中多位為1,則表示有乙個資料位出錯,其在碼字中的出錯位置由故障字的數值來確定,糾正時只要將其錯位取反即可。

c.迴圈冗餘效驗碼

1)編碼原理:

現假設有:有效資訊:m;

除數g(生成多項式)有:m/g=q+r/g;

此時,可選擇r作為校驗位,則mr即為校驗碼。

2)校驗原理:(m-r)/g=q+0/g

說明:以接收到的校驗碼除以約定的除數,若餘數為0,則可認為接收到的資料是正確的。

例:有效資訊1101,生成多項式樣1011

3)迴圈校驗碼解:

有效資訊1101(k=4),即m(x)=x3+x2+x0,生成多項式1011(r+1=4,即r=3);

即g(x)=x3+x1+x0,m(x)·x3=x6+x5+x3,即1101000(對1101左移三位);

m(x)·x3/g(x)=1101000/1011=1111+001/1011 即1010的crc是:1101001 。

計算**如下 :

預習非數值資料的編碼方式

1 邏輯值 邏輯資料和數值資料都是一串0 1序列,在形式上無任何差異,需要通過指令的操作碼型別來識別它們。2 字元 字元不能直接在計算機內部進行處理,因而也必須對其進行數位化編碼,字符集中每乙個字元都有乙個 構成了該字符集的 表,簡稱碼表。碼表中的 具有唯一性。用西文字元表示 由拉丁字母,數字,標點...

預習非數值資料的編碼方式

非數值資料的編碼表示 1.邏輯值 n位二進位制數可表示n個邏輯值。邏輯資料只能參加邏輯運算,並且是按位進行的,如按位 與 按位 或 邏輯左移,邏輯右移等。邏輯運算指令處理的是邏輯資料,算術運算指令處理的是數值資料。2.西文字元 西文由拉丁字母,數字,標點符號及一些特殊符號所組成,它們統稱為字元。所有...

預習非數值資料的編碼方式

正常情況下,每個字或其他可定址單位 位元組半字等 是作為乙個整體資料單元看待的。但是,某些時候還需要將乙個,位數掘看成由n個1位資料組成,每個取值為0或1.例如,有時需要儲存乙個布林或二講制資料陣列.陣列中的每項只能取值為1或0 有時可能需要提取乙個資料項中的某位進行諸如 置位 或 清零 等操作。當...