第三節 資料與編碼

2021-10-20 16:32:54 字數 2213 閱讀 6518

第三節 資料與編碼

一、進製

(一)基本概念

數制即表示數值的方法,有非進製數和進製數兩種。在計算機數制中,需要掌握數碼、基數和位權

的概念。

數碼:數制中表示基本數值大小的不同數字符號。在一種數制中,只能使用一組固定的符號來表示

數的大小。例如,十進位制有 10 個數碼,分別為 0,1,2,3,4,5,6,7,8,9 十個數。十六進製制有 16

個數碼,分別為 0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f。

基數:一種數制所使用數碼的個數。例如,十進位制的基數為 10,十六進製制的基數為 16。

位權:乙個數值中某一位上的 1 所表示數值的大小。例如,十進位制的 123,1 的位權是 10^2 ,2 的位

權是 10^1 ,3 的位權是 10^0 。

(二)進製表示

在計算機內部儲存、處理和傳遞的資訊均採用二進位制**來表示,二進位制的基數為 2,只有「0」和

「1」兩個數碼。

除了二進位制外,計算機中常用的還有八進位制和十六進製制。

對於不同的數制,我們常採用以下兩種書寫方式:

(1)在數字後面加乙個大寫字母作為字尾,表示該數字採用的數制;

(2)在括號外面加下標

二、不同進製之間的轉換

(一)r 進製轉換為十進位制數

r 進製轉換為十進位制數,只要將各位數字乘以各自的位權求和即可。

轉換規則:採用 r 進製數的位權展開法,即將 r 進製數按「位權」展開形成多項式並求和,得到

的結果就是轉換結果,例如:

(1101) 2 =1×2 3 +1×2 2 +0×2 1 +1×2 0 =13

(二)十進位制轉換為 r 進製數

轉換規則:整數部分(倒讀法):「逐次除以基數取餘」法,直到商為 0;

十進位制轉換二進位制:(15) 10 轉換成二進位制數。

四、編碼

通訊的目的是為了交換資訊,資訊的載體可以是數字、文字、語音、圖形、影象。由於計算機內部

只能處理二進位制**,因此,為了傳輸這些資訊,首先要將這些資訊轉換成二進位制。數值通過數制的轉

換即可轉換成計算機識別的二進位制,而非數值型資料則需要遵循一定的編碼標準進行編碼從而被計算機

來識別。

(一)數值編碼

數值在計算機中的表示形式稱為機器數,乙個數的最高位定義為符號位,其餘位用來表示數值。常

用的機器數表示法有原碼、反碼和補碼 3 種。

原碼:機器數的最高位為符號位,正數為 0,負數為 1。數值部分為真值的絕對值。

反碼:正數的反碼與原碼的表現方式相同;負數的反碼是最高位為 1,數值位為原碼逐位求反。

補碼:正數的補碼與原碼的表現方式相同;負數的補碼是把原碼除符號位以外的各位取反,然後最

低位加 1,即「反碼+1」。

(三)漢字編碼

1.輸入碼

目前漢字主要是通過鍵盤輸入到計算機中,漢字輸入有不同的輸入法,不同輸入法對應著不同的編

碼規則,這些編碼規則就是漢字輸入碼,也稱為外碼。通常輸入碼是由鍵盤上的字元或數字組合而成,

有數字編碼、拼音編碼和字形編碼,常見的有智慧型 abc、五筆字體碼、搜狗輸入法等。

2.機內碼

機內碼是計算機系統內部處理和儲存漢字時使用的**。漢字可以選擇不同的輸入碼,但是輸入碼

必須轉換成統一的**——機內碼才能被計算機識別。每個漢字對應的機內碼是唯一的。

3.字形碼

字形碼是顯示或列印輸出漢字時產生的字形,這種編碼是通過點陣來實現的。全部的字形碼都放在

漢字字型檔裡。根據對漢字質量要求不同,常用的點陣有 16×16,24×24,32×32 及 48×48。每個點在

儲存器中用乙個二進位制數儲存,用「0」「1」分別表示「白」「黑」。根據點陣大小可計算出乙個漢字所

需的儲存空間。

第三節 資料降維

過濾方差,進行降維 threshold指定要過濾的方差,小於等於即過濾該特徵 var variancethreshold threshold 0.0 data var.fit transform 0,2,0,3 0,1,4,3 0,1,1,3 print data if name main var ...

資料結構與演算法第三節 陣列的使用

陣列 array 是一種線性表資料結構,它用一組連續的記憶體空間,來儲存一組具有相同型別的資料。陣列的特性 線性表 連續的 相同型別 線性表 就是資料排成像一條線一樣的結構。每個線性表的資料最多只有前和後兩個方向。ps 陣列 鍊錶 佇列都是線性表結構。其結構和簡單特性如下圖所示 ps 除了線性表,還...

編譯原理 第三節

我們知道世界上存在很多種語言 我們可以把他們分為自然語言 人們日常交流的工具 和程式語言。自然語言複雜且難以描述,程式語言結構規整,便於處理。但兩者又有共性,即核心都由語法和語義兩部分組成。那什麼是語言呢?首先來看一下字母表定義 字母表是元素的非空有窮集合。字母表包含了語言中允許出現的全部符號。例如...