字元 位元組的概念和區別 編碼概念

2022-07-29 07:33:08 字數 1149 閱讀 4625

位元組(byte)
位元組是通過網路傳輸資訊(或在硬碟或記憶體中儲存資訊)的基本單位。位元組是計算機資訊技術用於計量儲存容量和傳輸容量的一種計量單位,1個位元組等於8位二進位制,它是乙個8位的二進位制數,是乙個很具體的儲存空間。

字元
人們使用的記號,抽象意義上的乙個符號。比如鍵盤上敲出的數字、字母、各種符號........ '1', '中', 'a', '$', '¥', ……

字元要通過編碼才能被計算機認識,計算機只認識高(1)低(0)電平:101011100000醬紫的,so,只有最終被解釋為1010001011的二進位制才能被計算機識別

字元------->編碼----------->010101010010000000000

這個過程,其實就是乙個字元怎麼對應一段特定的數字的標準,這個標準也叫作編碼標準

總結:ascii,乙個bytes代表乙個字元(英文本元/鍵盤上的所有其他字元),1bytes=8bit,8bit可以表示0-2**8-1種變化,即可以表示256個字元,ascii最初只用了後七位,127個數字,已經完全能夠代表鍵盤上所有的字元了(英文本元/鍵盤的所有其他字元),後來為了將拉丁文也編碼進了ascii表,將最高位也占用了。

即:axcii採用8bit(1位元組)存放字元

unilde採用16bit(2位元組)存在字元

ansi以單位元組存放英文本元以雙位元組存放中文等字元,而unicode下,英文和中文的字元都以雙位元組存放

這兩個是不能相容的

我們可以簡單的記這樣乙個結論:按照ansi編碼標準,標點符號、數字、大小寫字母都佔乙個位元組,漢字佔2個位元組。按照unicode標準所有字元都佔2個位元組。

1、檔案是以什麼方式編碼的,就會以什麼方式開啟

如果不在python檔案指定頭資訊#-*-coding:utf-8-*-,那就使用預設的python2中預設使用ascii,python3中預設使用utf-8

位,位元組,字元的概念

1 bit 1 二進位制資料0或1 1 byte 8 bit 1 字母 1 byte 8 bit 1 漢字 2 byte 16 bit1 計算機儲存資訊的最小單位,稱之為位 bit 音譯位元,二進位制的乙個 0 或乙個 1 叫一位。2 計算機儲存容量基本單位是位元組 byte 音譯為拜特,8個二進位...

字元,位元組和編碼

想搞清楚這幾個問題,樓主需要分清楚三個概念 字元 位元組和編碼。比如2d 4e和d6 d0和e4 b8 ad和ff fe 2d 4e是位元組,但是都對應同乙個字元 中 編碼 把字元變成位元組的過程。比如 d6 d0把字元 中 使用gb2312進行編碼的位元組結果。e4 b8 ad把字元 中 使用ut...

位元組字和位的概念

什麼是位?所謂位,是最基本的概念,在計算機中,由於只有邏輯0和邏輯1的存在,因此很多東西 動作 數字都要表示為一串二進位制的字碼例如 1001 0000 1101等等。其中每乙個邏輯0或者1便是乙個位。例如這個例子裡的1000 1110共有八個位,它的英文名字叫 bit 是計算機中最基本的單位。所謂...