字元編碼詳解

2021-09-06 12:03:23 字數 2361 閱讀 5054

字元編碼詳解

2.1.2.1. ascii字符集中的功能/控制字元

2.1.2.1.1. 什麼是function code功能碼或 function character功能字元

ascii字符集,大家都知道吧,最基本的包含了128個字元。其中前32個,0-31,即0x00-0x1f,都是不可見字元。這些字元,就叫做控制字元。

這些字元沒法列印出來,但是每個字元,都對應著乙個特殊的控制功能的字元,簡稱功能字元或功能碼function code。

簡言之:ascii中前32個字元,統稱為function code功能字元。

此外,由於ascii中的127對應的是delete,也是不可見的,所以,此處根據筆者的理解,也可以歸為function code。

此類字元,對應不同的「功能」,起到一定的「控制作用」,所以,稱為控制字元。

關於每個控制字元的控制功能縮寫,參見表 2.1 「ascii中的控制字元」

表 2.1. ascii中的控制字元

十進位制十六進製制

控制字元

轉義字元

說明ctrl + 下列字母

nul\0

null character(空字元)

@sohstart of header(標題開始)a2

02stx

start of text(正文開始)b3

03etx

end of text(正文結束)c4

04eot

end of transmission(傳輸結束)d5

05enq

enquiry(請求)e6

06ack

acknowledgment(收到通知/響應)f7

07bel

\abell(響鈴)g8

08bs

\bbackspace(退格)h9

09ht

\thorizontal tab(水平製表符)i10

0alf

\nline feed(換行鍵)j11

0bvt

\vvertical tab(垂直製表符)k12

0cff

\fform feed(換頁鍵)l13

0dcr

\rcarriage return(回車鍵)m14

0eso

shift out(不用切換)n15

0fsi

shift in(啟用切換)o16

10dle

data link escape(資料鏈路轉義)p17

11dc1

device control 1(裝置控制1) /xon(transmit on)q18

12dc2

device control 2(裝置控制2)r19

13dc3

device control 3(裝置控制3) /xoff(transmit off)s20

14dc4

device control 4(裝置控制4)t21

15nak

negative acknowledgement(拒絕接收/無響應)u22

16syn

synchronous idle(同步空閒)v23

17etb

end of trans the block(傳輸塊結束)w24

18can

cancel(取消)x25

19em

end of medium(已到介質末端/介質儲存已滿)y26

1asub

substitute(替補/替換)z27

1besc

\eescape(溢位/逃離/取消)[28

1cfs

file separator(檔案分割符)\29

1dgs

group separator(分組符)]30

1ers

record separator(記錄分隔符)

^311f

usunit separator(單元分隔符)

_3220

spwhite space

[space]

1277f

deldelete(刪除)

?即在c語言中或其他地方如何表示。

可以通過 「ctrl+對應字母/按鍵」實現上述控制字元的輸入

下面列舉一些你可能遇到的情況:

注意此處想要在鍵盤上輸入這三個字元的話,是需要通過shift加上對應字元才能輸入的:

32=0x20,對應的是空格(blank space)鍵。不需要加ctrl鍵,即可直接通過鍵盤上的空格鍵輸入。

127=0x7f=刪除(delete)鍵;,除了可以用鍵盤上的刪除鍵輸入,也可以用'ctrl+?'輸入。

字元編碼詳解

你是否認為 ascii碼 乙個字元就是8位元 你是否認為乙個位元組就是乙個字元,乙個字元就是8位元?你是否還認為你是否還認為utf 8就是用8位元表示乙個字元?如果真的是這樣認為認真讀完這篇文章吧!首先大家需要明確的是在計算機裡所有的資料都是位元組的形式儲存,處理的。我們需要這些位元組來表示計算機裡...

字元編碼詳解

1.acsii表,00000000,8位儲存,一共有256個種表示方法,使用英語的國家使用一張acsii表即可 a,美國人使用只需要128種表示方法即可表示所有字元 b,拉丁國家使用了256種表示方法 2.gb2312,中國人使用,需要兩個位元組,剛開始只能表示幾千個漢字 gbk,能表示所有漢字,2...

python 字元編碼轉換詳解

unicode所有的中文或者英文都是占用兩個位元組 16位 ascii 只能存英文 8位 utf 8 可變長的字元編碼,所有英文按ascll佔乙個位元組,常用中文字元用utf 8編碼占用3個位元組 coding gbk import sys with語句 為了避免開啟檔案後忘記關閉,可以通過管理上下...