Unicode 和 UTF 8 有何區別?

2021-08-17 17:01:04 字數 628 閱讀 5719

遇上0×10, 終端就換行;

遇上0×07, 終端就向人們嘟嘟叫;

遇上0x1b, 印表機就列印反白的字,或者終端就用彩色顯示字母。

因為當時各個國家都像中國這樣搞出一套自己的編碼標準,結果互相之間誰也不懂誰的編碼,誰也不支援別人的編碼,連大陸和台灣這樣只相隔了150海浬,使用著同一種語言的兄弟地區,也分別採用了不同的 dbcs 編碼方案——當時的中國人想讓電腦顯示漢字,就必須裝上乙個」漢字系統」,專門用來處理漢字的顯示、輸入的問題,像是那個台灣的愚昧封建人士寫的算命程式就必須加裝另一套支援 big5 編碼的什麼」倚天漢字系統」才可以用,裝錯了字元系統,顯示就會亂了套!這怎麼辦?而且世界民族之林中還有那些一時用不上電腦的窮苦人民,他們的文字又怎麼辦? 真是計算機的巴比倫塔命題啊!

unicode同樣也不完美,這裡就有兩個的問題,乙個是,如何才能區別unicode和ascii?計算機怎麼知道三個位元組表示乙個符號,而不是分別表示三個符號呢?第二個問題是,我們已經知道,英文本母只用乙個位元組表示就夠了,如果unicode統一規定,每個符號用三個或四個位元組表示,那麼每個英文本母前都必然有二到三個位元組是0,這對於儲存空間來說是極大的浪費,文字檔案的大小會因此大出二三倍,這是難以接受的。

unicode符號範圍 | utf-8編碼方式

最後簡單總結一下:

Unicode 和 UTF 8 有何區別

unicode是字符集,utf8是unicode的一種編碼方式 很久很久以前,有一群人,他們決定用8個可以開合的電晶體來組合成不同的狀態,以表示世界上的萬物。他們看到8個開關狀態是好的,於是他們把這稱為 位元組 再後來,他們又做了一些可以處理這些位元組的機器,機器開動了,可以用位元組來組合出很多狀態...

Unicode 和 UTF 8有何區別

unicode 和 utf 8有何區別 很久很久以前,有一群人,他們決定用8個可以開合的電晶體來組合成不同的狀態,以表示世界上的萬物。他們看到8個開關狀態是好的,於是他們把這稱為 位元組 再後來,他們又做了一些可以處理這些位元組的機器,機器開動了,可以用位元組來組合出很多狀態,狀態開始變來變去。他們...

Unicode 和 UTF 8 有何區別

unicode是字符集,utf8是unicode的一種編碼方式 很久很久以前,有一群人,他們決定用8個可以開合的電晶體來組合成不同的狀態,以表示世界上的萬物。他們看到8個開關狀態是好的,於是他們把這稱為 位元組 再後來,他們又做了一些可以處理這些位元組的機器,機器開動了,可以用位元組來組合出很多狀態...