對於Unicode,UTF系列的理解

2021-09-27 04:28:27 字數 396 閱讀 2711

unicode簡單來說就是字符集,涵蓋了世界上所有字元的一本「字典」。這些上百萬的字元儲存都是靠很多個1和0實現的即所謂的**。

那麼在計算機執行中,怎麼智慧型地把字典中的文字**翻譯成我們熟知的文字語言呢,那麼就需要「翻譯工具」,utf系列就是這樣的編碼「翻譯工具」。

unicode 可以使用的編碼有三種,分別是:

uft-8:一種變長的編碼方案,使用 1~6 個位元組來儲存;

uft-32:一種固定長度的編碼方案,不管字元編號大小,始終使用 4 個位元組來儲存;

utf-16:介於 utf-8 和 utf-32 之間,使用 2 個或者 4 個位元組來儲存,長度既固定又可變。

*只有 utf-8 相容 ascii,utf-32 和 utf-16 都不相容 ascii,因為它們沒有單位元組編碼。

對 Unicode UTF 8 的一些理解

之前沒搞明白 iso8859 1 ascii gb2312 gbk unicode utf 8 的關係,因此總是覺得雲裡霧裡。首先,要明白 iso8859 1 ascii gb2312 gbk,它們既是字符集,又是編碼方式。而 unicode,它只是字符集。它對應的編碼方式有好幾種,分別是 utf ...

Linux2 4系列核心對於網路資料的處理

為了更好的了解netfilter的工作機理,非常有必要先來分析一下linux2.4系列核心對於網路資料是如何處理的。以下的分析全部基於乙太網和ipv4協議。1 收到資料,中斷發生 通常的,當一塊網絡卡接收到屬於其自己mac位址或者廣播的以太網路資料幀時,就會引發乙個中斷,網絡卡驅動的中斷處理程式獲得...

對於CFileDialog的研究

cfiledialog 建構函式 cfiledialog bool bopenfiledialog,lpctstr lpszdefext null,lpctstr lpszfilename null,dword dwflags ofn hidereadonly ofn overwriteprompt...