讀取漢字點陣資料

2021-07-04 23:16:38 字數 2047 閱讀 7016

心血來潮,想模仿lcd的顯示效果,寫了個從點陣字型檔中提取漢字點陣資料的一段php指令碼。

背景知識:

簡體中文國標字型檔(2023年訂,中國大陸)。7445個字元,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組(16位二進位制)編碼。

區位碼:國標gb2312規定,所有的國標漢字與符號組成乙個94×94的矩陣。在此方陣中,每一行稱為乙個」區」,每一列稱為乙個」位」,因此,這個方陣實際上組成了乙個有94個區(區號分別為0 1到94)、每個區內有94個位(位號分別為01到94)的漢字字符集。乙個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的」區位碼」。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。

內碼:漢字的內碼是指在計算機中表示漢字的編碼。機內碼與區位碼稍有區別。為什麼不直接用區位碼作為計算機內的編碼呢? 這是因為漢字的區碼和位碼的範圍都在1到94內, 如果直接用區位碼作機內碼, 就會與基本ascii碼衝突。 漢字的內碼通常與所使用的計算機系統有關。目前,對於國內大多數的計算機系統,乙個漢字的內碼佔兩個位元組,分別稱為高位位元組與低位位元組,且這兩位位元組與區位碼的關係如下: 內碼高位=區碼+a0h(h表示十六進製制) 內碼低位=位碼+a0h 例如,漢字」啊」的區位碼為」1601″,區碼和位碼分別用十六進製制表示即為」1001h」,則它的內碼為」b0a1h」。其中b0h為內碼的高位位元組,a1h為內碼的低位位元組。

php**:返回由0和1組成的字串。

<?php  

$str 

= "中華人民共和國"

; $font_file_name   

= "simsun12.fon"

; // 點陣字型檔檔名 

$font_width       

= 12

;  // 單字寬度 

$font_height      

= 12

;  // 單字高度 

$start_offset     = 0

;   

// 偏移 

$fp 

= fopen

($font_file_name

, "rb"

); $offset_size 

= $font_width 

* $font_height / 8

; $string_size 

= $font_width 

* $font_height

; $dot_string  

= ""

; for (

$i = 0; 

$i strlen

($str

); $i 

++) 

) > 

160) 

) - 

0xa1

) * 

94 + 

ord(

$str

) - 

0xa1

) * 

$offset_size

; $i 

++; 

} else 

) + 

156 - 1

) * 

$offset_size

;         

} // 讀取其點陣資料 

fseek

($fp

, $start_offset 

+ $offset

, seek_set

); $bindot 

= fread

($fp

, $offset_size

); for (

$j = 0; 

$j $offset_size

; $j 

++) 

)); 

} } 

fclose

($fp

); echo 

$dot_string

; ?>

其中包括兩個點陣字型檔案:乙個為16×16的chs16.fon,另乙個為12×12的simsun12.fon,偏移均為零。

PHP讀取漢字的點陣資料

專案中遇到的問題 php如何讀取漢字的點陣資料?想實現輸入一段文字,能得到這一段文字的所有點陣碼。解決方法 簡體中文國標字型檔7445個字元,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組 16位二進位制 編碼。區位碼 國標gb2312規定,所有的國標漢字與符號組成乙個...

點陣漢字顯示

由於turbo c應用於dos作業系統下,在使用turbo c進行程式設計時,一般情況下只好使用英文進行人機互動。要是想直接用中文介面,就需要另想他法了。如果使用中文dos系統 如ucdos 則可以解決在字元介面下的漢字顯示問題。也就是說,可以用printf或其他字串函式來輸出漢字。但是,這樣仍然有...

點陣漢字顯示

陣漢字顯示 目錄 dos下的點陣漢字 漢字的內碼 漢字字模 漢字型檔檔案 列印字型檔檔案和hzk12 文件內容 dos下的點陣漢字 你是否碰到過用啟動盤啟動系統後用dir命令得到一串串莫名其妙的字元?有經驗的朋友會告訴你 那是漢字。漢字?你不禁會問 怎麼乙個我乙個也不認識。但那確確實實是漢字,如果你...