PHP讀取漢字的點陣資料

2022-09-28 19:12:14 字數 1456 閱讀 4334

專案中遇到的問題:

php如何讀取漢字的點陣資料?想實現輸入一段文字,能得到這一段文字的所有點陣碼。

解決方法:

簡體中文國標字型檔7445個字元,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組(16位二進位制)編碼。

區位碼:國標gb2312規定,所有的國標漢字與符號組成乙個9494的矩陣。在此方陣中,每一行稱為乙個」區」,每一列稱為乙個」位程式設計客棧」,因此,這個方陣實際上組成了乙個有94個區(區號分別為0 1到94)、每程式設計客棧個區內有94個位(位號分別為01到94)的漢字字符集。乙個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的」區位碼」。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。

內碼:漢字的內碼是指在計算機中表示漢字的編碼。機內碼與區位碼稍有區別。目前,對於國內大多數的計算機系統,乙個漢字的內碼佔兩個位元組,分別稱為高位位元組與低位位元組,且這兩位位元組與區位碼的關係如下: 內碼高位=區碼+a0h(h表示十六進製制) 內碼低位=位碼+a0h 例如,漢字」啊」的區位碼為」1601″,區碼和位碼分別用十六進製制表示即為」1001h」,則它的內碼為」b0a1h」。其中b0h為內碼的高位位元組,a1h為內碼的低位位元組。

返回由0和1組成的字串

<?php /**

* 讀取漢字點陣資料**/

$str = "程式設計客棧中華人民共和國";

$font_file_name = "simsun12.fon"; // 點陣字型檔檔名

$font_width = 12; // 單字寬度

$font_height = 12; // 單字高度

$start_offset = 0; // 偏移

$fp = fopen($font_file_name, "rb");

$offset_size = $font_width * $font_height / 8;

$string_size = $font_width * $font_height;

$dot_string = "";

for ($i = 0; $i < strlen($str); $i ++)

) > 160)

) - 0xa1) * 94 + ord($str) - 0xa1) * $offset_size;

$i ++;

}else

) + 156 - 1) * $offset_size;

}// 讀取其點陣資料

fseek($fp, $start_offset + $offset, seek_set);

$bindot = fread($fp, $offset_size);

for ($j = 0; $j < $offset_size; $j ++)

));}

}fclose($fp);

echo $dot_string;

?>

本文標題: php讀取漢字的點陣資料

本文位址:

讀取漢字點陣資料

心血來潮,想模仿lcd的顯示效果,寫了個從點陣字型檔中提取漢字點陣資料的一段php指令碼。背景知識 簡體中文國標字型檔 1981年訂,中國大陸 7445個字元,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組 16位二進位制 編碼。區位碼 國標gb2312規定,所有的國標...

在漢字型檔中尋找某個漢字的點陣資料

在計算機中英文可以使用 ascii 碼來表示,而漢字使用的是擴充套件 ascii 碼,並且使用兩個擴充套件 ascii 碼來表示乙個漢字。乙個 ascii 碼使用乙個位元組表示,所謂擴充套件 ascii 碼,也就是 ascii 碼的最高位是1的 ascii 碼,簡單的說就是碼值大於等於 128 的 ...

PHP讀取Excel資料

承接上篇 設定reader和編碼 file path test.xls excel5 reader new phpexcel reader excel5 excel5 reader defaultencoding encoding excel2007 reader new phpexcel read...