任意字符集下正常顯示網頁

2022-04-09 04:52:15 字數 837 閱讀 4380

通常情況下,我們的網頁要指定乙個編碼字符集,如 gb2312、utf-8、iso-8859-1 等,這樣我們就可以在網頁上顯示我們指定編碼的文字了。但是我們很可能會碰到這種情況,那就是我們可能盼看在 iso-8859-1 編碼的網頁上顯示漢字,或者在 gb2312 編碼的網頁上顯示韓文等。當然一種解決措施就是我們不用 iso-8859-1 或者 gb2312 編碼,而統統都採用 utf-8 編碼,這樣我們只要在這種編碼下,就可以混雜顯示各國文字了,這是現在很多**採用的方法。

而我這裡所說的並非上面這種方法,由於上面這種方法必需要指定字符集為 utf-8 才可以,一旦使用者手工指定為其他字符集,或者可能由於某些原因,那個字符集設定沒起作用,而瀏覽器又沒有準確主動辨認的話,我們看到的網頁還是亂碼,尤其是在某些用框架作的網頁中,某個框架中的頁面假如字符集設定沒起作用,在 firefox 中顯示亂碼而且還沒法轉變(我是說在不裝rightencode外掛程式的情況下)。

而我這裡先容的方法即使是把網頁指定為 iso-8859-1 字符集,也能夠準確顯示漢字、日文等。原理很簡略,就是把除了 iso-8859-1 編碼中前128個字元以外的所有其他的編碼都用 ncr(numeric character reference) 來表現。比如「漢字」這兩個字,假如我們寫成「漢字」這種情勢,那麼它在任意字符集下都可以準確顯示。根據這個原理,我寫了下面這個程式,它可以把現有的網頁轉化為在任意字符集下都能顯示的網頁。你只需要指定源網頁的字符集和源網頁,點提交按鈕,就可以得到目標網頁了。你也可以只轉化某些文字,只需要把文字填寫到文字框中,並指定這些文字本來的字符集,點提交按鈕,就會在頁面上面顯示編碼後的文字了。另外我還編寫了 wordpress 的外掛程式,現在我的 blog 已經可以在任意字符集下都能準確顯示了。

實現方法:

在任意字符集下正常顯示網頁的方法

通常情況下,我們的網頁要指定乙個編碼字符集,如 gb2312 utf 8 iso 8859 1 等,這樣我們就可以在網頁上顯示我們指定編碼的文字了。但是我們很可能會遇到這種情況,那就是我們可能希望在 iso 8859 1 編碼的網頁上顯示漢字,或者在 gb2312 編碼的網頁上顯示韓文等。當然一種解...

根據指定字符集拆分任意字串

題目真不知道怎麼寫。我經常自己做一些小工具,所以並沒啥系統的東西可寫,這也並不是我想寫系統的東西,而且看別人寫的高大上的東西我也一點都不羨慕,真的 具體是這樣,有乙個列表,裡面存放的是一些不重複的字元,假定這些字元就是我需要找出的,或者說在我這個工具中,我需要在乙個任意字串中分別找出字元列表中有的和...

ORACLE漢字顯示的字符集問題

在國內外大中型資料庫管理系統中,把oracle作為資料庫管理平台的使用者比較多。oracle 不論是資料庫管理能力還是安全性都是無可非議的,但是,它在漢字資訊的顯示方面著實給中國使用者帶來不少麻煩,筆者多年從事oracle資料庫管理,經常收到周圍使用者和外地使用者反映有關oracle資料庫漢字顯示問...