有關XML的編碼問題

2021-04-07 07:32:57 字數 2024 閱讀 8449

由於xml文件中可以包含外語字母,如挪威語 ??? 或法語 êèé,因此要讓你的xml分解器理解這些字母,就應該把xml文件儲存成unicode(統一的字元編碼標準)。

1、windows 95/98 記事本

windows 95/98 記事本不能將檔案儲存成unicode 格式。你可以用notepad 編輯和儲存包含外語字母(如挪威語和法語的??? 和 êèé)的xml 文件,

<?xml version="1.0"?>

jani

tove

norwegian: ???. french: êèé

但是如果你儲存檔案並用ie 5.0開啟它,就會得到乙個錯誤資訊。

2、帶有編碼的windows 95/98 記事本

windows 95/98 記事本檔案必須用編碼屬性儲存。 要避免這個錯誤,你可以向你的xml宣告中加上乙個編碼屬性,但是不能使用unicode。

這樣的編碼(用ie 5.0開啟它), 就不會給出乙個錯誤資訊:

<?xml version="1.0" encoding="windows-1252"?>

這樣的編碼(ie 5.0開啟它), 也不會給出錯誤資訊:

<?xml version="1.0" encoding="iso-8859-1"?>

這樣的編碼(ie 5.0開啟它), 會給出乙個錯誤資訊:

<?xml version="1.0" encoding="utf-8"?>

這樣的編碼(ie 5.0開啟它), 會給出乙個錯誤資訊:

<?xml version="1.0" encoding="utf-16"?>

3、windows 2000 記事本

windows 2000 記事本可以將檔案儲存成unicode。windows 2000 中的記事本編輯器支援 unicode。如果你選擇要將這個xml檔案儲存成unicode(注意文件中不包含任何編碼屬性):

<?xml version="1.0"?>

jani

tove

norwegian: ???. french: êèé

你可以用ie 5.0 開啟它,而不會得到錯誤資訊。

4、帶有編碼的windows 2000 記事本

windows 2000 記事本用"utf-16"編碼將檔案儲存為unicode。如果你向儲存為unicode的xml檔案中增加乙個編碼屬性,windows 編碼值就會產生乙個錯誤。

這樣的編碼(ie 5.0開啟它), 會給出乙個錯誤資訊:

< ?xml version="1.0" encoding="windows-1252"?>

這樣的編碼(ie 5.0開啟它), 會給出乙個錯誤資訊:

< ?xml version="1.0" encoding="iso-8859-1"?>

這樣的編碼(ie 5.0開啟它), 會給出乙個錯誤資訊:

< ?xml version="1.0" encoding="utf-8"?>

這樣的編碼(ie 5.0開啟它), 不會給出乙個錯誤資訊:

< ?xml version="1.0" encoding="utf-16"?>

5、錯誤資訊

如果你試圖向internet explorer 5中裝載乙個xml文件,你會得到兩個不同的錯誤資訊表示編碼的問題:

在文字內容中發現了乙個無效字元: 如果xml文件中的乙個字元與編碼屬性不匹配,你就會得到這個錯誤資訊。通常,如果你的xml 文件中包含外語字母並且檔案是用記事本這樣的單位元組編碼編輯器儲存的,而且沒有規定編碼屬性的話,就會得到這樣的錯誤資訊。從當前編碼轉換到不支援的指定編碼: 如果你的檔案儲存為unicode/utf-16,但是編碼屬性指定了單位元組編碼,例如windows-1252、 iso-8859-1或utf-8,你就會得到這樣的錯誤資訊。另外如果你的文件是用單位元組編碼儲存的,但是編碼屬性指定了雙位元組編碼例如utf-16的話,你也會得到這樣的錯誤資訊。

結論結論就是編碼屬性必須指定儲存文件時所使用的編碼。為避免這類錯誤,我的建議是: 總是將xml檔案儲存成沒有任何編碼資訊的unicode。使用乙個支援unicode的編輯器(windows 2000 記事本就行),總是省略編碼屬性。

XML編碼問題

當時用ie5.0或者更高版本瀏覽xml文件時,可能會遇到兩中不同的編碼錯誤 在文字內容中發現乙個非法字元 an invalid character was found in text content 如果你的xml文件和你的xml文件的編碼格式不匹配就可能導致錯誤發生。通常情況是,xml文件包含一些...

關於xml的編碼問題

昨天在進行蕭山校產的報表配置的時候遇到乙個問題,我要求輸出的xml檔案中保留我原來的內容 內容中包括有很多的空格 但是dom4j在輸出檔案時自動將這些空格去除了,經研究有以下發現 當我們在用dom4j處理xml檔案輸出的時候可能會遇到以下的問題,就是我們要求每個element中的text保留我寫入的...

XML檔案編碼問題

這兩天的過程中的乙個專案,以解決編碼格式ansi的xml當檔案。我遇到了一些問題。下面的例子現在將總結分析過程。通過win7記事本或notepad 建立乙個xml檔案test source xml version 1.0 encoding utf 16 coffeecat 測試 能夠看到在xml檔案...