XML編碼問題

2021-08-29 21:27:35 字數 592 閱讀 4274

當時用ie5.0或者更高版本瀏覽xml文件時,可能會遇到兩中不同的編碼錯誤:

在文字內容中發現乙個非法字元(an invalid character was found in text content)。

如果你的xml文件和你的xml文件的編碼格式不匹配就可能導致錯誤發生。通常情況是,xml文件包含一些「非英文」字元,並且使用了單位元組編碼的編輯器,而且沒有在xml文件的宣告中設定xml文件的編碼格式。 

不支援從當前的編碼格式轉換成另一種編碼格式(switch from current encoding to specified encoding not supported)。

如果xml文件以unicode/utf-16編碼格式儲存,但是xml文件的宣告中卻設定了編碼格式是一些單位元組的編碼(比如 windows-1252, iso-8859-1 或者  utf-8);或者xml文件以單位元組編碼格式儲存,但是xml文件的宣告中卻設定了編碼格式是一些unicode/utf-16的編碼形式,這樣兩種情況都會導致錯誤發生。

結論:在儲存xml文件之前在xml文件的宣告中設定文件的編碼格式,我的一些關於避免錯誤發生的建議:

XML檔案編碼問題

這兩天的過程中的乙個專案,以解決編碼格式ansi的xml當檔案。我遇到了一些問題。下面的例子現在將總結分析過程。通過win7記事本或notepad 建立乙個xml檔案test source xml version 1.0 encoding utf 16 coffeecat 測試 能夠看到在xml檔案...

有關XML的編碼問題

由於xml文件中可以包含外語字母,如挪威語 或法語 因此要讓你的xml分解器理解這些字母,就應該把xml文件儲存成unicode 統一的字元編碼標準 1 windows 95 98 記事本 windows 95 98 記事本不能將檔案儲存成unicode 格式。你可以用notepad 編輯和儲存包含...

關於xml的編碼問題

昨天在進行蕭山校產的報表配置的時候遇到乙個問題,我要求輸出的xml檔案中保留我原來的內容 內容中包括有很多的空格 但是dom4j在輸出檔案時自動將這些空格去除了,經研究有以下發現 當我們在用dom4j處理xml檔案輸出的時候可能會遇到以下的問題,就是我們要求每個element中的text保留我寫入的...