用將xml轉義為 純文字

2022-07-01 03:51:08 字數 983 閱讀 5315

此標記用於xml文件中,我們先來看看使用轉義符的情況。我們知道,在xml中,」<」、」>」、」&」等字元是不能直接存入的,否則xml語法檢查時會報錯,如果想在xml中使用這些符號,必須將其轉義為實體,如」<」、」>」、」&」,這樣才能儲存進xml文件。

在使用程式讀取的時候,解析器會自動將這些實體轉換回」<」、」>」、」&」。舉個例子:

age < 30

上面這種寫法會報錯,應該這樣寫:

age < 30

值得注意的是:

(1)轉義序列字元之間不能有空格;

(2) 轉義序列必須以」;」結束;

(3) 單獨出現的」&」不會被認為是轉義的開始;

(4) 區分大小寫。

常用轉義的字元:

(1)< <

(2)<= <=

(3)> >

(4)>= >=

(5)& &

(6)' '

(7)" "

(8)(空格)  

但是嚴格來說,在xml中只有」<」和」&」是非法的,其它三個都是可以合法存在的,但是,把它們都進行轉義是乙個好的習慣。

不管怎麼樣,轉義前的字元也好,轉義後的字元也好,都會被xml解析器解析,為了方便起見,使用來包含不被xml解析器解析的內容。但要注意的是:

(1) 此部分不能再包含」]]>」;

(2) 不允許巢狀使用;

(3)」]]>」這部分不能包含空格或者換行。

最後,說說和xml轉移字元的關係,它們兩個看起來是不是感覺功能重複了?

是的,它們的功能就是一樣的,只是應用場景和需求有些不同:

(1)不能適用所有情況,轉義字元可以;

(2) 對於短字串寫起來囉嗦,對於長字串轉義字元寫起來可讀性差;

(3) 表示xml解析器忽略解析,所以更快。

參考博文:

(1)

(2) (html常用轉義字元對照表)

(3)

將Html文件整理為規範XML文件

有多種方式可以在.net 平台進行html檔案解析 資料提取,其中最簡單 穩妥的辦法是先使用工具將html文件整理成xml文件,再通過xml dom模型或xpath靈活地進行資料處理。sgml便是乙個html文件整理工具類庫 microsoft的xml大師chris lovett專門開發了乙個sgm...

將Html文件整理為規範XML文件

有多種方式可以在.net 平台進行html檔案解析 資料提取,其中最簡單 穩妥的辦法是先使用工具將html文件整理成xml文件,再通過xml dom模型或xpath靈活地進行資料處理。sgml便是乙個html文件整理工具類庫 microsoft的xml大師chris lovett專門開發了乙個sgm...

SQL Server 將資料匯出為XML和Json

有時候需要一次性將sql server中的資料匯出給其他部門的也許進行關聯或分析,這種需求對於ssis來說當然是非常簡單,但很多時候僅僅需要一次性匯出這些資料而建立乙個ssis包就顯得小題大做,而sql server的匯入匯出工具其中bug還是蠻多的,最簡單的辦法是bcp。在sql server 2...