xml中的空格之完全解說

2021-04-17 08:41:42 字數 1965 閱讀 1724

只適合對xml檔案結構有一定了解的學者,不適合初學者。請按從上至下的順序閱讀。

對html檔案而言,空格不重要;然而,對xml而言,預設立場就是要保留空格結點(空格結點的解釋見下文)。

根據xml規範的規定,所謂空格是四種字元的任意組合序列:

-----------------------

空格字元(space),對應字元值為 #x20

返回字元(carriage return),對應字元值為 #xd

新行字元(newline),對應字元值為 #xa

跳格字元(tab),對應字元值為 #x9。

xml檔案的空格也會形成結點,也就是空格結點。空格結點屬於文字結點型別。

對xml和xslt而言,空格結點會牽涉到兩個議題:

-----------------------

1。在xml輸入檔案中決定哪些空格是重要的,xslt處理器要看見這些空格結點。而決定的金鑰就是xml:space屬性。

2。在xsl模板檔案中決定哪些空格是重要的,xslt處理器應將它複製到結果樹中,而決定的金鑰就是xsl:strip-space

和xsl:preserve-space這兩個命令。

「重要和不重要的空格結點」

-----------------------

若某元件的內容只能放元件,則該元件中的空格結點就是不重要的(insignificant);

如果某元件的內容是#pcdata的型別,則其內的空格結點應視為重要的(signficant)。

至於元件內容混雜了文字內容和元件的情況則無從評判,應視元件及其內容之語意而定。

xslt處理器接觸到xml輸入檔案之前,會先由xml分析器進行分析

-----------------------

(1)xml:space屬性可以改變後續接手的xml應用程式處理空格結點的模式,例如,xslt處理器就會受xml:space屬性影響。

(2)xml檔案中任何一列標記或內容尾端的結尾的結尾符號全部會換成單一新行字元(#xa)。

(3)屬性值交給xml應用程式之前,xml分析器也應該先對屬性值做規範化的操作。這是因為不同的作業系統每一行文字列的結尾字元有不同的組合,例如,windows系統會由返回字元呵新行字元組成結尾符號,而unix系統則僅由新行字元組

成結尾符號。xml分析器在讀取xml檔案之後,便先行將所有結尾符號換成單一新行字元,不僅統一了不同系統間不同結尾符號設計的差異性,同時也簡化了後續xml應用程式的的操作難度。這樣乙個處理過程稱為「規範化(normalization)」。

a,每一文字列的結尾符號都要規範化成單一的新行字元(#xa)。

b,任何乙個空格符(#x20、#xd、#xa、#x9)都應換成乙個空格字元(#x20)。

c,屬性值中若含有字參碼,則應替換成該參考字元,例如,

會換成新行字元(#xa)。

d,屬性值若含有實體參考,則應以其替換文字替換。

e,除此之外,任何字元都應直接放入規範化屬性值中。

f,最後,如果屬性型別不是cdata,則xml分析器應該再進一步把屬性值前後的空格字串行刪除,而且屬性值中間若有空格序列,也應該替換成單一空格字元。

xslt處理器把xml輸入檔案和xsl模板檔案的結構樹建好之後,會現把元件中相鄰的文字結點合併成單一的文字結點,然後再把一些文字結點抽掉。然而,如果文字結點符合下列條件之一,就會被保留下來:

-----------------------

(1)文字結點的父元件是空格保留元件名稱集(set of whitespace-preserving element names)中的一員。

(2)文字結點中至少有乙個非空格符。

(3)文字結點的某個祖先元件中有xml:space屬性,其值為preserve,而且較近的祖先元件中沒有其他xml:space屬性值為default。除此之外的文字結點逗會被抽掉。

對xsl模板而言,所謂的空格保留元件名稱集只有乙個xsl:text元件可用。xsl模板檔案的空格結點都會被刪除,但是,如果空格結點出現在xsl:text元件中就會被保留下來。

xml中的空格之完全解說

只適合對xml檔案結構有一定了解的學者,不適合初學者。請按從上至下的順序閱讀。對html檔案而言,空格不重要 然而,對xml而言,預設立場就是要保留空格結點 空格結點的解釋見下文 根據xml規範的規定,所謂空格是四種字元的任意組合序列 空格字元 space 對應字元值為 x20 返回字元 carri...

xml中的空格之完全解說

只適合對xml檔案結構有一定了解的學者,不適合初學者。請按從上至下的順序閱讀。對html檔案而言,空格不重要 然而,對xml而言,預設立場就是要保留空格結點 空格結點的解釋見下文 根據xml規範的規定,所謂空格是四種字元的任意組合序列 空格字元 space 對應字元值為 x20 返回字元 carri...

解說Lua中的物件導向

物件導向不是針對某一門語言,而是一種思想,在面向過程的語言也可以使用物件導向的思想來進行程式設計。在lua中,並沒有物件導向的概念存在,沒有類的定義和子類的定義,但同樣在lua中可以利用物件導向的思想來實現物件導向的類繼承。一 複製表的方式物件導向 lua中的物件導向 複製表方式物件導向 引數為一張...