超越學XML DTD筆記技術總結(之一)

2021-07-12 01:45:32 字數 2421 閱讀 2243

>> xml定義:

xml(extensible markup language)可擴充套件的標記語言,它是標準通用標記語言(standard generalized markup language,sgml)的乙個子集。

>> w3c是全球資訊網聯盟(world wide web consortium)w3c不是官方組織,它發布的規範為推薦(建議)標準。

>> xml對文件格式的要求須注意的地方:

1)所有的標籤都區分大小寫

2)所有的標籤的屬性值必須用雙引號或單引號括起來.

>>xml宣告:

〈?xml version="1.0" encoding="gb2312" standalone="yes"?〉//在?左右兩邊不能有空格,xml宣告必須在第一行,前面不能有任何字元

>>文件型別宣告:dtd

用dtd(document type definition,文件型別

定義),規範xml文件 dtd檔案是乙個文字檔案,用.dtd作為副檔名。

>>xml元素組成:

1)開始標籤

2)元素內容

3)結束標籤

>>xml元素的四種形式:

1)空元素------------〈student/〉//幾乎不用

2)帶有屬性的空元素-------〈student name="張三" age="18"/〉

3)帶有內容的元素--------〈student〉這是乙個學生的資訊〈name〉張三〈/name〉〈age〉28〈/age〉〈/student〉

4)帶有內容和屬性的元素----- 〈student name="張三"〉〈age〉28〈/age〉〈/student〉

>> 元素和標籤之間的區別:

元素是指開始標籤、結束標籤以及兩者之間的一切內容,包括屬性、文字、注釋及子元素。標籤是一對尖括號< > 和兩者之間的內容,包括元

素名和所有屬性。

例:〈font color="blue"〉是乙個標籤,〈/font〉也是乙個標籤,〈font color="blue"〉hello〈/font〉則是乙個元素

>> 元素內容的構成:

1)子元素-----在類似於之間的元素

2)字元資料----除&、< 、]]〉的任何字元

3)字元引用和實體引用----如&字元引用為&#x3c;《字元預定義實體引用為&lt;

4)cdata段----cdata段以〈![開始,以]]〉結束,cdata段中的內容不被xml處理器分析,所以可以含有任意字元,寫程式**時可以用到,以結束,特別時可用]]〉解決問題(和以上不同的是多個空格)

>> xml的注釋:

〈!-- 和 --〉之間的內容被xml處理器忽略

>> 處理指令(processing instructions , pi)

常見的使用樣式表單的處理指令:

〈?xml-stylesheet href="hello.css" type="text/css"?〉

對於不認識的處理指令,大多數應用程式採取忽略的方式進行處理。

>>空白處理

xml文件中可以在元素中使用乙個特殊的屬性xml:space , 來通知應用程式保留此元素中的空白 

xml:space屬性必須被宣告為enumerated(列舉)型別,值必須為「default」和「preserve」兩者之一,也可以兩個都取.

例:〈!attlist poem xml:space (default|preserve) 'preserve'〉

〈!attlist pre xml:space (preserve) #fixed 'preserve'〉

>>行尾處理

xml資料以行來分隔,空白字元以ascii碼行尾控制字元:回車(cr,#xa)  換行(lf,#xd).win和linux等應用方式不同,為了簡化工作要將所有的兩字串行#xd#xa,以及單獨的#xd字元轉換成單個的#xa字元

>>語言標識

xml文件中可以在元素中使用乙個特殊的屬性xml:lang

例:〈p xml:lang="en"〉the quick brown fox jumps over the lazy dog.〈/p〉

〈p xml:lang="en-gb"〉what color is it ?〈/p〉

〈p xml:lang="en-us"〉what color is it ?〈/p〉

xml:lang的乙個簡單的宣告可以採用如下形式:

xml:lang nmtoken #implied

超越學XML與DTD技術總結筆記(之二)

空白處理 xml文件中可以在元素中使用乙個特殊的屬性xml space 來通知應用程式保留此元素中的空白 xml space屬性必須被宣告為enumerated 列舉 型別,值必須為 default 和 preserve 兩者之一,也可以兩個都取 例 attlist poem xml space d...

超越闡釋 技術文字的語言學解讀

超越闡釋 技術文字的語言學解讀 熊節 本文首發於 中華讀書報 2004年8月4日號 凡不可言說者,必保持沉默。路德維希 維根斯坦 邏輯哲學論 聖奧古斯丁這樣談起人們學會自我表達的過程 這樣一再聽到那些語言,按各種語句中的先後次序,我逐漸通解它們的意義,便勉 強鼓動唇舌,藉以表達我的意願。在維根斯坦看...

密碼學筆記 代替技術

代替技術是將明文本母替換成其他字母 數字或符號的方法。ab cdef gh01 2345 67ijklmnop89 1011 1213 1415 qrstuvwx 1617 1819 2021 2223 yz 2425 則加密演算法可以如下表達。對每個明文本母p,代替成密文字母c c e 3,p p...