php解釋HTML XML的幾種方法

2021-06-18 04:44:10 字數 1034 閱讀 5336

翻譯的原文在這裡,很多庫我都沒用過,所以僅簡單記錄一些特性,和我認為有用的庫,以備不時之需。

建議用php

原生的xml擴充套件,通常要比第三方庫要快,靈活性更高,我想怎麼弄就怎麼弄。

用這個dom擴充套件,你可以通過dom介面動態地讀取或更新html。也可做xpath查詢,它是基於libxml的。

學習dom需要花些時間,不過也是值得,它是乙個通用的介面,你在php學的這個技巧去到其它語言也能信手捻來。

這個擴充套件可以非常方便地將xml轉換成物件,但前提是xml需要是結構良好的xhtml,否則會出錯。如果你解釋的是不完整的html,還是用dom擴充套件好。

如果你想用第三方庫,建議使用那些構建在dom/libxml之上的。

phpquery 是乙個伺服器端,支援css3方式選擇的dom介面。此外它還可用於命令列。

其中的zend_dom_query 提供乙個統一的介面利用xpath或css選擇器去查詢dom結構。

qeurypath 可以用來維護html/xml 它不單只是處理本地檔案,web services 及資料庫資源也可以處理。它很多地方都有點像jquery,不過記住它是用於伺服器端的。

強烈不建議使用,效率太慢記憶體消耗嚴重。

用上面庫來解釋html5有時會得不到想要的結果,因為html5的語法規則會有點不同,

像這裡的例子,在現行的標準中script標籤裡面不能有「

html5lib可用於php和python的html 5 直譯器。由於當html5標準還沒最終定下來,只能說是目前最大程度相容。當html5標準定下來後,我們應該會見到更多優秀的庫。

如果你不想自己寫php,就用web services吧

yql 是雅虎的webservice介面。允許你查詢,過濾,組合來自不同地方的網際網路資料。它就像sql語言一樣,有過資料庫經驗的開發人員不會對它陌生。

正則是最後最後的選擇,不鼓勵大範圍使用。大部分的html結構複雜多變,只要多個空格,多個屬性,你的表示式可能就匹配錯誤,你需要小心地去驗證各個表示式的正確性,既然上面有這麼多的直譯器比你更熟悉html語法,你又何必冒太大的風險地白寫一堆**呢。

HTML XML中的轉義字元

html中 等有特殊含義,前兩個字元用於鏈結籤,用於轉義 不能直接使用。使用這三個字元時,應使用它們的轉義序列,如下所示 或 和 或 小於號 或 大於號 雙引號 空格版權符 註冊符前者為字元轉義序列,後者為數字轉義序列。數字轉為字元對應的 ascii 碼值。例如 lt font 顯示為,若直接寫為則...

HTML XML中的轉義字元

html中的轉義字元 html中 等有特殊含義,前兩個字元用於鏈結籤,用於轉義 不能直接使用。使用這三個字元時,應使用它們的轉義序列,如下所示 或 和 或 小於號 或 大於號 雙引號 空格版權符 註冊符 前者為字元轉義序列,後者為數字轉義序列。數字轉為字元對應的 ascii 碼值。例如 lt fon...

php中 this 的解釋

我們一般是先宣告乙個類,然後用這個類去例項化物件!但是,當我們在宣告這個類的時候,想在類本身內部使用本類的屬性或者方法。應該怎麼表示呢?例如 我宣告乙個user類!它只含有乙個屬性 name class user at position 9 name 現在,我給user類加個方 name屬性的值吧!...