Vs巨集 之 整理HTML文件格式

2022-01-14 01:50:04 字數 2240 閱讀 6270

有時從其它html編輯器得到的 html 是非標準的。一些標籤沒有閉合。不影響功能,但vs會提示不正確,而且,不能正常的縮排。如: input , br ,meta .

以下巨集做兩件事情:

1. 修正沒有閉合的標籤

2.把編碼轉為 utf8

其中:巨集所引用的dll路徑: c:\program files (x86)\microsoft visual studio 10.0\common7\ide\publicassemblies

取得解決方案選中項: 

directcast(dte.selecteditems.item(1).projectitem, envdte.projectitem).properties.item("

fullpath

").value

'

補全自閉合標籤。像 input br meta

subtidyhtmlsolo()

for i as

integer = 1

todte.selecteditems.count

dim filename = directcast(dte.selecteditems.item(i).projectitem, envdte.projectitem).properties.item("

fullpath

").value

if (system.io.directory.exists(filename)) then

dim fs = system.io.directory.getfiles(filename, "

*.aspx

", searchoption.alldirectories)

for j as

integer = 0

to fs.length - 1

tidyonehtmlsolo(fs(j))

next

elseif (system.io.file.exists(filename)) then

tidyonehtmlsolo(filename)

else

msgbox("

找不到檔案:

" +filename)

exit sub

endif

next

end sub

function tidyonehtmlsolo(byval filename as

string

)

if (file.exists(filename) = false) then

msgbox("

找不到檔案:

" +filename)

exit function

endif

dim txt =file.readalltext(filename, system.text.encoding.default)

dim html = new

htmlcharload(txt)

dim list =html.load(htmlnodeproc.proctype.none)

for i as

integer = 0

to list.count - 1

dim o =list(i)

if o.type = htmlnode.nodetype.tag then

dim tag = ctype

(o, htmltagnode)

if tag.tagname.tolower().isin(new

string() ) then

if (tag.issole = false

and i < list.count - 1) then

dim n = list(i + 1

)

if (n.type <> htmlnode.nodetype.closetag) then

tag.issole = true

endif

endif

endif

endif

next

file.writealltext(filename,

string.join("", list.select(function

(a) a.tostring()).toarray()), system.text.encoding.utf8)

end function

將Html文件整理為規範XML文件

有多種方式可以在.net 平台進行html檔案解析 資料提取,其中最簡單 穩妥的辦法是先使用工具將html文件整理成xml文件,再通過xml dom模型或xpath靈活地進行資料處理。sgml便是乙個html文件整理工具類庫 microsoft的xml大師chris lovett專門開發了乙個sgm...

將Html文件整理為規範XML文件

有多種方式可以在.net 平台進行html檔案解析 資料提取,其中最簡單 穩妥的辦法是先使用工具將html文件整理成xml文件,再通過xml dom模型或xpath靈活地進行資料處理。sgml便是乙個html文件整理工具類庫 microsoft的xml大師chris lovett專門開發了乙個sgm...

HTML文件基本格式詳細介紹

html基本格式主要包括 文件型別宣告 跟標記 1 標記 標記位於文件的最前面,用於向瀏覽器說明當前文件使用哪種html或xhtml標準規範。只有這樣瀏覽器才能將該網頁作為有效的html或xhtml文件,並按指定的文件型別進行解析。2 標記 標記位於標記之後,稱為跟標記,用於告知瀏覽器其自身是乙個h...