Linux sed識別HTML標籤

2022-06-21 20:48:11 字數 1415 閱讀 8369

在做linux作業,遇到一題用sed替換掉檔案中的特殊字元,其中html標籤就是一大堆特殊字元。

先來說說sed的替換使用「s/待替換的字元/將替換成的字元/」

其後還可以跟g,即「s///g」,表示全域性替換,整個文字都會執行替換詞。

再者,遇到相同字串中含有大小字母,忽略大小字母進行替換,則使用i,即「s///i」。

如果遇到需要執行多個sed命令,可以使用-e,同時執行多個命令。如:sed -e "2d" -e "s/abc/xyz/i";

現在再來說說重點,如何替換:

1.只想單純過濾掉html標籤,顯示內容: 

"s/<[^>]*>//g"

2.識別出html標籤(這個要換成與html標籤對應的字元):

下面的是一些對應字元替換

s//.tl\n/g

s///g

s//.au\n/g

s///g

s//.ai\n/g

s///g

s//.ab/g

s//.ae/g

s//.i /g

s//\n/g

s///g

s//.pp/g

s/

//g

s//.fs/g

s//.fe/g

s//.ip/g

s///g

s//.qp/g

s///g

s//.ts/g

s//.te/g

s//.eq/g

s//.en/g

s//.ps/g

s//.pe/g

s/

/.ds/g

s/

/.de/g

擷取html字元長度,並保留html格式標記

using system using system.data using system.configuration using system.collections using system.web using system.web.security using system.web.ui usin...

HTML5 CSS學習筆記(2)HTML表單標籤

屬性 action 介面位址 method get post name 表單名稱 屬性 type 控制項型別 name 屬性標識表單域的名稱 value 屬性定義表單域的預設值,其他屬性根據type的不同而有所變化。maxlength 控制最多輸入的字元數,size 控制框的寬度 以字元為單位 1 ...

html 核取方塊的文字溢位來 HTML表單標籤基礎

一 傳統表單 一 1 表單是什麼?01.在網頁中主要負責資料採集功能的元件。02.通常與資料庫相連。03.由表單元素組成。2 表單元件介紹 01.文字 字段 02.選擇 03.單選按鈕 組 04.文字域 05.核取方塊 06.密碼 字段 07.檔案域 08.提交按鈕 09.重置按鈕 3 form 標...