擷取帶HTML標籤的文字 面試題

2021-05-28 09:54:04 字數 2087 閱讀 2101

如果我想從內容中取100個字元出來(注:內容中有html**,因為想保留基本的p、div、img、font、b、i),如何取?取得時候應該考慮哪些問題?

快活林顧心懌得分可   &;倒薩飛機佛擋殺佛1阿飛 2 粉底阿飛第三發嗲發iedfias發的死阿飛第四阿夫頓大佛寺

阿飛大夫額3脎放大發得啊《范德薩范德薩》分大福大佛擋殺佛倒薩范德薩婦撒佛擋殺佛嗒89颯8噠89783721849372148

1.對上面文字進行字串擷取,100(注1個漢字等於2個字元)。

2.保留p,div,img,font,b,i標籤。

3.需要注意的地方有:舉乙個例子,如 是空格,算1個字元

下面給出我寫的**,還有很多不完善的地方,有待商榷。

using system;

using system.collections.generic;

using system.linq;

using system.text;

using system.text.regularexpressions;

namespace shangyun2

//if (script == false)

//regex regimg = new regex("(?

matchcollection matchcol = regimg.matches(html);

if (matchcol.count > 0)

}//待優化 讀取出來的字串中的換號和回車\r\n,這裡暫未處理

html = replacehtml(html, "

html = replacehtml(html, ">", ref count);

html = replacehtml(html, " ", ref count);

html = replacehtml(html, "&", ref count);

html = html.replace("

", "

"); //用正則去掉不要的html標籤

//因為考慮到可能有自定義的一些標籤,暫時沒想到好的方法去做,所以暫時沒做

stringbuilder sbresult = new stringbuilder();

int temp = 0;//計數器

while (true)

temp++;}}

if (count == 0)

temp++;

count--;

}//這裡寫的有些麻煩,還希望大家幫忙改正

html = sbresult.tostring().replace("", " ").replace("", "&").replace("/>", ">");

//stackstack = new stack();

for (int i = 0; i < html.length; i++)

i = temps;

dowhile (tempstring != "}}

//單個標籤出棧操作

else if (html[i].tostring() == "/")

while (tempstring != "}}

}stringbuilder sb = new stringbuilder();

for (int i = stack.count - 1; i >= 0; i--)

regex checktag = new regex("");

//判斷是否有單個的標籤 如果有的話在最後給他新增相應的閉標籤

matchcollection matchcollect = checktag.matches(sb.tostring());

if (matchcollect.count > 0)

}return html;

}/// ///

///

///

///

///

///

private string replacehtml(string html, string tags, ref int count)

return html;}}

}

面試題總結 html面試題)

附上鏈結 doctype 的作用是什麼?宣告一般位於文件的第一行,它的作用主要是告訴瀏覽器以什麼樣的模式來解析文件。一般指定了之後會以標準模式來 進行文件解析,否則就以相容模式進行解析。在標準模式下,瀏覽器的解析規則都是按照最新的標準進行解析的。而在相容模式下,瀏 覽器會以向後相容的方式來模擬老式瀏...

HTML 面試題總結

宣告文件的解析型別 document.compatmode 避免瀏覽器的怪異模式。有以下兩個值 這個屬性會被瀏覽器識別並使用,但是如果你的頁面沒有doctype的宣告,瀏覽器按照自己的方式解析渲染頁面 怪異模式 在不同的瀏覽器就會顯示不同的樣式。注意以下幾點 在 html 4.01 中,宣告引用 d...

html面試題目

1 必考 你是如何理解 html 語義化的?用正確的標籤做正確的事情。html語義化讓頁面的內容結構化,結構更清晰,便於對瀏覽器 搜尋引擎解析 即使在沒有樣式css情況下也以一種文件格式顯示,並且是容易閱讀的 搜尋引擎的爬蟲也依賴於html標記來確定上下文和各個關鍵字的權重,利於seo 使閱讀源 的...