獲取標籤全部文字的方式

2021-08-22 08:44:24 字數 975 閱讀 5681

1.獲取最外層標籤,遍歷內部所有的子標籤,獲取標籤文字

選擇貼吧**吧中的乙個為例 鏈結為    

#找到指定類名的div標籤 該標籤內為貼吧內容和作者的集合體

div_list = response.xpath('//div[@class="l_post l_post_bright j_l_post clearfix "]')

#遍歷內部所有子標籤

for div in div_list:

author = div.xpath('.//div[@class="louzhubiaoshi_wrap"]').extract()

print(author)

2.正則去掉標籤,re.compile.sub()

remove = re.compile('\s')

douhao = re.compile(',')

content = ''

for string in content_list:

string = re.sub(remove,'',string)

string = re.sub(douhao,'',string)

print(string)

3./text()獲取標籤的文字  //text() 獲取標籤以及子標籤的文字

content_list = div.xpath('.//div[@class="d_post_content j_d_post_content "]//text()').extract()
4.使用xpath('string(.)') ,這種方式來獲取所有文字

content = div.xpath('.//div[@class="d_post_content j_d_post_content "]').xpath('string(.)').extract()[0]+'\n'

獲取標籤的方式

body中所有標籤的設定 box1 id盒子標籤 div box2 id盒子標籤 div item 無序列表 li item 無序列表 li 無序列表 li 無序列表 li u1 文字標籤 span body 1.getelementbyid id名 根據id獲取指定元素,如果沒有找到指定元素則返回...

Jquery獲取select標籤的值 文字方式

首先看html 我勒個去!坑爹啊!悲催啊!冬瓜!我去!先來說說這個標籤吧!multiple這個屬性是可以多選!它的寫法就是 multiple multiple size 3 就是這個select標籤頂多可有3個option disabled disabled 這個屬性就是禁止下拉框下拉!就是不能用了...

img標籤與文字對齊方式

img標籤的align屬性可控制與文字的對齊方式,align屬性的值如下 absbottom 影象的下邊緣與同一行中最大元素的下邊緣對齊。absmiddle 影象的中間與同一行中最大元素的中間對齊。baseline 影象的下邊緣與第一行文字的下邊緣對齊。bottom 影象的下邊緣與第一行文字的下邊緣...