scrapy xpath實現頁面多次提取

2021-09-24 04:51:37 字數 457 閱讀 4641

第一次提取,

change_old = response.xpath('//*[@id="_container_changeinfo"]/table/tbody/tr')
如果需要繼續提取下一級, 後面不能加extract(),

因為extract()處理過的物件就變成了str格式

針對經過提取以後的以下html:

2

2017-07-20

法定代表人變更

朱文生

王春香

可以使用

old.xpath('td[4]/div//text()').extract()
進行提取

這裡需要注意的是://text()和descendant::text()效果一樣,都是提取當前標籤下的所有文字(所有子孫節點的文字)

scrapy xpath選擇器多級選擇錯誤

在學習scrapy中用xpath提取網頁內容時,有時要先提取出一整個行標籤內容,再從行標籤裡尋找目標內容。出現乙個錯誤。錯誤 def parse self,response sel scrapy.selector response sel li sel.xpath html body div 2 d...

實現頁面分頁

web專案經常遇到頁面分頁,在這裡總結一下。先進行 資料分析 需要傳給後台當前頁面數,每頁顯示幾條資料,資料總數形成的頁面總數 邏輯需求 將資料總數查出來形成頁面總數 首先是進行總數的計算,作用就是在前端頁面形成 1 n select count from 表 service中進行邏輯處理,根據資料...

實現頁面布局

當我們開發乙個 的時候,有幾種我們常見的頁面布局的方法,比如多欄布局頁面 彈性布局頁面。利用布局的方法使我們的頁面更完整更美觀。下面是我用 實現的多欄布局頁面 如下圖 首先建立頭部乙個div為box類,中間建立乙個大的div包裹著三個小的div,分別給它們設定類,尾部就跟頭部一樣然後設定乙個類box...