Task2 爬蟲 xpath實踐丁香園評論

2021-10-05 08:42:37 字數 1430 閱讀 8004

參加了 datawhale 的活動,學習實踐並作筆記已加深理解

構建解析 tree

# 導入庫

from lxml import etree

import requests

proxies =

url = ""

response = requests.get(url, proxies=proxies)

response.encoding='utf-8'

html = response.text

tree = etree.html(html) #lxml解析html

提取資訊

users = tree.xpath(

'//div[@class="auth"]/a/text()'

)contents = tree.xpath(

'//td[@class="postbody"]'

)for user, content in

zip(users, contents)

: content = content.xpath(

'string(.)'

) content = re.sub(

'\s',''

, content)

print

(user,

":", content)

結果

樓醫生 : 我遇到乙個「怪」病人,向大家請教。她,42歲。反覆驚嚇後暈厥30餘年。每次受響聲驚嚇後發生跌倒,短暫意識喪失。無逆行性遺忘,無抽搐,無口吐白沫,無大小便失禁。多次跌倒致外傷。嬰兒時有驚厥史。入院查體無殊。ecg、24小時動態心電圖無殊;頭顱mri示小軟化灶;腦電圖無殊。入院後有數次類似發作。請問該患者該做何診斷,還需做什麼檢查,**方案怎樣?

xghrh : 同意lion000版主的觀點:如果此患者隨著年齡的增長,其發作頻率逐漸減少且更加支援,不知此患者有無這一特點。入院後的holter及血壓監測對此患者只能是一種安慰性的檢查,因在這些檢查過程中患者發病的機會不是太大,當然不排除正好發作的情況。對此患者應常規作直立傾斜試驗,如果沒有誘發出,再考慮有無可能是其他原因所致的意識障礙,如室性心動過速等,但這需要電生理尤其是心腔內電生理的檢查,畢竟是有一種創傷性方法。因在外地,下面一篇文章可能對您有助,請您自己查詢一下。心理應激事件誘發血管迷走性暈厥1例,楊峻青、吳沃棟、張瑞雲,中國神經精神疾病雜誌,2002vol.28no.2

keys : 該例不排除精神因素導致的,因為每次均在受驚嚇後出現。當然,在作出此診斷前,應完善相關檢查,如頭顱mir(mra),直立傾斜試驗等。

的使用.m

Python爬蟲程式設計實踐task2

匯入包 import requests import re 提交商品搜尋請求,迴圈獲取頁面 def gethtmltext url 請求獲取html,字串 param url 爬取 return 字串 try 新增頭資訊,kv r requests.get url,timeout 30,header...

NLP 理論實踐 Task2

正向最大匹配法演算法流程 從前往後取詞,每次減乙個字,直至詞典命中或剩下1個單字。假設詞典中最長的單詞為 5 個,那麼最大匹配的起始子串字數也為 5 個 1 從左往右讀入子串,掃瞄字典,測試讀入的子串是否在字典中 2 如果存在,則從輸入中刪除掉該子串,重新按照規則取子串,重複 1 3 如果不存在於字...

nlp實踐task2 特徵提取

1.1 分詞的概念 分詞的正向最大 逆向最大 雙向最大匹配法 所謂詞典正向最大匹配就是將一段字串進行分隔,其中分隔 的長度有限制,然後將分隔的子字串與字典中的詞進行匹配,如果匹配成功則進行下一輪匹配,直到所有字串處理完畢,否則將子字串從末尾去除乙個字,再進行匹配,如此反覆。逆向匹配與此類似。正向最大...