初探python爬蟲(一) get請求

2021-10-02 14:40:11 字數 627 閱讀 4622

爬蟲步驟

請求方式:get和post

requests

安裝:pip install requests

import requests

#定義請求的url

url = ''

#定義請求頭資訊

headers =

#發起get請求

res = requests.get(url=url,headers=headers)

#獲取相應狀態碼,當響應狀態碼為200 時則表示請求成功

code = res.status_code

print(code)

#相應成功後把相應的內容加入檔案中

if code ==200:

with open ('e:/learn/pythonlearn/demo02/text.html','w',encoding="utf-8") as fp:

# fp.write(res.text)

# print(res.text).encode('gbk', 'ignore')

# print(res.text)

fp.write(res.text)

Python爬蟲初探

閒來無事研究了一下python的爬蟲技術,現在總結一下 testclass.py 檔案 加上這個可以輸入中文 coding utf 8 匯入幾個內建庫 import urllib import urllib2 import re import mytool 模擬瀏覽器和請求頭,否則顯示訪問出錯 us...

python爬蟲初探

確保程式引用類庫是否是引用的該目錄,否則會出現pip install chardet 後,無法在專案中呼叫chardet的問題.可能在會出現pip安裝到 usr local lib python2.7 dist packages下,但是程式在 usr local lib python2.7 dist...

Python爬蟲初探

以下功能均在jupyter notebook上實現。python及相應爬蟲工具安裝請參考部落格 一 爬蟲介紹 1.非結構化資料 沒有固定格式 如網頁資料,必須通過etl extract 抽取 transformation 轉換 loading 組成 工具將數 據轉化為結構化資料才能取用。raw da...