python爬蟲(一)入門常見錯誤集合

2021-10-24 20:11:43 字數 1274 閱讀 3610

syntaxerror: invalid syntax語法錯誤:無效語法

syntaxerror: unexpected eof while parsing語法錯誤:多了無法解析的符號(檢查是否多了或少了括號)

syntaxerror: invalid character in identifier語法錯誤:有無效識別符號(檢查中文符號)

indexerror: list index out of range索引錯誤:列表超出索引範圍(檢查列表是否為空)

typeerror: must be str, not int型別錯誤:資料不是正確的資料型別,比如字串和數字直接拼接(檢查資料型別)

indentationerror: expected an indented block縮排錯誤:檢查**的縮排是否正確

valueerror: substring not found值錯誤:輸入的資料型別跟要求不符合

nameerror: name 『a』 is not defined未初始化物件,變數沒有被定義

attributeerror: 『tuple』 object has no attribute 'remove』屬性錯誤:該物件沒有這個屬性、方法(檢查資料型別)

11.請求頭引數

invalidheader: invalid return character or leading space in header: user-agent

import requests

headers =

response = requests.get(

'', headers=headers)

html = response.text

print

(html)

其實很難發現問題在哪,但事實上是因為『 mozilla』之前多了個空格,把空格刪去即可

12. requests.exceptions.connectionerror: httpconnectionpool(host=『134.175.188.27』, port=5010): max retries exceeded with url: /get (caused by newconnectionerror(』: failed to establish a new connection: [winerror 10061] 由於目標計算機積極拒絕,無法連線。』,))

目標計算機積極拒絕

被識別了

**輸入錯誤了

伺服器停止提供伺服器了

總的來說,一定要耐心,沒有解決不了的問題,興趣是最好的方法。

Python爬蟲入門一

作為入門學習,我選擇了乙個靜態 生物資訊交流分享論壇 public library of bioinformatics plob 第一次嘗試,只抓取網頁文字部分。安裝requests庫和bs4庫 前者用來鏈結 和處理http協議 後者將網頁變成結構化資料,方便抓取。easy install requ...

Python爬蟲入門 一

python版本 2.7 首先爬蟲是什麼?網路爬蟲 又被稱為網頁蜘蛛,網路機械人,在foaf社群中間,更經常的稱為網頁追逐者 是一種按照一定的規則,自動的抓取全球資訊網資訊的程式或者指令碼。根據我的經驗,要學習python爬蟲,我們要學習的共有以下幾點 首先,我們要用python寫爬蟲,肯定要了解p...

python 爬蟲入門 一)

今天學了python爬蟲,很有意思,寫一下部落格記錄一下學習過程。最基本的爬蟲僅需要urllib庫,re庫和chardet庫 urllib庫是python內建的處理網路請求的庫。對於基本的爬蟲我們僅僅需要使用他的內部模組urllib.requset。urllib.request中所要使用的函式 ur...