第一次除錯python爬蟲

2021-09-24 02:53:27 字數 660 閱讀 4798

建立檔案:vi pic_down.py

執行:./pic_down.py

報錯:permission denied

解決:chmod a+x pic_down.py

執行:./pic_down.py

報錯:./pic_down.py: line 1: import: command not found

解決:在頭部加上 #!/usr/bin/python

執行:pip install requests 報錯,pip命令找不到

解決:具體就是執行 sudo easy_install pip 命令

執行:pip install requests 報錯,沒有許可權

解決:執行 sudo pip install requests 成功

繼續執行:./pic_down.py

報錯:importerror: no module named lxml 報錯

解決:執行 sudo pip install lxml 成功

執行:./pic_down.py

報錯:attributeerror: 『module』 object has no attribute 『request』

解決:網上各種答案不能解決,查了下urllib語法,把request去掉,完美執行

繼續學習之路

爬蟲第一次

由於面試的需要,昨天看了下爬蟲,python的,原先一直以為很高階,但是才發現大體思路很清晰。1。連線到要抓取的某網 注意import urllib,比如這個樣子 def gethtml url page urllib.urlopen url html page.read return html 這...

第一次爬蟲

from bs4 import beautifulsoup import requests import time def get item info url 如何從詳情頁裡面要爬取的內容 url wb data requests.get url soup beautifulsoup wb data...

記第一次爬蟲

出不來結果的時候,真是著急,期間犯了很多錯誤,這個過程痛苦並快樂著 哈哈哈哈哈,哈哈哈哈哈 import urllib.request import re import os url page urllib.request.urlopen url read page page.decode gbk ...