python寫爬蟲之if name

2021-08-20 07:09:32 字數 1673 閱讀 8413

在寫爬蟲的過程中遇到的疑問,故此記下來。

在大多數編排得好一點的指令碼或者程式裡面都有這段if __name__ == 'main': ,雖然一直知道他的作用,但是一直比較模糊,收集資料詳細理解之後與打架分享。

1、這段**的功能

乙個python的檔案有兩種使用的方法,第一是直接作為指令碼執行,第二是import到其他的python指令碼中被呼叫(模組重用)執行。因此if __name__ == 'main': 的作用就是控制這兩種情況執行**的過程,在if __name__ == 'main': 下的**只有在第一種情況下(即檔案作為指令碼直接執行)才會被執行,而import到其他指令碼中是不會被執行的。

舉個例子,下面在test.py中寫入如下**:

1print"i'm the first."

2if__name__=="__main__":

3print"i'm the second."

並直接執行test.py,結果如下圖,可以成功print兩行字串。即,if __name__=="__main__": 語句之前和之後的**都被執行。

然後在同一資料夾新建名稱為import_test.py的指令碼,只輸入如**:

import test 執行

import_test.py指令碼,輸出結果如下:

只輸出了第一行字串。即,if __name__=="__main__":

之前的語句被執行,之後的沒有被執行。

2、執行的原理

每個python模組(python檔案,也就是此處的test.py和import_test.py)都包含內建的變數__name__,當執行模組被執行的時候,__name__等於檔名(包含了字尾.py);如果import到其他模組中,則__name__等於模組名稱(不包含字尾.py)。而「__main__」等於當前執行檔案的名稱(包含了字尾.py)。進而當模組被直接執行時,__name__ == 'main'結果為真。

同樣舉例說明,我們在test.py指令碼的if __name__=="__main__":之前加入print __name__,即將__name__列印出來。檔案內容和結果如下,

可以看出,此時變數__name__的值為"__main__";

再執行import_test.py,模組內容和執行結果如下:

此時,test.py中的__name__變數值為test,不滿足__name__=="__main__"的條件,因此,無法執行其後的**。

我看完之後個人的理解是:

提供了一種隔離性,也可以說,沒有辦法重用。總之,作為專案開發的話 或者說 打算讓別人使用的話,不應該添那句

python寫網路爬蟲

注 本文旨在練習正規表示式的簡單使用方法 usr bin evn python coding cp936 def gethtml url 定義gethtml 函式,用來獲取頁面源 page urllib.urlopen url urlopen 根據url來獲取頁面源 html page.read 從...

python做爬蟲難嗎 python寫爬蟲難嗎

所謂網路爬蟲,通俗的講,就是通過向我們需要的url發出http請求,獲取該url對應的http報文主體內容,之後提取該報文主體中我們所需要的資訊。下面是乙個簡單的爬蟲程式 http基本知識 當我們通過瀏覽器訪問指定的url時,需要遵守http協議。本節將介紹一些關於http的基礎知識。http基本流...

用python寫爬蟲(一)初識爬蟲

爬蟲又被稱之為網路蜘蛛 網路機械人等,簡單來說就是模擬客戶端傳送網路請求,接收請求響應,按照一定的規則自動的抓取網際網路資訊的程式。1.從個人角度來說,爬蟲可以做我們的生活助手。2.從商業角度來說,爬蟲能實現巨大的商業價值。網路爬蟲根據系統結構和開發技術大致可以分為四種型別 通用網路爬蟲 聚焦網路爬...