網路爬蟲 多執行緒爬蟲

2021-09-26 21:00:26 字數 551 閱讀 3739

#多執行緒爬蟲

import threading

class one(threading.thread):

def __init__(self):

threading.thread.__init__(self)

def run(self):

for i in range(0,10):

print("我是執行緒1")

class two(threading.thread):

def __init__(self):

threading.thread.__init__(self)

def run(self):

for i in range(0,10):

print("我是執行緒2")

t1 = one()

t1.start()

t2 = two()

t2.start()

#因為是多執行緒,所以最後的輸出結果「我是執行緒1」和「我是執行緒2」是交叉輸出的    

#而如果是函式的話,會先輸出「我是執行緒1」,然後再輸出「我是執行緒2」

多執行緒網路爬蟲

最近用c在linux環境下搞了乙個多執行緒網路爬蟲,真是歷經坎坷啊。現在把自己的教訓總結一下 盡量不要使用靜態陣列,如 char path 200 之類的。不要以為 的path 應該 不長。有些網頁在302重定向時,會提供乙個特別長的path。這可能是由程式設計人員的疏忽導致。不管怎麼樣,如果pat...

python爬蟲 多執行緒爬蟲

在進行爬蟲工作的時候,考慮到爬蟲執行的速度慢,那麼怎樣提公升爬蟲的速度呢,那麼就得使用多執行緒爬蟲了,接下來我以糗事百科段子的爬取進行對多執行緒爬蟲的概述 github鏈結 鏈結一 不使用多執行緒爬取糗事百科 1.上 import urllib.request import re headers f...

爬蟲(六)多執行緒爬蟲

import threading 引入多執行緒模組 import time def run name print name,執行緒執行了!time.sleep 5 建立2個執行緒物件 t1 threading.thread target run,args t1 t2 threading.thread...