爬蟲面試常見問題

2021-08-15 20:52:18 字數 1703 閱讀 9337

許多自學爬蟲(python)的小夥伴因為沒有經歷過面試所以在找工作之前難免有些抓不住重點,雖然自己有些技術

但是因為發揮不好而錯失工作機會,本人經過n次面試以後特總結以下面試常見問題,為想要轉爬蟲的小

夥伴提供一些參考。

一.專案問題:

一般面試官的第乙個問題八成都是問一下以前做過的專案,所以最好準備兩個自己最近寫的有些技術

含量的專案,當然一定要自己親手寫過的,在別的地方看的原始碼,就算看的再清楚,總歸沒有自己敲的

了解的多。以下是抽出的幾點

1.你寫爬蟲的時候都遇到過什麼反爬蟲措施,你是怎麼解決的

2.用的什麼框架,為什麼選擇這個框架(我用的是scrapy框架,所以下面的問題也是針對scrapy)

二.框架問題(scrapy)可能會根據你說的框架問不同的問題,但是scrapy還是比較多的

1.scrapy的基本結構(五個部分都是什麼,請求發出去的整個流程)

2.scrapy的去重原理 (指紋去重到底是什麼原理)

3.scrapy中介軟體有幾種類,你用過那些中介軟體,

4.scrapy中介軟體再**起的作用(面向切面程式設計)

三.**問題

1.為什麼會用到**

2.**怎麼使用(具體**,請求在什麼時候新增的**)

3.**失效了怎麼處理

四.驗證碼處理

1.登陸驗證碼處理

2.爬取速度過快出現的驗證碼處理

3.如何用機器識別驗證碼

五.模擬登陸問題

1.模擬登陸流程

2.cookie如何處理

3.如何處理**傳參加密的情況

六.分布式

1.分布式原理

2.分布式如何判斷爬蟲已經停止了

3.分布式去重原理

七.資料儲存和資料庫問題

1.關係型資料庫和非關係型資料庫的區別

2.爬下來資料你會選擇什麼儲存方式,為什麼

3.各種資料庫支援的資料型別,和特點,比如:redis如何實現持久化,mongodb

是否支援事物等。。

八.python基礎問題

# 基礎問題非常多,但是因為爬蟲性質,還是有些問的比較多的,下面是總結

1.python2和python3的區別,如何實現python2**遷移到python3環境

2.python2和python3的編碼方式有什麼差別(工作中發現編碼問題還是挺讓人不爽的)

3.迭代器,生成器,裝飾器

4.python的資料型別

九.協議問題

# 爬蟲從網頁上拿資料肯定需要模擬網路通訊的協議

1.http協議,請求由什麼組成,每個字段分別有什麼用,https和http有什麼差距

2.證書問題

3.tcp,udp各種相關問題

十.資料提取問題

1.主要使用什麼樣的結構化資料提取方式,可能會寫一兩個例子

2.正則的使用

3.動態載入的資料如何提取

4.json資料如何提取

十二.演算法問題

# 這個實在不好總結,比較考驗**功力,大部分會讓你寫出時間複雜度比較低的

演算法。小夥伴們要善用python的資料型別,對python的資料結構深入了解。

以上就是總結內容,歡迎小夥伴們共同**。每個公司各有特點,但是這些算是基礎,也是常見問題。

祝大家能找到理想工作,不寫bug

爬蟲常見問題。

如果url中存在中文,而你卻不對它做任何處理,他不會達到你所想的那樣,因此我們需要將中文部分進行處理,要用到urllib.parse模組中的quote將中文轉化成url所需的編碼,url中的中文要單獨處理,不能中英文全部合在一起處理 因為一部分的特殊字元也會被處理掉 import urllib.pa...

面試常見問題

面試時,有幾個問題是公司面試人員常常會提出的,針對這些問題好好準備,在面試時也就不會啞口無言,無言以對了,下面就面試十大必考題做出分析,也許對hr經理也是乙個 1 為什麼想進本公司?這通常是面試官最先問到的問題。此時面試官就開始評斷錄用與否了,建議大家先判斷自己去應徵的工作性質,是專業能力導向呢,或...

面試常見問題

1.如果我們不能提供你所要求的薪水,你還願意來我們公司嗎?你的期望薪水是多少?你想得到的薪水是多 少?如果達不到你的要求,怎麼辦?答 我認為工作最重要的是合作開心,薪酬是其次的,不過我原來的月薪是 元,如果跳槽的話就希望 自己能有點進步,如果不是讓您太為難的話,您看這個工資是不是可以有一點提高?2....