網路爬蟲之手機號測吉凶（純屬娛樂）

#目標url=」

」#主要用到的python庫：requests , etree

主要用xpath進行資訊處理

先說一下xpath：

xpath

即為xml路徑語言，它是一種用來確定xml(標準通用標記語言的子集)文件中某部分位置的語言。xpath基於xml的樹狀結構，提供在資料結構樹中找尋節點的能力，說直白了就是在html**中將標籤中的內容提取出來。

思路：先看一下網頁

這就是我們主要要提取出來的資訊；

先看一下提取出來的效果：

我們所需要的資訊都在乙個標籤名為『table』的標籤中，在table標籤中又有小的標籤』tr』,』td』包裹著我們的資訊，所以**標籤的路徑十分清晰。標籤的路徑就是我們需要的xpath,這個可以直接通過瀏覽器複製貼上的，所以不有擔心路徑找出！

寫**：

str(number)中的number就是我們要查詢的手機號

然後就用將我們獲得的html**進行編碼和整理：

然後就用xpath來提取資訊了：

xpath在etree庫中，而etree 在模組lxml中，所以向c語言一樣先加標頭檔案from lxml import etree

然後根據路徑就可以提取了：

con1=selet.xpath('/html/body/table[2]/tr[1]/td/b/text())

con2=selet.xpath('/html/body/table[2]/tr[1]/td/text())

因為標籤table中有8個這樣的小標籤，所以我們要迴圈8次，只是每次迴圈的的時候將str[ ]中的數字換了，然後將其print出來就可以了：

最後給出全部**：

import requests
from lxml import etree
def find(slet,num):
con1=selet.xpath('/html/body/table[2]/tr['+str(num)+']/td/b/text()')
con2=selet.xpath('/html/body/table[2]/tr['+str(num)+']/td/text()')
for i in con1:
print(i)
for i in con2:
print(i)
while(1):
print("手機號測吉凶純屬娛樂！！！\n輸入q退出！\n")
number=input("請輸入你的手機號：")
if(number=='q'):
break;
kv=url=""+str(number)
r=requests.get(url,headers=kv)
html=r.text
selet=etree.html(html)
for num in range(1,9):
find(selet,num)
print("*************************************")

網路爬蟲之手機號測吉凶（純屬娛樂）

介面之手機號驗證介面api

生活之手機號可能註冊的賬號

手機號判斷

網路爬蟲之手機號測吉凶（純屬娛樂）

介面之 手機號驗證介面api

生活之 手機號可能註冊的賬號

手機號判斷

相關推薦

介面之手機號驗證介面api

生活之手機號可能註冊的賬號