網路爬蟲之手機號測吉凶(純屬娛樂)

2021-09-02 10:49:30 字數 1953 閱讀 3046

#目標url=」

」#主要用到的python庫:requests , etree

主要用xpath進行資訊處理

先說一下xpath:

xpath

即為xml路徑語言,它是一種用來確定xml(標準通用標記語言的子集)文件中某部分位置的語言。xpath基於xml的樹狀結構,提供在資料結構樹中找尋節點的能力,說直白了就是在html**中將標籤中的內容提取出來。

思路:先看一下網頁

這就是我們主要要提取出來的資訊;

先看一下提取出來的效果:

我們所需要的資訊都在乙個標籤名為『table』的標籤中,在table標籤中又有小的標籤』tr』,』td』包裹著我們的資訊,所以**標籤的路徑十分清晰。標籤的路徑就是我們需要的xpath,這個可以直接通過瀏覽器複製貼上的,所以不有擔心路徑找出!

寫**:

str(number)中的number就是我們要查詢的手機號

然後就用將我們獲得的html**進行編碼和整理:

然後就用xpath來提取資訊了:

xpath在etree庫中,而etree 在模組lxml中,所以向c語言一樣先加標頭檔案from lxml import etree

然後根據路徑就可以提取了:

con1=selet.xpath('/html/body/table[2]/tr[1]/td/b/text())

con2=selet.xpath('/html/body/table[2]/tr[1]/td/text())

因為標籤table中有8個這樣的小標籤,所以我們要迴圈8次,只是每次迴圈的的時候將str[ ]中的數字換了,然後將其print出來就可以了:

最後給出全部**:

import requests

from lxml import etree

def find(slet,num):

con1=selet.xpath('/html/body/table[2]/tr['+str(num)+']/td/b/text()')

con2=selet.xpath('/html/body/table[2]/tr['+str(num)+']/td/text()')

for i in con1:

print(i)

for i in con2:

print(i)

while(1):

print("手機號測吉凶純屬娛樂!!!\n輸入q退出!\n")

number=input("請輸入你的手機號:")

if(number=='q'):

break;

kv=url=""+str(number)

r=requests.get(url,headers=kv)

html=r.text

selet=etree.html(html)

for num in range(1,9):

find(selet,num)

print("*************************************")

介面之 手機號驗證介面api

免費的 手機號api資料介面 正規,收費的 1.手機號實名認證 該介面主要是用於核實使用者提交的手機號認證資訊是否與運營商庫中記錄匹配,根據提供的要素不同分為二要素和三要素認證,二要素是指 姓名 手機號 三要素是指 姓名 手機號 身份證號 2.手機號實名精確認證 該介面與手機號實名認證一樣也是用於核...

生活之 手機號可能註冊的賬號

由於我們的手機號碼會繫結很多東西,所以當我們手機號碼更換後,應該要及時解綁或者換綁各種賬號繫結。下面就列舉各種需要留意的賬號繫結平台 社交類qq 微博人人 豆瓣支付類 支付寶財付通 天貓 京東當當網 蘇寧易購 郵箱qq郵箱 163郵箱 谷歌郵箱 銀行卡工商銀行 招商銀行 建設銀行 郵政儲蓄銀行 農村...

手機號判斷

public class smsutil toast.maketext activity,手機號碼輸入有誤!toast.length short show return false 驗證手機格式 public static boolean ismobileno string mobilenums 1...