Python簡易爬蟲

2021-10-10 03:12:06 字數 2085 閱讀 4041

服務端**:

from flask import flask,request

import os

"/")

defshow()

:if os.path.exists(

"students.txt"):

st="" st=st+

"" fobj=

open

("students.txt"

,"rt"

)# encoding="utf-8"

while

true

:#讀取一行,去除行尾部"\n"換行符號

s=fobj.readline(

).strip(

"\n"

)#如果讀到檔案尾部就退出

if s=="":

break

#按逗號拆分開

s=s.split(

",")

st=st+

""#把各個資料組織在... 的單元中

for i in

range

(len

(s))

: st=st+

""+s[i]+""

#完成一行

st=st+

"" fobj.close(

) st=st+

""return st

if __name__==

"__main__"

:)

客戶端**:

import urllib.request

import re

try:

resp = urllib.request.urlopen(

"") data = resp.read(

) html = data.decode(

)print

(html)

m = re.search(r""

,html)

n = re.search(r""

, html)

while m!=

none

and n!=

none

: row = html[m.end(

):n.start()]

a = re.search(r""

, row)

b = re.search(r""

, row)

while a !=

none

and b !=

none

: s = row[a.end(

):b.start()]

print

(s, end=

" ")

row = row[b.end():

] a = re.search(r""

, row)

b = re.search(r""

, row)

print()

html = html[n.end():

] m = re.search(r""

, html)

n = re.search(r""

, html)

except exception as e:

print

(e)

students.txt內容:

no,name,gender,age

1001,張三,男,20

1002,李四,女,19

1003,王五,男,21

客戶端**說明:

python簡易爬蟲製作

編譯環境 pycharm 4.5.3 python版本 3.5.1 以knewone為例 frombs4importbeautifulsoup importrequests importtime url web data requests.get url 利用requests訪問網頁 soup be...

Python的簡易爬蟲

上 coding utf 8 import requests url wd joyful url url wd 獲取鏈結到的頁面 html,就跟你右鍵瀏覽器檢視源 差不多 r requests.get url 轉字串 string r.text def find string 定義兩個變數 分別表示...

2015 12 25Python 簡易爬蟲

使用python2.7.11版本 建立新的python file usr bin env python 指定用什麼直譯器執行指令碼以及直譯器所在的位置 coding utf 8 指定檔案編碼為utf 8 import urrlib2 if name main 提供乙個入口 設定 request 的u...