為完成爬取豆瓣Top250做的準備三

2021-10-19 22:54:21 字數 1687 閱讀 8197

分多個板塊,不同板塊之間用空行隔開,每個**塊幾乎都被注釋掉了,主要是出於簡潔考慮,因為會有重複部分,**塊中前部分是**,後部分是執行結果.

import sqlite3

#1.連線資料庫

# conn = sqlite3.connect("test.db") #開啟或建立資料庫檔案

# print("opened database successfully")

#2.建立資料表

"""conn = sqlite3.connect("test.db") #開啟或建立資料庫檔案

print("成功開啟資料庫")

c = conn.cursor() #獲取游標

sql ='''

create table company

(id int primary key not null,

name text not null,

age int not null,

address char(50),

salary real)

'''c.execute(sql) #執行sql語句

conn.commit() #提交資料庫操作

conn.close() #關閉資料庫連線

print("成功建表")

"""#3.插入資料

"""conn = sqlite3.connect("test.db") #開啟或建立資料庫檔案

print("成功開啟資料庫")

c = conn.cursor() #獲取游標

sql1 ='''

insert into company (id,name,age,address,salary)

values (1,'張三',32,"成都",8000);

'''sql2 ='''

insert into company (id,name,age,address,salary)

values (2,'李四',34,"重慶",18000);

'''c.execute(sql1) #執行sql語句

c.execute(sql2) #執行sql語句

conn.commit() #提交資料庫操作

conn.close() #關閉資料庫連線

print("插入資料完畢")

"""#4.查詢資料

conn = sqlite3.connect("test.db") #開啟或建立資料庫檔案

print("成功開啟資料庫")

c = conn.cursor() #獲取游標

sql = "select id,name,address,salary from company"

cursor = c.execute(sql)

for row in cursor:

print("id = ",row[0])

print("name = ",row[1])

print("address = ",row[2])

print("salary = ",row[3],"\n")

conn.close() #關閉資料庫連線

print("查詢完畢")

為完成爬取豆瓣Top250做的準備二

分多個板塊,不同板塊之間用空行隔開,每個 塊幾乎都被注釋掉了,主要是出於簡潔考慮,因為會有重複部分,塊中前部分是 後部分是執行結果.正規表示式 字串模式 判斷字串是否符合一定的標準 import re 建立模式物件 有模式物件 pat re.compile aa 此處的aa是正規表示式 用來驗證其它...

為完成爬取豆瓣Top250做的準備四

分多個板塊,不同板塊之間用空行隔開,每個 塊幾乎都被注釋掉了,主要是出於簡潔考慮,因為會有重複部分,塊中前部分是 後部分是執行結果.import urllib.request 獲取乙個get請求 res urllib.request.urlopen print res.read decode utf...

爬取豆瓣Top250

requests庫可以自動爬取html頁面,自動網路請求提交。安裝方法 pip install requests requests庫主要有7個方法 首先開啟網頁 豆瓣top250 然後f12,得到如下圖 我們要找的內容在紅框裡面。這個頁面有25個電影,第乙個頁面 第二個頁面 我們可以觀察到 每個頁面...