玩耍 Python實現備份CSDN部落格(未完成)

2021-08-07 03:56:13 字數 3126 閱讀 1111

想著把我csdn上所有部落格的markdown原始檔備份一遍,但其實沒學過這方面的東西,就做了個半成品。。。以後完善吧(應該)

實現了提取所有文章的名字與其對應文章id和發布時間,並找到編輯文件的網頁。

上面這些資訊提取很方便,網頁原始碼裡翻就找得到。

然後按照檔名與日期給每一篇文章建立每乙個空資料夾。

但是最關鍵的一步是,我不知道怎麼提取每一篇.md檔案。。。

渲染好的已經發布的文字我不要,我要.md原始檔。只有編輯文字的時候遇得到md檔案,所以就得實現模擬瀏覽器登陸。。。然而並不會做。。。

是文章的編輯頁面,(開啟來可以是markdown編輯器也可以是傳統的那個),傳統的編輯器的原始碼裡倒是可以看到帶樣式的每個字,但是md編輯器的原始碼裡面就沒有。。。

半成品**:

#coding=utf-8

'''created on 2023年8月19日

@author: xienaoban

@github:

@blog:

'''import os

import urllib

######

######

######

######

######

######

######

######

######

######

######

######

#def log(str):

print("log: " + str + ".")

######

######

######

######

######

######

######

######

######

######

######

######

##引數設定

auth = "xienaoban"

wsp = "c:\\users\\xjf19\\desktop\\"

######

######

######

######

######

######

######

######

######

######

######

######

#s = urllib.request.urlopen("" + auth).read().decode('utf-8')

pages = ord(s[s.find("尾頁") - 3]) - ord('0') + 1

fout = open(wsp + "articles.txt",'w', encoding='utf-8')

log(str(pages) + " page(s) found")

key = "+ auth + "/article/details/"

key2 = "link_postdate"

edit = ""

articles = 0

for page in range(1, pages):

url = "" + auth + "/article/list/"+str(page)

sc = urllib.request.urlopen(url).read().decode('utf-8')

i = 0

while

true:

tmp = sc.find(key, i)

if(tmp < i): break

i = tmp + len(key)

fout.write(edit)

while sc[i]!='\"':

fout.write(sc[i])

i += 1

i += 12

d = sc.find(key2, i) + len(key2) + 2

fout.write(" " + sc[d]+sc[d+1]+sc[d+2]+sc[d+3] + sc[d+5]+sc[d+6] + sc[d+8]+sc[d+9])

ed = sc.find("",i) - 22

while i != ed:

if sc[i] !='/'

and sc[i] != '*'

and sc[i] != '?': fout.write(sc[i])

i += 1

fout.write("\n")

articles += 1

fout.close()

log(str(articles) + " article(s) found")

fin = open(wsp + "articles.txt", "r", encoding='utf-8')

wsp += "blog\\"

ifnot os.path.exists(wsp): os.mkdir(wsp)

new_dir = 0

for arti in range(0, articles):

line = fin.readline()

ifnotline: break

line = line[len(edit) + 4 + 8:-1]

ifnot os.path.exists(wsp + line):

os.mkdir(wsp + line)

new_dir += 1

log(str(new_dir) + " directory(s) added")

log("program finished")

######

######

######

######

######

######

######

######

######

######

######

######

#

RBAC在CSD下的參考實現

許可權模組是mis系統中不可或缺的重要組成。員工在進行正常的訪問前,伺服器往往都需要認證員工的身份。確認員工是否授權,也就是進行訪問控制。訪問控制管理允許被授權的主體 個體或團體組織 對某些資源的訪問,同時拒絕向非授權的主體提供服務。許可權模組的邏輯模型一般形式如下 誰 員工 角色 對什麼 應用模組...

python實現檔案的備份

現實生活中很多檔案需要備份,這裡寫一下用python程式實現檔案的備份。提示輸 件 oldfilename input 請輸 要拷 的 件名字 table of contents 應 1 製作 件的備份 11 以讀的 式開啟 件 oldfile open oldfilename,rb 提取 件的字尾...

python指令碼實現檔案備份

本指令碼通過判斷是否為周一來執行完全備份或增量備份,需提前放到計畫任務中每天執行,實現周一完全備份,之後每天增量備份的功能.具體 實現如下 root bin python from time import strftime import os import tarfile import hashli...