使用Python轉換word文件到JSON

2022-01-30 21:34:37 字數 1348 閱讀 9631

需求是有一堆這樣的word文件,要轉換成試題,供web介面使用。

file = docx.document("./2018《廉潔自律準則》知識競賽試題及答案.docx")

list =

val = none

for para in file.paragraphs:

v = para.text.split()

for line in v:

items = re.compile("\.").split(line)

if (re.match('\d', line)):

if len(items) > 1:

val =

q = ''.join([str(x) for x in items[1:]])

key = re.search('(?<=(\(|())\s*[a-d]*', q)

if key != none:

val['k'] = key.group(0).lstrip()

val['q'] = re.sub('(?<=(\(|())\s*[a-d]*\s*', ' ', q)

if (re.match('a', line)):

if len(items) > 1:

val['a'] = ''.join([str(x) for x in items[1:]])

if (re.match('b', line)):

if len(items) > 1:

val['b'] = ''.join([str(x) for x in items[1:]])

if (re.match('c', line)):

if len(items) > 1:

val['c'] = ''.join([str(x) for x in items[1:]])

if (re.match('d', line)):

if len(items) > 1:

val['d'] = ''.join([str(x) for x in items[1:]])

with open('data.json', 'w') as outfile:

json.dump(list, outfile, ensure_ascii=false)

轉換過程並不完美,因為word文件並非標準,大約有90%左右的沒有問題,還有部分是有問題的。

word轉換為txt txt轉換為word 等等

在工作中,有可能需要將大量word的doc文件格式轉換為txt文字檔案格式。如果轉換量少,可以在word中利用 另存為 命令,但是當轉換量比較大 的時候用 另存為 的方法就很麻煩也很慢了,我們下面介紹如何在word中利用 轉換嚮導 快速完成這個任務的方法。具體操作以word2003為例,其 它版本可...

利用WORD發布博文

怎樣用 word 管理網易部落格 部落格,相信這年頭,只要在對上網略知一二的人都會有幾個賬戶吧.今天在網易部落格上瀏覽時無意間發現了網易支援word寫部落格的功能,仔細檢視了一下說明,親自試了一試,成功了.現在把經驗寫出來給大家分享一下,希望能給大家帶來幫助.工具 原料 開啟開始選單,選擇micro...

高效使用word

參考位址 為 word 中的題注新增章節號 76aa8706 3453 4a72 ad5c b87d90ce1698 步驟 1 對文件中的章節標題應用編號 注意 若要在題注中加入章節編號,則必須對章節標題使用唯一 標題樣式。例如,如果對章節標題使用 標題 1 樣式,請勿對該文件中其它文字使用 標題 ...