python讀取Word文件內容

2021-10-24 02:30:49 字數 389 閱讀 8902

本方法存在兩個問題

1.profit出現的次數沒統計進去

2.如果同乙個句子**現了兩次profit,只統計出1次。

請大神指教

from docx import document

doc=document('netease q2 2019 earnings release-final.docx')

count=0

for paragraph in doc.paragraphs:

for run in paragraph.runs:

if 'profit' in run.text:

print(run.text)

count=count+1

print(f'單詞profit一共出現了次')

18Python讀取Word文件內容

pip install python docx word文件結構 document 文件 paragraph 段落 run 文字塊 讀取word文件內容 doc.paragraphs 得到的是乙個列表,包含了每個段落的例項 from docx import document doc document...

python 處理 word 文件

簡介 安裝pip install python docx pip install docxtpl docxtpl 庫會依賴jinja2 使用對應的主要python 大同小異,在py指令碼中將資料徹底處理好,render僅做簡單資料填充。from docxtpl import docxtemplate...

aspose將word文件轉為html內容

引入aspose相關jar包 將word內容轉為html字串 word轉html文字 param doc 需要轉換的doc檔案物件 return public string parseword2html document doc catch exception e e.getmessage retu...