c 讀取pdf文件

2021-06-15 04:01:48 字數 448 閱讀 8823

2.解壓pdfbox,專案中新增存在解壓後bin目錄下的dll檔案:ikvm.gnu.classpath.dll、ikvm.runtime.dll、fontbox-0.1.0-dev.dll、pdfbox-0.7.3.dll

3.檔案中引入2個命名空間:using org.pdfbox.pdmodel、using org.pdfbox.util

4.如下**變可以讀取pdf文件:

void readpdf(fileinfo pdffile)

pddocument doc = pddocument.load(pdffile.fullname);

pdftextstripper pdfstripper = new pdftextstripper();

string text = pdfstripper.gettext(doc);

此時pdf文件的內容就被讀取到字串text中。

讀取PDF文件

coding utf 8 匯入開發包 frompdfminer.pdfparserimportpdfparser,pdfdocument frompdfminer.pdfinterpimportpdfresourcemanager,pdfpageinterpreter frompdfminer.pd...

python讀取pdf文件 實戰

coding utf 8 讀取pdf文件 from pdfminer.converter import pdfpageaggregator from pdfminer.layout import laparams from pdfminer.pdfparser import pdfparser,pd...

用python讀取pdf文件

首先要安裝庫 pdfminer3k from pdfminer.converter import pdfpageaggregator from pdfminer.layout import laparams from pdfminer.pdfparser import pdfparser,pdfdo...