C 讀取PDF PDFBox使用

2021-06-01 03:05:38 字數 901 閱讀 5462

這個絕對是個好**)

將以上4個檔案引用到專案中,在檔案中需要引入以下2個命名空間:

using org.pdfbox.pdmodel;

using org.pdfbox.util;

三、api的使用方法

using system.io;

using system.text;

using org.pdfbox.pdmodel;

using org.pdfbox.util;

namespace pdfreader

class program

public static void pdf2txt(fileinfo pdffile, fileinfo txtfile)

pddocument doc = pddocument.load(pdffile.fullname);

pdftextstripper pdfstripper = new pdftextstripper();

string text = pdfstripper.gettext(doc);

streamwriter swpdfchange = new streamwriter(txtfile.fullname, false, encoding.getencoding("gb2312"));

swpdfchange.write(text);

swpdfchange.close();

static void main(string args)

pdf2txt(new fileinfo(@"c:/users/susan/desktop/完整稿__匆匆那年_九夜茴.pdf"), new fileinfo(@"c:/users/susan/desktop/完整稿__匆匆那年_九夜茴.txt"));

轉化中文是沒有問題的,原因你應該知道。

c 使用xerces讀取XML

xml作為一種重要的檔案格式,應用面非常之廣。從asp.net的web.config,到android的頁面設計開發,webservice通訊等。有時候難免需要我們通過程式進行建立與解析,最近剛完成乙個c 專案,就需要讀取xml配置檔案,關於xml解析器的選擇很多,可以參考 個人比較喜歡apache...

C 使用XmlSerializer讀取Xml內容

1 book.xml檔案如下 asp.net 本質論劉湘 10.23 c 基礎孟第 50.28 2 根據book.xml 檔案生成架構檔案 book.xsd 在vs2010開啟book.xml檔案,vs2010的選單欄上出現乙個xml的選單,選擇 建立架構 vs2010會自動生成book.xsd檔案...

C 使用資料讀取器

很久以前就借了一本 beginning c databases from novice to professional 最近閒來無事終於可以拜讀一下。讀來發現自己之前的資料庫操作是何等的粗鄙。今天 抽時間記錄下一些關於資料讀取器有關的內容。在本書後面的資料集時提及 如果只想讀取資料和顯示資料,則只需...