(七)pdf的構成之檔案體(page物件)

2022-07-31 15:36:18 字數 759 閱讀 2844

頁面(page)

通過頁面樹訪問文件的頁面,頁面樹定義pdf文件中的所有頁面。樹包含表示pdf文件頁面的節點,可以是兩種型別:中間節點和葉節點。中間節點也稱為頁面樹節點,而葉節點稱為頁面物件。最簡單的頁面樹結構可以由單個頁面樹節點組成,該節點直接引用所有頁面物件(因此所有頁面物件都是葉子)

屬性:(指示包含部分)

type - 永遠是page

parent - 對此頁面的父級的間接引用

lastmodified - 上次修改此頁面的日期和時間

resource - 此頁面所需的資源。這通常是指此頁面上使用的字型和其他資訊。(內部是乙個字典型別)

mediabox - 乙個矩形,用於定義頁面必須在其中顯示的邊界。

contents - 描述此頁面內容的內容流。

rotate - 以90的倍數表示。在顯示之前將頁面旋轉度數。

thumb - 乙個流物件,為此頁面提供縮圖影象。

trans - 一種字典,用於指示在演示期間顯示頁面時要使用的轉換。

annots - 這是乙個字典陣列,包含對此頁面的所有注釋的引用

aa - 這是附加行動的簡短形式。此字典定義檔案開啟或關閉時需要採取的操作。

metadata - 包含此頁面元資料的流

例子:4 0 obj

/parent 3 0 r                 //父節點物件號:3

/resources/font 11 0 r

/contents 5 0 r

endobj

(三)pdf的構成之檔案頭綜述

引自 一般情況下,檔案頭,即,pdf檔案的第一行,它用來定義pdf的版本,從而確定該pdf遵循的哪個版本的pdf規範。pdf版本是向下相容的,即高版本的規範,相容低版本的規範。目前我見過的版本有 pdf 1.0 pdf 1.1 pdf 1.2 pdf 1.3 pdf 1.4 pdf 1.5 pdf ...

Python之合併PDF檔案

在日常的學習生活工作中,我們有時會遇到需要合併pdf檔案的需求。這時,我們可以利用相關的pdf軟體 如adobe acrobat reader dc 來完成這個任務,幸運的是,python也為我們提供了這方面的處理模組pypdf2,借用它,我們可以利用python 來很好地完成這項任務。pypdf2...

Python之合併PDF檔案

在日常的學習生活工作中,我們有時會遇到需要合併pdf檔案的需求。這時,我們可以利用相關的pdf軟體 如adobe acrobat reader dc 來完成這個任務,幸運的是,python也為我們提供了這方面的處理模組pypdf2,借用它,我們可以利用python 來很好地完成這項任務。pypdf2...