電子書格式問題的本質

2021-06-09 19:41:26 字數 3337 閱讀 9965

1.什麼是電子書的格式問題

簡單地說,電子書格式是對使用電子書時的檔案編碼方式、內容組織結構的一種約定。電子書的格式不僅限定了圖書內容的展現形式,更事關圖書內容的儲存和管理。

而電子書(或數字內容產品)則不同,由於讀者的閱讀總是需要借助閱讀終端(包括閱讀器、平板電腦、手機、電腦等),因此每乙個電子書產品就都存在著與軟硬體的對口和相容問題。這就是電子書的格式問題。

目前,由於閱讀終端或平台的複雜性,產品型別的多元化,再加上原有排版系統的不統一,使得電子書格式的選擇問題變得複雜。

在傳統出版模式下,圖書的版式是展現給讀者的閱讀外觀,但這種固化的外觀除了對應紙質印刷,並不能滿足其他多種形式的閱讀平台,也不能滿足數字閱讀習慣中所包含的個性化需求,如自定義介面、簡單互動等等。

但如果簡單地放棄固定版式(如採用純文字格式),對閱讀終端的適應性增強了,但因為降低了結構化水平和設計含量,從而不符合通過增進內容質量和藝術性提公升讀者閱讀體驗這一出版業的價值定位。更何況,對於複雜的圖書產品(專業書類),內容元素中本身就有高度格式化的成分(如公式、複雜符號、圖表等),不能隨意改變。

可見,格式要解決的問題,就是在這兩者之間取得平衡。乙個好的格式方案,應該能在保留版式的前提下,獲取一定的柔性。

目前,傳統出版邁向數字出版的第一步(電子書1.0時代),可行的路徑往往是:基於現有的成熟模式,給產品增加一種數字版形態,以迎合數字閱讀終端的湧現。所以從現實角度看,我們面對的與其說是格式問題,不如說是格式的轉換和對接問題。

因此,在現有的書稿排版檔案的基礎上選取一種或幾種格式標準進行轉檔,才是眼下需要決策的問題。

2.電子書格式的劃分

內容類電子檔案本來就有多種格式(針對多種不同的字處理或排版軟體),這些格式伴隨著電子書的起步和發展,並隨著閱讀終端的演變和發展,出現了多種格式並存的狀況。有關通用標準還在逐步成熟的過程中,國內這方面更顯落後。所以,這造成了使用中的電子書格式達到100餘種之多。

同時,一些格式還在衍生新的格式,例如亞馬遜kindle的azw格式即是以mobi格式為基礎,再加以修改衍生出來的。

格式雖然繁雜,但我們如果從通用性的角度來看,可以將其簡單地分為以下四類。

第一類:基礎格式。包括xml。

以這種格式為資料基礎,輔助相關工具或方法可以很容易的轉換為其它電子書的格式,其特點為:與具體電子書格式無關,與展現形式無關、與平台、裝置無關,可結構化儲存內容,非專有格式,易於編寫和修改,且具有良好的可擴充套件性和移植性;

第二類:開放/通用格式。包括txt、htm、epub、pdf、djvu等。

具有高普及率和高認知度的格式,同時它的資料介紹方式透明,結構規則公開且可利用,這種格式的標準通常是由官方或國際性標準組織認定和維護的。

第三類:半開放格式。代表性的有方正 cebx。

相對於私有格式而言,這種格式有一定開放性,但是出於商業利益以及對自身智財權的保護等因素,會保留一定的核心技術。同時這種格式專利權、商業使用權都掌握在制定格式的機構手中,第三方的機構很難參與到完善格式的標準制定之中以及推出相關的免費或商業軟體。

第四類:私有格式(專用)。包括亞馬遜的 azw、索尼的bbeb、超星的pdg等。

這類格式必須在某種專用的閱讀器或軟體的支援下方可使用,同時它的資料介紹方式不透明,結構不公開且不可利用,這種格式通常是軟體公司或某個機構為達到輸出控制、版權保護、專利保護的目的而形成的。

3.各類電子書格式的對比

(1)重排效果

對於一本電子書來說,很多時候是要兼顧不同的閱讀終端的,所以電子書的重排效果(即對螢幕尺寸的自適應或稱「流式」)的能力尤為重要。目前閱讀器的尺寸從5寸到10寸屏不等,如果想在各種尺寸的閱讀器上版式保持一致,那麼就需要電子書的格式有很好的自適應性,在字型大小不變的情況下,可以自動隨著螢幕的尺寸重排內容(增加或減少書的頁數),而不是讓讀者手動調整字型大小來閱讀。

目前重排效果比較好且利用率較高的格式是epub。基於流式排版(而非版式排版)的pdf也可以自適應螢幕。掃瞄版的pdf和由排版檔案直接轉檔的pdf重排效果最差。

(2)版式的支援

版式是用來描述書籍的開本、排式、版面、插圖等資訊的,在電子書的排版方式裡可以分為「版式排版」和「流式排版」,它們的側重點不同,如pdf更傾向於版式排版,epub更傾向於流式排版,我們來看看這兩種排版方式的不同之處。

(3)結構的支援

(4)數字版權管理(drm)的支援

drm主要通過技術手段來保護電子書不被非法使用、傳播、拷貝。這項技術通過對數字內容進行加密和附加使用規則對數字內容進行保護,其中,使用規則可以用來判斷使用者是否具有閱讀全文、列印、拷貝等許可權。

pdf、epub等格式在定義標準時,就已經含有版權保護的介面規則,方便使用者,在此基礎上進行版權保護的技術處理。不過目前的平台商基本都是用自己的加密演算法,這就導致了即便格式相同也無法在不同的閱讀器之間通用。例如,a、b兩個**都賣epub格式的電子書,我從a**買的epub書,用b**提供的支援epub格式的閱讀器同樣無法閱讀。

另外,今年(編註:指2023年)2月份epub 3發布的第一出版草案中提到,將會增加互動功能與富**的支援,這意味著將來的電子書會有更豐富的呈現形式。

附:「電子書格式標準的選擇與解決方案」全文概要:

一、電子書格式問題的本質

簡單地說,電子書格式是對使用電子書時的檔案編碼方式、內容組織結構的一種約定。電子書的格式不僅限定了圖書內容的展現形式,更事關圖書內容的儲存和管理。

內容類電子檔案本來就有多種格式(針對多種不同的字處理或排版軟體),這些格式伴隨著電子書的起步和發展,並隨著閱讀終端的演變和發展,出現了多種格式並存的狀況。有關通用標準還在逐步成熟的過程中,國內這方面更顯落後。所以,這造成了使用中的電子書格式達到100餘種之多。

二、格式選擇以及xml及epub的優勢

具體來看,xml和epub是目前的首選。

xml(extensible markup language)即所謂「可擴充套件標記語言」。

epub是基於xml的乙個開放標準,由國際數字出版論壇(idpf)提出。。

三、現存的技術解決方案

方案一:利用軟體轉檔。

方案二:外包給轉檔公司來做。

方案三:基於章節、段落的xml轉檔。

方案四:基於主題的xml轉檔

四、出版社的優選方案

一般而言,少數有實力的大型出版機構可以考慮自行解決格式轉換的技術問題。大多數出版機構,特別是中小出版機構,應優先考慮和使用外包,即和技術服務公司合作解決。

五、數字出版的全流程方案

(一)基於xml的全流程內容資源管理

(二)後期的多渠道發布

epub格式電子書剖析

1 檔案 mimetype 每一本epub電子書均包含乙個名為mimetype的檔案,且內容不變,用以說明epub的檔案格式。檔案內容如下 2 目錄 meta inf 依據ocf規範,meta inf用於存放容器資訊,預設情況下 即加密處理 該目錄包含乙個檔案,即container.xml,檔案內容...

epub電子書格式簡介

epub是國際開放電子圖書聯盟 open ebook forum oebf 於 1999 年推出了用來表示電子圖書的內容 結構的一種開放性規範,旨在統一電子書的格式和提公升電子書的相容性。目前 oebf 已改名為 idpf international digital publishing forum...

epub電子書格式簡介

epub是國際開放電子圖書聯盟 open ebook forum oebf 於 1999 年推出了用來表示電子圖書的內容 結構的一種開放性規範,旨在統一電子書的格式和提公升電子書的相容性。目前 oebf 已改名為 idpf international digital publishing forum...