利用GZIP壓縮網頁相關知識

2021-06-10 07:44:22 字數 1366 閱讀 2279

**的訪問速度是由多個因素所共同決定的,這些因素例如應用程式的響應速度、網路頻寬、伺服器效能、與客戶端之間的網路傳輸速度等等。其中最重要的乙個因素是應用程式本身的響應速度,因此當你為**效能所苦惱時,你第乙個需要著手進行處理的便是盡可能的提公升應用程式的執行速度,你可以使用快取或者是優化**的執行效率來提公升應用程式的速度。

網頁壓縮是一項由 web 伺服器和瀏覽器之間共同遵守的協議,也就是說 web 伺服器和瀏覽器都必須支援該技術,所幸的是現在流行的瀏覽器都是支援的,包括 ie、firefox、opera 等;伺服器有 apache 和 iis 等。

什麼是gzip?gzip是gnu zip的縮寫,它是乙個gnu自由軟體的檔案壓縮程式。最早由jean-loup gailly和mark adler建立,用於unix系統的檔案壓縮。我們在linux中經常會用到字尾為.gz的檔案,它們就是gzip格式的。現今已經成為internet上使用非常普遍的一種資料壓縮格式,或者說一種檔案格式。http協議上的gzip編碼是一種用來改進web應用程式效能的技術。大流量的web站點常常使用gzip壓縮技術來讓使用者感受更快的速度。這一般是指www伺服器中安裝的乙個功能,當有人來訪問這個伺服器中的**時,伺服器中的這個功能就將網頁內容壓縮後傳輸到來訪的電腦瀏覽器中顯示出來。一般對純文字內容可壓縮到原大小的40%。

gzip開啟後有什麼好處?開啟gzip後會在網頁資料傳輸之前,先使用gzip壓縮後再傳輸給客戶端,客戶端接收之後由瀏覽器解壓顯示。這樣就會減小通過網路傳輸的資料量,提高瀏覽的速度。

gzip web壓縮工作原理web伺服器處理http壓縮的過程如下: 1. web伺服器接收到瀏覽器的http請求後,檢查瀏覽器是否支援http壓縮(accept-encoding 資訊); 2. 如果瀏覽器支援http壓縮,web伺服器檢查請求檔案的字尾名; 3. 如果請求檔案是html、css等靜態檔案,web伺服器到壓縮緩衝目錄中檢查是否已經存在請求檔案的最新壓縮檔案; 4. 如果請求檔案的壓縮檔案不存在,web伺服器向瀏覽器返回未壓縮的請求檔案,並在壓縮緩衝目錄中存放請求檔案的壓縮檔案; 5. 如果請求檔案的最新壓縮檔案已經存在,則直接返回請求檔案的壓縮檔案; 6. 如果請求檔案是動態檔案,web伺服器動態壓縮內容並返回瀏覽器,壓縮內容不存放到壓縮快取目錄中。

下面是兩個演示圖:

未使用壓縮請求響應流程

使用壓縮請求響應流程

不同的web伺服器都可通過配置實現gzip壓縮.

apache 開啟Gzip網頁壓縮

下面就是就是要講解如何開啟gzip壓縮 例項環境 伺服器 centos6.5 apche 2.2.15 gzip壓縮需要 deflate module和headers module的支援 系統預設就是開啟的 需要做的是在httpd.conf配置項新增規則 root iz28qa8jt4uz conf...

配置Httpd的gzip壓縮網頁

1.開啟firefox瀏覽器的開發工具 2.配置httpd的gzip壓縮頁面 在errorlog logs error log 的後面新增配置 檢查配置檔案是否錯誤 配置後要重啟httpd服務 引數名稱 引數說明 setoutputfilter deflate 啟動gzip壓縮功能 deflatec...

解析網頁抓取所得gzip壓縮資料

在進行網頁資料抓取時,會遇到壓縮資料,可能主要出於如下考慮 簡單的防抓取方法 沒有經過分析就對抓取的網頁內容直接進行文字解析,肯定會遇到問題,就像我開始的時候一樣。壓縮資料減少流量 這個一般用於提供資料介面,將資料壓縮後可以大大減少流量 以下提供對抓取資料的處理方法 檢測反饋內容是否壓縮,並對壓縮內...