wget 抓取整站

2022-08-29 08:54:11 字數 461 閱讀 7960

wget -r -p -np -k
-r  遞迴

-p, --page-requisites(頁面必需元素)

-np, --no-parent(不追溯至父級)

找了幾個wget技巧,發一下。

$ wget -r -np -nd 

的作用是不遍歷父目錄,-nd 表示不在本機重新建立目錄結構。

$ wget -r -np -nd --accept=iso

目錄中所有擴充套件名為 iso 的檔案。你也可以指定多個副檔名,只需用逗號分隔即可。

$ wget -i filename.txt

$ wget -c

這裡所指定的 -c 選項的作用為斷點續傳。

$ wget -m -k (-h)

那麼可以使用 -h 選項

Linux命令之wget 抓取整站

wget r p np k r 遞迴 p,page requisites 頁面必需元素 np,no parent 不追溯至父級 找了幾個wget技巧,發一下。wget r np nd packages 的作用是不遍歷父目錄,nd 表示不在本機重新建立目錄結構。wget r np nd accept ...

Linux命令之wget 抓取整站

wget r p np k r 遞迴 p,page requisites 頁面必需元素 np,no parent 不追溯至父級 找了幾個wget技巧,發一下。wget r np nd packages 的作用是不遍歷父目錄,nd 表示不在本機重新建立目錄結構。wget r np nd accept ...

使用wget抓取網頁

使用wget的mirror選項可以實現整個 的映象抓取。語法是 wget mirror w html extension convert links p path 有點長 事實上,可以通過別名來簡化這個操作,在.bash profile下新增如下語句 alias webdup2 wget mirro...