home

Love life, love sports, love to learn, & love...

Blog

Thought,  done  &  record.

订阅到QQ邮箱 google reader google reader

Wget基本用法

Wget 是一个非交互式(即无图形交互界面)的自由网络下载工具,支持通过 HTTP、HTTPS、FTP 三个最常见的 TCP/IP 协议下载,并可以使用 HTTP 代理。可以说 wget 是网络下载工具的最佳选择,因为它可以处理几乎任何复杂的下载任务。

基本语法为:

$ wget [option]... [URL]...

下载单个文件

直接在 wget 命令之后加上文件的下载地址即可。用法:

$ wget <URL>

比如:

$ wget http://www.example.com/example.tar.bz2

断点续传下载

有时候由于网速限制或者文件太大无法一次性下载完成,此时如果利用的还是普通单个文件下载方式,则每次都需要从新下载整个文件,严重浪费下载时间,因此,可以开启断点续传模式,从而继续完成未完成的下载任务。用法:

$ wget -c <URL>

下载整个网站

方法一:

$ wget --mirror -p --convert-links -P ./LOCAL-DIR WEBSITE-URL
  • –-mirror(-m):开启镜像下载模式,进行递归下载。与以下选项组合等效:-r -N -l inf --no-remove-listing。
  • -p(--page-requisites):下载为使HTML文件能正常完整显示的必要文件,比如行内图片、声音以及参考样式表等。
  • --convert-links(-k):将下载的网页里的链接修改为本地链接,以便正常访问或浏览。
  • -P ./LOCAL-DIR:将所下载的所有文件或目录都存放到指定目录中。

方法二:

$ wget -r -p -k -np WEBSITE-URL
  • -r:递归下载,会下载所有的链接,不过要注意的是,不要单独使用这个参数,因为如果你要下载的网站也有别的网站的链接,wget 也会把别的网站的东西下载下来,由于互联网的特性,很有可能你会把整个互联网给下载下来,所以要加上 -np 这个参数,表示不下载别的站点的链接。
  • -np(--no-parent):递归下载时不要下载完站之外的文件。

下载多个文件

首先需要建立一份下载任务列表,将需要下载的所有文件的下载地址依次列出:

$ cat > download-file-list.txt
url1
url2
url3
...

然后利用 -i 选项将下载任务列表文件作为参数传递给 wget:

$ wget -i download-file-list.txt
回顶部