欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

详解Linux系统中wget的使用方法

程序员文章站 2024-01-01 15:48:22
这篇文章主要介绍了详解Linux系统中wget的使用方法,文中详细讲解了操作wget的命令的常用参数,需要的朋友可以参考下... 15-07-07...

功能说明: wget使用 http 和 ftp 协议,支持代理服务器和断点续传,是基于控制台最强大的下载工具。
命令格式: wget [参数] <url>
常用参数:
1. 启动选项:
-v : 显示 wget 的版本
-h : 显示 wget 的使用说明
-b : 启动之后转入后台执行,日志文件写在当前目录下”wget-log”文件中
-e <command> : 执行一个 .wgetrc 里面的 <command> 指令
2. 日志文件与输入文件选项:
-o <file> : 将命令的输出写入指定的 <file> 文件
-a <file> : 将命令的输出以追加方式写入指定的 <file> 文件
-d : 显示调试信息
-q : 以安静模式执行(无输出)
-v : 输出详细信息
-nv : 关闭详细信息输出,但不是安静模式
-i <file> : 从指定的 <file> 文件中读取 url
-f : 把输入文件视为 html 文件(与 -i 参数同时使用)
-b <url> : 与 -f 一同使用,优先考虑 -i 所指定文件中的 url
3. 下载选项:
-t <number> : 当wget无法与服务器建立连接时,尝试连接<number>次,(0表示无限制)
-o <file> : 将下载的文件保存为指定的 <file>
-nc : 不覆盖已有的文件
-c : 续传文件
-n : 不取回比本地旧的文件,只下载更新的文件
-s : 显示服务器响应
-t <seconds> : 设定响应超时的秒数为 <seconds>
-w <seconds> : 在两次尝试之间等待 <seconds> 秒
-y : 通过代理服务器进行连接
-q <quota> : 限制下载文件的总大小最多不能超过 <quota>,单位为字节,可以使用 k,m 后缀
––limit-rate=<rate> : 限定下载传输率,单位为字节,可以使用 k,m 后缀
4. 目录选项:
-nd : 不下载目录结构,把从服务器所有指定目录下载的文件都堆到当前目录里
-x : 创建与远程完全一直的目录结构
-nh : 不创建以目标主机域名为目录名的目录,将目标主机的目录结构直接下到当前目录下
-p <prefix> : 将文件保存到目录 prefix/…
––cut-dirs=<number> : 忽略 <number> 层远程目录
5. http 选项:
––http-user=<user> : 指定 http 用户验证的用户
––http-passwd=<pass> : 指定 http 用户验证的用户口令
––no-cache : 禁用服务器端的数据缓存 (默认情况下为允许)

-c, –cache=on/off 允许/不允许服务器端的数据缓存 (一般情况下允许).
-e, –html-extension 将所有text/html文档以.html扩展名保存
–ignore-length 忽略 `content-length'头域
–header=string 在headers中插入字符串 string
––proxy-user=<user> : 指定 proxy 使用者为 <user>
––proxy-passwd=<pass> : 指定 proxy 使用者口令为 <pass>
-e : 将所有类型为 application/xhtml+xml 或 text/html 的文档以 .html 扩展名保存
-u <agent> : 设定代理的名称为 <agent> 而不是 wget/version

–referer=url 在http请求中包含 `referer: url'头
-s, –save-headers 保存http头到文件
-u, –user-agent=agent 设定代理的名称为 agent而不是 wget/version.
–no-http-keep-alive 关闭 http活动链接 (永远链接).
–cookies=off 不使用 cookies.
--load-cookies=file 在开始会话前从文件 file中加载cookie
–save-cookies=file 在会话结束后将 cookies保存到 file文件
6. ftp 选项:
––ftp-user=<user> : 指定 ftp 用户
––ftp-passwd=<pass> : 指定 ftp 用户口令
––no-remove-listing : 不移除临时的 .listing 文件
––no-glob : 关闭文件名的 globbing 机制(即不使用通配符)

–passive-ftp 使用被动传输模式 (缺省值).
–active-ftp 使用主动传输模式
––no-passive-ftp : 关闭默认的被动传输模式(即使用主动传输模式)
––retr-symlinks : 在递归时,将链接指向文件(而不是目录)
7. 使用递回方式获取选项:
-r : 打开递归下载
-l <number> : 指定最大递归深度为 <number> (inf 或 0 代表无穷)
––delete-after : 删除下载完毕的本地文件
-k : 转换非相对链接为相对链接

-k  (大写), –backup-converted 在转换文件x之前,将之备份为 x.orig
-m : 开启适合用来镜像的选项,等价于 -n -r -l inf ––no-remove-listing
-p : 用以确保所有用于显示被下载网页的元素都被下载,如:图像,声音以及网页中用到的样式表
8. 递回方式的允许与拒绝选项:
-a <list> : 在 <list> 指定允许下载的扩展文件名(用逗号间隔)
-r <list> : 在 <list> 指定禁止下载的扩展文件名(用逗号间隔)
-d <list> : 在 <list> 指定允许下载的域名
––exclude-domains=<list> : 在 <list> 指定禁止下载的域名
––follow-ftp : 跟踪 html 文档中的 ftp 链接
––follow-tags=<list> : 在 <list> 中指定用逗号分隔的被跟踪的html标签列表
––ignore-tags=<list> : 在 <list> 中指定用逗号分隔的不被跟踪的html标签列表

-g, –ignore-tags=list 分号分隔的被忽略的html标签的列表
-h : 当递归时转到外部主机
-l : 仅仅跟踪相对链接
-i <list> : 在 <list> 指定允许下载的目录列表
-x <list> : 在 <list> 指定禁止下载的目录列表
-np : 不要追溯到父目录,即只下载目标站点指定目录及其子目录的内容

上一篇:

下一篇: