以前复制一些文档页面的时候用过 wget 命令,很久没用,忘了。
这次学习 Python Win32 类库的时候,需要复制一些 API 文档,重新 Google 了一下,现在做个记录,增强记忆。
复制指定 URL 路径下的所有文件到本地目录 HTML 下。
wget -m -p -k -np -P <HTML> <URL>
解释:
-m
/--mirror
,是-N -r -l inf --no-remove-listing
的缩写,就是复制遇到的每个连接。-N
/--timestamping
只获取比本地文件新的文件-r
/--recursive
递归下载-l
/--level
递归深度,inf 或 0 表示无限递归no-remove-listing
不要删除.listing
文件,不知道干嘛的~
-p
/--page-requisites
,下载页面所需的所有静态资源。-k
/--convert-links
,把连接都指向下载下来的本地静态文件-np
/--no-parent
,限制在指定 URL 路径,不下载超出的链接-P
/--directory-prefix
,文件保存到指定路径下