使用 wget 复制站点

以前复制一些文档页面的时候用过 wget 命令,很久没用,忘了。

这次学习 Python Win32 类库的时候,需要复制一些 API 文档,重新 Google 了一下,现在做个记录,增强记忆。

复制指定 URL 路径下的所有文件到本地目录 HTML 下。

wget -m -p -k -np -P <HTML> <URL>

解释:

  • -m/--mirror,是 -N -r -l inf --no-remove-listing 的缩写,就是复制遇到的每个连接。
    • -N/--timestamping 只获取比本地文件新的文件
    • -r/--recursive 递归下载
    • -l/--level 递归深度,inf 或 0 表示无限递归
    • no-remove-listing 不要删除 .listing 文件,不知道干嘛的~
  • -p/--page-requisites,下载页面所需的所有静态资源。
  • -k/--convert-links,把连接都指向下载下来的本地静态文件
  • -np/--no-parent,限制在指定 URL 路径,不下载超出的链接
  • -P/--directory-prefix,文件保存到指定路径下