我想下载带有 wget
的
网站的所有页面(带有嵌套链接)。我尝试了以下命令:
wget --reject php,xml --exclude-domains https://motamem.org/wp-content/plugins/ProProfile/ajax/upme-get-avatar.php?email=' + new_user_email,https://motamem.org/wp-admin/admin-ajax.php,https://wprp.sovrn.com/static/,https:\/\/motamem.org\/wp-admin\/admin-ajax.php,https://motamem.org/xmlrpc.php,https://motamem.org/feed/,https://motamem.org/wp-includes/wlwmanifest.xml,https://motamem.org/xmlrpc.php?rsd,https://motamem.org/wp-json/ -U "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36" -mkEpnp -l10 -e robots=off --page-requisites --html-extension --adjust-extension --convert-links https://motamem.org/
但有这些问题:
index.html
。-mkEpnp
选项,但链接不是相对的。我没能用 wget 下载 PHP(实际上是 Wordpress)网站,但我有幸使用 httrack,例如在 Ubuntu 上:
sudo apt install httrack
httrack 'your website here'
尝试这个命令,我们可以轻松地从 WordPress 下载所有文件。
wget --mirror --page-requisites --convert-link --no-clobber --no-parent --domains yoursite.com https://yoursite.com/
尝试
wget \
-r \
--mirror \
--page-requisites \
--convert-links \
--span-hosts \
-U mozilla \
-F \
http://example.com