Para efetuar o download de um site completo, utilizando o comando wget, basta:
wget -e robots=off -c --recursive --no-clobber --page-requisites --html-extension --convert-links --domains <DOMINIO ALVO> --no-parent 'http://<SITE DESEJADO AQUI>/<PONTO DE PARTIDA>/'
Este comando efetua o download de todo o website http://SITE_DESEJADO/PONTO_DE_PARTIDA/. .
As opções do comando wget utilizadas foram:
- –recursice: segue os links buscando efetuar download de todos do website
- domains: Não seguirá links para fora do domínio informado
- –no-clobber: Não sobreescreverá qualquer arquivo existente. Será utilizado em caso de download interrompido e continuado posterior.
- –no-parent: Não seguirá links fora do diretório de .
- –page-requisites: Obtém todos os elementos que compõe uma página (css, js, images, etc)
- –convert-links: Modifica os links existentes para funcionarem localmente e apontando somente para os arquivos locais e não os correspondentes no servidor copiado.
- –html-extension: Efetua o salvamento dos arquivos com conteúdo html com a extensão .html, removendo os .php, .jsp, .asp, etc.