Efetuar download de um site inteiro

image_pdfimage_print

Para efetuar o download de um site completo, utilizando o comando wget, basta:

wget -e robots=off -c --recursive --no-clobber --page-requisites --html-extension --convert-links --domains <DOMINIO ALVO> --no-parent 'http://<SITE DESEJADO AQUI>/<PONTO DE PARTIDA>/'

Este comando efetua o download de todo o website http://SITE_DESEJADO/PONTO_DE_PARTIDA/. .

As opções do comando wget utilizadas foram:

  • –recursice: segue os links buscando efetuar download de todos do website
  • domains: Não seguirá links para fora do domínio informado
  • –no-clobber: Não sobreescreverá qualquer arquivo existente. Será utilizado em caso de download interrompido e continuado posterior.
  • –no-parent: Não seguirá links fora do diretório de .
  • –page-requisites: Obtém todos os elementos que compõe uma página (css, js, images, etc)
  • –convert-links: Modifica os links existentes para funcionarem localmente e apontando somente para os arquivos locais e não os correspondentes no servidor copiado.
  • –html-extension: Efetua o salvamento dos arquivos com conteúdo html com a extensão .html, removendo os .php, .jsp, .asp, etc.
Gostou? Tire um minutinho e dê sua contribuição para Drall Dev Community no Patreon!