É muito simples obter todo o conteúdo de uma dada página de internet.
Para tanto, basta:
$wget -cr “http://<url>”
E todo o conteúdo recusivamente será obtido e salvo no diretório corrente. É muito simples obter todo o conteúdo de uma dada página de internet.