Esas cosas por las que uno ama Linux. Encontré este post en DiarioLinux que me pareció genial.
$ wget --spider --no-parent -r -o log.txt http://tuweb.com
–spider : recorrer la web que le digas, pero SIN descargar nada. Sólo recorrerla.
- r : recursivo, como si fuera el robotito de Google ![]()
- o fichero : la salida de ejecutar el comando que salga por pantalla
–no-parent : si le pasamos como parámetro un nombre de directorio, no queremos que suba hacia los directorios padre.
La lista de enlaces rotos estará en log.txt (parte final)
Tomado de DiarioLinux.
Y agrego otro muy útil. Cómo descargar todos los contenidos de un sitio FTP con wget.
wget -r -q -b -P /home/myuser/destination ftp://mydomain.com --ftp-user=myuser --ftp-password=mypass
Parámetros:
-r: recursivo
-q: quiet/silencioso, no imprime mensajes en la consola
-b: background, para que se ejecute en background y nos devuelva el prompt.
-P: directorio donde queremos que se guarde todo lo que bajamos
–ftp-user=: usuario FTP
–ftp-password=: password FTP

0 Comentarios.