Obtener listado de link rotos con wget

Esas cosas por las que uno ama Linux. Encontré este post en DiarioLinux que me pareció genial.

$  wget --spider  --no-parent -r -o log.txt http://tuweb.com


Parámetros:

–spider : recorrer la web que le digas, pero SIN descargar nada. Sólo recorrerla.
- r : recursivo, como si fuera el robotito de Google :-)
- o fichero : la salida de ejecutar el comando que salga por pantalla
–no-parent : si le pasamos como parámetro un nombre de directorio, no queremos que suba hacia los directorios padre.

La lista de enlaces rotos estará en log.txt (parte final)

Tomado de DiarioLinux.

Y agrego otro muy útil. Cómo descargar todos los contenidos de un sitio FTP con wget.

wget -r -q -b -P /home/myuser/destination ftp://mydomain.com --ftp-user=myuser --ftp-password=mypass

Parámetros:

-r: recursivo
-q: quiet/silencioso, no imprime mensajes en la consola
-b: background, para que se ejecute en background y nos devuelva el prompt.
-P: directorio donde queremos que se guarde todo lo que bajamos
–ftp-user=: usuario FTP
–ftp-password=: password FTP

Bookmark and Share
Comentar

0 Comentarios.

Comentar


[ Ctrl + Enter ]