Archivo para la Etiqueta ‘wget’
Usando el Comando wget
Después de no sé cuanto tiempo, pero ya estoy de vuelta por acá, disculpas por tanta espera por lo usuarios que estaban comenzando a visitar el sitio.
Revisando entre mis feeds me encuentro con este artículo en Muy Linux, basándose de Jam’s Ubuntu, sobre la utilización del comando wget pareciendome muy intersante por lo que describo algunos de sus usos.
Para poder descargar un archivo desde Internet:
wget http://www.sitioweb.com/archivo_a_descargar.zip
Cuando estas descargando un archivo cuyo tamaño es considerable, puedes utilizar wget junto con el parámetro -c de la siguiente manera:
wget -c http://www.sitioweb.com/archivo_grande.zip
El parámetro -c permite que la descarga del archivo continue aún cuando se presente alguna interrupción.
Existen sitios Web de los cuales no puedes descargar algún archivo con un administrador de descargas, entonces puedes utilizar :
wget -U mozilla http://www.sitioweb.com/
Con lo anterior, se hace pasar wget como si fuera un navegador convencional.
Para descargar una página Web completa, recurre a lo siguiente:
wget -r -p http://www.sitioweb.com
El parámetro -p permite incluir todos los archivos de la página hasta las imagenes de la misma para que al hacer uso del archivo parezca como si en realidad se estuviera accediendo a la página vía online.
Inclusive se puede apagar el archivo robots.txt de la siguiente manera:
wget -r -p -e robots=off http://www.sitioweb.com
Y como no todo puede ser miel sobre hojuelas, no todas las páginas podrás descargartelas completas pero para esto cuentas con:
wget -r -p -e robots=off -U mozilla http://www.sitioweb.com
Pero si aún así no puedes con una página y esto suele ocurrir porque no a todos los administradores les agrada la idea de que sus paginas sean descargadas de manera masiva por lo que llegan a poner un limite a esto, pero como siempre hay una alternativa puedes hacer lo siguiente:
wget –wait=X -r -p -e robots=off -U mozilla http://www.sitioweb.com
Donde X es el número en segundos para la espera de la descarga, inclusive se puede realziar esto con un intervalo de manera aleatorio colocando el parámetro –random-wait
Pues bien, espero y les sirva aún más este comando de los más potentes con los que se pueden contar a la hora de trabajar en la consola.
Visto en: Jam’s Ubuntu
Dejar un comentario