logo

Comando Wget en Linux/Unix

Wget es el descargador de red no interactivo que se utiliza para descargar archivos del servidor incluso cuando el usuario no ha iniciado sesión en el sistema y puede funcionar en segundo plano sin obstaculizar el proceso actual.

  • GNU wget es una utilidad gratuita para la descarga no interactiva de archivos de la Web. Admite los protocolos HTTP, HTTPS y FTP, así como la recuperación a través de servidores proxy HTTP.
  • wget no es interactivo, lo que significa que puede funcionar en segundo plano, mientras el usuario no haya iniciado sesión. Esto le permite iniciar una recuperación y desconectarse del sistema, permitiendo que wget termine el trabajo. Por el contrario, la mayoría de los navegadores web requieren la presencia constante del usuario, lo que puede suponer un gran obstáculo a la hora de transferir una gran cantidad de datos.
  • wget puede seguir enlaces en páginas HTML y XHTML y crear versiones locales de sitios web remotos, recreando completamente la estructura de directorios del sitio original. A esto a veces se le llama descarga recursiva. Al hacerlo, wget respeta el Estándar de exclusión de robots (/robots.txt). Se puede indicar a wget que convierta los enlaces de los archivos HTML descargados a archivos locales para verlos sin conexión.
  • wget ha sido diseñado para ser robusto en conexiones de red lentas o inestables; Si una descarga falla debido a un problema de red, seguirá intentándolo hasta que se haya recuperado todo el archivo. Si el servidor admite la reanudación, le indicará que continúe la descarga desde donde la dejó.

Sintaxis básica:

La sintaxis básica del comando Wget es la siguiente:



wget [option] [URL]>

Aquí

[options]> representa varias opciones de línea de comandos que modifican el comportamiento de Wget

[URL]> es la dirección del archivo o sitio web que se va a descargar.



Opciones:

Estas son las opciones disponibles en el comando wget en Linux.

lista de programas de Python
Opción Descripción Sintaxis
-v / –versión Muestra la versión de Wget instalada en tu sistema. $ wget-v
-h / –ayuda Imprima un mensaje de ayuda que muestre todas las opciones de línea de comandos disponibles para Wget. $ wget -h [URL]
-o archivo de registro Dirija todos los mensajes generados por el sistema al archivo de registro especificado. Si no se especifica ningún archivo de registro, los mensajes se redirigen al archivo de registro predeterminado ('wget-log'). $ wget -o archivo de registro [URL]
-b / –fondo Envíe el proceso a un segundo plano tan pronto como comience, permitiendo que otros procesos continúen. Si no se especifica ningún archivo de salida, la salida se redirige a 'wget-log' de forma predeterminada. $ wget-b [URL]
-a Agregue mensajes de salida al archivo de registro de salida actual sin sobrescribirlo. Esto conserva el registro de comandos anteriores, con el registro actual adjunto después de ellos. $ wget -un archivo de registro [URL]
-i Leer URL de un archivo. Si se especifica como archivo, las URL se leen desde la entrada estándar. Si las URL están presentes tanto en la línea de comando como en el archivo de entrada, las de la línea de comando tienen prioridad. No es necesario que el archivo sea un documento HTML. $ wget -i archivo de entrada
$ wget -i archivo de entrada [URL]
-t número / –tries=número Establezca el número de reintentos. Especifique '0' o 'inf' para reintentos infinitos. El valor predeterminado es 20 reintentos, con excepciones para errores fatales como rechazo de conexión o enlace no encontrado. $ wget -t número [URL]
-C Reanudar un archivo parcialmente descargado si el archivo admite la reanudación. Si no se admite la reanudación, no se podrá reanudar la descarga. $wget-c[URL]
-En Configure el sistema para que espere la cantidad especificada de segundos entre recuperaciones. Esta opción ayuda a reducir la carga del servidor al espaciar las solicitudes. El tiempo se puede especificar en segundos, minutos (m), horas (h) o días (d). $ wget -w número_en_segundos [URL]
-r Habilite la recuperación recursiva de enlaces específicos, incluso en caso de errores fatales. Esta opción sigue de forma recursiva enlaces dentro de la URL dada. $ wget -r [URL]

Ejemplo :

1. Para simplemente descargar una página web:

Para descargar un solo archivo desde una URL, simplemente especifique la URL de la siguiente manera:

wget http://example.com/sample.php>

2. Para descargar el archivo en segundo plano.

Ejecute el proceso de descarga en segundo plano usando el-b>o--background>opción:



wget -b http://www.example.com/samplepage.php>

3. Para sobrescribir el registro mientras se ejecuta el comando wget

Redirigir los mensajes de salida a un archivo de registro usando el-o>opción:

wget http://www.example.com/filename.txt -o /path/filename.txt>

4. Para reanudar un archivo parcialmente descargado

Si se interrumpe una descarga, reanúdela usando el-c>opción:

wget -c http://example.com/samplefile.tar.gz>

5. Intentar un número determinado de veces

Especifique el número de reintentos utilizando el--tries>opción:

wget --tries=10 http://example.com/samplefile.tar.gz>

6. Establecer el tiempo de espera entre recuperaciones:

Establezca el tiempo de espera entre recuperaciones usando el-w>opción (en segundos, minutos, horas o días):

wget -w 10 http://example.com/large_file.zip>

7. Habilite la recuperación recursiva:

Habilite la recuperación recursiva para descargar un sitio web completo utilizando el-r>opción:

wget -r http://example.com/>

8. Leer las URL del archivo:

Lea las URL de un archivo y descárguelas usando el-i>opción:

wget -i urls.txt>

Comando Wget – Preguntas frecuentes

¿Para qué se utiliza el comando wget?

El comando wget es una potente herramienta de línea de comandos que se utiliza en sistemas basados ​​en Linux y Unix para recuperar archivos de Internet a través de los protocolos HTTP, HTTPS y FTP. Es particularmente útil para descargas no interactivas, sitios web reflejados y descargas recursivas.

convertir caracteres en cadenas

¿Cómo se descarga un archivo usando wget?

Para descargar un solo archivo usando wget, simplemente ejecute el comando seguido de la URL del archivo que desea descargar.

Por ejemplo:

wget https://example.com/file.zip>

¿Cómo puedo descargar un sitio web completo usando wget?

Para descargar un sitio web completo de forma recursiva, utilice el-m>o--mirror>opción junto con el-p>o--page-requisites>opción para descargar todos los archivos necesarios.

para bucle en c

Por ejemplo:

wget -m -p https://example.com>

¿Cómo limito la velocidad de descarga o el ancho de banda cuando uso wget?

Puedes usar el--limit-rate>opción para limitar la velocidad de descarga o el uso del ancho de banda.

Por ejemplo: para limitar la velocidad de descarga a 500 KB/s, puede ejecutar:

wget --limit-rate=500k https://example.com/file.zip>

¿Cómo puedo continuar una descarga interrumpida usando wget?

Si se interrumpe una descarga, puede utilizar el-c>o--continue>opción para reanudar la descarga desde donde se quedó.

Por ejemplo:

wget -c https://example.com/file.zip>

Conclusión

En este artículo analizamos el comando Wget, que es una herramienta útil en Linux para descargar archivos de Internet sin necesidad de interacción del usuario. Funciona silenciosamente en segundo plano, lo que significa que puedes iniciar una descarga y hacer otras cosas mientras funciona. Wget puede manejar varios tipos de direcciones web e incluso copiar sitios web completos. Es útil para conexiones a Internet lentas o poco confiables porque sigue intentando descargar hasta que lo logra. Además, ofrece funciones útiles como reanudar descargas interrumpidas y establecer tiempos de espera entre recuperaciones. Al aprender sus comandos y opciones simples, los usuarios pueden administrar eficientemente sus descargas y ahorrar tiempo.