Python Acceso a Internet mediante Urllib.Request y urlopen()

ยฟQuรฉ es urllib?

urllib es un Python mรณdulo que se puede utilizar para abrir URL. Define funciones y clases para ayudar en las acciones de URL.

Con Python Tambiรฉn puede acceder y recuperar datos de Internet como XML, HTML, JSON, etc. Tambiรฉn puede utilizar Python para trabajar con estos datos directamente. En este tutorial vamos a ver cรณmo podemos recuperar datos de la web. Por ejemplo, aquรญ usamos una URL de video de guru99 y vamos a acceder a esta URL de video usando Python asรญ como imprimir el archivo HTML de esta URL.

Cรณmo abrir una URL usando Urllib

Antes de ejecutar el cรณdigo para conectarnos a los datos de Internet, necesitamos importar la declaraciรณn para el mรณdulo de biblioteca de URL o "urllib".

Abrir URL usando Urllib

  • Importar URLlib
  • Define tu funciรณn principal
  • Declarar la variable webUrl
  • Luego llame a la funciรณn urlopen en la biblioteca URL lib
  • La URL que estamos abriendo es tutorial de guru99 en youtube
  • A continuaciรณn, vamos a imprimir el cรณdigo de resultado.
  • El cรณdigo de resultado se recupera llamando a la funciรณn getcode en la variable webUrl que hemos creado.
  • Vamos a convertir eso en una cadena, para que pueda concatenarse con nuestra cadena "cรณdigo de resultado".
  • Este serรก un cรณdigo HTTP normal "200", que indica que la solicitud http se procesรณ correctamente

Cรณmo obtener la URL del formulario de un archivo HTML en Python

Tambiรฉn puede leer el archivo HTML utilizando la โ€œfunciรณn de lecturaโ€ en Python, y cuando ejecute el cรณdigo, el archivo HTML aparecerรก en la consola.

URL del formulario del archivo HTML en Python

  • Llame a la funciรณn de lectura en la variable webURL
  • La variable de lectura permite leer el contenido de los archivos de datos.
  • Leer todo el contenido de la URL en una variable llamada datos
  • Ejecute el cรณdigo: imprimirรก los datos en formato HTML.

Aquรญ estรก el cรณdigo completo

Python 2 Ejemplo

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Ejemplo

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)

Resumir este post con: