Python Internet hozzáférés az Urllib.Request és az urlopen() használatával

Mi az urllib?

urllib egy Python URL-ek megnyitására használható modul. Funkciókat és osztályokat határoz meg, amelyek segítenek az URL-műveletekben.

A Python adatokat is elérhet és lekérhet az internetről, például XML, HTML, JSON stb. Python hogy közvetlenül dolgozzon ezekkel az adatokkal. Ebben az oktatóanyagban azt fogjuk látni, hogyan kérhetünk le adatokat az internetről. Például itt egy guru99 videó URL-t használtunk, és ehhez a videó URL-hez fogunk hozzáférni Python valamint kinyomtathatja ennek az URL-nek a HTML-fájlját.

Hogyan lehet megnyitni az URL-t az Urllib használatával

Mielőtt futtatnánk a kódot az internetes adatokhoz való csatlakozáshoz, importálni kell az URL könyvtár modul vagy az „urllib” utasítást.

Nyissa meg az URL-t az Urllib használatával

  • urllib importálása
  • Határozza meg fő funkcióját
  • Deklarálja a webUrl változót
  • Ezután hívja meg az urlopen függvényt az URL lib könyvtárban
  • A megnyitott URL a guru99 oktatóanyag a YouTube-on
  • Ezután kinyomtatjuk az eredménykódot
  • Az eredménykód lekérése az általunk létrehozott webUrl változó getcode függvényének meghívásával történik
  • Ezt stringgé alakítjuk, hogy össze lehessen fűzni a karakterláncunk „eredménykódjával”
  • Ez egy szokásos HTTP-kód „200”, jelezve, hogy a http-kérés sikeresen feldolgozott

A HTML-fájl űrlap URL-címének bekérése Python

A HTML-fájlt az „olvasási funkció” használatával is olvashatja Python, és a kód futtatásakor a HTML-fájl megjelenik a konzolban.

HTML-fájl űrlap URL-je be Python

  • Hívja meg a read függvényt a webURL változóban
  • Az olvasási változó lehetővé teszi az adatfájlok tartalmának olvasását
  • Olvassa be az URL teljes tartalmát egy adat nevű változóba
  • Futtassa a kódot – HTML formátumba nyomtatja az adatokat

Itt a teljes kód

Python 2 Példa

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Példa

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)

Foglald össze ezt a bejegyzést a következőképpen: