Python Interneti-juurdepääs Urllib.Requesti ja urlopen() abil

Mis on urllib?

urllib on a Python moodul, mida saab kasutada URL-ide avamiseks. See määratleb funktsioonid ja klassid, mis aitavad URL-i toiminguid teha.

koos Python Samuti saate Internetist juurde pääseda ja hankida andmeid, nagu XML, HTML, JSON jne. Python nende andmetega otse töötamiseks. Selles õpetuses näeme, kuidas saame veebist andmeid hankida. Näiteks kasutasime siin guru99 video URL-i ja pääseme sellele video URL-ile juurde Python samuti printida selle URL-i HTML-fail.

URL-i avamine Urllibi abil

Enne Interneti-andmetega ühenduse loomiseks koodi käivitamist peame importima URL-i teegi mooduli või „urllib” avalduse.

Ava URL Urllibi abil

  • Import urllib
  • Määratlege oma põhifunktsioon
  • Deklareerige muutuja webUrl
  • Seejärel kutsuge URL-i lib teegis funktsioon urlopen
  • Avatav URL on guru99 õpetus YouTube'is
  • Järgmisena trükime tulemuse koodi
  • Tulemuse kood hangitakse, kutsudes meie loodud muutuja webUrl funktsiooni getcode
  • Teisendame selle stringiks, et seda saaks ühendada meie stringi "tulemuse koodiga"
  • See on tavaline HTTP-kood “200”, mis näitab, et http-päringu töötlemine õnnestus

Kuidas hankida HTML-faili vormi URL Python

HTML-faili saate lugeda ka funktsiooni "lugemine" abil Python, ja koodi käivitamisel kuvatakse konsoolis HTML-fail.

HTML-faili vormi URL sisse Python

  • Kutsuge WebURL-i muutuja lugemisfunktsiooni
  • Lugemismuutuja võimaldab lugeda andmefailide sisu
  • Lugege kogu URL-i sisu muutujaks nimega andmed
  • Käivitage kood – see prindib andmed HTML-vormingusse

Siin on täielik kood

Python 2 Näide

#  
# read the data from the URL and print it
#
import urllib2

def main():
# open a connection to a URL using urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
  
#get the result code and print it
   print "result code: " + str(webUrl.getcode()) 
  
# read the data from the URL and print it
   data = webUrl.read()
   print data
 
if __name__ == "__main__":
  main()

Python 3 Näide

#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl  = urllib.request.urlopen('https://www.youtube.com/user/guru99com')

#get the result code and print it
print ("result code: " + str(webUrl.getcode()))

# read the data from the URL and print it
data = webUrl.read()
print (data)

Võta see postitus kokku järgmiselt: