Python Interneti-juurdepääs Urllib.Requesti ja urlopen() abil
Mis on urllib?
urllib on a Python moodul, mida saab kasutada URL-ide avamiseks. See määratleb funktsioonid ja klassid, mis aitavad URL-i toiminguid teha.
koos Python Samuti saate Internetist juurde pääseda ja hankida andmeid, nagu XML, HTML, JSON jne. Python nende andmetega otse töötamiseks. Selles õpetuses näeme, kuidas saame veebist andmeid hankida. Näiteks kasutasime siin guru99 video URL-i ja pääseme sellele video URL-ile juurde Python samuti printida selle URL-i HTML-fail.
URL-i avamine Urllibi abil
Enne Interneti-andmetega ühenduse loomiseks koodi käivitamist peame importima URL-i teegi mooduli või „urllib” avalduse.
- Import urllib
- Määratlege oma põhifunktsioon
- Deklareerige muutuja webUrl
- Seejärel kutsuge URL-i lib teegis funktsioon urlopen
- Avatav URL on guru99 õpetus YouTube'is
- Järgmisena trükime tulemuse koodi
- Tulemuse kood hangitakse, kutsudes meie loodud muutuja webUrl funktsiooni getcode
- Teisendame selle stringiks, et seda saaks ühendada meie stringi "tulemuse koodiga"
- See on tavaline HTTP-kood “200”, mis näitab, et http-päringu töötlemine õnnestus
Kuidas hankida HTML-faili vormi URL Python
HTML-faili saate lugeda ka funktsiooni "lugemine" abil Python, ja koodi käivitamisel kuvatakse konsoolis HTML-fail.
- Kutsuge WebURL-i muutuja lugemisfunktsiooni
- Lugemismuutuja võimaldab lugeda andmefailide sisu
- Lugege kogu URL-i sisu muutujaks nimega andmed
- Käivitage kood – see prindib andmed HTML-vormingusse
Siin on täielik kood
Python 2 Näide
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Näide
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


