Python Přístup k internetu pomocí Urllib.Request a urlopen()
Co je urllib?
urllib je a Python modul, který lze použít pro otevírání adres URL. Definuje funkce a třídy, které pomáhají při akcích URL.
S Python můžete také přistupovat a získávat data z internetu, jako je XML, HTML, JSON atd. Můžete také použít Python pracovat s těmito daty přímo. V tomto tutoriálu se podíváme na to, jak můžeme získat data z webu. Například zde jsme použili adresu URL videa guru99 a k této adrese URL videa budeme přistupovat pomocí Python stejně jako tisk HTML souboru této URL.
Jak otevřít URL pomocí Urllib
Než spustíme kód pro připojení k internetovým datům, musíme importovat příkaz pro modul knihovny URL nebo „urllib“.
- Importovat urllib
- Definujte svou hlavní funkci
- Deklarujte proměnnou webUrl
- Poté zavolejte funkci urlopen v knihovně URL lib
- Adresa URL, kterou otevíráme, je výukový program guru99 na youtube
- Dále vytiskneme výsledný kód
- Výsledný kód se získá voláním funkce getcode v proměnné webUrl, kterou jsme vytvořili
- Převedeme to na řetězec, aby mohl být zřetězen s naším řetězcem „kód výsledku“
- Bude to běžný HTTP kód „200“, což znamená, že požadavek http byl úspěšně zpracován
Jak získat adresu URL formuláře souboru HTML Python
Soubor HTML můžete také číst pomocí funkce „čtení“ v Pythona když kód spustíte, soubor HTML se objeví v konzole.
- Zavolejte funkci čtení v proměnné webURL
- Číst proměnná umožňuje číst obsah datových souborů
- Přečtěte si celý obsah adresy URL do proměnné s názvem data
- Spusťte kód - vytiskne data do formátu HTML
Zde je úplný kód
Python 2 Příklad
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Příklad
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


