Python Доступ до Інтернету за допомогою Urllib.Request і urlopen()
Що таке urllib?
urllib є a Python модуль, який можна використовувати для відкриття URL-адрес. Він визначає функції та класи для допомоги в діях URL.
З Python ви також можете отримати доступ до даних з Інтернету, таких як XML, HTML, JSON тощо. Ви також можете використовувати Python працювати з цими даними безпосередньо. У цьому підручнику ми побачимо, як ми можемо отримати дані з Інтернету. Наприклад, тут ми використали URL-адресу відео guru99, і ми збираємося отримати доступ до цієї URL-адреси відео за допомогою Python а також роздрукувати HTML-файл цієї URL-адреси.
Як відкрити URL за допомогою Urllib
Перш ніж запустити код для підключення до даних Інтернету, нам потрібно імпортувати оператор для модуля бібліотеки URL-адрес або «urllib».
- Імпорт urllib
- Визначте свою основну функцію
- Оголошіть змінну webUrl
- Потім викличте функцію urlopen у бібліотеці URL-адрес lib
- URL-адреса, яку ми відкриваємо, є підручником guru99 на YouTube
- Далі ми збираємося надрукувати код результату
- Код результату отримується шляхом виклику функції getcode у змінній webUrl, яку ми створили
- Ми збираємося перетворити це на рядок, щоб його можна було об’єднати з нашим «кодом результату» рядка
- Це буде звичайний HTTP-код «200», що вказує на успішну обробку http-запиту
Як отримати URL-адресу форми файлу HTML Python
Ви також можете прочитати HTML-файл за допомогою «функції читання» в Python, і коли ви запустите код, файл HTML з’явиться на консолі.
- Викличте функцію читання для змінної webURL
- Змінна Read дозволяє читати вміст файлів даних
- Зчитати весь вміст URL-адреси в змінну під назвою data
- Запустіть код – він роздрукує дані у форматі HTML
Ось повний код
Python 2 Приклад
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Приклад
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)


