Що таке urllib?
urllib - це модуль Python, який можна використовувати для відкриття URL-адрес. Він визначає функції та класи, які допомагають виконувати дії URL.
За допомогою Python ви також можете отримувати доступ та отримувати дані з Інтернету, такі як XML, HTML, JSON тощо. Ви також можете використовувати Python для безпосередньої роботи з цими даними. У цьому підручнику ми побачимо, як ми можемо отримувати дані з Інтернету. Наприклад, тут ми використовували URL-адресу відео guru99, і ми збираємось отримати доступ до цієї URL-адреси відео за допомогою Python, а також надрукувати HTML-файл цієї URL-адреси.
У цьому підручнику ми дізнаємось
- Як відкрити URL за допомогою Urllib
- Як прочитати HTML-файл для вашої URL-адреси в Python
Як відкрити URL за допомогою Urllib
Перш ніж запускати код для підключення до Інтернет-даних, нам потрібно імпортувати оператор для модуля бібліотеки URL або "urllib".
- Імпортувати urllib
- Визначте свою основну функцію
- Оголосіть змінну webUrl
- Потім викличте функцію urlopen у бібліотеці бібліотеки URL
- Ми відкриваємо URL-адресу - підручник guru99 на YouTube
- Далі ми надрукуємо код результату
- Код результату отримується за допомогою виклику функції getcode у створеній нами змінній webUrl
- Ми перетворимо це на рядок, щоб його можна було об'єднати з нашим рядком "код результату"
- Це буде звичайний HTTP-код "200", що вказує на успішну обробку запиту http
Як отримати URL-адресу форми HTML-файлу в Python
Ви також можете прочитати файл HTML, використовуючи "функцію читання" в Python, і при запуску коду файл HTML з'явиться в консолі.
- Викличте функцію читання змінної webURL
- Змінна Read дозволяє читати вміст файлів даних
- Прочитайте весь вміст URL-адреси у змінну, яка називається data
- Запустіть код - він надрукує дані у форматі HTML
Ось повний код
Приклад Python 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Приклад Python 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)