Доступ до Інтернету на Python за допомогою Urllib.Request та urlopen ()

Зміст:

Anonim

Що таке urllib?

urllib - це модуль Python, який можна використовувати для відкриття URL-адрес. Він визначає функції та класи, які допомагають виконувати дії URL.

За допомогою Python ви також можете отримувати доступ та отримувати дані з Інтернету, такі як XML, HTML, JSON тощо. Ви також можете використовувати Python для безпосередньої роботи з цими даними. У цьому підручнику ми побачимо, як ми можемо отримувати дані з Інтернету. Наприклад, тут ми використовували URL-адресу відео guru99, і ми збираємось отримати доступ до цієї URL-адреси відео за допомогою Python, а також надрукувати HTML-файл цієї URL-адреси.

У цьому підручнику ми дізнаємось

  • Як відкрити URL за допомогою Urllib
  • Як прочитати HTML-файл для вашої URL-адреси в Python

Як відкрити URL за допомогою Urllib

Перш ніж запускати код для підключення до Інтернет-даних, нам потрібно імпортувати оператор для модуля бібліотеки URL або "urllib".

  • Імпортувати urllib
  • Визначте свою основну функцію
  • Оголосіть змінну webUrl
  • Потім викличте функцію urlopen у бібліотеці бібліотеки URL
  • Ми відкриваємо URL-адресу - підручник guru99 на YouTube
  • Далі ми надрукуємо код результату
  • Код результату отримується за допомогою виклику функції getcode у створеній нами змінній webUrl
  • Ми перетворимо це на рядок, щоб його можна було об'єднати з нашим рядком "код результату"
  • Це буде звичайний HTTP-код "200", що вказує на успішну обробку запиту http

Як отримати URL-адресу форми HTML-файлу в Python

Ви також можете прочитати файл HTML, використовуючи "функцію читання" в Python, і при запуску коду файл HTML з'явиться в консолі.

  • Викличте функцію читання змінної webURL
  • Змінна Read дозволяє читати вміст файлів даних
  • Прочитайте весь вміст URL-адреси у змінну, яка називається data
  • Запустіть код - він надрукує дані у форматі HTML

Ось повний код

Приклад Python 2

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Приклад Python 3

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)