Машинне навчання під наглядом: що таке, алгоритми, приклад

Зміст:

Anonim

Що таке машинне навчання під наглядом?

У контрольованому навчанні ви тренуєте машину, використовуючи дані, які добре "позначені ". Це означає, що деякі дані вже позначені правильною відповіддю. Це можна порівняти з навчанням, яке відбувається в присутності керівника або викладача.

Керований алгоритм навчання навчається на позначених навчальних даних, допомагає прогнозувати результати для непередбачених даних.

Успішна побудова, масштабування та впровадження точних моделей машинного навчання, що контролюються, вимагає часу та технічних знань команди висококваліфікованих вчених-дослідників даних. Більше того, вчений з обробки даних повинен перебудувати моделі, щоб переконатися, що отримані уявлення залишаються вірними, поки його дані не зміняться.

У цьому підручнику ви дізнаєтесь:

  • Що таке машинне навчання під наглядом?
  • Як працює контрольоване навчання
  • Типи керованих алгоритмів машинного навчання
  • Техніка машинного навчання під наглядом та без нагляду
  • Проблеми машинного навчання під наглядом
  • Переваги контрольованого навчання:
  • Недоліки контрольованого навчання
  • Кращі практики для контрольованого навчання

Як працює контрольоване навчання

Наприклад, ви хочете навчити машину, щоб допомогти вам передбачити, скільки часу вам знадобиться, щоб доїхати додому зі свого робочого місця. Тут ви починаєте зі створення набору маркованих даних. Ці дані включають

  • Метеорологічні умови
  • Час доби
  • Свята

Усі ці деталі є вашими вхідними даними. Результат - це кількість часу, необхідного для повернення додому в той конкретний день.

Ви інстинктивно знаєте, що якщо надворі дощить, то вам доведеться довше їхати додому. Але машині потрібні дані та статистика.

Давайте подивимось тепер, як ви можете розробити контрольовану модель навчання на цьому прикладі, яка допоможе користувачеві визначити час їзди на роботу. Перше, що потрібно для створення - це навчальний набір. Цей навчальний набір міститиме загальний час їзди на роботу та відповідні фактори, такі як погода, час тощо. На основі цього навчального набору ваша машина може побачити, що існує пряма залежність між кількістю дощу та часом, який ви витратите на повернення додому.

Отже, він встановлює, що чим більше дощить, тим довше ви їдете, щоб повернутися до свого дому. Він також може бачити зв’язок між часом, коли ви залишаєте роботу, і часом, коли ви будете в дорозі.

Чим ближче ви до 18:00, тим довше вам потрібно додому. Ваш апарат може знайти деякі зв’язки з вашими маркованими даними.

Це початок вашої моделі даних. Це починає впливати на те, як дощ впливає на те, як люди рухаються. Він також починає бачити, що більше людей подорожує в певний час доби.

Типи керованих алгоритмів машинного навчання

Регресія:

Техніка регресії передбачає одне вихідне значення, використовуючи дані навчання.

Приклад : Ви можете використовувати регресію, щоб передбачити ціну будинку за даними навчальних даних. Вхідними змінними будуть місцевість, розмір будинку тощо.

Сильні сторони : результати завжди мають імовірнісну інтерпретацію, і алгоритм можна регулювати, щоб уникнути переобладнання.

Слабкі сторони : Логістична регресія може бути недостатньо ефективною, якщо існує кілька чи нелінійних меж рішення. Цей метод не є гнучким, тому не охоплює більш складних взаємозв’язків.

Логістична регресія:

Метод логістичної регресії, що використовується для оцінки дискретних значень на основі заданого набору незалежних змінних. Це допомагає передбачити ймовірність настання події шляхом підбору даних до функції logit. Тому він також відомий як логістична регресія. Оскільки він передбачає ймовірність, його вихідне значення лежить між 0 і 1.

Ось декілька типів алгоритмів регресії

Класифікація:

Класифікація означає групування вихідних даних всередині класу. Якщо алгоритм намагається позначити введення в двох різних класах, це називається двійковою класифікацією. Вибір між більш ніж двома класами називається багатокласовою класифікацією.

Приклад : Визначення того, чи буде хтось неплатником кредиту чи ні.

Сильні сторони : Дерево класифікації дуже добре працює на практиці

Слабкі сторони : необмежені, окремі дерева схильні до переобладнання.

Ось декілька типів класифікаційних алгоритмів

Наївні класифікатори Байєса

Наївна байєсівська модель (NBN) проста в побудові і дуже корисна для великих наборів даних. Цей метод складається з прямих ациклічних графіків з одним із батьків та кількома дітьми. Він передбачає незалежність серед дочірніх вузлів, відокремлених від батьківських.

Дерева рішень

Дерева рішень класифікують екземпляр, сортуючи їх на основі значення ознаки. У цьому методі кожен режим є особливістю екземпляра. Його слід класифікувати, і кожна гілка представляє значення, яке вузол може прийняти. Це широко застосовувана техніка для класифікації. У цьому методі класифікація - це дерево, яке відоме як дерево рішень.

Це допоможе вам оцінити реальні значення (вартість придбання автомобіля, кількість дзвінків, загальний обсяг щомісячних продажів тощо).

Підтримка векторної машини

Машина опорних векторів (SVM) - це тип алгоритму навчання, розроблений у 1990 році. Цей метод базується на результатах статистичної теорії навчання, представленої Вап Ніком.

Машини SVM також тісно пов'язані з функціями ядра, що є центральним поняттям для більшості навчальних завдань. Фреймворк ядра та SVM використовуються в різних сферах. Він включає пошук мультимедійної інформації, біоінформатику та розпізнавання зразків.

Техніка машинного навчання під наглядом та без нагляду

На основі Контрольована техніка машинного навчання Техніка машинного навчання без нагляду
Вхідні дані Навчання алгоритмів здійснюється з використанням маркованих даних. Алгоритми використовуються щодо даних, які не позначені
Обчислювальна складність Навчання під наглядом - це більш простий метод. Навчання без нагляду є обчислювально складним
Точність Високоточний і надійний метод. Менш точний і надійний метод.

Проблеми машинного навчання під наглядом

Ось проблеми, з якими стикається машинне навчання під наглядом:

  • Невідповідна функція введення, що містять дані навчальних даних, може дати неточні результати
  • Підготовка та попередня обробка даних - це завжди проблема.
  • Точність страждає, коли неможливо, малоймовірно, а неповні значення вводяться як дані навчання
  • Якщо відповідний експерт недоступний, тоді інший підхід - "груба сила". Це означає, що вам потрібно думати, що потрібні функції (вхідні змінні) для тренування машини. Це може бути неточно.

Переваги контрольованого навчання:

  • Навчання під контролем дозволяє збирати дані або отримувати дані, отримані на основі попереднього досвіду
  • Допомагає оптимізувати критерії ефективності, використовуючи досвід
  • Контрольоване машинне навчання допомагає вирішувати різні типи реальних обчислювальних задач.

Недоліки контрольованого навчання

  • Межа прийняття рішень може бути перетренованою, якщо ваш навчальний набір, який не має прикладів, які ви хочете мати в класі
  • Вам потрібно вибрати безліч хороших прикладів з кожного класу під час навчання класифікатора.
  • Класифікація великих даних може бути справжньою проблемою.
  • Навчання для контрольованого навчання потребує багато обчислювального часу.

Кращі практики для контрольованого навчання

  • Перш ніж робити щось інше, вам слід вирішити, який тип даних використовуватиметься як навчальний набір
  • Вам потрібно визначити структуру вивченої функції та алгоритм навчання.
  • Зберіть відповідні результати або від людських експертів, або від вимірювань

Резюме

  • У контрольованому навчанні ви тренуєте машину, використовуючи дані, які добре "позначені".
  • Ви хочете навчити машину, яка допоможе вам передбачити, скільки часу вам знадобиться, щоб доїхати з робочого місця додому - це приклад навчання під контролем
  • Регресія та класифікація - це два типи контрольованих технік машинного навчання.
  • Навчання під наглядом - це більш простий метод, в той час як навчання без нагляду - складний метод.
  • Найбільшою проблемою в навчанні під наглядом є те, що нерелевантна функція введення, яка містить дані навчальних даних, може дати неточні результати.
  • Головною перевагою контрольованого навчання є те, що воно дозволяє збирати дані або отримувати вихідні дані з попереднього досвіду.
  • Недоліком цієї моделі є те, що межа прийняття рішень може бути надто напруженою, якщо у вашому навчальному наборі немає прикладів, які ви хочете мати в класі.
  • Як найкраща практика нагляду за навчанням, спочатку потрібно вирішити, який тип даних слід використовувати як навчальний набір.