Навчане під контролем та без нагляду: ключові відмінності

Зміст:

Anonim

Що таке машинне навчання під наглядом?

У контрольованому навчанні ви тренуєте машину, використовуючи дані, які добре "позначені ". Це означає, що деякі дані вже позначені правильною відповіддю. Це можна порівняти з навчанням, яке відбувається в присутності керівника або викладача.

Керований алгоритм навчання навчається на позначених навчальних даних, допомагає прогнозувати результати для непередбачених даних. Успішна побудова, масштабування та розгортання точного нагляду за машинним навчанням Модель науки про дані вимагає часу та технічного досвіду від групи висококваліфікованих вчених-дослідників даних. Більше того, вчений з обробки даних повинен перебудувати моделі, щоб переконатися, що отримані уявлення залишаються вірними, поки його дані не зміняться.

У цьому підручнику ви дізнаєтесь

  • Що таке машинне навчання під наглядом?
  • Що таке навчання без нагляду?
  • Чому навчання під наглядом?
  • Чому навчання без нагляду?
  • Як працює контрольоване навчання?
  • Як працює неконтрольоване навчання?
  • Типи контрольованих методів машинного навчання
  • Види техніки машинного навчання без нагляду
  • Навчання під контролем та без нагляду

Що таке навчання без нагляду?

Навчання без нагляду - це техніка машинного навчання, де не потрібно контролювати модель. Натомість вам потрібно дозволити моделі працювати самостійно, щоб виявляти інформацію. В основному мова йде про немічені дані.

Алгоритми навчання без нагляду дозволяють виконувати більш складні завдання з обробки порівняно з контрольованим навчанням. Хоча безконтрольне навчання може бути більш непередбачуваним порівняно з іншими методами глибокого навчання та зміцнення.

Чому навчання під наглядом?

  • Навчання під контролем дозволяє збирати дані або отримувати дані, отримані на основі попереднього досвіду.
  • Допомагає оптимізувати критерії ефективності, використовуючи досвід
  • Контрольоване машинне навчання допомагає вирішувати різні типи реальних обчислювальних задач.

Чому навчання без нагляду?

Ось основні причини використання непідконтрольного навчання:

  • Машинне навчання без нагляду знаходить у даних усі невідомі закономірності.
  • Методи без нагляду допомагають знайти функції, які можуть бути корисними для категоризації.
  • Це відбувається в режимі реального часу, тому всі вхідні дані аналізуються та маркуються у присутності учнів.
  • Отримати немічені дані з комп’ютера простіше, ніж мічені дані, які потребують ручного втручання.

Як працює контрольоване навчання?

Наприклад, ви хочете навчити машину, щоб допомогти вам передбачити, скільки часу вам знадобиться, щоб доїхати додому зі свого робочого місця. Тут ви починаєте зі створення набору маркованих даних. Ці дані включають

  • Метеорологічні умови
  • Час доби
  • Свята

Усі ці деталі є вашими вхідними даними. Результат - це кількість часу, необхідного для повернення додому в той конкретний день.

Ви інстинктивно знаєте, що якщо надворі дощить, то вам доведеться довше їхати додому. Але машині потрібні дані та статистика.

Давайте подивимось тепер, як ви можете розробити контрольовану модель навчання на цьому прикладі, яка допоможе користувачеві визначити час їзди на роботу. Перше, що вам потрібно створити, - це набір навчальних даних. Цей навчальний набір міститиме загальний час їзди на роботу та відповідні фактори, такі як погода, час тощо. На основі цього навчального набору ваша машина може побачити, що існує пряма залежність між кількістю дощу та часом, який ви витратите на повернення додому.

Отже, він встановлює, що чим більше дощить, тим довше ви їдете, щоб повернутися до свого дому. Він також може бачити зв’язок між часом, коли ви залишаєте роботу, і часом, коли ви будете в дорозі.

Чим ближче ви до 18:00, тим довше вам потрібно додому. Ваш апарат може знайти деякі зв’язки з вашими маркованими даними.

Це початок вашої моделі даних. Це починає впливати на те, як дощ впливає на те, як люди рухаються. Він також починає бачити, що більше людей подорожує в певний час доби.

Як працює неконтрольоване навчання?

Давайте візьмемо випадок з дитиною та її сімейною собакою.

Вона знає та ідентифікує цю собаку. Через кілька тижнів сімейний друг привозить із собою собаку і намагається пограти з дитиною.

Дитина раніше не бачив цю собаку. Але він розпізнає багато особливостей (2 вуха, очі, ходіння на 4 ногах), як її домашня собака. Вона визначає таку нову тварину, як собака. Це навчання без нагляду, де вас не вчать, але ви дізнаєтесь з даних (у даному випадку дані про собаку.) Якби це було контрольоване навчання, сімейний друг сказав би дитині, що це собака.

Типи контрольованих методів машинного навчання

Регресія:

Техніка регресії передбачає одне вихідне значення, використовуючи дані навчання.

Приклад: Ви можете використовувати регресію, щоб передбачити ціну будинку за даними навчальних даних. Вхідними змінними будуть місцевість, розмір будинку тощо.

Класифікація:

Класифікація означає групування вихідних даних всередині класу. Якщо алгоритм намагається позначити введення в двох різних класах, це називається двійковою класифікацією. Вибір між більш ніж двома класами називається багатокласовою класифікацією.

Приклад : Визначення того, чи буде хтось неплатником кредиту чи ні.

Сильні сторони : результати завжди мають імовірнісну інтерпретацію, і алгоритм можна регулювати, щоб уникнути переобладнання.

Слабкі сторони : Логістична регресія може бути недостатньо ефективною, якщо існує кілька чи нелінійних меж рішення. Цей метод не є гнучким, тому не охоплює більш складних взаємозв’язків.

Види техніки машинного навчання без нагляду

Проблеми навчання без нагляду в подальшому групуються у проблеми кластеризації та асоціації.

Скупчення

Кластеризація є важливим поняттям, коли мова йде про навчання без нагляду. В основному мова йде про пошук структури або зразка в колекції некатегоризованих даних. Алгоритми кластеризації оброблять ваші дані та знайдуть природні кластери (групи), якщо вони існують у даних. Ви також можете змінити кількість кластерів, які повинні ідентифікувати ваші алгоритми. Це дозволяє регулювати деталізацію цих груп.

Асоціація

Правила асоціації дозволяють встановлювати асоціації серед об'єктів даних усередині великих баз даних. Ця неконтрольована техніка стосується виявлення захоплюючих зв’язків між змінними у великих базах даних. Наприклад, люди, які купують нове житло, найімовірніше купують нові меблі.

Інші приклади:

  • Підгрупа хворих на рак, згрупована за вимірами експресії генів
  • Групи покупців на основі їх історії перегляду та покупок
  • Група фільмів за рейтингом, який дали глядачі фільмів

Навчання під контролем та без нагляду

Параметри Контрольована техніка машинного навчання Техніка машинного навчання без нагляду
Процес У контрольованій навчальній моделі будуть вказані змінні введення та виведення. У моделі навчання без нагляду надаватимуться лише вхідні дані
Вхідні дані Навчання алгоритмів здійснюється з використанням маркованих даних. Алгоритми використовуються щодо даних, які не позначені
Використані алгоритми Підтримують векторну машину, нейронну мережу, лінійну та логістичну регресію, випадковий ліс та класифікаційні дерева. Некеровані алгоритми можна розділити на різні категорії: як кластерні алгоритми, K-засоби, ієрархічна кластеризація тощо.
Обчислювальна складність Навчання під наглядом - це більш простий метод. Навчання без нагляду є обчислювально складним
Використання даних Контрольована модель навчання використовує дані навчання, щоб дізнатись про зв’язок між вхідними та вихідними показниками. Навчання без нагляду не використовує вихідні дані.
Точність результатів Високоточний і надійний метод. Менш точний і надійний метод.
Навчання в режимі реального часу Метод навчання відбувається в автономному режимі. Метод навчання відбувається в реальному часі.
Кількість класів Кількість занять відома. Кількість класів невідома.
Основний недолік Класифікація великих даних може бути справжньою проблемою у навчанні під наглядом. Ви не можете отримати точну інформацію щодо сортування даних, а вихідні дані як дані, що використовуються в непідконтрольному навчанні, позначені та невідомі.

Резюме

  • У контрольованому навчанні ви тренуєте машину, використовуючи дані, які добре "позначені".
  • Навчання без нагляду - це техніка машинного навчання, де не потрібно контролювати модель.
  • Навчання під контролем дозволяє збирати дані або отримувати дані, отримані на основі попереднього досвіду.
  • Машинне навчання без нагляду допомагає знаходити всі види невідомих закономірностей у даних.
  • Наприклад, ви зможете визначити час, необхідний для повернення до базової бази, залежно від погодних умов, часу доби та свят.
  • Наприклад, Малюк може ідентифікувати інших собак на основі минулого навчання під контролем.
  • Регресія та класифікація - це два типи контрольованих технік машинного навчання.
  • Кластеризація та асоціація - це два типи навчання без нагляду.
  • У контрольованій моделі навчання дані про вхідні та вихідні змінні будуть надані, тоді як для моделі без контрольованого навчання - лише вхідні дані