Різниця між глибоким навчанням та машинним навчанням проти ШІ

Зміст:

Anonim

Що таке ШІ?

ШІ (Штучний інтелект) - це розділ інформатики, в якому машини програмуються та отримують когнітивну здатність мислити та імітувати дії, подібні до людей та тварин. Орієнтиром для штучного інтелекту є людський інтелект щодо міркувань, мови, навчання, бачення та вирішення проблем, що далеке у майбутньому.

ШІ має три різні рівні:

  1. Вузький ШІ : Штучний інтелект вважається вузьким, коли машина може виконувати певне завдання краще, ніж людина. Поточне дослідження ШІ зараз тут
  2. Загальний ШІ : Штучний інтелект досягає загального стану, коли він може виконувати будь-які інтелектуальні завдання з тим самим рівнем точності, що і людина
  3. Активний ШІ : ШІ активний, коли може перемогти людей у ​​багатьох завданнях

Ранні системи ШІ використовували відповідність шаблонів та експертні системи.

Огляд системи штучного інтелекту

У цьому підручнику ви дізнаєтесь-

  • Що таке ШІ?
  • Що таке ML?
  • Що таке глибоке навчання?
  • Процес машинного навчання
  • Процес глибокого навчання
  • Автоматизуйте вилучення функцій за допомогою DL
  • Різниця між машинним навчанням та глибоким навчанням
  • Коли використовувати ML або DL?

Що таке ML?

ML (Machine Learning) - це тип ШІ, при якому комп'ютер навчається автоматизувати завдання, які є вичерпними або неможливими для людей. Це найкращий інструмент для аналізу, розуміння та виявлення закономірностей у даних на основі вивчення комп'ютерних алгоритмів. Машинне навчання може приймати рішення з мінімальним втручанням людини.

Порівнюючи штучний інтелект із машинним навчанням, машинне навчання використовує дані для подання алгоритму, який може зрозуміти взаємозв'язок між входом і виходом. Коли машина закінчить навчання, вона може передбачити значення або клас нової точки даних.

Що таке глибоке навчання?

Глибоке навчання - це комп’ютерна програма, що імітує мережу нейронів мозку. Це підмножина машинного навчання і називається глибоким навчанням, оскільки використовує глибокі нейронні мережі. Машина використовує різні шари для вивчення даних. Глибина моделі представлена ​​кількістю шарів у моделі. Поглиблене навчання - це новий рівень техніки з точки зору ШІ. При глибокому навчанні фаза навчання здійснюється за допомогою нейронної мережі. Нейронна мережа - це архітектура, де шари укладаються один на одного

Процес машинного навчання

Уявіть, що ви покликані створити програму, яка розпізнає об’єкти. Для навчання моделі ви будете використовувати класифікатор . Класифікатор використовує ознаки об’єкта, щоб спробувати ідентифікувати клас, до якого він належить.

У цьому прикладі класифікатор буде навчений виявляти, чи є зображення таким:

  • Велосипед
  • Човен
  • Автомобіль
  • Літак

Чотири наведені вище об’єкти - це клас, який класифікатор повинен розпізнати. Щоб побудувати класифікатор, вам потрібно мати деякі дані як вхідні дані і призначати їм мітку. Алгоритм візьме ці дані, знайде шаблон і класифікує його у відповідний клас.

Це завдання називається навчанням під наглядом. При контрольованому навчанні навчальні дані, які ви подаєте в алгоритм, містять мітку.

Навчання алгоритму вимагає виконання кількох стандартних кроків:

  • Зберіть дані
  • Тренуйте класифікатор
  • Робіть прогнози

Перший крок необхідний, вибір правильних даних зробить алгоритм успішним або невдалим. Дані, які ви вибрали для навчання моделі, називаються функцією. У прикладі об'єкта особливостями є пікселі зображень.

Кожне зображення - це рядок у даних, тоді як кожен піксель - стовпець. Якщо ваше зображення має розмір 28x28, набір даних містить 784 стовпці (28x28). На малюнку нижче кожна картинка перетворена у векторний елемент. Етикетка повідомляє комп’ютеру, який об’єкт знаходиться на зображенні.

Процес машинного навчання

Мета полягає у використанні цих навчальних даних для класифікації типу об’єкта. Перший крок складається зі створення стовпців об’єктів. Потім другий крок передбачає вибір алгоритму навчання моделі. Коли навчання буде виконано, модель передбачить, яка картина відповідає якому об’єкту.

Після цього модель легко використовувати для прогнозування нових зображень. Для кожного нового зображення, що подається в модель, апарат прогнозує клас, до якого належить. Наприклад, абсолютно нове зображення без ярлика проходить через модель. Для людини тривіально візуалізувати образ як автомобіль. Машина використовує свої попередні знання для прогнозування, а також зображення автомобіля.

Процес глибокого навчання

При глибокому навчанні фаза навчання здійснюється за допомогою нейронної мережі. Нейронна мережа - це архітектура, де шари укладаються один на одного.

Розглянемо той самий приклад зображення вище. Навчальний набір подавався б до нейронної мережі

Кожен вхід надходить у нейрон і множиться на вагу. Результат множення перетікає до наступного шару і стає вхідним. Цей процес повторюється для кожного рівня мережі. Кінцевий шар називається вихідним шаром; він забезпечує фактичне значення для завдання регресії та ймовірність кожного класу для завдання класифікації. Нейронна мережа використовує математичний алгоритм для оновлення ваг усіх нейронів. Нейронна мережа повністю навчена, коли значення ваг дає результат, близький до реальності. Наприклад, добре навчена нейронна мережа може розпізнати об'єкт на зображенні з більшою точністю, ніж традиційна нейронна мережа.

Процес глибокого навчання

Автоматизуйте вилучення функцій за допомогою DL

Набір даних може містити від десятка до сотні функцій. Система буде вчитися на значущості цих функцій. Однак не всі функції мають значення для алгоритму. Найважливішою частиною машинного навчання є пошук відповідного набору функцій, щоб система чомусь навчилася.

Одним із способів виконати цю частину в машинному навчанні є використання вилучення функцій. Вилучення об’єднань поєднує існуючі функції, щоб створити більш відповідний набір функцій. Це можна зробити за допомогою PCA, T-SNE або будь-яких інших алгоритмів зменшення розмірності.

Наприклад, обробляючи зображення, практикуючий повинен витягти функцію вручну на зображенні, як-от очі, ніс, губи тощо. Ці вилучені ознаки подаються до класифікаційної моделі.

Поглиблене навчання вирішує це питання, особливо для нейромережевої нейромережі. Перший шар нейронної мережі вивчить дрібні деталі з малюнка; наступні шари поєднуватимуть попередні знання для отримання більш складної інформації. У згортковій нейронній мережі виділення ознак здійснюється за допомогою фільтра. Мережа застосовує фільтр до зображення, щоб перевірити, чи є збіг, тобто форма об’єкта ідентична частині зображення. Якщо є збіг, мережа використовуватиме цей фільтр. Таким чином, процес вилучення функцій виконується автоматично.

Традиційне машинне навчання проти глибокого навчання

Різниця між машинним навчанням та глибоким навчанням

Нижче наведено ключову різницю між глибоким навчанням та машинним навчанням

Машинне навчання

Глибоке навчання

Залежності даних

Відмінні результати на невеликому / середньому наборі даних

Відмінна продуктивність на великому наборі даних

Апаратні залежності

Робота на машині низького класу.

Потрібна потужна машина, бажано з графічним процесором: DL виконує значну кількість множення матриць

Особливість інженерії

Потрібно зрозуміти особливості, що представляють дані

Не потрібно розуміти найкращу функцію, яка представляє дані

Час виконання

Від кількох хвилин до годин

До тижнів. Нейронна мережа повинна обчислити значну кількість ваг

Інтерпретабельність

Деякі алгоритми легко інтерпретувати (логістика, дерево рішень), інші майже неможливо (SVM, XGBoost)

Складно до неможливо

Коли використовувати ML або DL?

У таблиці нижче ми підсумовуємо різницю між машинним навчанням та глибоким навчанням на прикладах.

Машинне навчання Глибоке навчання
Набір навчальних даних Маленький Великий
Виберіть функції Так Ні
Кількість алгоритмів Багато Небагато
Час навчання Короткий Довгота

При машинному навчанні для підготовки алгоритму потрібно менше даних, ніж глибоке навчання. Поглиблене навчання вимагає великого та різноманітного набору даних для виявлення основної структури. Крім того, машинне навчання забезпечує швидше навчену модель. Навчання найдосконалішої архітектури глибокого навчання може зайняти від днів до тижня. Перевага глибокого навчання перед машинним є те, що воно є дуже точним. Вам не потрібно розуміти, які функції найкраще відображають дані; нейронна мережа навчилася вибирати критичні функції. У машинному навчанні потрібно самостійно вибирати, які функції включати в модель.

Резюме

Штучний інтелект надає машині когнітивні здібності. Порівнюючи ШІ та Машинне навчання, ранні системи ШІ використовували узгодження шаблонів та експертні системи.

Ідея машинного навчання полягає в тому, що машина може вчитися без участі людини. Машині потрібно знайти спосіб навчитися вирішувати завдання з урахуванням даних.

Глибоке навчання - це прорив у галузі штучного інтелекту. Коли є достатньо даних для тренувань, глибоке навчання досягає вражаючих результатів, особливо для розпізнавання зображень та перекладу тексту. Основною причиною є те, що вилучення функцій здійснюється автоматично в різних рівнях мережі.