Завантажте PDF
1) Що таке машинне навчання?
Машинне навчання - це розділ інформатики, який займається системним програмуванням з метою автоматичного навчання та вдосконалення з досвідом. Наприклад: Роботи запрограмовані таким чином, що вони можуть виконувати завдання на основі даних, які вони збирають із датчиків. Він автоматично вивчає програми з даних.
2) Згадайте різницю між видобутком даних та машинним навчанням?
Машинне навчання пов'язане з вивченням, розробкою та розробкою алгоритмів, що дають комп'ютерам можливість вчитися без явного програмування. У той час як видобуток даних можна визначити як процес, при якому неструктуровані дані намагаються витягти знання або невідомі цікаві закономірності. Під час цієї технологічної машини використовуються алгоритми навчання.
3) Що таке "переобладнання" в машинному навчанні?
У машинному навчанні, коли статистична модель описує випадкову помилку або шум, а не основний зв'язок, виникає "переобладнання". Коли модель надмірно складна, зазвичай спостерігається переобладнання через занадто багато параметрів щодо кількості типів навчальних даних. Модель демонструє низьку продуктивність, яка була перебільшена.
4) Чому трапляється переобладнання?
Існує можливість переобладнання, оскільки критерії, що використовуються для навчання моделі, не є однаковими з критеріями, що використовуються для оцінки ефективності моделі.
5) Як можна уникнути переобладнання?
Використовуючи велику кількість даних, можна уникнути переобладнання даних, переобладнання відбувається відносно, оскільки у вас є невеликий набір даних, і ви намагаєтесь на цьому навчитися. Але якщо у вас невелика база даних, і ви змушені створити модель, засновану на ній. У такій ситуації ви можете використовувати техніку, відому як перехресна перевірка . У цьому методі набір даних розділяється на два розділи, тестування та навчальні набори даних, тестуючий набір даних буде лише тестувати модель, тоді як у навчальному наборі даних точки даних будуть створювати модель.
У цій техніці моделі зазвичай надається набір даних із відомих даних, на яких проводиться навчання (набір навчальних даних), і набір невідомих даних, на основі яких модель тестується. Ідея перехресної перевірки полягає у визначенні набору даних для «тестування» моделі на етапі навчання.
6) Що таке індуктивне машинне навчання?
Індуктивне машинне навчання включає процес навчання на прикладах, коли система з сукупності спостережуваних примірників намагається навести загальне правило.
7) Які п’ять популярних алгоритмів машинного навчання?
- Дерева рішень
- Нейронні мережі (зворотне поширення)
- Імовірнісні мережі
- Найближчий сусід
- Підтримка векторних машин
8) Які різні методи алгоритму в машинному навчанні?
Різні типи методів машинного навчання такі
- Навчання під наглядом
- Навчання без нагляду
- Навчання під наглядом
- Підкріплення навчання
- Трансдукція
- Вчимось вчитися
9) Які три етапи будують гіпотези чи модель машинного навчання?
- Побудова моделі
- Тестування моделі
- Застосування моделі
10) Який стандартний підхід до навчання під контролем?
Стандартний підхід до контрольованого навчання полягає у розділенні набору прикладів на навчальний набір та тест.
11) Що таке "навчальний комплект" та "тест-комплект"?
У різних сферах інформатики, таких як машинне навчання, набір даних використовується для виявлення потенційно передбачуваних взаємозв’язків, відомих як „Набір навчальних матеріалів”. Навчальний набір - це приклади, що даються учню, тоді як Тестовий набір використовується для перевірки точності гіпотез, що генеруються учнем, і це набір прикладів, який стримується від учня. Тренувальний набір відрізняється від тестового.
12) Перелічіть різні підходи до машинного навчання?
Різні підходи в машинному навчанні такі
- Концепція проти класифікації навчання
- Символічне проти статистичного навчання
- Індуктивне проти аналітичного навчання
13) Що не є машинним навчанням?
- Штучний інтелект
- Висновок на основі правила
14) Поясніть, яка функція “Навчання без нагляду”?
- Знайдіть кластери даних
- Знайдіть низьковимірні подання даних
- Знайдіть цікаві напрямки в даних
- Цікаві координати та кореляції
- Знайдіть нові спостереження / очищення бази даних
15) Поясніть, яка функція „Навчання під наглядом”?
- Класифікації
- Розпізнавання мови
- Регресія
- Прогнозуйте часові ряди
- Анотувати рядки
16) Що таке незалежне від алгоритму машинне навчання?
Машинне навчання там, де математичні основи не залежать від будь-якого конкретного класифікатора або алгоритму навчання, називається машинним навчанням, незалежним від алгоритму?
17) У чому різниця між штучним навчанням та машинним навчанням?
Розробка та розробка алгоритмів відповідно до поведінки на основі емпіричних даних відомі як машинне навчання. Окрім штучного інтелекту, крім машинного навчання, він також охоплює інші аспекти, такі як подання знань, обробка природних мов, планування, робототехніка тощо.
18) Що таке класифікатор у машинному навчанні?
Класифікатор в машинному навчанні - це система, яка вводить вектор дискретних або неперервних значень ознак і виводить одне дискретне значення - клас.
19) Які переваги Naive Bayes?
У Naive Байєса класифікатор буде збігатися швидше, ніж дискримінаційні моделі, такі як логістична регресія, тому вам потрібно менше навчальних даних. Головна перевага полягає в тому, що він не може вивчити взаємодії між функціями.
20) У яких областях використовується розпізнавання зразків?
Розпізнавання зразків можна використовувати в
- Комп’ютерне бачення
- Розпізнавання мови
- Видобуток даних
- Статистика
- Неформальне отримання
- Біоінформатика
21) Що таке генетичне програмування?
Генетичне програмування - одна з двох методик, що застосовуються в машинному навчанні. Модель базується на тестуванні та виборі найкращого вибору серед набору результатів.
22) Що таке індуктивне логічне програмування в машинному навчанні?
Індуктивне логічне програмування (ILP) - це підполе машинного навчання, яке використовує логічне програмування, що представляє базові знання та приклади.
23) Що таке вибір моделі в машинному навчанні?
Процес вибору моделей серед різних математичних моделей, які використовуються для опису одного і того ж набору даних, відомий як Вибір моделі. Вибір моделі застосовується до областей статистики, машинного навчання та інтелектуального аналізу даних.
24) Які два методи використовуються для калібрування під контролем навчання?
Два методи, що використовуються для прогнозування високих ймовірностей у контрольованому навчанні, такі
- Калібрування Платта
- Ізотонічна регресія
Ці методи призначені для двійкової класифікації, і це не тривіально.
25) Який метод часто використовується для запобігання переобладнанню?
Коли є достатньо даних, для запобігання проблемі переобладнання використовується `` Ізотонічна регресія ''.
26) Яка різниця між евристикою для навчання правилам та евристикою для дерев рішень?
Різниця полягає в тому, що евристика для дерев рішень оцінює середню якість ряду нероз’єднаних множин, тоді як ті, хто навчається за правилами, оцінюють лише якість набору екземплярів, що охоплюється правилом кандидата.
27) Що таке персептрон у машинному навчанні?
У машинному навчанні Perceptron - це алгоритм контрольованої класифікації вхідних даних в один із декількох можливих недвійкових результатів.
28) Поясніть дві складові програми логіки Байєса?
Байєсова логічна програма складається з двох компонентів. Перший компонент є логічним; він складається з набору байєсівських положень, який фіксує якісну структуру домену. Другий компонент - кількісний, він кодує кількісну інформацію про домен.
29) Що таке Байєсові мережі (BN)?
Байєсова мережа використовується для представлення графічної моделі зв’язку ймовірностей між набором змінних.
30) Чому алгоритм навчання на основі екземплярів іноді називають алгоритмом ледачого навчання?
Екземплярний алгоритм навчання також називають алгоритмом лінивого навчання, оскільки вони затримують процес індукції або узагальнення, поки не буде проведена класифікація.
31) З якими двома методами класифікації може впоратися SVM (Support Vector Machine)?
- Поєднання двійкових класифікаторів
- Модифікація двійкового файлу для включення багатокласового навчання
32) Що таке ансамблеве навчання?
Для вирішення конкретної обчислювальної програми стратегічно генеруються та поєднуються різні моделі, такі як класифікатори або експерти. Цей процес відомий як ансамблеве навчання.
33) Чому використовується ансамблеве навчання?
Ансамблеве навчання використовується для поліпшення класифікації, прогнозування, наближення функцій тощо моделі.
34) Коли застосовувати ансамблеве навчання?
Навчання ансамблю використовується, коли ви створюєте класифікатори компонентів, які є більш точними та незалежними один від одного.
35) Які дві парадигми ансамблевих методів?
Дві парадигми ансамблевих методів є
- Послідовні ансамблеві методи
- Паралельні ансамблеві методи
36) У чому полягає загальний принцип ансамблевого методу, а що таке мішки та посилення в ансамблевому методі?
Загальний принцип ансамблевого методу полягає у поєднанні передбачень кількох моделей, побудованих із заданим алгоритмом навчання, з метою покращення стійкості щодо однієї моделі. Сумка - це метод у сукупності для поліпшення нестабільних схем оцінки або класифікації. При цьому підсилювальні методи використовуються послідовно для зменшення упередженості комбінованої моделі. Підсилення та завантаження мішків можуть зменшити кількість помилок за рахунок зменшення терміну дисперсії.
37) Що таке декомпозиція дисперсійної помилки класифікаційної помилки в ансамблевому методі?
Очікувана помилка алгоритму навчання може бути розкладена на упередженість та дисперсію. Термін упередженості вимірює, наскільки середній класифікатор, створений алгоритмом навчання, відповідає цільовій функції. Термін дисперсії вимірює, наскільки коливається прогнозування алгоритму навчання для різних навчальних наборів.
38) Що таке алгоритм додаткового навчання в ансамблі?
Додатковий метод навчання - це здатність алгоритму вчитися на нових даних, які можуть бути доступні після того, як класифікатор вже сформований із вже наявного набору даних.
39) Для чого використовуються PCA, KPCA та ICA?
PCA (аналіз основних компонентів), KPCA (аналіз основних компонентів на основі ядра) та ICA (незалежний аналіз компонентів) є важливими методами вилучення особливостей, що використовуються для зменшення розмірності.
40) Що таке зменшення розмірів у машинному навчанні?
У машинному навчанні та статистиці зменшення розмірності - це процес зменшення кількості випадкових величин, що розглядається, і його можна розділити на вибір об’єкта та вилучення об’єкта.
41) Що таке машини векторної підтримки?
Машини опорних векторів - це керовані алгоритми навчання, що використовуються для класифікації та регресійного аналізу.
42) Які складові реляційних методів оцінки?
Важливими компонентами методів реляційного оцінювання є
- Збір даних
- Набуття наземної правди
- Техніка перехресної перевірки
- Тип запиту
- Підрахунок метрики
- Тест на значимість
43) Які існують різні методи послідовного керованого навчання?
Різними методами вирішення проблем послідовного контрольованого навчання є
- Методи розсувного вікна
- Періодичні розсувні вікна
- Приховані моделі Маркоу
- Максимальна ентропія моделей Markow
- Умовні випадкові поля
- Графічні трансформаторні мережі
44) У яких сферах робототехніки та обробки інформації виникає проблема послідовного прогнозування?
Області в робототехніці та обробці інформації, де виникає проблема послідовного прогнозування, є
- Навчання імітації
- Структуроване прогнозування
- Навчання підкріплення на основі моделі
45) Що таке пакетне статистичне навчання?
Статистичні методи навчання дозволяють вивчити функцію або предиктор із набору спостережуваних даних, які можуть робити прогнози щодо невидимих або майбутніх даних. Ці методи забезпечують гарантії ефективності вивченого предиктора щодо майбутніх невидимих даних на основі статистичного припущення щодо процесу формування даних.
46) Що таке навчання PAC?
Навчання PAC (ймовірно, приблизно правильне) - це система навчання, яка була введена для аналізу алгоритмів навчання та їх статистичної ефективності.
47) За якими категоріями можна класифікувати процес навчання послідовності?
- Прогнозування послідовності
- Генерація послідовності
- Розпізнавання послідовності
- Послідовне рішення
48) Що таке навчання послідовності?
Послідовне навчання - це метод навчання та навчання в логічній манері.
49) Які дві техніки машинного навчання?
Дві техніки машинного навчання такі
- Генетичне програмування
- Індуктивне навчання
Механізм рекомендацій, реалізований основними веб-сайтами електронної комерції, використовує машинне навчання.