Ансамблеві методи машинного навчання : Стекинг, Беггинг, Бустинг 8 Ансамблеві методи машинного навчання : Стекинг, Беггинг, Бустинг 9 Ансамблеві методи машинного навчання : Стекинг, Беггинг, Бустинг 10

Ансамблі моделей машинного навчання

#Машинне навчання #Нейронні мережі

Коли потрібно вирішити складну обчислювальну задачу і жоден алгоритм не підходить ідеально, використовують ансамблі. Ансамблі – поєднання відразу декількох алгоритмів, які навчаються одночасно і виправляють помилки один одного. На сьогоднішній день саме вони дають найточніші результати, тому саме їх найчастіше використовують усі великі компанії, для яких важлива швидка обробка великої кількості даних.

Як працюють ансамблі

Ідея дуже проста - дати всім одну задачу і спостерігати як вони знайдуть десятки та більше нових способів вирішити завдання.

Найкращий результат виходить, коли алгоритми в ансамблях максимально різні. Наприклад, Регресія (Regression) і Дерева Рішень (Decision Trees) поєднуються відмінно. А ось поєднання Наївний Байес (Naive Bayes) і метод k-найближчих сусідів (k-nn method) в ансамблях не використовують – вони занадто стабільні і тому не можуть вийти за звичні рамки рішень.

Для збору ансамблів застосовують наступні підходи:

Ансамблевые методы МЛ

Стекінг = Stacking = Meta Ensembling

Спершу навчають кілька алгоритмів, потім результати їх роботи показують останньому алгоритму. Саме він і приймає остаточне рішення. Стекінг – хороший, але найменш точний ансамбль серед інших методів.

Стекинг

Беггінг = Bootstrap AGGregatING

Цей тип навчання означає: багато разів навчати ансамбль на випадкових вибірках даних. І в кінцевому підсумку усереднити відповіді. Це виглядає як голосування за найбільш популярну відповідь, де багато моделей працюють паралельно.

Роботу цього способу ми бачимо коли збираємося зробити фото, а камера знаходить і обводить обличчя в кадрі.

Беггинг

Бустінг = Boosting

Цей спосіб включає послідовне навчання алгоритмів. Тобто спершу навчаємо перший і відзначаємо місця, де він помилився. Потім навчаємо другий, особливу увагу приділяючи місцям на яких помилявся перший. І так далі. До необхідного результату.

Бустинг

Тут також робляться вибірки даних, проте вже не за випадковою ознакою. Тепер кожна наступна вибірка складається з тих даних, на яких помилився попередній алгоритм. Таким чином досягається найбільш якісний результат, але тільки в тих випадках, де не потрібні паралельні методи.

Детальніше про інші методи машинного навчання читайте в наших статтях: «Штучний інтелект, машинне навчання та нейронні мережі»,«Класичне навчання як різновид машинного навчання»,«Навчання з підкріпленням як різновид машинного навчання».

21.01.2019
Зображення, використані в статті, були взяті з відкритих джерел і використовуються як ілюстрації.
Хочете обговорити ваш проект або замовити розробку?
Надіслати
Цей сайт є українською мовою. Ви можете переключити мову у меню, або зробити це зараз.