Определение
Бэггинг помогает снизить разброс и сделать модель устойчивее. Вместо одной модели обучают много похожих моделей на случайных выборках с возвращением. Затем ответы усредняют или выбирают большинством голосов. Известный пример подхода — случайный лес.
Пример
Для классификации заявок обучают несколько деревьев решений на разных частях данных, а итоговый ответ выбирают голосованием.
Почему это важно
Термин важен для понимания ансамблей: иногда группа простых моделей работает надёжнее одной сложной.
Как работает
Алгоритм создаёт несколько обучающих наборов из исходных данных, обучает отдельные модели и агрегирует их предсказания.
Где применяется
- классификация
- регрессия
- устойчивые модели на табличных данных
Ограничения
Бэггинг увеличивает вычислительные затраты и не всегда помогает, если базовые модели слишком простые или данные плохо подготовлены.
FAQ
Зачем знать термин «Бэггинг»?
Термин важен для понимания ансамблей: иногда группа простых моделей работает надёжнее одной сложной.
