バギングとは
バギングは組の学習データ集合の集合に対してそれぞれ学習を行い、
個の予測器の多数決や平均によって予測を行う手法です。
ブートストラップサンプル
ブートストラップサンプルとは、個の学習データから重複を許して
個のサンプルを復元抽出したものです。
ブートストラップサンプルを選択された学習データの番号の集合で表現します。
※数学の集合の定義では同一の要素を重複してカウントしないが、表記の簡略化のために、
本記事では別の要素として扱います。
例えば、として、ブートストラップ集合
を
のように表記し、
その要素数はのように扱うことにします。
分類問題、回帰問題に対するバギング
個の学習データ
が与えられ、
個のブートストラップサンプル集合
を生成したとします。
の時のブートストラップサンプル集合の生成イメージを下図に記載しました。

各に対して学習を行い、特徴ベクトル
に対する
番目の予測器の出力を
とします。
この時、分類問題に対するバギングでは、各予測器の出力の頻度が最も多いクラスに分類を行います。
特徴ベクトルに対する予測クラス
は次式で表されます。
の時の分類問題に対するバギングのイメージを下図に記載しました。

一方、回帰問題の場合、特徴ベクトルに推定値
は次式で表されます。
の時の回帰問題に対するバギングのイメージを下図に記載しました。

偉人の名言

あなたの運命が形作られるのは、あなたが決断する瞬間なのです。
アンソニー・ロビンズ
動画
なし