バギングとは
バギングは組の学習データ集合の集合に対してそれぞれ学習を行い、
個の予測器の多数決や平均によって予測を行う手法です。
ブートストラップサンプル
ブートストラップサンプルとは、個の学習データから重複を許して
個のサンプルを復元抽出したものです。
ブートストラップサンプルを選択された学習データの番号の集合で表現します。
※数学の集合の定義では同一の要素を重複してカウントしないが、表記の簡略化のために、
本記事では別の要素として扱います。
例えば、として、ブートストラップ集合をのように表記し、
その要素数はのように扱うことにします。
分類問題、回帰問題に対するバギング
個の学習データが与えられ、
個のブートストラップサンプル集合を生成したとします。
の時のブートストラップサンプル集合の生成イメージを下図に記載しました。
各に対して学習を行い、特徴ベクトルに対する番目の予測器の出力をとします。
この時、分類問題に対するバギングでは、各予測器の出力の頻度が最も多いクラスに分類を行います。
特徴ベクトルに対する予測クラスは次式で表されます。
の時の分類問題に対するバギングのイメージを下図に記載しました。
一方、回帰問題の場合、特徴ベクトルに推定値は次式で表されます。
の時の回帰問題に対するバギングのイメージを下図に記載しました。
偉人の名言
あなたの運命が形作られるのは、あなたが決断する瞬間なのです。
アンソニー・ロビンズ
動画
なし