混合ガウス分布とは
混合ガウス分布は以下の式で表されます。
混合ガウス分布は字の通り、ガウス分布を混合係数で重みづけした和になっています。
混合係数はを満たしている必要があります。
例として、の混合ガウス分布のイメージ図を以下に記します。
潜在変数を潜り込ませる
次元の2値確率変数を導入します。
これは1-of-K符号化を取るとします。かつを満たします。
例えば、だとすると、とは3種類の値しかとりません。
なら、となるので、のいづれかがになることが分かればよいということになります。
という確率分布を与えます。
すると、以下が成り立ちます。
また、の値が与えられた下でのの条件付き分布は、
であれば番目のガウス分布に従うため、以下の式が成り立ちます。
式より
となります。
周辺化することによりを求めてみます。
式は混合ガウス分布の式と一致するので潜在変数を潜り込ませてもよいことが分かります。
負担率
を負担率と表現することにします。
の時の負担率のイメージ図を以下に記します。
混合ガウス分布モデルの確率変数
今回登場する確率変数の紹介です。
観測データを とします。
潜在変数 を潜り込ませます。
混合ガウス分布のパラメータは
混合比率 、
ガウス分布の平均、
ガウス分布の共分散行列 です。
今回の混合ガウス分布モデルのグラフィカルモデルを以下に記します。
最尤推定
各データ点が混合ガウス分布から独立に生成されると仮定すると、尤度は以下のようになります。
対数を取ります。
式はlog-sumになっており、解析的解くことができません。
そこでEMアルゴリズムを適用します。
1.初期化
を初期化します。
2.Eステップ
負担率を計算します。
3.Mステップ
以下のMステップの全ての更新式で使う為、を以下のようにおきます。
の更新式
の更新式の導出に使用する行列の微分やトレースの公式を書き出します。
準備として、を求めます。
式の変形に式を用いました。
式に対数を取ります。
式の変形には式を用いました。
式より、以下の式が成り立ちます。
式から式を導くときに、式を用いました。
対数尤度をで微分してとおきます。
アルゴリズム
1.初期化
を初期化します。
2.Eステップ
を更新します。
3.Mステップ
を更新します。
ただし、
とします。
4.収束確認
対数尤度を再計算し、前回との差分があらかじめ設定していた収束条件を満たしていなければ2に戻り、満たしていれば終了します。
偉人の名言
何かを得るためには、心でそれを思うことから始まる。
ブルース・リー
動画
記事作成前に作った動画なので、内容が異なる可能性があります。