混合ガウス分布モデルの確率変数
今回登場する確率変数の紹介です。
観測データを とします。
EMアルゴリズム同様、潜在変数 を潜り込ませます。
混合比率 、
ガウス分布の平均、
ガウス分布の精度 です。
精度行列は分散共分散行列の逆行列のことです。計算が少し楽になるので、こちらを使います。
変分推論を適用する
やりたいことは、から混合ガウス分布の潜在変数とパラメータを推定することです。
そのためには、潜在変数とパラメータの事後分布に近い分布を見つければよさそうです。
式より、潜在変数とパラメータの事後分布は同時分布に比例するので
同時分布に近い分布を考えることにします。
ここでが以下のように分解できると仮定します。
式のように潜在変数とパラメータの分布を分けて近似する手続きを、特に変分EMアルゴリズムと呼ぶ場合があります。
前回の記事で導いた変分推論の公式(3)を用いると
以降では、
式に共通な同時分布を定める
式を変形して、の更新式を求める
の2つをやっていきます。
同時分布
変分推論を用いた混合ガウス分布モデルのグラフィカルモデルは、以下の図1です。
※図1では、ハイパーパラメータは省略しています。
図1
このグラフィカルモデルから同時分布を書き起こしてみます。
グラフィカルモデルでははプレート内にありますが、まとめてとして書きだしました。
式の右辺の因子をそれぞれ書き出してみます。
式ですが、 はカテゴリ分布のパラメータなので、共役事前分布のディレクレ分布を採用しています。 は正規化定数です。
の要素は全て としています。
の式変形
この後の数式を見やすくする為に、3つの統計量を定義します。
PRML演習問題 10.13(標準) wwwより、が以下のように分解されることが分かります。
これは変分事後分布 が と分解されることを意味します。
さらに、 及び を含む項は と を含む項の についての積からなり、次のように分解されます。
PRML演習問題 10.13(標準) wwwより、 はディレクレ分布であることが分かります。ディレクレ分布のパラメータを とおきます。
式で、を以下のようにおきました。
PRML演習問題 10.13(標準) wwwより、がガウス-ウィシャート分布であることが分かります。
式のは以下のようにおきました。
の計算
が分かったので、を計算していきます。
その前に、計算で使う期待値を記しておきます。
ディレクレ分布 のの期待値は以下のようになります。
はディガンマ関数です。
ウィシャート分布 のの期待値は以下のようになります。
式は、これまで計算してきた変分ガウス分布の変数とは関係なく一般的なものなので、ご注意ください。
には期待値の項が3つあるので、別々に計算していきます。
まず、を計算します。
これは式をそのまま適用すればよいので、以下のようになります。
をとおきました。
次に、を計算します。
これは式をそのまま適用すればよいので、以下のようになります。
最後に、はPRML演習問題 10.14(標準)より、以下のようになります。
ここで、式を以下のようにおきます。
式を式へ代入します。
式の対数を外します。
ところではの計算のために必要で、は定数であり、計算時に打ち消しあうので、式は以下のようになります。
※にもという定数があるが、参考書に倣いそのままにしておきます。
式は本来比例で書くべきかもしれませんがイコールにしています。
アルゴリズム
0.要件
次元のが与えられています。
1.初期化
を初期化します。
を以下のように初期化します。
2.変分Eステップ
を更新します。
ただし、
とします。
3.変分Mステップ
を更新します。
ただし、
とします。
4.収束確認
対数尤度を再計算し、前回との差分があらかじめ設定していた収束条件を満たしていなければ2に戻り、満たしていれば終了します。
※収束確認は変分下限でもよいと思います。