変分推論とは
変分推論は確率分布の近似手法です。
ある確率分布を、より簡単な近似分布で表現できないか考えます。
は分布の距離のようなものなので、これが小さくなるようにします。
単純にとするのではなく、にある制限を設けます。
のように各確率変数に独立の仮定をおきます。
変分推論においてこうした分解された形を用いることは、物理学で平均場近似と呼ばれる近似法に対応しています。
変分推論の基礎となる近似式の導出
すでにとが与えられているとします。
このときのを求めてみましょう。
期待値はブラケットによる表記法()を用いることにします。
(6)の式変形ですがを使った変形をしております。
(8)を最小値は次の式で得ることができます。
(9)式に対数を取ってみましょう。(10)のは(9)の正規化項です。同様に、やに対する最適化も全く同じ議論になり、それぞれの近似分布に対する更新を繰り返すことにより、KLダイバージェンスが徐々に最小化されていきます。
ここで、現実的な想定として、観測データが与えられた一般的な確率モデルの事後分布に対する近似公式を求めてみます。
は潜在変数やパラメータであるとします。
(8)式より((8)式は一般的なケースは示していません。いづれ書くのでお待ちください。)
(12)のにも入れています。
最後に
今回の記事で示したかったのは(11)と(13)です。
次回の記事ではこれらを駆使して、混合ガウス分布に変分推論を適用していきます。
計算が中々むつかしいですが、一緒に頑張っていきましょう。