主成分分析の復習
さらっと主成分分析を復習しておきます。
データ集合 の共分散行列 の固有値 と固有ベクトル を求めます。
固有値の大きい順に 個選び、その固有値に対応する固有ベクトルとデータとの内積を取ったものが、
次元削減されたデータ となります。
確率的主成分分析の導入
確率的主成分分析を定式化するには、 まず主部分空間に対応する潜在変数 を明示的に導入します。
潜在変数 上の事前分布は、平均 で共分散行列が単位行列のガウス分布
で与えられます。
潜在変数 の値で条件付けられた観測変数 についての条件付き分布もまたガウス分布で、
のような形を持ちます。
生成モデルの観点から解釈する
式 を生成モデルの観点(どのようにデータが生成するか)から説明します。
まずは、式 に従う 次元の潜在変数 をサンプリングします。
その に 線形変換を施した 次元の観測変数 をサンプリングします。
式 の は 次元の平均が で共分散行列が のガウス分布に従うノイズの変数です。
さらに具体例として、 次元のデータ空間と 次元の潜在変数空間を考えたときの、データ生成モデルと
しての確率的主成分分析モデルの説明が図 です。
最初に潜在変数 の値を事前分布 からひとつ抽出し、
次に の値を、平均 、共分散行列 の等方的なガウス分布(赤の円)から抽出することにより、
観測データ点 を生成します。
図
周辺分布 を求める
尤度関数を計算する際に必要なので、先に、 を求めます。
がガウス分布なので、 もガウス分布です。
以下の公式が使えます。
ーーーーーー↓ここから公式ーーーーーー
が与えられている時
が成り立つ。
ーーーーーー↑ここまで公式ーーーーーー
公式 を用いると、次式が成り立ちます。
ここで、 共分散行列は は次のように定義されます。
尤度関数
観測変数のデータ点の集合 が与えられた下で、確率的主成分分析モデルは図 に示すような有向グラフで記述できます。
図
尤度関数は以下のようになります。
対数尤度関数は以下のようになります。
偉人の名言
作曲の95%は、過去の遺産を糧にしています。
作曲家自身の「発明」は、せいぜい1、2%程度で、最大5%といったところ。
作曲の大部分は過去の作品の引用です。
坂本龍一