分散最大化
主成分分析 - 分散最大化による定式化 - 導出その1では場合を定式化した後に
一般のについて帰納法を使って定式化しましたが、それとは異なる方法(分散最大化という方針は変わらない)で定式化していきます。
をデータ集合の平均とします。
をデータ集合の共分散行列とします。
次元の正規直交基底をとします。
です。
ここで、とします。正規直交性より、次が成り立ちます。
はに射影されます。
射影されたデータの平均はです。
射影されたデータの分散は
です。
※共分散行列ではなく、分散です。
本記事の後半で「共分散行列」を使って分散を最大化するというアプローチも記載しておりますので、そちらもお読みください。
を計算していきます。
の2行目で公式を、4行目でトレースの線形性を用いました。
制約条件の下で、を最大化します。
ラグランジュの未定乗数法を用いると、ラグランジュ関数は以下のようになります。
をで微分して、とおきます。
より、の固有値と固有ベクトルを求めればよいことが分かります。
を最大化したいので、の固有値の大きい方から個選べばよいです。
共分散を使って分散最大化
上で書いた通り、今度は射影されたデータの共分散行列を用いて定式化してみます。
射影されたデータの共分散行列は
です。
分散の最大化をしたいのですが、共分散行列を使って分散(散らばり)を最大化を以下のように考えてみることにします。
一般論として、射影後の散らばりについて考えます。
は各点を各主軸方向に射影して、固有値倍して、すべて足しわせたものと解釈できます。
よって、やがの射影後の散らばりを表すと考えることができます。
本記事では、射影後の散らばりはと固有値の和で考えることにします。
よって、制約条件の下で、を最大化すればよいことになります。
あとは、同じです。
偉人の名言
学べば学ぶほど、自分がどれだけ無知であるか思い知らされる。
自分の無知に気づけば気づくほど、より一層学びたくなる。
アインシュタイン
参考リンク
参考文献
無し
動画
無し