問題
で与えられる主成分分析の歪み尺度 の、正規直交条件 の下での に対する最小値は、
がデータ共分散行列 の固有ベクトルであるときに得られることを示せ。
これを行うために、ラグランジュ乗数の行列 を導入し、制約条件のそれぞれを取り込む。
その結果、歪み尺度の式は修正を受け、行列形式で表すと、
のようになる。
ここで、 は 行列で、その列ベクトルは で与えられる。
についてこの を最小化し、その解が を満たすことを示せ。
明らかに、可能なひとつの解は、 の列ベクトルが の固有ベクトルとなっている場合である。
その場合、 は対応する固有値を持った対角行列となる。
一般的な解を得るために、 が対称行列と仮定できることを示し、その固有ベクトル展開を用いるいることで、
の一般解が、 の列ベクトルを の固有ベクトルに選ぶという特解と同じ の値を与えることを示せ。
これらの解は等価なので、固有ベクトルの方の解を選んだ方が楽である。
参照
解答
一般的なについて考えます。
制約条件の下で、歪み尺度を最小化します。
ラグランジュの未定乗数法を用いると、ラグランジュ関数は以下のようになります。
を以下のように定義します。
以下で、を式変形します。
を計算します。
の行列は以下のようになります。
よって、のトレースは以下のようになります。
を以下のように定義します。
を計算します。
一般のにおいて、は以下のようになります。(ここの導出は下の方で補足しています。)
より、は次のように書けます。
をで微分して、とおきます。
ここで、が以下の形で表されると仮定すると
は成立します。
この時、は以下のようになります。
したがって、の固有値のうち小さい方の個に対応する固有ベクトルを選んだ時に歪み尺度の最小値を得ることができます。
よって、主部分空間はの固有値のうち大きい方の個に対応する固有ベクトルを選ぶとよいことが分かります。
を仮定しない場合のの解をとします。
の固有値を、固有ベクトルをとします。
を以下のようにおきます。
このとき、
が成り立ちます。
の両辺に右からを掛けます。
でとおきました。
はがの固有値であることを示しています。
この時、は以下のようになります。
したがって、の固有値のうち小さい方の個に対応する固有ベクトルを選んだ時に歪み尺度の最小値を得ることができます。
よって、主部分空間はの固有値のうち大きい方の個に対応する固有ベクトルを選ぶとよいことが分かります。
補足
として、を計算します。