機械学習基礎理論独習

誤りがあればご指摘いただけると幸いです。数式が整うまで少し時間かかります。リンクフリーです。

勉強ログです。リンクフリーです
目次へ戻る

PRML演習問題 1.14(標準)

問題

w_{ij}を成分とする任意の正方行列はw_{ij}=w_{ij}^S+w_{ij}^Aという形に書けることを示せ。
ただし、w_{ij}^Sw_{ij}^Aはそれぞれ対称行列と反対称行列の成分でありw_{ij}^S=w_{ji}^Sおよびw_{ij}^A=-w_{ji}^Aがすべてのi,jについて成り立つ。
さてここで、D次元における高次の多項式2次の項

\begin{eqnarray}
\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j\tag{1.131}
\end{eqnarray}

を考えると、

\begin{eqnarray}
\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j=\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^Sx_ix_j\tag{1.132}
\end{eqnarray}

となり、反対称行列の寄与が消えることを示せ。
このことから、一般性を失うことなく、係数w_{ij}は対称に選んでよく、すべてのD^2の成分の選び方が独立ではないことがわかる。
これを使って、行列w_{ij}^Sの独立パラメータの数がD(D+1)/2で与えられることを示せ。

解答

w_{ij}^S,w_{ij}^Aを以下のように定義します。

\begin{eqnarray}
&&w_{ij}^S=\frac{w_{ij}+w_{ij}^\top}{2}\tag{1}\\
&&w_{ij}^A=\frac{w_{ij}-w_{ij}^\top}{2}\tag{2}\\
\end{eqnarray}

w_{ij}^S+w_{ij}^Aを計算します。

\begin{eqnarray}
w_{ij}^S+w_{ij}^A&=&\frac{w_{ij}+w_{ij}^\top}{2}+\frac{w_{ij}-w_{ij}^\top}{2}\\
&=&w_{ij}\tag{3}
\end{eqnarray}

(3)より、w_{ij}=w_{ij}^S+w_{ij}^Aという形に書けることを示せました。

\displaystyle\sum_{i=1}^D\displaystyle\sum_{j=1}^Dw_{ij}x_ix_jw_{ij}=w_{ij}^S+w_{ij}^Aを代入して展開します。

\begin{eqnarray}
\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j&=&\sum_{i=1}^D\sum_{j=1}^D(w_{ij}^S+w_{ij}^A)x_ix_j\\
&=&\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^Sx_ix_j+\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^Ax_ix_j\tag{4}
\end{eqnarray}

(4)\displaystyle\sum_{i=1}^D\displaystyle\sum_{j=1}^Dw_{ij}^Ax_ix_jを計算します。

\begin{eqnarray}
\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^Ax_ix_j&=&\sum_{i=1}^D\sum_{j=1}^D\left(\frac{w_{ij}-w_{ij}^\top}{2}\right)x_ix_j\\
&=&\frac{1}{2}\left(\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j-\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^\top x_ix_j\right)\\
&=&\frac{1}{2}\left(\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j-\sum_{i=1}^D\sum_{j=1}^Dw_{ji} x_ix_j\right)\\
&=&\frac{1}{2}\left(\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j-\sum_{j=1}^D\sum_{i=1}^Dw_{ji} x_jx_i\right)\\
&=&0\tag{5}
\end{eqnarray}

(5)を式(4)に代入します。

\begin{eqnarray}
\sum_{i=1}^D\sum_{j=1}^Dw_{ij}x_ix_j=\sum_{i=1}^D\sum_{j=1}^Dw_{ij}^Sx_ix_j\tag{6}
\end{eqnarray}

(6)より、式(1.132)を示せました。

行列w_{ij}^SD\times Dの対象行列なので、独立なパラメータの数は(i,i)成分の数と(i,j)\ (i\not=j)成分の数の和なので、以下のようになります。

\begin{eqnarray}
\sum_{i=1}^Di=\frac{D(D+1)}{2}\tag{7}
\end{eqnarray}

(7)より、行列w_{ij}^Sの独立パラメータの数がD(D+1)/2で与えられることが示せました。

補足

最後の「行列w_{ij}^Sの独立パラメータの数がD(D+1)/2」を示すところですが、
PRML演習問題 2.21(基本)を参考にしてもらうと分かりやすいかと思います。

目次へ戻る