はじめに
こんなツイートがありました。
これ暗記なのか…? pic.twitter.com/t6U3lxOAjU
— クルトン (@kuruton456) 2021年10月31日
ツイート主は、「こんな式覚えるのか?」と困惑しているようでしたので、
私なりの回答を作成してみることにしました。
統計学的な記法とやや異なる箇所がありますが、それについてはご了承ください。
問題を書き直すと、以下のようになります。
問題
と で、相関係数が の時の を求めよ。
回答 - その1
普通に計算して求めてみます。
と の相関係数がであることから、以下の式が導けます。
を以下のように定義します。
は以下のようになります。
は以下のようになります。
を、確率の乗法定理を用いて変形します。
を についてまとめます。
の平均を、分散を とおいて、 についてまとめます。
式 の の係数を比較すると、以下のようになります。
式 を式 に代入します。
式 より、 が求まりました。
ツイート主は「パッとできる簡単な導出」を望んでいるので、この解法はそれを満たしているかは微妙です。
式 の計算をどれだけ早く計算できるかがポイントとなります。
回答 - その2
条件付きガウス分布の公式を使って求めます。
------↓ここから公式------
同時ガウス分布があり、は以下のようにブロック化されているとします。
この時、以下の条件付き分布の式が成り立ちます。
------↑ここまで公式------
変数の「公式」と「問題」の対応表を下に記します。
公式 | 問題 |
---|---|
まず、 に公式を適用します。
次に、 に公式を適用します。
最後に、
式 を式 へ代入します。
式 より、 が求まりました。
この公式が頭に入っていれば、「パッとできる簡単な導出」を満たしていると思いますが、
こんなの普通覚えてないですよね。
回答 - その3
3つ目の回答は、「パッとできる簡単な導出」です。(簡単かどうかは微妙です。)
回帰について理解していれば、 は自然と導けます。
ーーーーーー↓ここから回帰の一般論ーーーーーー
回帰の一般論を説明します。(計算過程はかなり飛ばします。)
データ が与えられているとします。(一般論なので、 は一旦問題の とは無関係とします。)
で回帰します。
二乗和
を最小にする は を で偏微分して、 とすると、以下の正規方程式が成り立ちます。
式 を について解くと、
が得られます。
ただし、 とします。
と の相関係数 は以下のようになります。
式 より、
という関係式が成り立ちます。
ただし、 は の標準偏差、 は の標準偏差とします。
回帰直線による のあてはめ値 とおきます。
と には次の関係式が成り立ちます。
と の距離を とします。
このとき、それの2乗について
が成り立ちます。
ということで、ここまでが一般論です。
ーーーーーー↑ここまで回帰の一般論ーーーーーー
なぜ、回帰を考えるかというと、
を固定したときの の平均 は下図の緑色の線のように直線となり、
この直線は の誤差を最小化するものであり、最小二乗法そのものだからです。
緑色の線は点 を通り、傾きは です。
後は、変数を置き換えるだけです。
式 の を確率変数で、 を で置き換えると、次のようになります。
式 の両辺に を掛けます。
先程同様、式 の を確率変数で、 を で置き換えた後、
式 の 左辺 は回帰後なので、 の代わりに で重み付けして で積分し、
式 の右辺 は回帰前なので、 の代わりに で重み付けして で積分すると、以下のようになります。
はガウス分布であり、式 は、 の平均と分散なので、 が求まりました。
という感じで求まるのですが、回帰について十分な理解が必要かと思います。
回答 - その3の式変形の補足
回答 - その3にて、式変形をぶっ飛ばしすぎたので、ここで補足します。
式 は単なる微分なので、大丈夫かと思います。
式 は相関係数の定義そのものです。
式 の変形については、統計学入門を参考にしてください。
式 の式変形について説明します。