確率的識別モデル
2クラス分類問題における確率モデルの場合、目的変数は2値表現が一般的です。
その表記では、クラスをで表現し、クラスをで表現する1つの目的変数が使用されます。
の値はクラスがである確率として解釈できます。
である確率を出力するモデルを定義したいが、
回帰同様、をモデルとしてしまうと、
値域がとなってしまい、確率の公理を満たしません。
そこで、以下のようにします。を特徴ベクトルとします。
ここではシグモイド関数です。
の値域はなので確率の公理を満たしています。
またより、の事後分布は、以下のように書けます。
を合わせて書くことができます。
が求まったとして、新たな入力に対して、クラスを予測する場合は以下のようにします。
目的関数の微分
この目的関数は解析的に解くことができないので、目的関数の勾配ベクトルを求めて数値的に(最急降下法など)解くことを考えます。
の4行目でとおきました。
勾配ベクトルが求まりました。
最急降下法で解く場合、以下の更新式を収束するまで繰り返せばが求まります。
は学習パラメータです。
偉人の名言
夢中で日を過ごしておれば、
いつかわかる時が来る。
坂本龍馬