機械学習基礎理論独習

誤りがあればご指摘いただけると幸いです。数式が整うまで少し時間かかります。リンクフリーです。

勉強ログです。リンクフリーです
目次へ戻る

PRML演習問題 1.3(標準)

問題

3 個の色分けされた箱 r (赤)、b (青)、g (緑)を考える。
r には 3 個のりんご、4 個のオレンジ、3 個のライムが入っており、
b には 1 個のりんご、1 個のオレンジ、0 個のライムが入っており、
g には 3 個のりんご、3 個のオレンジ、4 個のライムが入っている。
箱を p(r)= 0.2,\ p(b)=0.2,\ p(g)=0.6 という確率でランダムに選び、
果物を箱から 1 個取り出す(箱の中のものは等確率で選ばれるとする)とき、りんごを選び出す確率を求めよ。
また、選んだ果物がオレンジであったとき、それが緑の箱から取り出されたものである確率はいくらか?

解答

箱の種別を表す確率変数を c\in\{r,b,g\}
果物の種別を表す確率変数を f\in\{a,o,l\}(a はりんご、o はオレンジ、l はライムを表す)とします。
イメージ図は以下です。
図1
f:id:olj611:20210917115521p:plain:w400
1 個取り出したときリンゴである確率は、p(f=a) なので、これを求めます。

\begin{eqnarray}
p(f=a)&=&\sum_{c\in\{r,b,g\}}p(c,f=a)\\
&=&p(c=r,f=a)+p(c=b,f=a)+p(c=g,f=a)\\
&=&p(f=a|c=r)p(c=r)+p(f=a|c=b)p(c=b)+p(f=a|c=g)p(c=g)\\
&=&\frac{3}{10}\cdot\frac{2}{10}+\frac{1}{2}\cdot\frac{2}{10}+\frac{3}{10}\cdot\frac{6}{10}\\
&=&\frac{3}{50}+\frac{5}{50}+\frac{9}{50}\\
&=&\frac{17}{50}\tag{1}
\end{eqnarray}

次に、選んだ果物がオレンジであった(f=o)とき、それが緑の箱から取り出された(c=g)ものである確率、
すなわち、p(c=g|f=o) を求めます。
先に p(f=o) を求めます。

\begin{eqnarray}
p(f=o)&=&\sum_{c\in\{r,b,g\}}p(c,f=o)\\
&=&p(c=r,f=o)+p(c=b,f=o)+p(c=g,f=o)\\
&=&p(f=o|c=r)p(c=r)+p(f=o|c=b)p(c=b)+p(f=o|c=g)p(c=g)\\
&=&\frac{4}{10}\cdot\frac{2}{10}+\frac{1}{2}\cdot\frac{2}{10}+\frac{3}{10}\cdot\frac{6}{10}\\
&=&\frac{4}{50}+\frac{5}{50}+\frac{9}{50}\\
&=&\frac{18}{50}\\
&=&\frac{9}{25}\tag{2}
\end{eqnarray}

p(c=g|f=o)ベイズの定理を適用して、計算します。

\begin{eqnarray}
p(c=g|f=o)&=&\frac{p(f=o|c=g)p(c=g)}{p(f=o)}\\
&=&\frac{\dfrac{3}{10}\cdot\dfrac{6}{10}}{\dfrac{9}{25}}\\
&=&\frac{18}{100}\cdot\frac{25}{9}\\
&=&\frac{1}{2}\tag{3}
\end{eqnarray}

目次へ戻る