条件付き独立性
3変数を考えます。
およびが与えられたとき、の条件付き分布がの値に依存しないとします。
式で書くと以下のようになります。
このとき、が与えられた下で、はに対して、条件付き独立であるといいます。
この条件付き独立は次のようにも表せます。
また、次のような記法でも表せます。
以下で、条件付き独立を考える上で大事な3つのパターンを紹介します。
tail-to-tail
まず、tail-to-tailです。
が2本のリンクの矢印の尾(英語でtail)で接続しているので、tail-to-tailといいます。
が未観測の時のグラフは以下のようになります。
図1: が未観測の時のtail-to-tail
図1の有向グラフより、同時分布を書くと次のようになります。
の独立性を調べるため、式をで周辺化します。
式は一般にはの形には書けないので、
が言えます。
ここで、は空集合、は条件付き独立性が「一般には」成立しないことを意味します。
が観測されたとします。この時、グラフは以下のようになります。
図2: が観測された時のtail-to-tail
図2の有向グラフより、同時分布を書くと次のようになります。
式より、
が言えます。
これは元々独立ではなかったが、が観測されたことにより、独立になったことを意味しています。
head-to-tail
次に、head-to-tailです。
が1本のリンクは矢印の先(英語でhead)で、もう1本のリンクは矢印の尾(英語でtail)で接続しているので、head-to-tailといいます。
※tail-to-headとはいいません。
が未観測の時のグラフは以下のようになります。
図3: が未観測の時のhead-to-tail
図3の有向グラフより、同時分布を書くと次のようになります。
の独立性を調べるため、式をで周辺化します。
式の最後の変形ですが、に確率の乗法定理を適用しているだけで、あまり意味はありません。
式は一般にはの形には書けないので、
が言えます。
が観測されたとします。この時、グラフは以下のようになります。
図4: が観測された時のhead-to-tail
図4の有向グラフより、同時分布を書くと次のようになります。
式より、
が言えます。
これは元々独立ではなかったが、が観測されたことにより、独立になったことを意味しています。
head-to-tailとtail-to-tailは同じような現象になりました。
head-to-head
最後に、head-to-headです。
が2本のリンクの矢印の先(英語でhead)で接続しているので、head-to-headといいます。
が未観測の時のグラフは以下のようになります。
図5: が未観測の時のhead-to-head
図5の有向グラフより、同時分布を書くと次のようになります。
の独立性を調べるため、式をで周辺化します。
よって、先の2例とは異なり、どの変数も観測されていないときとは独立であることが分かります。
この時、
がいえます。
が観測されたとします。この時、グラフは以下のようになります。
図6: が観測された時のhead-to-head
図6の有向グラフより、同時分布を書くと次のようになります。
式は一般に積の形に因数分解できない為、
です。
これは元々独立であったが、が観測されたことにより、独立とはいえなくなった(遮断が解かれた)ことを意味しています。
また、に子孫があり、は観測されずにその子孫が観測されても、の遮断が解かれます。(証明についてはPRML演習問題 8.10(基本)参照)
このように、やの子孫が観測されることにより経路が遮断されることを弁明というようです。
有向分離
一般の有向グラフを考えます。
をそれぞれ重複しないノード集合とします。
を合わせたときにグラフ全体にならなくてもよいです。
この時、有向グラフがを示唆するかは次ので判断できます。
に属する任意のノードからに属する任意のノードへの全ての可能な経路のうち、
を満たすノードを含む経路は遮断されているといいます。
:集合に含まれるノードであって、経路に含まれる矢印がそこでhead-to-tailまたはtail-to-tailである
:経路に含まれる矢印がそのノードでhead-to-headであり、自身あるいはそのすべての子孫のいずれもが集合Cに含まれない。
全ての経路が遮断されていれば、はによってから有向分離されていると言い、
グラフの全変数上の同時分布はを満たします。
有向分離の例
図7
図7を用いて、有向分離の例を示します。
※有向分離の条件と図7のは関連がありません。
まずは、グラフにおける有向分離されない例です。
からへの経路はノードによって、遮断されません。
この経路において、ノードはtail-to-tailでありかつ観測されていない為です。
さらに、この経路はノードによって、遮断されません。
この経路において、ノードはhead-to-headですが、その子孫ノードが観測されている為です。
よって、グラフにおいては導けません。
次に、グラフにおける有向分離される例です。
からへの経路はノードによって、遮断されます。
この経路において、ノードはtail-to-tailでありかつ観測されている為です。
よって、グラフにおいてが導けます。
さらに、この経路はノードによって、遮断されます。
この経路において、ノードはhead-to-headですが、ノード自身とその子孫ノードが観測されていない為です。
マルコフブランケット
個のノードを持つ有向グラフで表現される同時分布と、変数に対応するノード上の、
他の全ての変数で条件づけられた条件付き分布を考えます。
条件付き分布は次のように書けます。
式において、因数はかつのとき、分子と分母に存在するので約分されます。
(に無関係な因数は式から消えるってことです。)
ですので、残る因数はとです。
はノードの親に依存し、はノードの子とその共同親に依存します。
(のは親にを含むので、の子です。)
共同親とは、ノードの親のうちノード以外のものを指します。
以下の図8は、マルコフブランケットと呼ばれる、親、子及び共同親からなるノード集合です。
図8
ノードのマルコフブランケットは、を残りのグラフからから孤立させるためのノードの最小集合と考えることができます。
マルコフブランケットはノードの親と子だけからなるのではないので注意が必要です。
なぜなら弁明現象ににより、子ノードの観測によって共同親への経路の遮断が解かれるためです。
したがって、の値を得るためには全ての共同親ノードも観測しなくてはなりません。
マルコフブランケット以外の残りの変数に対して、独立であることを有向分離基準を用いた証明は、
PRML演習問題 8.9(基本) wwwを参照してください。
最後に
有向分離については、おすすめのブログがありまして、
有向分離を使いこなす!~有向分離の導入と教師有り学習~にシステマチックな手法で有向分離を判断する記事が掲載されています。
偉人の名言
努力によって得られる習慣だけが善である。
カント
動画
なし