機械学習基礎理論独習

誤りがあればご指摘いただけると幸いです。数式が整うまで少し時間かかります。リンクフリーです。

勉強ログです。リンクフリーです
目次へ戻る

決定木とは

この記事では決定木に関する用語などを説明します。

決定木とは

決定木とは木構造のモデルのことであり、
特に分類問題で用いられる決定木は分類木と呼ばれ、回帰問題で用いられる決定木は回帰木と呼ばれます。

分類木

例を挙げて説明します。
N組の学習データ({\bf x}_1,y_1),\ldots,({\bf x}_N,y_N)が与えれているとします。
{\bf x}_i\in\mathbb{R}^2であるとします。
3クラスあると想定し、 {\bf C}=\{c_1, c_2,c_3\}としてy_i\in{\bf C}のようにクラスが与えられているとします。
この時、分類木では以下の図のように分類できます。

f:id:olj611:20210304094934p:plainf:id:olj611:20210304095604p:plain

x_1<\theta_1を満たすデータはc_1であり、
x_2\geq\theta_1かつx_2<\theta_2を満たすデータはc_2であり、
x_1\geq\theta_1かつx_2\geq\theta_2を満たすデータはc_3であることを表しています。

丸のノードのを中間ノード、四角のノードのことを葉ノードと呼びます。
最も上にあるノードを根ノードと呼びます。

回帰木

分類木との違いは、葉ノードのラベルだけです。

偉人の名言

f:id:olj611:20210304100536p:plain
人生はどちらかです。勇気をもって挑むか、棒にふるか。
ヘレン・ケラー

参考文献

入門 パターン認識機械学習

動画

目次へ戻る