逐次学習 - 確率的勾配降下法 - 機械学習基礎理論独習

バッチ手法・逐次学習

すべての訓練データ集合を一度に処理する最尤推定のような方法はバッチ手法と呼ばれます。
バッチ手法の問題点は、大規模なデータ集合に対して計算に時間がかかるという点です。

データ集合が大規模なときには、データ点を一度に $1$ つだけ用いてモデルのパラメータを順次更新してしいく
逐次学習(あるいはオンライン学習としても知られる)アルゴリズムを使うとよいです。

確率的勾配降下法

逐次学習のアルゴリズムは、以下のように確率的勾配降下法を適用することにより得られます。
誤差関数が $E=\sum_n E_n$ のようにデータ点の和からなるとき、パターン $n$ が与えられた( $n$ はランダムに選ぶことが多い)とき、
確率的勾配降下法では、パラメータベクトル $\bf w$ を