学習とは"目的となる関数に近似していくこと"でした。

近似したい関数に対する理解

機械学習で近似したい関数は、人間にも正確には分からない事が前提である。

学習とはモデルに関数の近似を表現させることだと説明してまいりました。
しかし、強化学習において近似したい関数は未知であることが大多数を占めます。
なぜなら、もし近似したい関数が正確に記述出来るのであれば、入力と出力の関係式を数式で記述出来るということであります。
それは機械学習を利用せずとも、関数をプログラミングできるということに他なりません。

私たち人間が判断(関数)を数式に記述出来ないということは、その判断は感覚によって行っているということです。
つまり、機械学習は、人間が感覚で行っている判断の近似に対して強大な効力を発揮するのであります。

教師データ

実際の学習に使用するのは目的関数でなくサンプルデータである

近似したい関数については正確に分からないとお話ししました。
では何が分かっているのでしょうか?

答えは、近似したい関数の入力と出力のサンプルです。
例えば以下のようなものが挙げられます。

  • 現在のオセロの盤面(入力)と、一番有力な次の一手(出力)
  • 画像データ(入力)と、その画像が示す動物のラベル(出力)

事前に分かっているサンプルのことを、機械学習の分野では教師データと呼びます。
ニューラルネットワークでもこの教師データを元に学習を進めていくのです。

少し機械学習に詳しい方であれば、教師なし学習や強化学習はどうなのかと疑問に思うかもしれません。
実はニューラルネットワークでは、教師なし学習も強化学習も、内部的には教師データは存在しているのです。

まとめ

  • 機械学習において近似したい関数は未知である。
  • 事前に分かっている近似したい関数に対する入力と出力を教師データという。
  • 学習とは、教師データとモデルの出力を近づけるようにパラメータを調整することである。