ゼロから作る Deep Learning で Affine レイヤーの内積の誤差逆伝播を求める部分が省略されていたので、行列で微分する部分の説明を動画で録画してみました。

Deep Learning 補足動画

行列での微分部分の補足動画です。

この

について解説してく。

今回想定するモデル

今回はバイアス部分は除いて、単純に入力 2 個と次の層への出力 3 個で考える。

ここで

となる。

① について

まで計算しておいて

を代入すると

よって示せた。

② について

同じように

少し複雑になるが

なので、ほとんどは 0 になってしまう。

よって示せた。

単純な数値計算例(値は結構適当)

もし、損失関数を計算して

として値が渡ってきたとしたら、