輪読会「ゼロから作るDeep Learning」第６回

はじめに

てくますプロジェクトでは、てくますゼミと呼ばれる輪読会を隔週で開催しています。

少人数であーだこーだ議論しながら、考える楽しさを分かち合う、ゼミのようなコミュニティです。主に、AIなどの「IT × 数学」領域について学習しています。

現在は「ゼロから作るDeep Learning」というディープラーニングの有名な本を読み進めています。

リンク

今回は本書第６回の輪読会ということで、７章を読み進めました！

本記事では、今回の勉強会で学んだことをざっくりと紹介していきます。

これまで見てきたニューラルネットワークでは、入力データが画像の場合でもデータを１次元にして考えていました。しかしそれでは、画像が持っていた隣接情報が失われるという問題点があります。

この問題点を解決するために、畳み込みニューラルネットワーク（CNN）では、データを１次元にせず、そのまま入力することを考えます。

畳み込みニューラルネットワークには２つの新しい層が登場します。

畳み込み層（Convolutionレイヤ）
CNNの核となる層です。入力データに対してフィルターを考え、畳み込み演算を行います。畳み込み演算とは、入力データの要素と対応するフィルターの要素を掛け算し、それらの和を取る積和演算（つまりは内積）のことです。
プーリング層（Poolingレイヤ）
プーリングは、縦・横方向の空間を小さくする演算です。Maxプーリングの場合、対象領域の値のうち最大値を出力します。入力データの小さなずれに対し、プーリングは同じような結果を返すため、この層で小さなずれを吸収します。