輪読会「BERTによる自然言語処理入門」第１回

はじめに

てくますプロジェクトでは、てくますゼミと呼ばれる学習会を開催しています。

少人数であーだこーだ議論しながら、考える楽しさを分かち合うことを大切にしています。

現在は「BERTによる自然言語処理入門」という本を読み進めています。

リンク

今回は本書第１回の輪読会ということで、1章と2章を読み進めました！

本記事では、今回の勉強会で学んだことをざっくりと紹介していきます。

BERTは2018年にGoogleが発表した自然言語処理モデルです。BERTは、自然言語処理の様々なタスクにおいて当時の最高スコアを叩き出しました。

BERTには次の二つの学習過程があることが特徴です。

はじめにしっかり事前学習をしておくことで、ファインチューニング（個別タスクに対しての調整）は少しで済むということです。

言語モデルは、文章の出現のしやすさを確率によってモデル化します。例えば、「私はパンを食べた」は「私は家を食べた」より自然な文章でしょう。

文章の出現のしやすさをモデル化するには、ある文脈下でのトークンの出現確率をモデル化すればよいです。（トークンとは、文を適当な単位に分割したものです）

ニューラル言語モデルでは、これをニューラルネットワークを用いて実現します。

BERTが誕生するまでに提案されたニューラル言語モデルには、以下のようなものがあります。

自然言語処理の歴史についてはこちらの記事にまとめています。もしよければ、こちらも読んでみてください。

また、自然言語処理を学ぶために、本書の前に学習した『ゼロから作るDeep Learning② 自然言語処理編』の活動記録はこちらです。

新シリーズが始まりました。これからBERTについて学んでいきます。メンバー8人で頑張って読み進めていきます。

今回はまだ、自然言語処理の復習が中心の回でした。なので記事もあっさりです。

次回から本格的にBERTを使っていきます。

では、また！