Exploring the Limits of Language Modelingを読んだ - またーりくおんつノート

Google Brainが2016年に出してた下の論文を読んだ.
読んでたら出勤まであと10分くらいしかないので、そのうち追記するかも. (しなさそう...

昨日までに読んでたのはむしろこれを読むために読んでた.
特に昨日のペーパーはかなり前提にしている.

やっていること

ペーパーの要所要所から情報をshareしてやっていきたいという感じが見て取れる.
2016年より前の手法が結構整理されている印象なのでもう少し精読してもいいかな、と思う.

とりあえずこの時点では巨大なデータセットへの文字レベルのインプットはかなり有効性が示されているのかなと感じる.
(違ってたら誰か教えて.)

Importance samplingのくだりとかは深層学習のNLP赤本(出た！本)に載ってたやつと同じなのかな？浅くしか読めなかったのでそのあたり実験するときは読み直したい.