Negative Samplingの復習

numpy 復習

はじめに今更ですが、word2vecの高速化の計算手法である「Negative Sampling」について復習しました。世は完全に「Transfomer」の趨勢ですが、勉強のために復習しました。前に「階層的ソフトマックス」を説明している論文を読んでいて、これってどう実装す…

2019-09-30

Pytorch：CNNで文字表現の抽出

CNN PyTorch 復習

NLPにCNNを利用したモデルはすっかり当たり前になりました。少し前に「CNNでテキスト分類」という記事を書きましたが、その時はPytorchでCNNを扱うための基本的なコードだけに留まっていました。 kento1109.hatenablog.com今回はNERなどで用いられる文字情…

2019-08-28

pytorch-transformersを触ってみる⑤

Language Model PyTorch Transformers

はじめに前回はBERTのfine tuningということで、NER（固有表現認識）を試してみました。 kento1109.hatenablog.com今回はfine tuningではなく、BERTの事前学習について見ていきたいと思います。 pre-training from scratch ただ、pytorch-transformersでの…

2019-08-26

pytorch-transformersを触ってみる④

Language Model PyTorch torchtext Transformers

はじめに前回はfine tuningということで、GLUEタスクのSST-2に取り組みました。 kento1109.hatenablog.comまた、GLUEタスクのfine tuningを実行するためのスクリプト（run_glue.py ）のコードを眺めました。今回は、CoNLL（NERの共通タスク）のためのfine t…

2019-08-23

pytorch-transformersを触ってみる③

Language Model PyTorch Transformers

はじめに前回は日本語でのpytorch-transformersの扱い方についてまとめました。 kento1109.hatenablog.comこれまでpytorch-transformersの基本的なところを英語・日本語で動かしてみました。今回はもう一歩進んでfine tuningについてまとめてみます。ドキュ…

2019-08-21

pytorch-transformersを触ってみる②

Language Model PyTorch Transformers

はじめに前回はの入門ということで、QuikStartの内容を触ってみました。 kento1109.hatenablog.com前回は英語でしたが、日本語のテキストを扱う場合はそのまま使うことは出来ません。ということで、今回はpytorch-transformersで日本語のテキストを扱って…

2019-08-20

pytorch-transformersを触ってみる①

Language Model PyTorch Transformers

今更ながら、pytorch-transformersを触ってみます。このライブラリはドキュメントが充実していて、とても親切です。なので、今回はドキュメントに基づいて触ってみただけの備忘録です。以下、有名どころのBERTで試してます。詳しいことはここなどを参照し…

2019-07-06

tensorboardXの基本的な使い方①

tensorboard PyTorch

はじめに今更ですが、tensorboardを触ってみました。普段TensorFlowを使わないので、何となく避けてたのですが、 tensorboardXは「tensorboard for pytorch」ということで、触ってみました。結論から言うとめちゃくちゃ簡単で便利でした。なので、備忘録…

2019-05-09

（論文）Cloze-driven Pretraining of Self-attention Networks

論文

はじめに 2018年のNLPの主役は「BERT」で間違いないでしょう。元の論文はGoogleから発表されており、Googleすごいってなりました。黙っていないのがPytorchを開発した「Facebook」です。ってことで、彼らの手法でNERのタスクにおいて僅かですがBERTを抜い…

2019-04-30

（論文）Pretrained language models

論文 Transfer Learning Language Model

はじめに以前にPretrained language modelsの基本について書きました。 kento1109.hatenablog.com今回はドメイン領域（Biomedical）での固有表現認識（NER）について適用した論文をまとめます。[1711.07908] Effective Use of Bidirectional Language Model…

2019-04-28

（論文）BERT

論文

今日も少し前に流行ったモデルの復習。今日はBERTに関してまとめる。https://wikiwiki.jp/animegameex/%E3%83%90%E3%83%BC%E3%83%88これもまた既に素晴らしいまとめがあるのでそちらを参考にしながら復習した。 jalammar.github.io towardsdatascience.com …