BertJapaneseTokenizerを使った日本語事前学習済みALBERTモデルをつくった

8076 ワード

どうもこんばんは。
ご無沙汰してます。
またALBERTの日本語事前学習済みモデルをつくったのですが、今回はそのトークナイザーに BertJapaneseTokenizer を使ってみたというポエムです。

albert-base-japanese-v1-with-japanese-tokenizer