bert_servingインストール使用チュートリアル(パラメータ詳細!)

3412 ワード

0はじめに
BERTは現在のNLPにおける性能一流のモデルとして広く応用されている.bert_servingは文ベクトルや語ベクトルを簡単に取得するツールです.この質問ではbert_について詳しく説明します.servingのインストール、使用、パラメータ
1インストール
pip install bert-serving-server  # server
pip install bert-serving-client  # client, independent of `bert-serving-server`

要求:(1)Python>=3.5(2)Tensorflow>=1.10(3)Python 2!!!bertトレーニングモデルchinese_L-12_H-768_A-12:ダウンロードをクリック
2使用
2.1コマンド起動方式
1.cdからbert-serving-start.exeパスの下2.
bert-serving-start -pooling_strategy NONE -model_dir /Users/bj.develop.intern4/chinese_L-12_H-768_A-12 -max_seq_len 60

2.2スクリプト起動方式
from bert_serving.server.helper import get_args_parser
from bert_serving.server import BertServer
args = get_args_parser().parse_args(['-model_dir', '/Users/bj.develop.intern4/chinese_L-12_H-768_A-12',
                                     '-pooling_strategy', 'NONE',
                                     '-max_seq_len','60'])

server = BertServer(args)
server.start()

2.3呼び出し
from bert_serving.client import BertClient
bc = BertClient(ip='localhost')
test=bc.encode(['  ','bert'])

3パラメータの詳細
パラメータ
説明
-model_dir
プリトレーニングモデルのパス
-num_worker
同時に処理できる同時要求の数を示すスレッド数
-pooling_strategy
デフォルトは文ベクトルです.-pooling_strategy NONEは語ベクトル
-max_seq_len
文の最大長