FasterTransformerインストール


第一:TensorRTのインストール(FasterTransformerはcuda 10.0をサポートしているので、TensorRTもcuda 10.0対応バージョン)
1、TensorRTをダウンロードする
https://developer.nvidia.com/nvidia-tensorrt-5x-download
2、pycodaのインストール
pip install pycuda

3、TensorRTのインストール
# home      ,   tensorrt_tar,                
tar xzvf TensorRT-5.0.2.6.Ubuntu-16.04.4.x86_64-gnu.cuda-9.0.cudnn7.3.tar
 
#    TensorRT-5.0.2.6    ,    lib            
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/lthpc/tensorrt_tar/TensorRT-5.0.2.6/lib
 
#  TensorRT
cd TensorRT-5.0.2.6/python
#if python2
sudo pip2 install tensorrt-5.0.2.6-py2.py3-none-any.whl
#if python3
sudo pip3 install tensorrt-5.0.2.6-py2.py3-none-any.whl
 
#  UFF
cd TensorRT-5.0.2.6/uff
#if python2
sudo pip2 install uff-0.5.5-py2.py3-none-any.whl
#if python3
sudo pip3 install uff-0.5.5-py2.py3-none-any.whl
 
#  graphsurgeon
cd TensorRT-5.0.2.6/graphsurgeon
#if python2
sudo pip2 install graphsurgeon-0.3.2-py2.py3-none-any.whl
#if python3
sudo pip3 install graphsurgeon-0.3.2-py2.py3-none-any.whl

第二:FasterTransformerのインストール
1、fastertransformer/commonを修正する.hファイル
追加:#includeがcmakeでないとエラーが表示されます
2、新規ビルドディレクトリ
mkdir build
3、cmake
cmake -DCUDA_TOOLKIT_ROOT_DIR=/YOURDIR/cuda/10.0 -DSM=61 -DCMAKE_BUILD_TYPE=Release -DBUILD_TRT=ON -DTRT_PATH=/YOURDIR/TensorRT-5.1.5.0 -DBUILD_TF=ON -DTF_PATH=/YOURDIR/site-packages/tensorflow
その中でYOURDIRはあなた自身の経路、-SMは自分のgpuによってgpuの計算力を確定します
4、makeコンパイル
make
 
発生したエラー:
1、
Unknown or unsupported GPU architectureエラー
-SMは制定されていないので
2、
未追加:#include
3、makeヒントにlibtensorflowがないframework.so
pipでインストールされているtensorflowのライブラリの名前はlibtensorflow_かもしれません.framework.so.1,接続libtensorflow_framework.so.1からlibtensorflow_framework.so