nnetbin/sat-nnet-train-frmshuff.cc注記1

1146 ワード

Nnet読み出し

Nnet nnet;
nnet.Read(model_filename);
nnet.SetTrainOptions(trn_opts);
  • 宣言nnet
  • std::vector components_;各component
  • を格納するために使用される
  • std::vector> propagate_buf_,backpropagate_buf_; 前方および後方用の2つのbuffer(ディスプレイメモリ)
  • NnetTrainOptions opts_; learningrate,momentum,L 1,L 2
  • を格納するために使用される
  • 利用モデル_Filename読み込みモデルやSetTrainOptions設定learningrateなどのパラメータ
  • モデルを読むには、前のcomponentの出力次元==後のcomponentの入力次元
  • が必要です.
  • propagate_buf_.resize(NumComponents()+1);backpropagate_buf_.resize(NumComponents()+1);
  • opts_.learn_rate=0.0

  • マッピング・テーブルの構築

    std::map<:string int32=""> map_utt2spk;
    if (utt2spk != "") {
    std::ifstream fi_map(utt2spk.c_str());
      if (!fi_map) {
        KALDI_ERR << "failed to open file " << utt2spk;
      }
      std::string key;
      int32 value;
      while (fi_map >> key >> value) {
        map_utt2spk[key] = value;
      }
    }
    
  • ここでkeyはutterance-id(utterance-idとrecording-idの区別に注意)
  • です.
  • ここのvalueは0-speakernum-1の数値で、speaker_に対応しています.codeマトリクスの行番号