doc/nnet-loss_8h_source.html

 // nnet/nnet-loss.h

 // Copyright 2011-2015  Brno University of Technology (author: Karel Vesely)

 // See ../../COPYING for clarification regarding multiple authors
 //
 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use this file except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //  http://www.apache.org/licenses/LICENSE-2.0
 //
 // THIS CODE IS PROVIDED *AS IS* BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 // KIND, EITHER EXPRESS OR IMPLIED, INCLUDING WITHOUT LIMITATION ANY IMPLIED
 // WARRANTIES OR CONDITIONS OF TITLE, FITNESS FOR A PARTICULAR PURPOSE,
 // MERCHANTABLITY OR NON-INFRINGEMENT.
 // See the Apache 2 License for the specific language governing permissions and
 // limitations under the License.

 #ifndef KALDI_NNET_NNET_LOSS_H_
 #define KALDI_NNET_NNET_LOSS_H_

 #include <string>
 #include <vector>

 #include "base/kaldi-common.h"
 #include "base/timer.h"
 #include "util/kaldi-holder.h"
 #include "itf/options-itf.h"
 #include "cudamatrix/cu-matrix.h"
 #include "cudamatrix/cu-vector.h"
 #include "cudamatrix/cu-array.h"
 #include "hmm/posterior.h"

 namespace kaldi {
 namespace nnet1 {

 struct LossOptions {
   int32 loss_report_frames;

   LossOptions():
     loss_report_frames(5*3600*100) // 5h,
   { }

   void Register(OptionsItf *opts) {
     opts->Register("loss-report-frames", &loss_report_frames,
         "Report loss per blocks of N frames (0 = no reports)");
   }
 };

 class LossItf {
  public:
   LossItf(LossOptions& opts) {
     opts_ = opts;
   }
   virtual ~LossItf() { }

   virtual void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat> &net_out,
             const CuMatrixBase<BaseFloat> &target,
             CuMatrix<BaseFloat> *diff) = 0;

   virtual void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat> &net_out,
             const Posterior &target,
             CuMatrix<BaseFloat> *diff) = 0;

   virtual std::string Report() = 0;

   virtual BaseFloat AvgLoss() = 0;

  protected:
   LossOptions opts_;
   Timer timer_;
 };


 class Xent : public LossItf {
  public:
   Xent(LossOptions &opts):
     LossItf(opts),
     frames_progress_(0.0),
     xentropy_progress_(0.0),
     entropy_progress_(0.0),
     elapsed_seconds_(0.0)
   { }

   ~Xent()
   { }

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat> &net_out,
             const CuMatrixBase<BaseFloat> &target,
             CuMatrix<BaseFloat> *diff);

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat> &net_out,
             const Posterior &target,
             CuMatrix<BaseFloat> *diff);

   std::string Report();

   std::string ReportPerClass();

   BaseFloat AvgLoss() {
     if (frames_.Sum() == 0) return 0.0;
     return (xentropy_.Sum() - entropy_.Sum()) / frames_.Sum();
   }

  private:
   // main stats collected per target-class,
   CuVector<double> frames_;
   Vector<double> correct_;
   CuVector<double> xentropy_;
   CuVector<double> entropy_;

   // partial results during training,
   double frames_progress_;
   double xentropy_progress_;
   double entropy_progress_;
   std::vector<float> loss_vec_;
   double elapsed_seconds_;

   // weigting buffer,
   CuVector<BaseFloat> frame_weights_;
   CuVector<BaseFloat> target_sum_;

   // loss computation buffers,
   CuMatrix<BaseFloat> tgt_mat_;
   CuMatrix<BaseFloat> frames_aux_;
   CuMatrix<BaseFloat> xentropy_aux_;
   CuMatrix<BaseFloat> entropy_aux_;

   // frame classification buffers,
   CuArray<int32> max_id_out_;
   CuArray<int32> max_id_tgt_;
 };


 class Mse : public LossItf {
  public:
   Mse(LossOptions &opts):
     LossItf(opts),
     frames_(0.0),
     loss_(0.0),
     frames_progress_(0.0),
     loss_progress_(0.0)
   { }

   ~Mse()
   { }

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat>& net_out,
             const CuMatrixBase<BaseFloat>& target,
             CuMatrix<BaseFloat>* diff);

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat>& net_out,
             const Posterior& target,
             CuMatrix<BaseFloat>* diff);

   std::string Report();

   BaseFloat AvgLoss() {
     if (frames_ == 0) return 0.0;
     return loss_ / frames_;
   }

  private:
   double frames_;
   double loss_;

   double frames_progress_;
   double loss_progress_;
   std::vector<float> loss_vec_;

   CuVector<BaseFloat> frame_weights_;
   CuMatrix<BaseFloat> tgt_mat_;
   CuMatrix<BaseFloat> diff_pow_2_;
 };


 class MultiTaskLoss : public LossItf {
  public:
   MultiTaskLoss(LossOptions &opts):
     LossItf(opts)
   { }

   ~MultiTaskLoss() {
     while (loss_vec_.size() > 0) {
       delete loss_vec_.back();
       loss_vec_.pop_back();
     }
   }

   void InitFromString(const std::string& s);

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat>& net_out,
             const CuMatrixBase<BaseFloat>& target,
             CuMatrix<BaseFloat>* diff) {
     KALDI_ERR << "This is not supposed to be called!";
   }

   void Eval(const VectorBase<BaseFloat> &frame_weights,
             const CuMatrixBase<BaseFloat>& net_out,
             const Posterior& target,
             CuMatrix<BaseFloat>* diff);

   std::string Report();

   BaseFloat AvgLoss();

  private:
   std::vector<LossItf*>  loss_vec_;
   std::vector<int32>     loss_dim_;
   std::vector<BaseFloat> loss_weights_;

   std::vector<int32>     loss_dim_offset_;

   CuMatrix<BaseFloat>    tgt_mat_;
 };

 }  // namespace nnet1
 }  // namespace kaldi

 #endif  // KALDI_NNET_NNET_LOSS_H_

kaldi::nnet1::Xent::xentropy_progress_
double xentropy_progress_
Definition: nnet-loss.h:128

kaldi
This code computes Goodness of Pronunciation (GOP) and extracts phone-level pronunciation feature for...
Definition: chain.dox:20

kaldi::nnet1::Xent::AvgLoss
BaseFloat AvgLoss()
Get loss value (frame average),.
Definition: nnet-loss.h:114

kaldi::nnet1::Xent::frames_
CuVector< double > frames_
Definition: nnet-loss.h:121

kaldi::CuVector< double >

kaldi::nnet1::Xent::elapsed_seconds_
double elapsed_seconds_
Definition: nnet-loss.h:131

kaldi-holder.h

kaldi::nnet1::MultiTaskLoss
Definition: nnet-loss.h:197

kaldi::nnet1::Xent::frames_aux_
CuMatrix< BaseFloat > frames_aux_
Definition: nnet-loss.h:139

kaldi::nnet1::Xent::target_sum_
CuVector< BaseFloat > target_sum_
Definition: nnet-loss.h:135

kaldi::nnet1::Mse::diff_pow_2_
CuMatrix< BaseFloat > diff_pow_2_
Definition: nnet-loss.h:193

kaldi::nnet1::Mse::tgt_mat_
CuMatrix< BaseFloat > tgt_mat_
Definition: nnet-loss.h:192

kaldi::nnet1::Xent::loss_vec_
std::vector< float > loss_vec_
Definition: nnet-loss.h:130

kaldi::nnet1::Xent::xentropy_
CuVector< double > xentropy_
Definition: nnet-loss.h:123

kaldi::int32
kaldi::int32 int32
Definition: online-tcp-source.cc:27

cu-matrix.h

kaldi::CuMatrix
This class represents a matrix that&#39;s stored on the GPU if we have one, and in memory if not...
Definition: matrix-common.h:71

kaldi::nnet1::Xent
Definition: nnet-loss.h:82

kaldi::nnet1::Xent::tgt_mat_
CuMatrix< BaseFloat > tgt_mat_
Definition: nnet-loss.h:138

kaldi::nnet1::MultiTaskLoss::MultiTaskLoss
MultiTaskLoss(LossOptions &opts)
Definition: nnet-loss.h:199

kaldi::nnet1::Xent::entropy_aux_
CuMatrix< BaseFloat > entropy_aux_
Definition: nnet-loss.h:141

kaldi::nnet1::Xent::max_id_out_
CuArray< int32 > max_id_out_
Definition: nnet-loss.h:144

cu-vector.h

posterior.h

timer.h

kaldi::nnet1::Xent::correct_
Vector< double > correct_
Definition: nnet-loss.h:122

kaldi::nnet1::LossItf::timer_
Timer timer_
Definition: nnet-loss.h:78

kaldi::nnet1::LossOptions
Definition: nnet-loss.h:38

kaldi::OptionsItf::Register
virtual void Register(const std::string &name, bool *ptr, const std::string &doc)=0

kaldi::nnet1::Xent::~Xent
~Xent()
Definition: nnet-loss.h:92

kaldi::nnet1::LossOptions::LossOptions
LossOptions()
Definition: nnet-loss.h:41

kaldi::nnet1::LossItf
Definition: nnet-loss.h:51

kaldi::nnet1::MultiTaskLoss::loss_weights_
std::vector< BaseFloat > loss_weights_
Definition: nnet-loss.h:240

kaldi::nnet1::Xent::entropy_progress_
double entropy_progress_
Definition: nnet-loss.h:129

options-itf.h

kaldi::nnet1::Mse::~Mse
~Mse()
Definition: nnet-loss.h:159

kaldi::Posterior
std::vector< std::vector< std::pair< int32, BaseFloat > > > Posterior
Posterior is a typedef for storing acoustic-state (actually, transition-id) posteriors over an uttera...
Definition: posterior.h:42

kaldi::nnet1::MultiTaskLoss::Eval
void Eval(const VectorBase< BaseFloat > &frame_weights, const CuMatrixBase< BaseFloat > &net_out, const CuMatrixBase< BaseFloat > &target, CuMatrix< BaseFloat > *diff)
Evaluate mean square error using target-matrix,.
Definition: nnet-loss.h:218

kaldi::nnet1::LossOptions::loss_report_frames
int32 loss_report_frames
Report loss value every &#39;report_interval&#39; frames,.
Definition: nnet-loss.h:39

kaldi::nnet1::LossItf::~LossItf
virtual ~LossItf()
Definition: nnet-loss.h:56

kaldi::nnet1::Mse::AvgLoss
BaseFloat AvgLoss()
Get loss value (frame average),.
Definition: nnet-loss.h:178

kaldi::nnet1::Mse::loss_progress_
double loss_progress_
Definition: nnet-loss.h:188

kaldi::nnet1::MultiTaskLoss::tgt_mat_
CuMatrix< BaseFloat > tgt_mat_
Definition: nnet-loss.h:244

kaldi::nnet1::MultiTaskLoss::loss_dim_offset_
std::vector< int32 > loss_dim_offset_
Definition: nnet-loss.h:242

float

kaldi::nnet1::LossItf::LossItf
LossItf(LossOptions &opts)
Definition: nnet-loss.h:53

kaldi::nnet1::Mse::frame_weights_
CuVector< BaseFloat > frame_weights_
Definition: nnet-loss.h:191

kaldi::nnet1::Xent::entropy_
CuVector< double > entropy_
Definition: nnet-loss.h:124

kaldi::nnet1::Xent::frame_weights_
CuVector< BaseFloat > frame_weights_
Definition: nnet-loss.h:134

kaldi::nnet1::Mse::Mse
Mse(LossOptions &opts)
Definition: nnet-loss.h:151

KALDI_ERR
#define KALDI_ERR
Definition: kaldi-error.h:147

kaldi::OptionsItf
Definition: options-itf.h:26

kaldi::nnet1::Xent::xentropy_aux_
CuMatrix< BaseFloat > xentropy_aux_
Definition: nnet-loss.h:140

kaldi::Timer
Definition: timer.h:63

kaldi::nnet1::MultiTaskLoss::~MultiTaskLoss
~MultiTaskLoss()
Definition: nnet-loss.h:203

kaldi::CuMatrixBase
Matrix for CUDA computing.
Definition: matrix-common.h:69

kaldi::Vector< double >

kaldi::nnet1::Xent::max_id_tgt_
CuArray< int32 > max_id_tgt_
Definition: nnet-loss.h:145

kaldi::CuArray< int32 >

kaldi::nnet1::MultiTaskLoss::loss_dim_
std::vector< int32 > loss_dim_
Definition: nnet-loss.h:239

kaldi::nnet1::Xent::frames_progress_
double frames_progress_
Definition: nnet-loss.h:127

kaldi::nnet1::Mse::loss_vec_
std::vector< float > loss_vec_
Definition: nnet-loss.h:189

kaldi::nnet1::Mse::frames_
double frames_
Definition: nnet-loss.h:184

kaldi::nnet1::Xent::Xent
Xent(LossOptions &opts)
Definition: nnet-loss.h:84

kaldi::nnet1::Mse::loss_
double loss_
Definition: nnet-loss.h:185

kaldi::nnet1::Mse
Definition: nnet-loss.h:149

kaldi::nnet1::MultiTaskLoss::loss_vec_
std::vector< LossItf * > loss_vec_
Definition: nnet-loss.h:238

kaldi::nnet1::LossOptions::Register
void Register(OptionsItf *opts)
Definition: nnet-loss.h:45

kaldi::VectorBase
Provides a vector abstraction class.
Definition: kaldi-vector.h:41

kaldi-common.h

cu-array.h

kaldi::nnet1::LossItf::opts_
LossOptions opts_
Definition: nnet-loss.h:77

kaldi::nnet1::Mse::frames_progress_
double frames_progress_
Definition: nnet-loss.h:187