doc/basis-fmllr-diag-gmm_8cc_source.html

 // transform/basis-fmllr-diag-gmm.cc

 // Copyright 2012  Carnegie Mellon University (author: Yajie Miao)
 //           2014  Johns Hopkins University (author: Daniel Povey)
 //           2014  IMSL, PKU-HKUST (Author: Wei Shi)

 // See ../../COPYING for clarification regarding multiple authors
 //
 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use this file except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //  http://www.apache.org/licenses/LICENSE-2.0
 //
 // THIS CODE IS PROVIDED *AS IS* BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 // KIND, EITHER EXPRESS OR IMPLIED, INCLUDING WITHOUT LIMITATION ANY IMPLIED
 // WARRANTIES OR CONDITIONS OF TITLE, FITNESS FOR A PARTICULAR PURPOSE,
 // MERCHANTABLITY OR NON-INFRINGEMENT.
 // See the Apache 2 License for the specific language governing permissions and
 // limitations under the License.

 #include <algorithm>
 #include <utility>
 #include <vector>
 using std::vector;
 #include <string>
 using std::string;

 #include "transform/fmllr-diag-gmm.h"
 #include "gmm/am-diag-gmm.h"
 #include "gmm/mle-diag-gmm.h"
 #include "gmm/mle-am-diag-gmm.h"
 #include "transform/basis-fmllr-diag-gmm.h"

 namespace kaldi {


 static BaseFloat CalBasisFmllrStepSize(
     const AffineXformStats &spk_stats,
     const Matrix<BaseFloat> &spk_stats_tmp_K,
     const std::vector<SpMatrix<BaseFloat> > &spk_stats_tmp_G,
     const Matrix<BaseFloat> &delta,
     const Matrix<BaseFloat> &A,
     const Matrix<BaseFloat> &S,
     int32 max_iters);


 void BasisFmllrAccus::Write(std::ostream &os, bool binary) const {

   WriteToken(os, binary, "<BASISFMLLRACCUS>");
   WriteToken(os, binary, "<BETA>");
   WriteBasicType(os, binary, beta_);
   if (!binary) os << '\n';
   if (grad_scatter_.NumCols() != 0) {
     WriteToken(os, binary, "<GRADSCATTER>");
     grad_scatter_.Write(os, binary);
   }
   WriteToken(os, binary, "</BASISFMLLRACCUS>");
 }

 void BasisFmllrAccus::Read(std::istream &is, bool binary,
                            bool add) {
   ExpectToken(is, binary, "<BASISFMLLRACCUS>");
   ExpectToken(is, binary, "<BETA>");
   double tmp_beta = 0;
   ReadBasicType(is, binary, &tmp_beta);
   if (add) {
     beta_ += tmp_beta;
   } else {
     beta_ = tmp_beta;
   }
   ExpectToken(is, binary, "<GRADSCATTER>");
   grad_scatter_.Read(is, binary, add);
   ExpectToken(is, binary, "</BASISFMLLRACCUS>");
 }

 void BasisFmllrAccus::ResizeAccus(int32 dim) {
   if (dim <= 0) {
     KALDI_ERR << "Invalid feature dimension " << dim; // dim=0 is not allowed
   } else {
     // 'kSetZero' may not be necessary, but makes computation safe
     grad_scatter_.Resize((dim + 1) * dim, kSetZero);
   }
 }

 void BasisFmllrAccus::AccuGradientScatter(
                       const AffineXformStats &spk_stats) {

   // Gradient of auxf w.r.t. xform_spk
   // Eq. (33)
   Matrix<double> grad_mat(dim_, dim_ + 1);
   grad_mat.SetUnit();
   grad_mat.Scale(spk_stats.beta_);
   grad_mat.AddMat(1.0, spk_stats.K_);
   for (int d = 0; d < dim_; ++d) {
       Matrix<double> G_d_mat(spk_stats.G_[d]);
        grad_mat.Row(d).AddVec(-1.0, G_d_mat.Row(d));
   }
   // Row stack of gradient matrix
   Vector<BaseFloat> grad_vec((dim_+1) * dim_);
   grad_vec.CopyRowsFromMat(grad_mat);
   // The amount of data beta_ is likely to be ZERO, especially
   // when silence-weight is set to be 0 and we are using the
   // per-utt mode.
   if (spk_stats.beta_ > 0) {
     beta_ += spk_stats.beta_;
     grad_scatter_.AddVec2(BaseFloat(1.0 / spk_stats.beta_), grad_vec);
   }
 }

 void BasisFmllrEstimate::Write(std::ostream &os, bool binary) const {
   uint32 tmp_uint32;

   WriteToken(os, binary, "<BASISFMLLRPARAM>");

   WriteToken(os, binary, "<NUMBASIS>");
   tmp_uint32 = static_cast<uint32>(basis_size_);
   WriteBasicType(os, binary, tmp_uint32);
   if (fmllr_basis_.size() != 0) {
     WriteToken(os, binary, "<BASIS>");
     for (int32 n = 0; n < basis_size_; ++n) {
       fmllr_basis_[n].Write(os, binary);
     }
   }
   WriteToken(os, binary, "</BASISFMLLRPARAM>");
 }

 void BasisFmllrEstimate::Read(std::istream &is, bool binary) {
   uint32 tmp_uint32;
   string token;

   ExpectToken(is, binary, "<BASISFMLLRPARAM>");

   ExpectToken(is, binary, "<NUMBASIS>");
   ReadBasicType(is, binary, &tmp_uint32);
   basis_size_ = static_cast<int32>(tmp_uint32);
   KALDI_ASSERT(basis_size_ > 0);
   ExpectToken(is, binary, "<BASIS>");
   fmllr_basis_.resize(basis_size_);
   for (int32 n = 0; n < basis_size_; ++n) {
     fmllr_basis_[n].Read(is, binary);
     if (n == 0)
       dim_ = fmllr_basis_[n].NumRows();
     else {
       KALDI_ASSERT(dim_ == fmllr_basis_[n].NumRows());
     }
   }
   ExpectToken(is, binary, "</BASISFMLLRPARAM>");
 }

 void BasisFmllrEstimate::ComputeAmDiagPrecond(const AmDiagGmm &am_gmm,
                                               SpMatrix<double> *pre_cond) {
   KALDI_ASSERT(am_gmm.Dim() == dim_);
   if (pre_cond->NumRows() != (dim_ + 1) * dim_)
     pre_cond->Resize((dim_ + 1) * dim_, kSetZero);

   int32 num_pdf = am_gmm.NumPdfs();
   Matrix<double> H_mat((dim_ + 1) * dim_, (dim_ + 1) * dim_);
   // expected values of fMLLR G statistics
   vector< SpMatrix<double> > G_hat(dim_);
   for (int32 d = 0; d < dim_; ++d)
        G_hat[d].Resize(dim_ + 1, kSetZero);

   // extend mean vectors with 1  [mule_jm 1]
   Vector<double> extend_mean(dim_ + 1);
   // extend covariance matrix with a row and column of 0
   Vector<double> extend_var(dim_ + 1);
   for (int32 j = 0; j < num_pdf; ++j) {
     const DiagGmm &diag_gmm = am_gmm.GetPdf(j);
     int32 num_comp = diag_gmm.NumGauss();
     // means, covariance and mixture weights for this diagonal GMM
     Matrix<double> means(num_comp, dim_);
     Matrix<double> vars(num_comp, dim_);
     diag_gmm.GetMeans(&means); diag_gmm.GetVars(&vars);
     Vector<BaseFloat> weights(diag_gmm.weights());

     for (int32 m = 0; m < num_comp; ++m) {
       extend_mean.Range(0, dim_).CopyFromVec(means.Row(m));
       extend_mean(dim_) = 1.0;
       extend_var.Range(0, dim_).CopyFromVec(vars.Row(m));
       extend_var(dim_) = 0;
       // loop over feature dimension
       // Eq. (28): G_hat {d} = \sum_{j, m} P_{j}{m} Inv_Sigma{j, m, d}
       // (mule_extend mule_extend^T + Sigma_extend)
       // where P_{j}{m} = P_{j} c_{j}{m}
       for (int32 d = 0; d < dim_; ++d) {
         double alpha = (1.0 / num_pdf) * weights(m) * (1.0 / vars.Row(m)(d));
         G_hat[d].AddVec2(alpha, extend_mean);
         // add vector to the diagonal elements of the matrix
         // not work for full covariance matrices
         G_hat[d].AddDiagVec(alpha, extend_var);
       } // loop over dimension
     } //  loop over Gaussians
   }  // loop over states

   // fill H_ with G_hat[i]; build the block diagonal structure
   // Eq. (31)
   for (int32 d = 0; d < dim_; d++) {
     H_mat.Range(d * (dim_ + 1), (dim_ + 1), d * (dim_ + 1), (dim_ + 1))
               .CopyFromSp(G_hat[d]);
   }

   // add the extra H(1) elements
   // Eq. (30) and Footnote 1 (0-based index)
   for (int32 i = 0; i < dim_; ++i)
     for (int32 j = 0; j < dim_; ++j)
       H_mat(i * (dim_ + 1) + j, j * (dim_ + 1) + i) += 1;
   // the final H should be symmetric
   if (!H_mat.IsSymmetric())
     KALDI_ERR << "Preconditioner matrix H = H(1) + H(2) is not symmetric";
   pre_cond->CopyFromMat(H_mat, kTakeLower);
 }

 void BasisFmllrEstimate::EstimateFmllrBasis(
                               const AmDiagGmm &am_gmm,
                               const BasisFmllrAccus &basis_accus) {
   // Compute the preconditioner
   SpMatrix<double> precond_mat((dim_ + 1) * dim_);
   ComputeAmDiagPrecond(am_gmm, &precond_mat);
   // H = C C^T
   TpMatrix<double> C((dim_+1) * dim_);
   C.Cholesky(precond_mat);
   TpMatrix<double> C_inv(C);
   C_inv.InvertDouble();
   // From TpMatrix to Matrix
   Matrix<double> C_inv_full((dim_ + 1) * dim_, (dim_ + 1) * dim_);
   C_inv_full.CopyFromTp(C_inv);

   // Convert to the preconditioned coordinates
   // Eq. (35)  M_hat = C^{-1} grad_scatter C^{-T}
   SpMatrix<double> M_hat((dim_ + 1) * dim_);
   {
     SpMatrix<double> grad_scatter_d(basis_accus.grad_scatter_);
     M_hat.AddMat2Sp(1.0, C_inv_full, kNoTrans, grad_scatter_d, 0.0);
   }
   Vector<double> Lvec((dim_ + 1) * dim_);
   Matrix<double> U((dim_ + 1) * dim_, (dim_ + 1) * dim_);
   // SVD of M_hat; sort eigenvalues from greatest to smallest
   M_hat.SymPosSemiDefEig(&Lvec, &U);
   SortSvd(&Lvec, &U);
   // After transpose, each row is one base
   U.Transpose();

   fmllr_basis_.resize(basis_size_);
   for (int32 n = 0; n < basis_size_; ++n) {
     fmllr_basis_[n].Resize(dim_, dim_ + 1, kSetZero);
     Vector<double> basis_vec((dim_ + 1) * dim_);
     // Convert eigenvectors back to unnormalized space
     basis_vec.AddMatVec(1.0, C_inv_full, kTrans, U.Row(n), 0.0);
     // Convert stacked vectors to matrix
     fmllr_basis_[n].CopyRowsFromVec(basis_vec);
   }
   // Output the eigenvalues of the gradient scatter matrix
   // The eigenvalues are divided by twice the number of frames
   // in the training data, to get the per-frame values.
   Vector<double> Lvec_scaled(Lvec);
   Lvec_scaled.Scale(1.0 / (2 * basis_accus.beta_));
   KALDI_LOG << "The [per-frame] eigenvalues sorted from largest to smallest: " << Lvec_scaled;
   KALDI_LOG << "Sum of the [per-frame] eigenvalues, that is"
           " the log-likelihood improvement, is " << Lvec_scaled.Sum();
 }

 double BasisFmllrEstimate::ComputeTransform(
     const AffineXformStats &spk_stats,
     Matrix<BaseFloat> *out_xform,
     Vector<BaseFloat> *coefficient,
     BasisFmllrOptions options) const {
   if (coefficient == NULL) {
     Vector<BaseFloat> tmp;
     return ComputeTransform(spk_stats, out_xform, &tmp, options);
   }
   KALDI_ASSERT(dim_ == spk_stats.dim_);
   if (spk_stats.beta_ < options.min_count) {
     KALDI_WARN << "Not updating fMLLR since count is below min-count: "
                << spk_stats.beta_;
     coefficient->Resize(0);
     return 0.0;
   } else {
     if (out_xform->NumRows() != dim_ || out_xform->NumCols() != (dim_ +1)) {
       out_xform->Resize(dim_, dim_ + 1, kSetZero);
     }
     // Initialized either as [I;0] or as the current transform
     Matrix<BaseFloat> W_mat(dim_, dim_ + 1);
     if (out_xform->IsZero()) {
       W_mat.SetUnit();
     } else {
       W_mat.CopyFromMat(*out_xform);
     }

     // Create temporary K and G quantities. Add for efficiency,
     // avoid repetitions of converting the stats from double
     // precision to single precision
     Matrix<BaseFloat> stats_tmp_K(spk_stats.K_);
     std::vector<SpMatrix<BaseFloat> > stats_tmp_G(dim_);
     for (int32 d = 0; d < dim_; d++)
       stats_tmp_G[d] = SpMatrix<BaseFloat>(spk_stats.G_[d]);

     // Number of bases for this speaker, according to the available
     // adaptation data
     int32 basis_size = int32 (std::min( double(basis_size_),
                                options.size_scale * spk_stats.beta_));

     coefficient->Resize(basis_size, kSetZero);

     BaseFloat impr_spk = 0;
     for (int32 iter = 1; iter <= options.num_iters; ++iter) {
       // Auxf computation based on FmllrAuxFuncDiagGmm from fmllr-diag-gmm.cc
       BaseFloat start_obj = FmllrAuxFuncDiagGmm(W_mat, spk_stats);

       // Contribution of quadratic terms to derivative
       // Eq. (37)  s_{d} = G_{d} w_{d}
       Matrix<BaseFloat> S(dim_, dim_ + 1);
       for (int32 d = 0; d < dim_; ++d)
         S.Row(d).AddSpVec(1.0, stats_tmp_G[d], W_mat.Row(d), 0.0);


       // W_mat = [A; b]
       Matrix<BaseFloat> A(dim_, dim_);
       A.CopyFromMat(W_mat.Range(0, dim_, 0, dim_));
       Matrix<BaseFloat> A_inv(A);
       A_inv.InvertDouble();
       Matrix<BaseFloat> A_inv_trans(A_inv);
       A_inv_trans.Transpose();
       // Compute gradient of auxf w.r.t. W_mat
       // Eq. (38)  P = beta [A^{-T}; 0] + K - S
       Matrix<BaseFloat> P(dim_, dim_ + 1);
       P.SetZero();
       P.Range(0, dim_, 0, dim_).CopyFromMat(A_inv_trans);
       P.Scale(spk_stats.beta_);
       P.AddMat(1.0, stats_tmp_K);
       P.AddMat(-1.0, S);

       // Compute directional gradient restricted by bases. Here we only use
       // the simple gradient method, rather than conjugate gradient. Finding
       // the optimal transformation W_mat is equivalent to optimizing weights
       // d_{1,2,...,N}.
       // Eq. (39)  delta(W) = \sum_n tr(\fmllr_basis_{n}^T \P) \fmllr_basis_{n}
       // delta(d_{n}) = tr(\fmllr_basis_{n}^T \P)
       Matrix<BaseFloat> delta_W(dim_, dim_ + 1);
       Vector<BaseFloat> delta_d(basis_size);
       for (int32 n = 0; n < basis_size; ++n) {
         delta_d(n) = TraceMatMat(fmllr_basis_[n], P, kTrans);
         delta_W.AddMat(delta_d(n), fmllr_basis_[n]);
       }

       BaseFloat step_size = CalBasisFmllrStepSize(spk_stats, stats_tmp_K,
         stats_tmp_G, delta_W, A, S, options.step_size_iters);
       W_mat.AddMat(step_size, delta_W, kNoTrans);
       coefficient->AddVec(step_size, delta_d);
       // Check auxiliary function
       BaseFloat end_obj = FmllrAuxFuncDiagGmm(W_mat, spk_stats);

       KALDI_VLOG(4) << "Objective function (iter=" << iter << "): "
                     << start_obj / spk_stats.beta_  << " -> "
                     << (end_obj / spk_stats.beta_) << " over "
                     << spk_stats.beta_ << " frames";

       impr_spk += (end_obj - start_obj);
     }  // loop over iters

     out_xform->CopyFromMat(W_mat, kNoTrans);
     return impr_spk;
   }
 }

 // static
 BaseFloat CalBasisFmllrStepSize(const AffineXformStats &spk_stats,
   const Matrix<BaseFloat> &spk_stats_tmp_K,
   const std::vector<SpMatrix<BaseFloat> > &spk_stats_tmp_G,
   const Matrix<BaseFloat> &delta,
   const Matrix<BaseFloat> &A,
   const Matrix<BaseFloat> &S,
   int32 max_iters) {

   int32 dim = spk_stats.dim_;
   KALDI_ASSERT(dim == delta.NumRows() && dim == S.NumRows());
   // The first D columns of delta_W
   SubMatrix<BaseFloat> delta_Dim(delta, 0, dim, 0, dim);
   // Eq. (46): b = tr(delta K^T) - tr(delta S^T)
   BaseFloat b = TraceMatMat(delta, spk_stats_tmp_K, kTrans)
                  - TraceMatMat(delta, S, kTrans);
   // Eq. (47): c = sum_d tr(delta_{d} G_{d} delta_{d})
   BaseFloat c = 0;
   Vector<BaseFloat> G_row_delta(dim + 1);
   for (int32 d = 0; d < dim; ++d) {
     G_row_delta.AddSpVec(1.0, spk_stats_tmp_G[d], delta.Row(d), 0.0);
     c += VecVec(G_row_delta, delta.Row(d));
   }

   // Sometimes, the change of step size, d1/d2, may get tiny
   // Due to numerical precision, we compute everything in double
   BaseFloat step_size = 0.0;
   BaseFloat obj_old, obj_new = 0.0;
   Matrix<BaseFloat> N(dim, dim);
   for (int32 iter_step = 1; iter_step <= max_iters; ++iter_step) {
     if (iter_step == 1) {
       // k = 0, auxf = beta logdet(A)
       obj_old = spk_stats.beta_ * A.LogDet();
     } else {
       obj_old = obj_new;
     }

     // Eq. (49): N = (A + k * delta_Dim)^{-1} delta_Dim
     // In case of bad condition, careful preconditioning should be done. Maybe safer
     // to use SolveQuadraticMatrixProblem. Future work for Yajie.
     Matrix<BaseFloat> tmp_A(A);
     tmp_A.AddMat(step_size, delta_Dim, kNoTrans);
     tmp_A.InvertDouble();
     N.AddMatMat(1.0, tmp_A, kNoTrans, delta_Dim, kNoTrans, 0.0);
     // first-order derivative w.r.t. k
     // Eq. (50): d1 = beta * trace(N) + b - k * c
     BaseFloat d1 = spk_stats.beta_ * TraceMat(N) + b - step_size * c;
     // second-order derivative w.r.t. k
     // Eq. (51): d2 = -beta * tr(N N) - c
     BaseFloat d2 = -c - spk_stats.beta_ * TraceMatMat(N, N, kNoTrans);
     d2 = std::min((double)d2, -c / 10.0);
     // convergence judgment from fmllr-sgmm.cc
     // it seems to work well, though not sure whether 1e-06 is appropriate
     // note from Dan: commenting this out after someone complained it was
     // causing a test to behave weirdly.  This doesn't dominate computation
     // anyway, I don't think.
     // if (std::fabs(d1 / d2) < 0.000001) { break; }

     // Eq. (52): update step_size
     BaseFloat step_size_change = -(d1 / d2);
     step_size += step_size_change;

     // Repeatedly check auxiliary function; halve step size change if auxf decreases.
     // According to the paper, we should limit the number of repetitions. The
     // following implementation seems to work well. But the termination condition/judgment
     // should be optimized later.
     do {
       // Eq. (48): auxf = beta * logdet(A + k * delta_Dim) + kb - 0.5 * k * k * c
       tmp_A.CopyFromMat(A);
       tmp_A.AddMat(step_size, delta_Dim, kNoTrans);
       obj_new = spk_stats.beta_ * tmp_A.LogDet() + step_size * b -
           0.5 * step_size * step_size * c;

       if (obj_new - obj_old < -1.0e-04 * spk_stats.beta_) {  // deal with numerical issues
         KALDI_WARN << "Objective function decreased (" << obj_old << "->"
                    << obj_new << "). Halving step size change ( step size "
                    << step_size << " -> " << (step_size - (step_size_change/2))
                    << ")";
         step_size_change /= 2;
         step_size -= step_size_change;
       }
     } while (obj_new - obj_old < -1.0e-04 * spk_stats.beta_ && step_size_change > 1e-05);
   }
   return step_size;
 }

 } // namespace kaldi
am-diag-gmm.h

kaldi::BasisFmllrAccus::beta_
double beta_
Occupancy count.
Definition: basis-fmllr-diag-gmm.h:101

kaldi::BasisFmllrEstimate::Write
void Write(std::ostream &out_stream, bool binary) const
Routines for reading and writing fMLLR basis matrices.
Definition: basis-fmllr-diag-gmm.cc:116

kaldi
This code computes Goodness of Pronunciation (GOP) and extracts phone-level pronunciation feature for...
Definition: chain.dox:20

kaldi::BasisFmllrOptions::num_iters
int32 num_iters
Definition: basis-fmllr-diag-gmm.h:49

kaldi::MatrixBase::InvertDouble
void InvertDouble(Real *LogDet=NULL, Real *det_sign=NULL, bool inverse_needed=true)
matrix inverse [double].
Definition: kaldi-matrix.cc:2046

kaldi::SpMatrix< double >

kaldi::AffineXformStats::K_
Matrix< double > K_
K_ is the summed outer product of [mean times inverse variance] with [extended data], scaled by the occupation counts; dimension is dim by (dim+1)
Definition: transform-common.h:36

mle-am-diag-gmm.h

kaldi::BasisFmllrAccus::AccuGradientScatter
void AccuGradientScatter(const AffineXformStats &spk_stats)
Accumulate gradient scatter for one (training) speaker.
Definition: basis-fmllr-diag-gmm.cc:91

rnnlm::j
int j
Definition: mikolov-rnnlm-lib.cc:66

kaldi::Matrix::Transpose
void Transpose()
Transpose the matrix.
Definition: kaldi-matrix.cc:2091

kaldi::AffineXformStats
Definition: transform-common.h:30

kaldi::MatrixBase::NumCols
MatrixIndexT NumCols() const
Returns number of columns (or zero for empty matrix).
Definition: kaldi-matrix.h:67

kaldi::TraceMat
double TraceMat(const MatrixBase< Real > &A)
Returns trace of matrix.
Definition: kaldi-matrix.h:1042

kaldi::ReadBasicType
void ReadBasicType(std::istream &is, bool binary, T *t)
ReadBasicType is the name of the read function for bool, integer types, and floating-point types...
Definition: io-funcs-inl.h:55

kaldi::BasisFmllrOptions
Definition: basis-fmllr-diag-gmm.h:48

mle-diag-gmm.h

kaldi::BasisFmllrEstimate::Read
void Read(std::istream &in_stream, bool binary)
Definition: basis-fmllr-diag-gmm.cc:133

kaldi::MatrixBase::AddMat
void AddMat(const Real alpha, const MatrixBase< Real > &M, MatrixTransposeType transA=kNoTrans)
*this += alpha * M [or M^T]
Definition: kaldi-matrix.cc:356

kaldi::CalBasisFmllrStepSize
static BaseFloat CalBasisFmllrStepSize(const AffineXformStats &spk_stats, const Matrix< BaseFloat > &spk_stats_tmp_K, const std::vector< SpMatrix< BaseFloat > > &spk_stats_tmp_G, const Matrix< BaseFloat > &delta, const Matrix< BaseFloat > &A, const Matrix< BaseFloat > &S, int32 max_iters)
This function takes the step direction (delta) of fMLLR matrix as argument, and optimize step size us...
Definition: basis-fmllr-diag-gmm.cc:374

kaldi::int32
kaldi::int32 int32
Definition: online-tcp-source.cc:27

kaldi::Matrix< double >

kaldi::BasisFmllrAccus::Write
void Write(std::ostream &out_stream, bool binary) const
Routines for reading and writing stats.
Definition: basis-fmllr-diag-gmm.cc:53

kaldi::Vector::Resize
void Resize(MatrixIndexT length, MatrixResizeType resize_type=kSetZero)
Set vector to a specified size (can be zero).
Definition: kaldi-vector.cc:190

kaldi::VectorBase::AddSpVec
void AddSpVec(const Real alpha, const SpMatrix< Real > &M, const VectorBase< Real > &v, const Real beta)
Add symmetric positive definite matrix times vector: this <– beta*this + alpha*M*v.
Definition: kaldi-vector.cc:141

kaldi::MatrixBase::CopyFromMat
void CopyFromMat(const MatrixBase< OtherReal > &M, MatrixTransposeType trans=kNoTrans)
Copy given matrix. (no resize is done).
Definition: kaldi-matrix.cc:862

kaldi::PackedMatrix::NumRows
MatrixIndexT NumRows() const
Definition: packed-matrix.h:104

kaldi::AffineXformStats::dim_
int32 dim_
dim_ is the feature dimension.
Definition: transform-common.h:43

kaldi::MatrixBase::SetUnit
void SetUnit()
Sets to zero, except ones along diagonal [for non-square matrices too].
Definition: kaldi-matrix.cc:1348

kaldi::BasisFmllrEstimate::ComputeTransform
double ComputeTransform(const AffineXformStats &spk_stats, Matrix< BaseFloat > *out_xform, Vector< BaseFloat > *coefficients, BasisFmllrOptions options) const
This function performs speaker adaptation, computing the fMLLR matrix based on speaker statistics...
Definition: basis-fmllr-diag-gmm.cc:270

kaldi::AmDiagGmm
Definition: am-diag-gmm.h:36

kaldi::kTrans
Definition: matrix-common.h:33

kaldi::DiagGmm::GetVars
void GetVars(Matrix< Real > *v) const
Accessor for covariances.
Definition: diag-gmm-inl.h:115

kaldi::VectorBase::AddVec2
void AddVec2(const Real alpha, const VectorBase< Real > &v)
Add vector : *this = *this + alpha * rv^2 [element-wise squaring].
Definition: kaldi-vector.cc:1255

kaldi::BasisFmllrEstimate::ComputeAmDiagPrecond
void ComputeAmDiagPrecond(const AmDiagGmm &am_gmm, SpMatrix< double > *pre_cond)
This function computes the preconditioner matrix, prior to base matrices estimation.
Definition: basis-fmllr-diag-gmm.cc:156

kaldi::MatrixBase::IsZero
bool IsZero(Real cutoff=1.0e-05) const
Returns true if matrix is all zeros.
Definition: kaldi-matrix.cc:1900

kaldi::MatrixBase::IsSymmetric
bool IsSymmetric(Real cutoff=1.0e-05) const
Returns true if matrix is Symmetric.
Definition: kaldi-matrix.cc:1848

kaldi::TpMatrix::Cholesky
void Cholesky(const SpMatrix< Real > &orig)
Definition: tp-matrix.cc:88

kaldi::BaseFloat
float BaseFloat
Definition: kaldi-types.h:29

kaldi::BasisFmllrOptions::size_scale
BaseFloat size_scale
Definition: basis-fmllr-diag-gmm.h:50

kaldi::BasisFmllrAccus
Stats for fMLLR subspace estimation.
Definition: basis-fmllr-diag-gmm.h:73

kaldi::MatrixBase::Row
const SubVector< Real > Row(MatrixIndexT i) const
Return specific row of matrix [const].
Definition: kaldi-matrix.h:188

float

kaldi::MatrixBase::Scale
void Scale(Real alpha)
Multiply each element with a scalar value.
Definition: kaldi-matrix.cc:1209

kaldi::BasisFmllrAccus::Read
void Read(std::istream &in_stream, bool binary, bool add=false)
Definition: basis-fmllr-diag-gmm.cc:66

kaldi::ExpectToken
void ExpectToken(std::istream &is, bool binary, const char *token)
ExpectToken tries to read in the given token, and throws an exception on failure. ...
Definition: io-funcs.cc:191

rnnlm::n
struct rnnlm::@11::@12 n

kaldi::DiagGmm::GetMeans
void GetMeans(Matrix< Real > *m) const
Accessor for means.
Definition: diag-gmm-inl.h:123

kaldi::MatrixBase::CopyFromTp
void CopyFromTp(const TpMatrix< OtherReal > &M, MatrixTransposeType trans=kNoTrans)
Copy given tpmatrix. (no resize is done).
Definition: kaldi-matrix.cc:958

kaldi::MatrixBase::AddMatMat
void AddMatMat(const Real alpha, const MatrixBase< Real > &A, MatrixTransposeType transA, const MatrixBase< Real > &B, MatrixTransposeType transB, const Real beta)
Definition: kaldi-matrix.cc:171

KALDI_ERR
#define KALDI_ERR
Definition: kaldi-error.h:147

kaldi::kNoTrans
Definition: matrix-common.h:34

kaldi::TpMatrix< double >

KALDI_WARN
#define KALDI_WARN
Definition: kaldi-error.h:150

kaldi::TraceMatMat
Real TraceMatMat(const MatrixBase< Real > &A, const MatrixBase< Real > &B, MatrixTransposeType trans)
We need to declare this here as it will be a friend function.
Definition: kaldi-matrix.cc:2692

kaldi::BasisFmllrAccus::ResizeAccus
void ResizeAccus(int32 dim)
Definition: basis-fmllr-diag-gmm.cc:82

kaldi::DiagGmm::weights
const Vector< BaseFloat > & weights() const
Definition: diag-gmm.h:178

kaldi::WriteToken
void WriteToken(std::ostream &os, bool binary, const char *token)
The WriteToken functions are for writing nonempty sequences of non-space characters.
Definition: io-funcs.cc:134

kaldi::DiagGmm::NumGauss
int32 NumGauss() const
Returns the number of mixture components in the GMM.
Definition: diag-gmm.h:72

kaldi::MatrixBase::SetZero
void SetZero()
Sets matrix to zero.
Definition: kaldi-matrix.cc:1330

kaldi::BasisFmllrAccus::dim_
int32 dim_
Feature dimension.
Definition: basis-fmllr-diag-gmm.h:99

kaldi::VectorBase::Scale
void Scale(Real alpha)
Multiplies all elements by this constant.
Definition: kaldi-vector.cc:963

kaldi::VectorBase::AddMatVec
void AddMatVec(const Real alpha, const MatrixBase< Real > &M, const MatrixTransposeType trans, const VectorBase< Real > &v, const Real beta)
Add matrix times vector : this <– beta*this + alpha*M*v.
Definition: kaldi-vector.cc:92

kaldi::BasisFmllrAccus::grad_scatter_
SpMatrix< BaseFloat > grad_scatter_
Gradient scatter. Dim is [(D+1)*D] [(D+1)*D].
Definition: basis-fmllr-diag-gmm.h:97

kaldi::AffineXformStats::G_
std::vector< SpMatrix< double > > G_
G_ is the outer product of extended-data, scaled by inverse variance, for each dimension.
Definition: transform-common.h:41

kaldi::AmDiagGmm::Dim
int32 Dim() const
Definition: am-diag-gmm.h:79

kaldi::AmDiagGmm::NumPdfs
int32 NumPdfs() const
Definition: am-diag-gmm.h:82

rnnlm::i
int i
Definition: mikolov-rnnlm-lib.cc:66

kaldi::SpMatrix::CopyFromMat
void CopyFromMat(const MatrixBase< Real > &orig, SpCopyType copy_type=kTakeMean)
Definition: sp-matrix.cc:112

kaldi::AmDiagGmm::GetPdf
DiagGmm & GetPdf(int32 pdf_index)
Accessors.
Definition: am-diag-gmm.h:119

basis-fmllr-diag-gmm.h

kaldi::Vector
A class representing a vector.
Definition: kaldi-vector.h:406

kaldi::kSetZero
Definition: matrix-common.h:38

KALDI_ASSERT
#define KALDI_ASSERT(cond)
Definition: kaldi-error.h:185

kaldi::MatrixBase::NumRows
MatrixIndexT NumRows() const
Returns number of rows (or zero for empty matrix).
Definition: kaldi-matrix.h:64

kaldi::SpMatrix::AddMat2Sp
void AddMat2Sp(const Real alpha, const MatrixBase< Real > &M, MatrixTransposeType transM, const SpMatrix< Real > &A, const Real beta=0.0)
Extension of rank-N update: this <– beta*this + alpha * M * A * M^T.
Definition: sp-matrix.cc:982

kaldi::FmllrAuxFuncDiagGmm
float FmllrAuxFuncDiagGmm(const MatrixBase< float > &xform, const AffineXformStats &stats)
Returns the (diagonal-GMM) FMLLR auxiliary function value given the transform and the stats...
Definition: fmllr-diag-gmm.cc:481

kaldi::MatrixBase::LogDet
Real LogDet(Real *det_sign=NULL) const
Returns logdet of matrix.
Definition: kaldi-matrix.cc:2038

kaldi::BasisFmllrOptions::min_count
BaseFloat min_count
Definition: basis-fmllr-diag-gmm.h:51

kaldi::BasisFmllrOptions::step_size_iters
int32 step_size_iters
Definition: basis-fmllr-diag-gmm.h:52

KALDI_VLOG
#define KALDI_VLOG(v)
Definition: kaldi-error.h:156

kaldi::DiagGmm
Definition for Gaussian Mixture Model with diagonal covariances.
Definition: diag-gmm.h:42

kaldi::VectorBase::CopyRowsFromMat
void CopyRowsFromMat(const MatrixBase< Real > &M)
Performs a row stack of the matrix M.
Definition: kaldi-vector.cc:348

kaldi::MatrixBase::Range
SubMatrix< Real > Range(const MatrixIndexT row_offset, const MatrixIndexT num_rows, const MatrixIndexT col_offset, const MatrixIndexT num_cols) const
Return a sub-part of matrix.
Definition: kaldi-matrix.h:202

kaldi::WriteBasicType
void WriteBasicType(std::ostream &os, bool binary, T t)
WriteBasicType is the name of the write function for bool, integer types, and floating-point types...
Definition: io-funcs-inl.h:34

kaldi::Matrix::Resize
void Resize(const MatrixIndexT r, const MatrixIndexT c, MatrixResizeType resize_type=kSetZero, MatrixStrideType stride_type=kDefaultStride)
Sets matrix to a specified size (zero is OK as long as both r and c are zero).
Definition: kaldi-matrix.cc:819

kaldi::BasisFmllrEstimate::EstimateFmllrBasis
void EstimateFmllrBasis(const AmDiagGmm &am_gmm, const BasisFmllrAccus &basis_accus)
Estimate the base matrices efficiently in a Maximum Likelihood manner.
Definition: basis-fmllr-diag-gmm.cc:219

kaldi::TpMatrix::InvertDouble
void InvertDouble()
Definition: tp-matrix.h:83

fmllr-diag-gmm.h

kaldi::SpMatrix::Resize
void Resize(MatrixIndexT nRows, MatrixResizeType resize_type=kSetZero)
Definition: sp-matrix.h:81

kaldi::SpMatrix::SymPosSemiDefEig
void SymPosSemiDefEig(VectorBase< Real > *s, MatrixBase< Real > *P, Real tolerance=0.001) const
This is the version of SVD that we implement for symmetric positive definite matrices.
Definition: sp-matrix.cc:57

kaldi::kTakeLower
Definition: matrix-common.h:50

KALDI_LOG
#define KALDI_LOG
Definition: kaldi-error.h:153

kaldi::VecVec
Real VecVec(const VectorBase< Real > &a, const VectorBase< Real > &b)
Returns dot product between v1 and v2.
Definition: kaldi-vector.cc:37

kaldi::VectorBase::AddVec
void AddVec(const Real alpha, const VectorBase< OtherReal > &v)
Add vector : *this = *this + alpha * rv (with casting between floats and doubles) ...
Definition: kaldi-vector.cc:1044

kaldi::AffineXformStats::beta_
double beta_
beta_ is the occupation count.
Definition: transform-common.h:33

kaldi::SubMatrix
Sub-matrix representation.
Definition: kaldi-matrix.h:988

kaldi::SortSvd
void SortSvd(VectorBase< Real > *s, MatrixBase< Real > *U, MatrixBase< Real > *Vt, bool sort_on_absolute_value)
Function to ensure that SVD is sorted.
Definition: kaldi-matrix.cc:2580

rnnlm::d
double d
Definition: mikolov-rnnlm-lib.cc:64

kaldi::VectorBase::Range
SubVector< Real > Range(const MatrixIndexT o, const MatrixIndexT l)
Returns a sub-vector of a vector (a range of elements).
Definition: kaldi-vector.h:94