doc/diag-gmm_8h_source.html

 // gmm/diag-gmm.h

 // Copyright 2009-2011  Microsoft Corporation;
 //                      Saarland University (Author: Arnab Ghoshal);
 //                      Georg Stemmer;  Jan Silovsky
 //           2012       Arnab Ghoshal
 //           2013-2014  Johns Hopkins University (author: Daniel Povey)

 // See ../../COPYING for clarification regarding multiple authors
 //
 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use this file except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //  http://www.apache.org/licenses/LICENSE-2.0
 //
 // THIS CODE IS PROVIDED *AS IS* BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 // KIND, EITHER EXPRESS OR IMPLIED, INCLUDING WITHOUT LIMITATION ANY IMPLIED
 // WARRANTIES OR CONDITIONS OF TITLE, FITNESS FOR A PARTICULAR PURPOSE,
 // MERCHANTABLITY OR NON-INFRINGEMENT.
 // See the Apache 2 License for the specific language governing permissions and
 // limitations under the License.

 #ifndef KALDI_GMM_DIAG_GMM_H_
 #define KALDI_GMM_DIAG_GMM_H_ 1

 #include <utility>
 #include <vector>

 #include "base/kaldi-common.h"
 #include "gmm/model-common.h"
 #include "matrix/matrix-lib.h"
 #include "tree/cluster-utils.h"
 #include "tree/clusterable-classes.h"

 namespace kaldi {

 class FullGmm;
 class DiagGmmNormal;

 class DiagGmm {
   friend class DiagGmmNormal;

  public:
   DiagGmm() : valid_gconsts_(false) { }

   explicit DiagGmm(const DiagGmm &gmm): valid_gconsts_(false) {
     CopyFromDiagGmm(gmm);
   }

   DiagGmm(const GaussClusterable &gc, BaseFloat var_floor);

   void CopyFromNormal(const DiagGmmNormal &diag_gmm_normal);

   DiagGmm(int32 nMix, int32 dim): valid_gconsts_(false) { Resize(nMix, dim); }

   explicit DiagGmm(const std::vector<std::pair<BaseFloat, const DiagGmm*> > &gmms);

   void Resize(int32 nMix, int32 dim);

   int32 NumGauss() const { return weights_.Dim(); }
   int32 Dim() const { return means_invvars_.NumCols(); }

   void CopyFromDiagGmm(const DiagGmm &diaggmm);
   void CopyFromFullGmm(const FullGmm &fullgmm);

   BaseFloat LogLikelihood(const VectorBase<BaseFloat> &data) const;

   void LogLikelihoods(const VectorBase<BaseFloat> &data,
                       Vector<BaseFloat> *loglikes) const;

   void LogLikelihoods(const MatrixBase<BaseFloat> &data,
                       Matrix<BaseFloat> *loglikes) const;


   void LogLikelihoodsPreselect(const VectorBase<BaseFloat> &data,
                                const std::vector<int32> &indices,
                                Vector<BaseFloat> *loglikes) const;

   BaseFloat GaussianSelection(const VectorBase<BaseFloat> &data,
                               int32 num_gselect,
                               std::vector<int32> *output) const;

   BaseFloat GaussianSelection(const MatrixBase<BaseFloat> &data,
                               int32 num_gselect,
                               std::vector<std::vector<int32> > *output) const;

   BaseFloat GaussianSelectionPreselect(const VectorBase<BaseFloat> &data,
                                        const std::vector<int32> &preselect,
                                        int32 num_gselect,
                                        std::vector<int32> *output) const;

   BaseFloat ComponentPosteriors(const VectorBase<BaseFloat> &data,
                                 Vector<BaseFloat> *posteriors) const;

   BaseFloat ComponentLogLikelihood(const VectorBase<BaseFloat> &data,
                                    int32 comp_id) const;

   int32 ComputeGconsts();

   void Generate(VectorBase<BaseFloat> *output);

   void Split(int32 target_components, float perturb_factor,
              std::vector<int32> *history = NULL);

   void Perturb(float perturb_factor);

   void Merge(int32 target_components, std::vector<int32> *history = NULL);

   // Merge the components to a specified target #components: this
   // version uses a different approach based on K-means.
   void MergeKmeans(int32 target_components,
                    ClusterKMeansOptions cfg = ClusterKMeansOptions());

   void Write(std::ostream &os, bool binary) const;
   void Read(std::istream &in, bool binary);

   void Interpolate(BaseFloat rho, const DiagGmm &source,
                    GmmFlagsType flags = kGmmAll);

   void Interpolate(BaseFloat rho, const FullGmm &source,
                    GmmFlagsType flags = kGmmAll);

   const Vector<BaseFloat> &gconsts() const {
     KALDI_ASSERT(valid_gconsts_);
     return gconsts_;
   }
   const Vector<BaseFloat> &weights() const { return weights_; }
   const Matrix<BaseFloat> &means_invvars() const { return means_invvars_; }
   const Matrix<BaseFloat> &inv_vars() const { return inv_vars_; }
   bool valid_gconsts() const { return valid_gconsts_; }

   void RemoveComponent(int32 gauss, bool renorm_weights);

   void RemoveComponents(const std::vector<int32> &gauss, bool renorm_weights);

   template<class Real>
   void SetWeights(const VectorBase<Real> &w);

   template<class Real>
   void SetMeans(const MatrixBase<Real> &m);
   template<class Real>
   void SetInvVarsAndMeans(const MatrixBase<Real> &invvars,
                           const MatrixBase<Real> &means);
   template<class Real>
   void SetInvVars(const MatrixBase<Real> &v);

   template<class Real>
   void GetVars(Matrix<Real> *v) const;
   template<class Real>
   void GetMeans(Matrix<Real> *m) const;

   template<class Real>
   void SetComponentMean(int32 gauss, const VectorBase<Real> &in);
   template<class Real>
   void SetComponentInvVar(int32 gauss, const VectorBase<Real> &in);
   inline void SetComponentWeight(int32 gauss, BaseFloat weight);

   template<class Real>
   void GetComponentMean(int32 gauss, VectorBase<Real> *out) const;

   template<class Real>
   void GetComponentVariance(int32 gauss, VectorBase<Real> *out) const;

  private:
   Vector<BaseFloat> gconsts_;
   bool valid_gconsts_;
   Vector<BaseFloat> weights_;
   Matrix<BaseFloat> inv_vars_;
   Matrix<BaseFloat> means_invvars_;

   // merged_components_logdet computes logdet for merged components
   // f1, f2 are first-order stats (normalized by zero-order stats)
   // s1, s2 are second-order stats (normalized by zero-order stats)
   BaseFloat merged_components_logdet(BaseFloat w1, BaseFloat w2,
                                      const VectorBase<BaseFloat> &f1,
                                      const VectorBase<BaseFloat> &f2,
                                      const VectorBase<BaseFloat> &s1,
                                      const VectorBase<BaseFloat> &s2) const;

  private:
   const DiagGmm &operator=(const DiagGmm &other);  // Disallow assignment
 };

 std::ostream &
 operator << (std::ostream &os, const kaldi::DiagGmm &gmm);
 std::istream &
 operator >> (std::istream &is, kaldi::DiagGmm &gmm);

 }  // End namespace kaldi

 #include "gmm/diag-gmm-inl.h"  // templated functions.

 #endif  // KALDI_GMM_DIAG_GMM_H_
kaldi::operator<<
std::ostream & operator<<(std::ostream &os, const MatrixBase< Real > &M)
Definition: kaldi-matrix-inl.h:41

kaldi
This code computes Goodness of Pronunciation (GOP) and extracts phone-level pronunciation feature for...
Definition: chain.dox:20

kaldi::DiagGmm::Dim
int32 Dim() const
Returns the dimensionality of the Gaussian mean vectors.
Definition: diag-gmm.h:74

kaldi::DiagGmm::CopyFromDiagGmm
void CopyFromDiagGmm(const DiagGmm &diaggmm)
Copies from given DiagGmm.
Definition: diag-gmm.cc:83

kaldi::DiagGmm::Perturb
void Perturb(float perturb_factor)
Perturbs the component means with a random vector multiplied by the pertrub factor.
Definition: diag-gmm.cc:215

kaldi::DiagGmm::Interpolate
void Interpolate(BaseFloat rho, const DiagGmm &source, GmmFlagsType flags=kGmmAll)
this = rho x source + (1-rho) x this
Definition: diag-gmm.cc:645

kaldi::DiagGmm::SetInvVarsAndMeans
void SetInvVarsAndMeans(const MatrixBase< Real > &invvars, const MatrixBase< Real > &means)
Use SetInvVarsAndMeans if updating both means and (inverse) variances.
Definition: diag-gmm-inl.h:63

kaldi::DiagGmm::Write
void Write(std::ostream &os, bool binary) const
Definition: diag-gmm.cc:705

matrix-lib.h

kaldi::DiagGmm::Merge
void Merge(int32 target_components, std::vector< int32 > *history=NULL)
Merge the components and remember the order in which the components were merged (flat list of pairs) ...
Definition: diag-gmm.cc:295

kaldi::DiagGmm::LogLikelihoodsPreselect
void LogLikelihoodsPreselect(const VectorBase< BaseFloat > &data, const std::vector< int32 > &indices, Vector< BaseFloat > *loglikes) const
Outputs the per-component log-likelihoods of a subset of mixture components.
Definition: diag-gmm.cc:566

kaldi::DiagGmm::Split
void Split(int32 target_components, float perturb_factor, std::vector< int32 > *history=NULL)
Split the components and remember the order in which the components were split.
Definition: diag-gmm.cc:154

kaldi::DiagGmmNormal
Definition for Gaussian Mixture Model with diagonal covariances in normal mode: where the parameters ...
Definition: diag-gmm-normal.h:45

kaldi::MatrixBase::NumCols
MatrixIndexT NumCols() const
Returns number of columns (or zero for empty matrix).
Definition: kaldi-matrix.h:67

kaldi::MatrixBase
Base class which provides matrix operations not involving resizing or allocation. ...
Definition: kaldi-matrix.h:49

kaldi::DiagGmm::means_invvars
const Matrix< BaseFloat > & means_invvars() const
Definition: diag-gmm.h:179

kaldi::FullGmm
Definition for Gaussian Mixture Model with full covariances.
Definition: full-gmm.h:40

kaldi::DiagGmm::GetComponentMean
void GetComponentMean(int32 gauss, VectorBase< Real > *out) const
Accessor for single component mean.
Definition: diag-gmm-inl.h:135

kaldi::DiagGmm::Resize
void Resize(int32 nMix, int32 dim)
Resizes arrays to this dim. Does not initialize data.
Definition: diag-gmm.cc:66

kaldi::DiagGmm::gconsts
const Vector< BaseFloat > & gconsts() const
Const accessors.
Definition: diag-gmm.h:174

kaldi::DiagGmm::valid_gconsts
bool valid_gconsts() const
Definition: diag-gmm.h:181

kaldi::DiagGmm::ComputeGconsts
int32 ComputeGconsts()
Sets the gconsts.
Definition: diag-gmm.cc:114

kaldi::int32
kaldi::int32 int32
Definition: online-tcp-source.cc:27

kaldi::Matrix< BaseFloat >

kaldi::GmmFlagsType
uint16 GmmFlagsType
Bitwise OR of the above flags.
Definition: model-common.h:35

kaldi::DiagGmm::SetMeans
void SetMeans(const MatrixBase< Real > &m)
Use SetMeans to update only the Gaussian means (and not variances)
Definition: diag-gmm-inl.h:43

kaldi::ClusterKMeansOptions
Definition: cluster-utils.h:161

kaldi::DiagGmm::SetComponentMean
void SetComponentMean(int32 gauss, const VectorBase< Real > &in)
Mutators for single component, supports float or double Set mean for a single component - internally ...
Definition: diag-gmm-inl.h:52

kaldi::DiagGmm::GetVars
void GetVars(Matrix< Real > *v) const
Accessor for covariances.
Definition: diag-gmm-inl.h:115

kaldi::DiagGmm::ComponentLogLikelihood
BaseFloat ComponentLogLikelihood(const VectorBase< BaseFloat > &data, int32 comp_id) const
Computes the log-likelihood of a data point given a single Gaussian component.
Definition: diag-gmm.cc:497

kaldi::DiagGmm::ComponentPosteriors
BaseFloat ComponentPosteriors(const VectorBase< BaseFloat > &data, Vector< BaseFloat > *posteriors) const
Computes the posterior probabilities of all Gaussian components given a data point.
Definition: diag-gmm.cc:601

float

kaldi::DiagGmm::RemoveComponent
void RemoveComponent(int32 gauss, bool renorm_weights)
Removes single component from model.
Definition: diag-gmm.cc:617

kaldi::DiagGmm::LogLikelihood
BaseFloat LogLikelihood(const VectorBase< BaseFloat > &data) const
Returns the log-likelihood of a data point (vector) given the GMM.
Definition: diag-gmm.cc:517

kaldi::DiagGmm::GetMeans
void GetMeans(Matrix< Real > *m) const
Accessor for means.
Definition: diag-gmm-inl.h:123

kaldi::DiagGmm::RemoveComponents
void RemoveComponents(const std::vector< int32 > &gauss, bool renorm_weights)
Removes multiple components from model; "gauss" must not have dups.
Definition: diag-gmm.cc:632

kaldi::DiagGmm::DiagGmm
DiagGmm(const DiagGmm &gmm)
Definition: diag-gmm.h:50

kaldi::DiagGmm::valid_gconsts_
bool valid_gconsts_
Recompute gconsts_ if false.
Definition: diag-gmm.h:233

kaldi::DiagGmm::inv_vars_
Matrix< BaseFloat > inv_vars_
Inverted (diagonal) variances.
Definition: diag-gmm.h:235

kaldi::DiagGmm::weights
const Vector< BaseFloat > & weights() const
Definition: diag-gmm.h:178

kaldi::DiagGmm::NumGauss
int32 NumGauss() const
Returns the number of mixture components in the GMM.
Definition: diag-gmm.h:72

kaldi::kGmmAll
Definition: model-common.h:33

kaldi::DiagGmm::LogLikelihoods
void LogLikelihoods(const VectorBase< BaseFloat > &data, Vector< BaseFloat > *loglikes) const
Outputs the per-component log-likelihoods.
Definition: diag-gmm.cc:528

kaldi::DiagGmm::GaussianSelectionPreselect
BaseFloat GaussianSelectionPreselect(const VectorBase< BaseFloat > &data, const std::vector< int32 > &preselect, int32 num_gselect, std::vector< int32 > *output) const
Get gaussian selection information for one frame.
Definition: diag-gmm.cc:875

kaldi::DiagGmm::MergeKmeans
void MergeKmeans(int32 target_components, ClusterKMeansOptions cfg=ClusterKMeansOptions())
Definition: diag-gmm.cc:231

kaldi::DiagGmm::SetInvVars
void SetInvVars(const MatrixBase< Real > &v)
Set the (inverse) variances and recompute means_invvars_.
Definition: diag-gmm-inl.h:78

kaldi::operator>>
std::istream & operator>>(std::istream &is, Matrix< Real > &M)
Definition: kaldi-matrix-inl.h:47

kaldi::DiagGmm::GetComponentVariance
void GetComponentVariance(int32 gauss, VectorBase< Real > *out) const
Accessor for single component variance.
Definition: diag-gmm-inl.h:145

kaldi::DiagGmm::CopyFromFullGmm
void CopyFromFullGmm(const FullGmm &fullgmm)
Copies from given FullGmm.
Definition: diag-gmm.cc:92

diag-gmm-inl.h

kaldi::DiagGmm::Read
void Read(std::istream &in, bool binary)
Definition: diag-gmm.cc:728

kaldi::DiagGmm::weights_
Vector< BaseFloat > weights_
weights (not log).
Definition: diag-gmm.h:234

kaldi::Vector
A class representing a vector.
Definition: kaldi-vector.h:406

KALDI_ASSERT
#define KALDI_ASSERT(cond)
Definition: kaldi-error.h:185

kaldi::DiagGmm::gconsts_
Vector< BaseFloat > gconsts_
Equals log(weight) - 0.5 * (log det(var) + mean*mean*inv(var))
Definition: diag-gmm.h:232

kaldi::DiagGmm::GaussianSelection
BaseFloat GaussianSelection(const VectorBase< BaseFloat > &data, int32 num_gselect, std::vector< int32 > *output) const
Get gaussian selection information for one frame.
Definition: diag-gmm.cc:765

kaldi::DiagGmm::DiagGmm
DiagGmm(int32 nMix, int32 dim)
Definition: diag-gmm.h:61

kaldi::DiagGmm
Definition for Gaussian Mixture Model with diagonal covariances.
Definition: diag-gmm.h:42

clusterable-classes.h

kaldi::DiagGmm::Generate
void Generate(VectorBase< BaseFloat > *output)
Generates a random data-point from this distribution.
Definition: diag-gmm.cc:922

model-common.h

kaldi::DiagGmm::SetComponentInvVar
void SetComponentInvVar(int32 gauss, const VectorBase< Real > &in)
Set inv-var for single component (recommend to do this before setting the mean, if doing both...
Definition: diag-gmm-inl.h:97

kaldi::DiagGmm::DiagGmm
DiagGmm()
Empty constructor.
Definition: diag-gmm.h:48

cluster-utils.h

kaldi::DiagGmm::SetWeights
void SetWeights(const VectorBase< Real > &w)
Mutators for both float or double.
Definition: diag-gmm-inl.h:28

kaldi::VectorBase
Provides a vector abstraction class.
Definition: kaldi-vector.h:41

kaldi::GaussClusterable
GaussClusterable wraps Gaussian statistics in a form accessible to generic clustering algorithms...
Definition: clusterable-classes.h:65

kaldi::DiagGmm::CopyFromNormal
void CopyFromNormal(const DiagGmmNormal &diag_gmm_normal)
Copies from DiagGmmNormal; does not resize.
Definition: diag-gmm.cc:918

kaldi-common.h

kaldi::DiagGmm::means_invvars_
Matrix< BaseFloat > means_invvars_
Means times inverted variance.
Definition: diag-gmm.h:236

kaldi::DiagGmm::SetComponentWeight
void SetComponentWeight(int32 gauss, BaseFloat weight)
Set weight for single component.
Definition: diag-gmm-inl.h:34

kaldi::DiagGmm::inv_vars
const Matrix< BaseFloat > & inv_vars() const
Definition: diag-gmm.h:180

kaldi::DiagGmm::merged_components_logdet
BaseFloat merged_components_logdet(BaseFloat w1, BaseFloat w2, const VectorBase< BaseFloat > &f1, const VectorBase< BaseFloat > &f2, const VectorBase< BaseFloat > &s1, const VectorBase< BaseFloat > &s2) const
Definition: diag-gmm.cc:471

kaldi::DiagGmm::operator=
const DiagGmm & operator=(const DiagGmm &other)