doc/feature-plp_8cc_source.html

 // feat/feature-plp.cc

 // Copyright 2009-2011  Petr Motlicek;  Karel Vesely
 //                2016  Johns Hopkins University (author: Daniel Povey)

 // See ../../COPYING for clarification regarding multiple authors
 //
 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use this file except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //  http://www.apache.org/licenses/LICENSE-2.0
 //
 // THIS CODE IS PROVIDED *AS IS* BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 // KIND, EITHER EXPRESS OR IMPLIED, INCLUDING WITHOUT LIMITATION ANY IMPLIED
 // WARRANTIES OR CONDITIONS OF TITLE, FITNESS FOR A PARTICULAR PURPOSE,
 // MERCHANTABLITY OR NON-INFRINGEMENT.
 // See the Apache 2 License for the specific language governing permissions and
 // limitations under the License.


 #include "feat/feature-plp.h"

 namespace kaldi {

 PlpComputer::PlpComputer(const PlpOptions &opts):
     opts_(opts), srfft_(NULL),
     mel_energies_duplicated_(opts_.mel_opts.num_bins + 2, kUndefined),
     autocorr_coeffs_(opts_.lpc_order + 1, kUndefined),
     lpc_coeffs_(opts_.lpc_order, kUndefined),
     raw_cepstrum_(opts_.lpc_order, kUndefined) {

   if (opts.cepstral_lifter != 0.0) {
     lifter_coeffs_.Resize(opts.num_ceps);
     ComputeLifterCoeffs(opts.cepstral_lifter, &lifter_coeffs_);
   }
   InitIdftBases(opts_.lpc_order + 1, opts_.mel_opts.num_bins + 2,
                 &idft_bases_);

   if (opts.energy_floor > 0.0)
     log_energy_floor_ = Log(opts.energy_floor);

   int32 padded_window_size = opts.frame_opts.PaddedWindowSize();
   if ((padded_window_size & (padded_window_size-1)) == 0)  // Is a power of two...
     srfft_ = new SplitRadixRealFft<BaseFloat>(padded_window_size);

   // We'll definitely need the filterbanks info for VTLN warping factor 1.0.
   // [note: this call caches it.]
   GetMelBanks(1.0);
 }

 PlpComputer::PlpComputer(const PlpComputer &other):
     opts_(other.opts_), lifter_coeffs_(other.lifter_coeffs_),
     idft_bases_(other.idft_bases_), log_energy_floor_(other.log_energy_floor_),
     mel_banks_(other.mel_banks_), equal_loudness_(other.equal_loudness_),
     srfft_(NULL),
     mel_energies_duplicated_(opts_.mel_opts.num_bins + 2, kUndefined),
     autocorr_coeffs_(opts_.lpc_order + 1, kUndefined),
     lpc_coeffs_(opts_.lpc_order, kUndefined),
     raw_cepstrum_(opts_.lpc_order, kUndefined) {
   for (std::map<BaseFloat, MelBanks*>::iterator iter = mel_banks_.begin();
        iter != mel_banks_.end(); ++iter)
     iter->second = new MelBanks(*(iter->second));
   for (std::map<BaseFloat, Vector<BaseFloat>*>::iterator
            iter = equal_loudness_.begin();
        iter != equal_loudness_.end(); ++iter)
     iter->second = new Vector<BaseFloat>(*(iter->second));
   if (other.srfft_ != NULL)
     srfft_ = new SplitRadixRealFft<BaseFloat>(*(other.srfft_));
 }

 PlpComputer::~PlpComputer() {
   for (std::map<BaseFloat, MelBanks*>::iterator iter = mel_banks_.begin();
       iter != mel_banks_.end(); ++iter)
     delete iter->second;
   for (std::map<BaseFloat, Vector<BaseFloat>* >::iterator
            iter = equal_loudness_.begin();
        iter != equal_loudness_.end(); ++iter)
     delete iter->second;
   delete srfft_;
 }

 const MelBanks *PlpComputer::GetMelBanks(BaseFloat vtln_warp) {
   MelBanks *this_mel_banks = NULL;
   std::map<BaseFloat, MelBanks*>::iterator iter = mel_banks_.find(vtln_warp);
   if (iter == mel_banks_.end()) {
     this_mel_banks = new MelBanks(opts_.mel_opts,
                                   opts_.frame_opts,
                                   vtln_warp);
     mel_banks_[vtln_warp] = this_mel_banks;
   } else {
     this_mel_banks = iter->second;
   }
   return this_mel_banks;
 }

 const Vector<BaseFloat> *PlpComputer::GetEqualLoudness(BaseFloat vtln_warp) {
   const MelBanks *this_mel_banks = GetMelBanks(vtln_warp);
   Vector<BaseFloat> *ans = NULL;
   std::map<BaseFloat, Vector<BaseFloat>*>::iterator iter
       = equal_loudness_.find(vtln_warp);
   if (iter == equal_loudness_.end()) {
     ans = new Vector<BaseFloat>;
     GetEqualLoudnessVector(*this_mel_banks, ans);
     equal_loudness_[vtln_warp] = ans;
   } else {
     ans = iter->second;
   }
   return ans;
 }

 void PlpComputer::Compute(BaseFloat signal_raw_log_energy,
                           BaseFloat vtln_warp,
                           VectorBase<BaseFloat> *signal_frame,
                           VectorBase<BaseFloat> *feature) {
   KALDI_ASSERT(signal_frame->Dim() == opts_.frame_opts.PaddedWindowSize() &&
                feature->Dim() == this->Dim());

   const MelBanks &mel_banks = *GetMelBanks(vtln_warp);
   const Vector<BaseFloat> &equal_loudness = *GetEqualLoudness(vtln_warp);


   KALDI_ASSERT(opts_.num_ceps <= opts_.lpc_order+1);  // our num-ceps includes C0.


   if (opts_.use_energy && !opts_.raw_energy)
     signal_raw_log_energy = Log(std::max<BaseFloat>(VecVec(*signal_frame, *signal_frame),
                                      std::numeric_limits<float>::min()));

   if (srfft_ != NULL)  // Compute FFT using split-radix algorithm.
     srfft_->Compute(signal_frame->Data(), true);
   else  // An alternative algorithm that works for non-powers-of-two.
     RealFft(signal_frame, true);

   // Convert the FFT into a power spectrum.
   ComputePowerSpectrum(signal_frame);  // elements 0 ... signal_frame->Dim()/2

   SubVector<BaseFloat> power_spectrum(*signal_frame,
                                       0, signal_frame->Dim() / 2 + 1);

   int32 num_mel_bins = opts_.mel_opts.num_bins;

   SubVector<BaseFloat> mel_energies(mel_energies_duplicated_, 1, num_mel_bins);

   mel_banks.Compute(power_spectrum, &mel_energies);

   mel_energies.MulElements(equal_loudness);

   mel_energies.ApplyPow(opts_.compress_factor);

   // duplicate first and last elements
   mel_energies_duplicated_(0) = mel_energies_duplicated_(1);
   mel_energies_duplicated_(num_mel_bins + 1) =
       mel_energies_duplicated_(num_mel_bins);

   autocorr_coeffs_.SetZero();  // In case of NaNs or infs
   autocorr_coeffs_.AddMatVec(1.0, idft_bases_, kNoTrans,
                              mel_energies_duplicated_,  0.0);

   BaseFloat residual_log_energy = ComputeLpc(autocorr_coeffs_, &lpc_coeffs_);

   residual_log_energy = std::max<BaseFloat>(residual_log_energy,
                                  std::numeric_limits<float>::min());

   Lpc2Cepstrum(opts_.lpc_order, lpc_coeffs_.Data(), raw_cepstrum_.Data());
   feature->Range(1, opts_.num_ceps - 1).CopyFromVec(
       raw_cepstrum_.Range(0, opts_.num_ceps - 1));
   (*feature)(0) = residual_log_energy;

   if (opts_.cepstral_lifter != 0.0)
     feature->MulElements(lifter_coeffs_);

   if (opts_.cepstral_scale != 1.0)
     feature->Scale(opts_.cepstral_scale);

   if (opts_.use_energy) {
     if (opts_.energy_floor > 0.0 && signal_raw_log_energy < log_energy_floor_)
       signal_raw_log_energy = log_energy_floor_;
     (*feature)(0) = signal_raw_log_energy;
   }

   if (opts_.htk_compat) {  // reorder the features.
     BaseFloat log_energy = (*feature)(0);
     for (int32 i = 0; i < opts_.num_ceps-1; i++)
       (*feature)(i) = (*feature)(i+1);
     (*feature)(opts_.num_ceps-1)  = log_energy;
   }
 }


 }  // namespace kaldi
kaldi
This code computes Goodness of Pronunciation (GOP) and extracts phone-level pronunciation feature for...
Definition: chain.dox:20

kaldi::FrameExtractionOptions::PaddedWindowSize
int32 PaddedWindowSize() const
Definition: feature-window.h:112

kaldi::PlpOptions::lpc_order
int32 lpc_order
Definition: feature-plp.h:45

kaldi::PlpOptions::use_energy
bool use_energy
Definition: feature-plp.h:47

kaldi::kUndefined
Definition: matrix-common.h:39

kaldi::PlpOptions::compress_factor
BaseFloat compress_factor
Definition: feature-plp.h:50

kaldi::PlpComputer::Dim
int32 Dim() const
Definition: feature-plp.h:111

kaldi::PlpComputer::log_energy_floor_
BaseFloat log_energy_floor_
Definition: feature-plp.h:151

kaldi::Lpc2Cepstrum
void Lpc2Cepstrum(int n, const BaseFloat *pLPC, BaseFloat *pCepst)
Definition: mel-computations.cc:300

kaldi::PlpComputer::mel_energies_duplicated_
Vector< BaseFloat > mel_energies_duplicated_
Definition: feature-plp.h:157

kaldi::PlpComputer
This is the new-style interface to the PLP computation.
Definition: feature-plp.h:101

kaldi::PlpComputer::GetEqualLoudness
const Vector< BaseFloat > * GetEqualLoudness(BaseFloat vtln_warp)
Definition: feature-plp.cc:97

kaldi::PlpComputer::lifter_coeffs_
Vector< BaseFloat > lifter_coeffs_
Definition: feature-plp.h:149

kaldi::PlpComputer::lpc_coeffs_
Vector< BaseFloat > lpc_coeffs_
Definition: feature-plp.h:161

kaldi::int32
kaldi::int32 int32
Definition: online-tcp-source.cc:27

kaldi::PlpOptions::num_ceps
int32 num_ceps
Definition: feature-plp.h:46

kaldi::PlpOptions::mel_opts
MelBanksOptions mel_opts
Definition: feature-plp.h:44

kaldi::MelBanks
Definition: mel-computations.h:78

kaldi::PlpComputer::autocorr_coeffs_
Vector< BaseFloat > autocorr_coeffs_
Definition: feature-plp.h:159

kaldi::PlpComputer::opts_
PlpOptions opts_
Definition: feature-plp.h:148

kaldi::PlpComputer::idft_bases_
Matrix< BaseFloat > idft_bases_
Definition: feature-plp.h:150

kaldi::MelBanksOptions::num_bins
int32 num_bins
Definition: mel-computations.h:44

kaldi::Log
double Log(double x)
Definition: kaldi-math.h:100

float

kaldi::PlpOptions::frame_opts
FrameExtractionOptions frame_opts
Definition: feature-plp.h:43

kaldi::VectorBase::MulElements
void MulElements(const VectorBase< Real > &v)
Multiply element-by-element by another vector.
Definition: kaldi-vector.cc:968

kaldi::PlpOptions::energy_floor
BaseFloat energy_floor
Definition: feature-plp.h:48

kaldi::PlpComputer::equal_loudness_
std::map< BaseFloat, Vector< BaseFloat > *> equal_loudness_
Definition: feature-plp.h:153

kaldi::PlpComputer::~PlpComputer
~PlpComputer()
Definition: feature-plp.cc:72

kaldi::ComputeLifterCoeffs
void ComputeLifterCoeffs(BaseFloat Q, VectorBase< BaseFloat > *coeffs)
Definition: mel-computations.cc:253

kaldi::ComputeLpc
BaseFloat ComputeLpc(const VectorBase< BaseFloat > &autocorr_in, Vector< BaseFloat > *lpc_out)
Definition: mel-computations.cc:326

kaldi::kNoTrans
Definition: matrix-common.h:34

kaldi::VectorBase::Data
Real * Data()
Returns a pointer to the start of the vector&#39;s data.
Definition: kaldi-vector.h:70

kaldi::PlpOptions::cepstral_scale
BaseFloat cepstral_scale
Definition: feature-plp.h:52

kaldi::VectorBase::Dim
MatrixIndexT Dim() const
Returns the dimension of the vector.
Definition: kaldi-vector.h:64

kaldi::InitIdftBases
void InitIdftBases(int32 n_bases, int32 dimension, Matrix< BaseFloat > *mat_out)
Definition: feature-functions.cc:188

kaldi::VectorBase::Scale
void Scale(Real alpha)
Multiplies all elements by this constant.
Definition: kaldi-vector.cc:963

kaldi::SplitRadixRealFft
Definition: srfft.h:105

rnnlm::i
int i
Definition: mikolov-rnnlm-lib.cc:66

kaldi::PlpComputer::Compute
void Compute(BaseFloat signal_raw_log_energy, BaseFloat vtln_warp, VectorBase< BaseFloat > *signal_frame, VectorBase< BaseFloat > *feature)
Function that computes one frame of features from one frame of signal.
Definition: feature-plp.cc:112

kaldi::ComputePowerSpectrum
void ComputePowerSpectrum(VectorBase< BaseFloat > *waveform)
Definition: feature-functions.cc:29

kaldi::PlpOptions::cepstral_lifter
int32 cepstral_lifter
Definition: feature-plp.h:51

kaldi::PlpComputer::GetMelBanks
const MelBanks * GetMelBanks(BaseFloat vtln_warp)
Definition: feature-plp.cc:83

kaldi::Vector
A class representing a vector.
Definition: kaldi-vector.h:406

KALDI_ASSERT
#define KALDI_ASSERT(cond)
Definition: kaldi-error.h:185

kaldi::VectorBase::ApplyPow
void ApplyPow(Real power)
Take all elements of vector to a power.
Definition: kaldi-vector.h:179

kaldi::PlpComputer::PlpComputer
PlpComputer(const PlpOptions &opts)
Definition: feature-plp.cc:26

kaldi::PlpComputer::raw_cepstrum_
Vector< BaseFloat > raw_cepstrum_
Definition: feature-plp.h:163

feature-plp.h

kaldi::GetEqualLoudnessVector
void GetEqualLoudnessVector(const MelBanks &mel_banks, Vector< BaseFloat > *ans)
Definition: mel-computations.cc:311

kaldi::PlpOptions
PlpOptions contains basic options for computing PLP features.
Definition: feature-plp.h:42

kaldi::VectorBase
Provides a vector abstraction class.
Definition: kaldi-vector.h:41

kaldi::PlpOptions::raw_energy
bool raw_energy
Definition: feature-plp.h:49

kaldi::PlpComputer::srfft_
SplitRadixRealFft< BaseFloat > * srfft_
Definition: feature-plp.h:154

kaldi::PlpComputer::mel_banks_
std::map< BaseFloat, MelBanks * > mel_banks_
Definition: feature-plp.h:152

kaldi::VecVec
Real VecVec(const VectorBase< Real > &a, const VectorBase< Real > &b)
Returns dot product between v1 and v2.
Definition: kaldi-vector.cc:37

kaldi::SubVector
Represents a non-allocating general vector which can be defined as a sub-vector of higher-level vecto...
Definition: kaldi-vector.h:501

kaldi::PlpOptions::htk_compat
bool htk_compat
Definition: feature-plp.h:54

kaldi::RealFft
void RealFft(VectorBase< Real > *v, bool forward)
RealFft is a fourier transform of real inputs.
Definition: matrix-functions.cc:391

kaldi::VectorBase::Range
SubVector< Real > Range(const MatrixIndexT o, const MatrixIndexT l)
Returns a sub-vector of a vector (a range of elements).
Definition: kaldi-vector.h:94