徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
安装
比浏览器更快的访问!
 

梅尔频率倒谱系数

指数 梅尔频率倒谱系数

在聲音處理領域中,梅爾頻率倒譜(Mel-Frequency Cepstrum)是基於聲音頻率的非線性梅爾刻度(mel scale)的對數能量頻譜的線性變換。 梅爾頻率倒譜系數 (Mel-Frequency Cepstral Coefficients,MFCCs)就是組成梅爾頻率倒譜的係數。它衍生自音訊片段的倒頻譜(cepstrum)。倒譜和梅爾頻率倒譜的區別在於,梅爾頻率倒譜的頻帶劃分是在梅爾刻度上等距劃分的,它比用於正常的對數倒頻譜中的線性間隔的頻帶更能近似人類的聽覺系統。 這樣的非線性表示,可以在多個領域中使聲音信號有更好的表示。例如在音訊壓縮中。 梅爾頻率倒譜係數(MFCC)廣泛被應用於語音識別的功能。他們由Davis和Mermelstein在1980年代提出,並在其後持續是最先進的技術之一。在MFCC之前,線性預測係數(LPCS)和線性預測倒譜系數(LPCCs)是自動語音識別的的主流方法。 MFCC通常有以下之過程.

3 关系: 倒頻譜语音识别梅尔刻度

倒頻譜

倒頻譜(cepstrum),顧名思義,就是將頻譜(spectrum)的英文前四個字母反過來寫。倒頻譜是為了某些時候,為了計算方便,將原來信號的頻譜先轉成類似分貝的單位,再作逆傅里叶变换,把它視為一種新的訊號做處理。倒頻譜有複數倒頻譜,及實數倒頻譜。 倒頻譜被定義在1963的論文(Bogert等)。定義如下:.

新!!: 梅尔频率倒谱系数和倒頻譜 · 查看更多 »

语音识别

语音识别(speech recognition;語音辨識/言語辨別)技术,也被称为自动语音识别(Automatic Speech Recognition, ASR)、電腦語音識別(Computer Speech Recognition)或是語音轉文本識別(Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。.

新!!: 梅尔频率倒谱系数和语音识别 · 查看更多 »

梅尔刻度

梅尔刻度(又稱Mel尺度,Mel scale),是一種基于人耳对等距的音高(pitch)變化的感官判断而定的非線性頻率刻度。由、 和Newman于1937年命名。 梅爾刻度與線性的頻率刻度赫茲(Hz)之間可以進行近似的數學換算。其参考點定義是將1000Hz,且高于人耳听阈值40分贝以上的聲音信號,定為1000mel。在頻率500Hz以上时,人耳每感覺到等量的音高變化,所需要的頻率變化隨頻率增加而愈來愈大。这样的结果是,在赫茲刻度500Hz往上的四个八度(一個八度即為兩倍的頻率),只对应梅尔刻度上的两个八度。Mel的名字来源于单词melody,表示这个刻度是基於音高比较而創造的。 一个常用的将f赫兹转换为m梅尔的公式是.

新!!: 梅尔频率倒谱系数和梅尔刻度 · 查看更多 »

重定向到这里:

梅爾頻率倒頻譜梅爾頻率倒頻譜係數

传出传入
嘿!我们在Facebook上吧! »