倒頻譜
倒頻譜(cepstrum),顧名思義,就是將頻譜(spectrum)的英文前四個字母反過來寫。倒頻譜是為了某些時候,為了計算方便,將原來信號的頻譜先轉成類似分貝的單位,再作逆傅里叶变换,把它視為一種新的訊號做處理。倒頻譜有複數倒頻譜,及實數倒頻譜。 倒頻譜被定義在1963的論文(Bogert等)。定義如下:.
新!!: 梅尔频率倒谱系数和倒頻譜 · 查看更多 »
语音识别
语音识别(speech recognition;語音辨識/言語辨別)技术,也被称为自动语音识别(Automatic Speech Recognition, ASR)、電腦語音識別(Computer Speech Recognition)或是語音轉文本識別(Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。.
新!!: 梅尔频率倒谱系数和语音识别 · 查看更多 »
梅尔刻度
梅尔刻度(又稱Mel尺度,Mel scale),是一種基于人耳对等距的音高(pitch)變化的感官判断而定的非線性頻率刻度。由、 和Newman于1937年命名。 梅爾刻度與線性的頻率刻度赫茲(Hz)之間可以進行近似的數學換算。其参考點定義是將1000Hz,且高于人耳听阈值40分贝以上的聲音信號,定為1000mel。在頻率500Hz以上时,人耳每感覺到等量的音高變化,所需要的頻率變化隨頻率增加而愈來愈大。这样的结果是,在赫茲刻度500Hz往上的四个八度(一個八度即為兩倍的頻率),只对应梅尔刻度上的两个八度。Mel的名字来源于单词melody,表示这个刻度是基於音高比较而創造的。 一个常用的将f赫兹转换为m梅尔的公式是.
新!!: 梅尔频率倒谱系数和梅尔刻度 · 查看更多 »