目录
基本頻率
基本頻率(或簡稱 基頻、fundamental frequency),当发声体由于振动而发出声音时,声音一般可以分解为许多单纯的正弦波,也就是说所有的自然声音基本都是由许多频率不同的正弦波组成的,其中频率最低的正弦波即为基音,而其他频率较高的正弦波则为泛音。 音乐演奏或歌唱中,基音是区别音高的主要元素,决定旋律。而泛音则决定乐器或人声的音色。.
查看 基音檢測算法和基本頻率
信号
信号(Signal)可以指:.
查看 基音檢測算法和信号
倒頻譜
倒頻譜(cepstrum),顧名思義,就是將頻譜(spectrum)的英文前四個字母反過來寫。倒頻譜是為了某些時候,為了計算方便,將原來信號的頻譜先轉成類似分貝的單位,再作逆傅里叶变换,把它視為一種新的訊號做處理。倒頻譜有複數倒頻譜,及實數倒頻譜。 倒頻譜被定義在1963的論文(Bogert等)。定義如下:.
查看 基音檢測算法和倒頻譜
音高
音高(pitch)在音樂領域裡指的是人類心理對音符基頻之感受。.
查看 基音檢測算法和音高
頻域
在電子學、控制系統及統計學中,頻域(frequency domain)是指在對函數或信號進行分析時,分析其和頻率有關部份,而不是和時間有關的部份,和時域一詞相對。 函數或信號可以透過一對數學的運算子在時域及頻域之間轉換。例如傅里葉變換可以將一個時域信號轉換成在不同頻率下對應的振幅及相位,其頻譜就是時域信號在頻域下的表現,而反傅里葉變換可以將頻譜再轉換回時域的信號。.
查看 基音檢測算法和頻域
频谱
頻譜是指一個時域的信號在頻域下的表示方式,可以針對信號進行傅立葉變換而得,所得的結果會是以分別以振幅及相位為縱軸,頻率為橫軸的兩張圖,不過有時也會省略相位的資訊,只有不同頻率下對應振幅的資料。有時也以「振幅頻譜」表示振幅隨頻率變化的情形,「相位頻譜」表示相位隨頻率變化的情形 。 簡單來說,頻譜可以表示一個訊號是由哪些頻率的弦波所組成,也可以看出各頻率弦波的大小及相位等資訊。.
查看 基音檢測算法和频谱
语音处理
語音處理(Speech processing),又稱語音訊號處理、人聲處理,其目的是希望做出想要的訊號,進一步做語音辨識,應用到手機介面甚至一般生活中,使人與電腦能進行溝通。.
查看 基音檢測算法和语音处理
语音识别
语音识别(speech recognition;語音辨識/言語辨別)技术,也被称为自动语音识别(Automatic Speech Recognition, ASR)、電腦語音識別(Computer Speech Recognition)或是語音轉文本識別(Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。.
查看 基音檢測算法和语音识别
自相关函数
自相关(Autocorrelation),也叫序列相关,是一个信号于其自身在不同时间点的互相关。非正式地来说,它就是两次观察之间的相似度对它们之间的时间差的函数。它是找出重复模式(如被噪声掩盖的周期信号),或识别隐含在信号谐波频率中消失的基頻的数学工具。它常用于信号处理中,用来分析函数或一系列值,如時域信号。.
查看 基音檢測算法和自相关函数
雜訊
Unreferenced/auto 自动产生。 --> 雜訊(Noise)在电子学中指,訊號在傳輸過程中會受到一些外在能量所產生訊號(如杂散电磁场)的干擾,這些能量即雜訊。雜訊通常會造成信號的失真。其來源除了來自系統外部,亦有可能由接收系統本身產生。雜訊的強度通常都是與訊號頻寬成正比,所以當訊號頻寬越寬,雜訊的干擾也會越大。所以在評估雜訊強度或是系統抵抗雜訊能力的數據,是以訊號強度對雜訊強度的比例為依據,此即訊雜比。.
查看 基音檢測算法和雜訊
週期性
週期性是定期或隔一定期間發生的量(在時間或空間),並且能用不同的上下文來印述:.
查看 基音檢測算法和週期性
泛音
泛音,泛音系列中除了基音以外的任何一音。 指当一根弦或空气柱整体振动而产生基础音(第一分音)时,在该基础音上发出的微弱的音。如果分成几段振动就会产生一些泛音(上方分音)。听者一般能够清楚听到基础音,很专心时能听到泛音。泛音列是分成等分的部分(如1/2,1/3,1/4)振动而产生的。振动的分段越小,泛音的音高就越高。各上方泛音的频率与基础音的频率形成简单的比率(例如2:1,3:1,4:1)。有些乐器能产生非泛音列中的泛音。音乐的色彩和声音的音色受某一乐器独特泛音的极大影响。因此,单簧管由于较低的泛音使声音柔和丰满,而双簧管则缺乏类似泛音而听上去比较尖利。 乐器或人声等自然发出的音,一般都不会只包含一个频率(参见纯音),而是可以分解成若干个不同频率的音的叠加。声音的波形是具有周期性的,因此根据傅里叶变换的理论,声音可以分解成若干个不同频率纯音的叠加。这些频率都是某一频率的倍数,这一频率就称作基频,也就决定了这个音的音高。假设某个音的基频为f,则频率为2f的音称为第二泛音,频率为3f的音称为第三泛音,等等。 基音和不同泛音的能量比例关系是决定一个音的音色的核心因素。並能使人明確地感到基音的響度。樂器和自然界裏所有的音都有泛音。.
查看 基音檢測算法和泛音
最大似然估计
在统计学中,最大似然估计(maximum likelihood estimation,缩写为MLE),也称最大概似估计,是用来估计一个概率模型的参数的一种方法。.
時域
時域(time domain)是描述數學函數或物理信號對時間的關係。例如一個信號的時域波形可以表達信號隨著時間的變化。 若考慮離散時間,時域中的函數或信號,在各個離散時間點的數值均為已知。若考慮連續時間,則函數或信號在任意時間的數值均為已知。 在研究時域的信號時,常會用示波器將信號轉換為其時域的波形。.
查看 基音檢測算法和時域