語音編碼器方法歸納起來可以分成三大類:波形編碼、信源編碼、混合編碼。
1.波形編碼
波形編碼比較簡單,編碼前采樣定理對模擬語音信號進行量化,然后進行幅度量化,再進行二進制編碼。解碼器作數(shù)/模變換后再由低通濾波器恢復出現(xiàn)原始的模擬語音波形,這就是最簡單的脈沖編碼調(diào)制(PCM),也稱為線性PCM?梢酝ㄟ^非線性量化,前后樣值的差分、自適應預測等方法實現(xiàn)數(shù)據(jù)壓縮。波形編碼的目標是讓解碼器恢復出的模擬信號在波形上盡量與編碼前原始波形相一致,也即失真要最小。波形編碼的方法簡單,數(shù)碼率較高,在64kbit/s至32kbit/s之間音質(zhì)優(yōu)良,當數(shù)碼率低于32kbit/s的時候音質(zhì)明顯降低,16 kbit/s時音質(zhì)非常差。
2.信源編碼
信源編碼又稱為聲碼器,是根據(jù)人的發(fā)生機理,在編碼端對語音信號進行分析,分解成有聲音和無聲音兩部分。聲碼器每隔一定時間分析一次語音,傳送一次分析的的道德有/無聲和濾波參數(shù)。在解碼端根據(jù)接收的參數(shù)再合成聲音。聲碼器編碼后的碼率可以做得很低,如1.2kbit/s、2.4kbit/s,但是也有其缺點。首先是合成語音質(zhì)量較差,往往清晰度可以而自然度沒有,難于辨認說話人是誰,其次是復雜度比較高。
3.混合編碼
混合編碼是將波形編碼和聲碼器的原理結(jié)合起來,數(shù)碼率約在4kbit/s—16kbit/s之間,音質(zhì)比較好,最近有個別算法所取得的音質(zhì)可與波形編碼相當,復雜程度介乎與波形編碼器和聲碼器之間。
上述的三大語音編碼方案還可以分成許多不同的編碼方案。
語音編碼屬性可以分為四類,分別是比特速率,時延、復雜性和質(zhì)量。比特律是語音編碼很重要的一方面。比特速率的范圍可以是從保密的電話通信的2.4kbit/s到64kbit/s的G.711PCM編碼和G.722寬帶(7KHz)語音編碼器。