電話線路上的模擬語音信號,經(jīng)話路帶寬濾波(符合ITU-T G.712建議)后,被8kHz采樣,量化成16bit線性PCM數(shù)字信號輸入到編碼器。該編碼器是基于線性預(yù)測分析合成技術(shù),盡量減少實際語音與合成語音之間經(jīng)聽覺加權(quán)后差分信號的能量為準(zhǔn)則來進行編碼的。編碼器的結(jié)構(gòu)框圖如圖1所示,其主要部分有:
·線性預(yù)測分析和LPC系數(shù)的量化;
·開環(huán)基音周期估計;
·自適應(yīng)碼本搜索;
·固定碼本搜索;
·碼本增益量化。
下面分別描述這五部分的主要技術(shù)。
·線性預(yù)測分析與LPC系數(shù)的量化
首先對信號進行加線性預(yù)測分析窗,分析窗由兩部分組成。第一部分是半個漢明窗,第二部分是四分之一個余弦信號。將加窗后的語音信號通過LevinsonDurbin算法獲得線性預(yù)測濾波器系數(shù)ai i=1......10。由于線譜對參數(shù)比線性預(yù)測系數(shù)具有更好的內(nèi)插特性和量化特性[3], G.729將LPC參數(shù)轉(zhuǎn)換成相應(yīng)的線譜對參數(shù),最后對線譜對參數(shù)進行量化。
·開環(huán)基音分析
為了減少自適應(yīng)碼本搜索的復(fù)雜度,需要計算開環(huán)基音Top,使自適應(yīng)碼本搜索在開環(huán)基音值附近進行;糁档姆秶18~145個樣本點之間。
·自適應(yīng)碼本搜索
G.729對每個子幀進行閉環(huán)基音搜索,它通過最小化原始語音信號和重構(gòu)語音信號的加權(quán)均方誤差來進行閉環(huán)基音搜索。對子幀1的閉環(huán)基音T1的搜索是局限在開環(huán)基音Top的一個小范圍內(nèi),對子幀2的閉環(huán)基音T2的搜索是局限在閉環(huán)基音T1的一個小范圍內(nèi)。這樣可以減少基音搜索的復(fù)雜度。
·固定碼本搜索
G.729固定碼本矢量含有四個非0脈沖,每個脈沖的幅度要可以是+1或-1。通過最小化加權(quán)語音信號和加權(quán)重構(gòu)語音信號的均方誤差來進行固定碼本的搜索。
·增益量化
G.729對自適應(yīng)碼本增益和固定碼本增益采用二級共軛結(jié)構(gòu)碼本進行矢量量化。在碼本搜索時,采用預(yù)搜索策略,使得運算量只為全搜索算法的1/4。