新加坡Columns公司在便攜式語(yǔ)音控制產(chǎn)品應(yīng)用中起步較早,其中一個(gè)產(chǎn)品是執(zhí)行歐元與其他歐洲貨幣之間進(jìn)行兌換的“語(yǔ)音控制歐洲貨幣兌換器”。歐元兌換器的設(shè)計(jì)要求包括:1.功率小,電池壽命至少為1年;2. 價(jià)格低廉,產(chǎn)品零售價(jià)不超過9美元;3.具有很強(qiáng)的靈活性,能用多種語(yǔ)言精確地識(shí)別并合成與說(shuō)話人相關(guān)的語(yǔ)音;4. 整個(gè)語(yǔ)音控制核產(chǎn)品應(yīng)具備可復(fù)用的特性。
本文介紹利用Frontier Design公司設(shè)計(jì)工具來(lái)開發(fā)歐元兌換器ASIC產(chǎn)品 的全過程。在ASIC中實(shí)現(xiàn)復(fù)雜DSP算法的要求通常極為苛刻,但采用Frontier的結(jié)構(gòu)合成工具A|RT Designer工具能迅速優(yōu)化RTL描述,該工具還允許自由選擇備用結(jié)構(gòu)以優(yōu)化應(yīng)用設(shè)計(jì)。
通過應(yīng)用基于C語(yǔ)言的設(shè)計(jì)流,能在結(jié)構(gòu)設(shè)計(jì)階段對(duì)新特性進(jìn)行設(shè)計(jì)和硬件優(yōu)化,這能降低50%的硅片面積,通過加快 C語(yǔ)言原型硬件的設(shè)計(jì),可以進(jìn)一步擴(kuò)展設(shè)計(jì)的性能以滿足用戶對(duì)產(chǎn)品規(guī)格的嚴(yán)格要求。
算法研究
歐元兌換器的效率在一定程度上取決于語(yǔ)音命令與存儲(chǔ)數(shù)據(jù)庫(kù)的比較以及執(zhí)行命令的能力。開發(fā)出滿足最終產(chǎn)品要求的算法對(duì)設(shè)計(jì)的成功至關(guān)重要,因?yàn)闆]有人希望看到語(yǔ)音控制設(shè)備不能始終如一地識(shí)別命令,人們需要算法自始至終達(dá)到98%以上的識(shí)別精度。因此,目前面臨的難題包括檢測(cè)并清除背景噪聲、區(qū)分真實(shí)的命令字和其他噪聲(呼吸聲、微小靜電干擾聲及麥克風(fēng)聲響)、確定命令字的起始和終止以及將輸入與存儲(chǔ)的“聲紋譜”數(shù)據(jù)庫(kù)及隨后的命令字識(shí)別(圖1)進(jìn)行比較。
以下幾種先進(jìn)的計(jì)算密集DSP算法適用于解決上述問題:1.Mel頻率聲譜(cepstral)系數(shù)(MFCC)算法,MFCC算法由快速傅立葉變換(FFT)功能譜、Mel定標(biāo)和logii構(gòu)成;2. 反離散余弦變換(iDCT);3. 應(yīng)用多重估計(jì)和選擇算法連續(xù)識(shí)別并估計(jì)背景聲音和語(yǔ)音噪聲的連續(xù)噪聲電平估計(jì)程序;4. 在命令字有效期間及其附近對(duì)聲音能級(jí)實(shí)施詳盡分析的不精確和精確命令字邊界檢測(cè)算法;5. 對(duì)一系列不等長(zhǎng)度的向量進(jìn)行比較并在這些向量間比較持續(xù)時(shí)間變化的動(dòng)態(tài)時(shí)間扭曲算法(dynamic time warp)。
該算法用浮點(diǎn)C語(yǔ)言編程,為了調(diào)整并優(yōu)化參數(shù),浮點(diǎn)C代碼的編譯和仿真速度要足夠快以檢驗(yàn)算法的性能。最后,C語(yǔ)言代碼必須能在傳統(tǒng)的PC機(jī)上運(yùn)行,語(yǔ)音識(shí)別和合成算法的性能可在實(shí)際環(huán)境中進(jìn)行測(cè)試。最終的語(yǔ)音識(shí)別算法在450MHz奔騰機(jī)上測(cè)試,當(dāng)用該公司的內(nèi)部語(yǔ)音記錄庫(kù)進(jìn)行測(cè)試時(shí),可得到99%的識(shí)別精度。
浮點(diǎn)算法向定點(diǎn)算法轉(zhuǎn)換