語音識(shí)別研究的根本目的是研究出一種具有聽覺功能的機(jī)器,能直接接受人的口呼命令,理解人的意圖并做出相應(yīng)的反映。語音識(shí)別系統(tǒng)的研究涉及微機(jī)技術(shù)、人工智能、數(shù)字信號(hào)處理、模式識(shí)別、聲學(xué)、語言學(xué)和認(rèn)知科學(xué)等許多學(xué)科領(lǐng)域,是一個(gè)多學(xué)科綜合性研究領(lǐng)域。近年來,高性能數(shù)字信號(hào)處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)提供了可能,其中,AD公司的數(shù)字信號(hào)處理芯片以其良好的性價(jià)比和代碼的可移植性被廣泛地應(yīng)用于各個(gè)領(lǐng)域。因此,我們采用AD公司的定點(diǎn)DSP處理芯片ADSP2181實(shí)現(xiàn)了語音信號(hào)的識(shí)別。
1 語音識(shí)別的基本過程
根據(jù)實(shí)際中的應(yīng)用不同,語音識(shí)別系統(tǒng)可以分為:特定人與非特定人的識(shí)別、獨(dú)立詞與連續(xù)詞的識(shí)別、小詞匯量與大詞匯量以及無限詞匯量的識(shí)別。但無論那種語音識(shí)別系統(tǒng),其基本原理和處理方法都大體類似。一個(gè)典型的語音識(shí)別系統(tǒng)的原理圖如圖1所示。
語音識(shí)別過程主要包括語音信號(hào)的預(yù)處理、特征提取、模式匹配幾個(gè)部分。預(yù)處理包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測、預(yù)加重等過程。語音信號(hào)識(shí)別最重要的一環(huán)就是特征參數(shù)提取。提取的特征參數(shù)必須滿足以下的要求:
(1)提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性;
(2)各階參數(shù)之間有良好的獨(dú)立性;
(3)特征參數(shù)要計(jì)算方便,最好有高效的算法,以保證語音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。
在訓(xùn)練階段,將特征參數(shù)進(jìn)行一定的處理后,為每個(gè)詞條建立一個(gè)模型,保存為模板庫。在識(shí)別階段,語音信號(hào)經(jīng)過相同的通道得到語音特征參數(shù),生成測試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識(shí)別結(jié)果。同時(shí),還可以在很多先驗(yàn)知識(shí)的幫助下,提高識(shí)別的準(zhǔn)確率。
2 系統(tǒng)的硬件結(jié)構(gòu)
2.1 ADSP2181的特點(diǎn)
AD公司的DSP處理芯片ADSP2181是一種16b的定點(diǎn)DSP芯片,他內(nèi)部存儲(chǔ)空間大、運(yùn)算功能強(qiáng)、接口能力強(qiáng)。有以下的主要特點(diǎn):
(1)采用哈佛結(jié)構(gòu),外接16.67MHz晶振,指令周期為30ns,指令速度為33MI/s,所有指令單周期執(zhí)行;
(2)片內(nèi)集成了80 kB的存儲(chǔ)器:16 kB字的(24b)的程序存儲(chǔ)器和16kB字(16b)的數(shù)據(jù)存儲(chǔ)器;
(3)內(nèi)部有3個(gè)獨(dú)立的計(jì)算單元:算術(shù)邏輯單元(ALU)、乘累加器(MAC)和桶形移位器(SHIFT),其中乘累加器支持多精度和自動(dòng)無偏差舍人;
(4)一個(gè)16b的內(nèi)部DMA端口(1DMA),供片內(nèi)存儲(chǔ)器的高速存。灰粋(gè)8b自舉DMA(BDMA)口,用于從自舉程序存儲(chǔ)器中裝載數(shù)據(jù)和程序;
(5)6個(gè)外部中斷,并且可以設(shè)置優(yōu)先級(jí)或屏蔽等。
由于ADSP2181以上的特點(diǎn),使得該芯片構(gòu)成的系統(tǒng)體積小、性能高、成本和功耗低,能較好地實(shí)現(xiàn)語音識(shí)別算法。
2.2 系統(tǒng)的硬件結(jié)構(gòu)
在構(gòu)成語音識(shí)別電路時(shí),我們采用了ADSP2181的主從結(jié)構(gòu)設(shè)計(jì)方式,通過IDMA口由CPU裝載程序。語音識(shí)別系統(tǒng)的硬件結(jié)構(gòu)如圖2所示。