摘 要:CM70C01是處理多種語音壓縮格式的混合信號(hào)處理芯片,由于編碼和解碼部分的標(biāo)準(zhǔn)不統(tǒng)一,使得部分語音壓縮文件與CM70C01不兼容。本文在深入了解CM70C01解碼和語音合成的基礎(chǔ)上,就LPC-10提出符合CM70C01的語音壓縮編碼方法。
關(guān)鍵詞:能量;音調(diào);反射系數(shù);語音壓縮
引言
CM70C01是中科微電子公司生產(chǎn)的混合信號(hào)處理芯片,集成8位MCU和語音合成電路,具有編程方便,能處理LPC-10、CELP、PCM、MELP等多種語音壓縮格式的能力和較優(yōu)的性價(jià)比,可以應(yīng)用在各種語音處理場(chǎng)合。但由于LPC-10、CELP和MELP等語音格式在編碼和解碼部分有多種不同的標(biāo)準(zhǔn),而且這些標(biāo)準(zhǔn)之間并不兼容,因此用戶自行編制的語音數(shù)據(jù)并不一定能被CM70C01識(shí)別或處理。在熟知語音壓縮基本算法而又缺少語音開發(fā)板和相應(yīng)軟件的情況下,就可以用純軟件的方法來實(shí)現(xiàn)基于CM70C01的語音壓縮編碼。本文以LPC-10為例子,說明特征參數(shù)的提取、編碼的幀結(jié)構(gòu)以及CM70C01的解碼和編碼的實(shí)現(xiàn)。
特征參數(shù)的提取
語音具有樣點(diǎn)間的短時(shí)相關(guān)性和相鄰基因周期間的長時(shí)相關(guān)性,可以用一個(gè)全極點(diǎn)模型來描述一小段語音的生成模型。在利用線性預(yù)測(cè)方法對(duì)語音進(jìn)行上述兩種相關(guān)性的去相關(guān)處理后,能夠得到預(yù)測(cè)的余量信號(hào)。根據(jù)余量信號(hào)和全極點(diǎn)模型的預(yù)測(cè)系數(shù),就可以合成語音。這就是線性預(yù)測(cè)編碼。
線性預(yù)測(cè)編碼(LPC-10)是將線性預(yù)測(cè)理論運(yùn)用到語音編碼領(lǐng)域的一個(gè)典型例子。在預(yù)測(cè)編碼過程中,以幀為單位來分析和提取語音信號(hào)的相關(guān)特征參數(shù),這些特征參數(shù)有包括:全極點(diǎn)模型的預(yù)測(cè)參數(shù){ai}、能量增益(Energy)、音調(diào)(Pitch)、濁/清音標(biāo)志(V/UV)。由特征參數(shù)來表述語音信號(hào)既可減小存儲(chǔ)空間,又可以低速率來進(jìn)行傳輸。在接收端,根據(jù)幀的特征參數(shù)決定激勵(lì)源、基音塊和幀塊間的插值,最后通過格型濾波器來合成語音。
由于預(yù)測(cè)參數(shù)不適于直接量化,因?yàn)樗奈⑿∽兓瘯?huì)造成極點(diǎn)位置很大的變化,所以一般采用在數(shù)學(xué)上與之完全等價(jià)的反射系數(shù)K1~K10代替預(yù)測(cè)參數(shù)進(jìn)行量化編碼。反射系數(shù)的穩(wěn)定條件是Ki <1,這在量化時(shí)是容易保證的�?梢杂肅holeski UV分解法對(duì)