Internet音頻產(chǎn)業(yè)
隨著Internet的普及,Internet也迅速成為一個音樂發(fā)行渠道。消費(fèi)者可以從Internet上把他們最喜歡的歌曲或新近發(fā)行的歌曲下載到便攜式播放器中。固態(tài)音頻壓縮技術(shù)不斷推進(jìn)的里程和具有龐大容量的各種便攜式存儲媒體的出現(xiàn),使Internet音頻產(chǎn)業(yè)呈現(xiàn)欣欣向榮的景象。
一些音像公司,如BMG、EMI和華納,均向Internet內(nèi)容提供商提供音樂,而Internet內(nèi)容提供商則將音樂內(nèi)容提供給消費(fèi)者下載。這便產(chǎn)生了一個重要的問題,即如何保護(hù)Internet發(fā)行渠道中的版權(quán)。于是,一些在Internet上提供數(shù)字權(quán)利管理(DRM)的軟件公司,如Liquid Audio、Intertrust、Microsoft和Verence便躋身進(jìn)入這一領(lǐng)域。這種業(yè)務(wù)的成功在很大程度上取決于SDMI(安全數(shù)字音樂倡議組織),該機(jī)構(gòu)聯(lián)手錄音公司、消費(fèi)電子公司、器件 (半導(dǎo)體芯片)供應(yīng)商及DRM公司,建立安全方針,確保Internet音樂發(fā)行得到保護(hù)并具有合法性。以上是這一快速發(fā)展領(lǐng)域的總體狀況。
MPEG 音頻
MPEG是高保真音頻壓縮的一個國際標(biāo)準(zhǔn)(采用于1992年)。這個標(biāo)準(zhǔn)分為3個層面:II層、III層和I層。流行的MP3是MPEG-1的III層。AAC(高級音頻編碼)是MPEG的第二階段(MPEG-2),MPEG-2是MPEG-1的改進(jìn)。這個新標(biāo)準(zhǔn)采用于1997年。在同樣的壓縮比率下,AAC比MP3提供更佳的音頻質(zhì)量。MPEG-2和MPEG-3的采樣頻率高達(dá)44.1kHz 或48kHz,比特率在32kbps至128kbps之間。 這些音頻壓縮標(biāo)準(zhǔn)全都利用了人類聽覺系統(tǒng)的直覺特征心理聲學(xué)。
心理聲學(xué)
通過將心理聲學(xué)模型應(yīng)用到音頻比特流中,可以消除大量無關(guān)的音頻數(shù)據(jù)。這一模型使用了頻域和時域中強(qiáng)信號的屏蔽效果。
頻率域屏蔽
當(dāng)一個強(qiáng)信號(屏蔽信號)出現(xiàn)時,與它同時產(chǎn)生的一個較弱信號(被屏蔽信號)就可能被我們的聽覺系統(tǒng)所忽略,前提是在頻率域中的被屏蔽信號與屏蔽信號十分相近。這稱為頻率屏蔽效果(如圖1所示)。480Hz將被較強(qiáng)的500Hz信號所屏蔽。通過采集這些頻率域在屏蔽效果下的有聲和無聲的音頻水平,可以獲得屏蔽閾值。任何振幅比閾值低的信號人耳都聽不見,因此可以去除。這將大幅度減少用于對音頻信號進(jìn)行編碼的數(shù)據(jù)量。
當(dāng)這個屏蔽信號變?nèi)鯐r,閾值曲線也隨著降低,直到一個水平,到了這個水平后,無論屏蔽信號是否繼續(xù)減弱,閾值曲線都將保持不變。只要信號大于3 dB,人耳就能聽到音頻內(nèi)容。
時間域屏蔽(當(dāng)時屏蔽)
這種屏蔽效果不僅在頻域發(fā)生,而且也在時域發(fā)生。當(dāng)出現(xiàn)一個強(qiáng)信號,并在極短的間隔內(nèi)跟隨一個弱信號時,這個弱信號就幾乎被人耳忽略了。這是人類聽覺反應(yīng)系統(tǒng)的感知效果。
這種信號屏蔽能力取決于其頻率位置和響度。音頻編碼器將使用這一信息(信號屏蔽比率SMR),利用允許的編碼比特數(shù)對輸入聲頻信號進(jìn)行編碼。
算法
基于以上的屏蔽技術(shù),典型的音頻編碼過程如下所示:
1.使用濾波器帶將音頻信號分流入頻率子帶中,大約有32個關(guān)鍵(critical)子帶-->子帶濾波。