国产久草深夜福利精品_精品国产看高清国产毛片_成年日韩片av在线网站_亚洲国产综合777_免费高清一级在线观看_欧美色图中文字幕_老中医用嘴排阴毒 小雨_99精品无码视频在线播放_久久久精品强暴视频_国产aⅴ一区最新精品

灰關(guān)聯(lián)分析與語音/音樂信號識別
電子元件,電子元器件深圳市創(chuàng)唯電子有限公司
您現(xiàn)在的位置: 首頁 > 電子技術(shù)
灰關(guān)聯(lián)分析與語音/音樂信號識別  2012/3/1
摘要:將灰關(guān)聯(lián)分析方法應(yīng)用于語音/音樂信號的分類和識別,并給出了對音頻信號進行灰關(guān)聯(lián)分析的方法和步驟。利用語音和音樂信號的短時能量均方根的概率統(tǒng)計特征建立目標(biāo)的參考數(shù)據(jù)和比較數(shù)據(jù),進行語音和音樂信號的灰關(guān)聯(lián)分析,確定目標(biāo)識別與分類的判據(jù),并對兩類信號進行識別。仿真結(jié)果表明灰關(guān)聯(lián)分析方法應(yīng)用于音頻信號分類和識別具有一定的可行性。關(guān)鍵詞:灰關(guān)聯(lián)分析特征語音和音樂識別仿真語音和音樂是兩類最重要的音頻數(shù)據(jù),語音
  摘要:將灰關(guān)聯(lián)分析方法應(yīng)用于語音/音樂信號的分類和識別,并給出了對音頻信號進行灰關(guān)聯(lián)分析的方法和步驟。利用語音和音樂信號的短時能量均方根的概率統(tǒng)計特征建立目標(biāo)的參考數(shù)據(jù)和比較數(shù)據(jù),進行語音和音樂信號的灰關(guān)聯(lián)分析,確定目標(biāo)識別與分類的判據(jù),并對兩類信號進行識別。仿真結(jié)果表明灰關(guān)聯(lián)分析方法應(yīng)用于音頻信號分類和識別具有一定的可行性。

   關(guān)鍵詞:灰關(guān)聯(lián)分析 特征 語音和音樂識別 仿真

語音和音樂是兩類最重要的音頻數(shù)據(jù),語音和音樂的自動分類在基于內(nèi)容的音頻檢索、視頻的摘要以及語音識別等眾多領(lǐng)域都有重要的應(yīng)用價值。

目前,國內(nèi)外語音信號識別多采用基于感覺特征(例如響度、音調(diào)、諧度等)和過零率、功率譜、MFCC系數(shù)等多種語音/音樂分類特征的模式識別技術(shù)實現(xiàn)信號的自動識別。然而當(dāng)識別對象的參數(shù)不完整、不齊全時,這些方法有的不能給出正確可靠的結(jié)果,有的無法進行識別,有的識別的可靠性較差。由于語音信號環(huán)境的復(fù)雜和多變性,語音和音樂信號參數(shù)有時很難完全得到,上述方法在實際應(yīng)用中存在一定的局限性。

因此,如何有效利用現(xiàn)有的少量音頻數(shù)據(jù),準(zhǔn)確地進行了音頻信號的自動分類識別,尤其是語音和音樂的分類,并作為提取音頻內(nèi)容語義和結(jié)構(gòu)的重要手段之一,其研究日益引起人們的重視�;疑到y(tǒng)理論特別是灰關(guān)聯(lián)分析方法的發(fā)展,為解決這一問題提供了問題。

圖1

1 語音/音樂信號的灰關(guān)聯(lián)分析方法

灰色系統(tǒng)理論屬系統(tǒng)論的范疇,灰色是指信息不完全。灰色系統(tǒng)理主要研究系統(tǒng)模型不明確、行為信息不完全、運行機制不清楚這類系統(tǒng)的建模、預(yù)測、決策和控制等問題。在進行序列關(guān)聯(lián)分析時,必須先確定參考數(shù)列,然后比其它序列與參考序列的接近程度,進而進出判斷�;谊P(guān)聯(lián)分析的主要步驟:(1)確定參考序列和比較序列;(2)求灰關(guān)聯(lián)系數(shù);(3)求灰度聯(lián)度;(4)按灰關(guān)聯(lián)度大小排序。

2 參考序列和比較序列的確定

選取一定無停頓的語音信號和音樂信號作為待識別音頻信號,音頻信號的特征提取本質(zhì)上起到了降維作用,用較少的維度表現(xiàn)了時域上的音頻信號�?紤]到只有在5~20ms的時間間隔內(nèi)才可以認(rèn)為音頻信號的特征基本保持不變。因此本文選取短時能量均方根的概率統(tǒng)計方法提取語音和音樂信號的特征。

圖1(a)和圖2(a)分別為語音和音樂信號短時能量的均方根(RMS)的時域波形。其采樣頻率均為11025Hz,矩形窗長度N取10ms,時間長度為30s。

式(1)中,x(n)是音頻信號,矩形窗序列沿音頻樣點序列逐幀移動,每段幀長度為N。

30s的RMS的概率分布即信號分布頻數(shù)直方圖如圖1(b)、圖2(b)所示。由圖可知兩分布有效明顯的差異,可以作為識別語音和音樂信號的特片依據(jù)。進一步研究發(fā)現(xiàn)其概率分布服從不同參數(shù)時的廣義X2分布。

選取上述30s的語音和音樂信號RMS概率分布作為參考序列,記為xj={xj(k) k=1,2,…,K},其中x1為語音參序列,x2為音樂參考序列,記作yi={yi(k) k=1,2,…,k},其中y1為語音比較數(shù)列,y2為音樂比較序列。K為特征數(shù)量,本文取K=10。為檢驗不同長度比較序列的灰關(guān)聯(lián)度,特征提取的比較序列時間長度分別取0.1s、1s、10s。圖3為與30s的語音和音樂參考信號RMS概率分布比較圖。由圖3可知,比較序列的時間長度越長,概率分布與參考序列的相似程度就越大,當(dāng)比較序列時長為10s時,概率分布幾乎與參考序列吻合。

為保證音頻序列的可比性,在進行灰關(guān)聯(lián)分析時,需要對序列進行初值化生成處理,即對一個數(shù)列的所有數(shù)據(jù)均用其第一個數(shù)去除。這個新序列表明原始數(shù)列中不同時刻的值相對于第一個時刻值的倍數(shù)。

圖2

3 計算灰關(guān)聯(lián)系數(shù)

與《灰關(guān)聯(lián)分析與語音/音樂信號識別》相關(guān)列表
電話:400-900-3095
QQ:800152669
庫存查詢
Copyright(C) 2011-2021 Szcwdz.com 創(chuàng)唯電子 版權(quán)所有 備案號:粵ICP備11103613號
專注電子元件代理銷售  QQ:800152669  電子郵件:[email protected]  電話:400-900-3095