亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

用麥克風(fēng)陣列時延估計(jì)定位聲源的方法

文檔序號:9843076閱讀:1381來源:國知局
用麥克風(fēng)陣列時延估計(jì)定位聲源的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)信號處理領(lǐng)域,具體涉及一種用麥克風(fēng)陣列時延估計(jì)定位聲源 的方法。
【背景技術(shù)】
[0002] 20世紀(jì)80年代以來,麥克風(fēng)陣列信號處理技術(shù)得到迅猛的發(fā)展,并在雷達(dá)、聲納 及通信中得到廣泛的應(yīng)用。這種陣列信號處理的思想后來應(yīng)用到語音信號處理中。在國際 上將麥克風(fēng)陣列系統(tǒng)用于語音信號處理的研究源于1970年。1976年,Gabfid將雷達(dá)和聲納 中的自適應(yīng)波束形成技術(shù)直接應(yīng)用于簡單的聲音獲取問題。1985年,美國AT&T/Bell實(shí)驗(yàn) 室的Flanagan采用21個麥克風(fēng)組成現(xiàn)行陣列,首次用電子控制的方式實(shí)現(xiàn)了聲源信號的 獲取,該系統(tǒng)采用簡單的波束形成方法,通過計(jì)算預(yù)先設(shè)定位置的能量,找到具有最大能量 的方向。同年,F(xiàn)lanagan等人又將二維麥克風(fēng)陣列應(yīng)用于大型房間內(nèi)的聲音拾取,以抑制 混響和噪聲對聲源信號的影響。由于當(dāng)時技術(shù)的制約,使得該算法還不能夠借助于數(shù)字信 號處理技術(shù)以數(shù)字的方式實(shí)現(xiàn),而主要采用了模擬器件實(shí)現(xiàn),1991年,Kellermann借助于 數(shù)字信號處理技術(shù),用全數(shù)字的方式實(shí)現(xiàn)了這一算法,進(jìn)一步改善了算法的性能,降低了硬 件成本,提高了系統(tǒng)的靈活性。隨后,麥克風(fēng)陣列系統(tǒng)已經(jīng)應(yīng)用于許多場合,包括視頻會議、 語音識別、說話人識別、汽車環(huán)境語音獲取、混響環(huán)境聲音拾取、聲源定位和助聽裝置等。目 前,基于麥克風(fēng)陣列的語音處理技術(shù)正成為一個新的研究熱點(diǎn),但相關(guān)應(yīng)用技術(shù)還不成熟。

【發(fā)明內(nèi)容】

[0003] 鑒于麥克風(fēng)陣列的聲源定位方法具有廣泛的應(yīng)用前景和潛在的經(jīng)濟(jì)效益,本發(fā)明 旨在提供一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,以期應(yīng)用在包括語音識別、強(qiáng)噪聲 環(huán)境下的語音獲取、大型場所的會議記錄、聲音檢測和助聽裝置等領(lǐng)域。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
[0005] -種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,包括時延估計(jì)和聲源定位,其特征 在于:首先,通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差;第二步則利用 估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差,然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索 確定聲源位置。
[0006] 所述時延估計(jì)的具體方法是:假設(shè)只有唯一的聲源,麥克風(fēng)陣列為均勻直線形陣 列的情況,遠(yuǎn)場環(huán)境中有一個待定位的聲源信號S(k),選擇第一個麥克風(fēng)陣兀為參考點(diǎn),第 η個陣元在k時刻接收到的信號表示為:
[0007] yn (k) = a ns (k~t~ τ nl) +vn (k)
[0008] = a ns [k-t_Fn ( τ ) ] +Vn (k)
[0009] = xn(k)+vn(k), n = 1,2, ..., N
[0010] 其中an(n = 1,2,···,Ν)為信號在傳播過程中的衰減,其值介于[0,1]之間;t表 示信號從s(k)傳播到1號陣元之間的傳播時間;v n(k)表示在第η個陣元上接收到的加性 噪聲;τ表τκ 1號麥克風(fēng)陣兀與2號麥克風(fēng)陣兀所接收到的信號時延差;Fn( τ )函數(shù)表τκ 第η個陣元與第一個陣元之間的信號時延。
[0011] 所述聲源定位的具體方法是:根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向角 與距離。
[0012] 本發(fā)明可實(shí)際應(yīng)用于以下領(lǐng)域:視頻會議,聲源定位技術(shù)可為視頻會議中的發(fā)言 人跟蹤定位;機(jī)器人技術(shù),利用雙耳時延模型及互相關(guān)操作來實(shí)現(xiàn)機(jī)器人對聲源的定位及 跟蹤;噪聲檢測,為了更好的控制汽車、摩托車等發(fā)動機(jī)及大型器械中的噪聲,聲源定位技 術(shù)是對發(fā)動機(jī)性能評估、大型機(jī)械穩(wěn)定性測試的重要方法;醫(yī)療診斷及醫(yī)療設(shè)備,在醫(yī)療設(shè) 備中,聲源定位技術(shù)可用于病變部位的分析,疾病的診斷起到極大的促進(jìn)推動作用。
【附圖說明】
[0013] 圖1是本發(fā)明的聲源定位原理圖。
【具體實(shí)施方式】
[0014] 基于時延估計(jì)的聲源定位方法通常分為兩個步驟,即時延估計(jì)和聲源定位。本發(fā) 明首先通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差;第二步則利用估計(jì)時 間差來計(jì)算出聲源到達(dá)各陣元的距離差,然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲 源位置。
[0015] 1.時延估計(jì)
[0016] 陣列的幾何形狀對聲源定位性能至關(guān)重要,根據(jù)麥克風(fēng)陣列所處的環(huán)境,時延估 計(jì)的模型可以被分為理想模型與混響模型。我們把麥克風(fēng)陣元這種只接收通過直接路徑到 達(dá)麥克風(fēng)陣列的聲音信號的模型稱作理想模型。把這種不僅考慮通過直接路徑到達(dá)的信 號,還考慮聲源發(fā)出的信號遇到墻壁、桌子等反射后間接到達(dá)陣列的信號的這種模型稱作 混響模型。由于混響信號的路徑的數(shù)量具有不確定性,基于混響模型的算法復(fù)雜度與理想 模型相比其算法復(fù)雜度相對比較大,基于混響模型的算法是用數(shù)學(xué)模型去擬合干擾的影響 并不像理想模型回避間接路徑信號的干擾,因此基于混響模型的算法的時延估計(jì)效果比較 好。盡管如此,為了降低算法的復(fù)雜度,本發(fā)明主要就理想模型來研究麥克風(fēng)陣列的時延估 計(jì)。
[0017] 假設(shè)只有唯一的聲源,麥克風(fēng)陣列為均勻直線形陣列的情況。遠(yuǎn)場環(huán)境中有一個 待定位的聲源信號S (k),如果我們選擇第一個麥克風(fēng)陣元為參考點(diǎn),那么第η個陣元在k時 刻接收到的信號可以表示為:
[0018] yn (k) = a ns (k-t- τ nl) +vn (k)
[0019] = a ns [k-t_Fn ( τ ) ]+Vn (k)
[0020] = xn(k)+vn(k), n = 1,2, ..., N
[0021] 其中an(n = 1,2, ···,N)為信號在傳播過程中的衰減,其值介于[0,1]之間。t 表示信號從s(k)傳播到1號陣元之間的傳播時間。vn(k)表示在第η個陣元上接收到的加 性噪聲。假設(shè)噪聲與語音信號以及其它陣兀的噪聲信號互不相關(guān)。τ (注意)表不1號麥 克風(fēng)陣元與2號麥克風(fēng)陣元所接收到的信號時延差。Fn(〇函數(shù)表示第η個陣元與第一 個陣元之間的信號時延。這里假設(shè)使用的麥克風(fēng)陣列模型為位于遠(yuǎn)場環(huán)境中的均勻直線陣 列,于是可以得到:
[0022] F!( τ ) = 〇, F2( τ ) = τ,F(xiàn)n( τ ) = (η-1) τ,η = 2,…,N
[0023] 在近場中,信號是以球面波形式到達(dá)麥克風(fēng)陣列的,所以^是τ的非線性函數(shù)。 這時Fn既與麥克風(fēng)陣元間距有關(guān),而且對聲源信號相對于陣列的位置有著很大的依賴性。 對于均勻直線形陣列,^函數(shù)已知,所以求時延估計(jì)的問題就等價于估計(jì)τ的問題,通過時 延估計(jì)算法,從采集到的有限幀的多通道聲音信號中計(jì)算出;
[0024] 2.聲源定位
[0025] 麥克風(fēng)陣列時延估計(jì)后,就可以根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向 角與距離,但在定位精度會受到很多因素的影響,其中影響定位精度的主要因素是時延估 計(jì)方法和定位方法。本技術(shù)采用改進(jìn)的聲源定位算法,將聲源看作是點(diǎn)聲源并假設(shè)聲源在 無窮遠(yuǎn)處,那么波前就垂直于波面。麥克風(fēng)Α和Β接收到信號的時間先后如圖1所示,其中 L是兩個麥克風(fēng)陣元間的間距,c是聲音在空氣中傳播速度,τ AB是聲源到兩個麥克風(fēng)的時 間差也就是陣元間的時延,Θ是聲源的方向角。
【主權(quán)項(xiàng)】
1. 一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,包括時延估計(jì)和聲源定位,其特征在 于:首先,通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差;第二步則利用估 計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差,然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確 定聲源位置。2. 根據(jù)權(quán)利要求1所述的用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,其特征在于所述時 延估計(jì)的具體方法是:假設(shè)只有唯一的聲源,麥克風(fēng)陣列為均勻直線形陣列的情況,遠(yuǎn)場環(huán) 境中有一個待定位的聲源信號s (k),選擇第一個麥克風(fēng)陣元為參考點(diǎn),第η個陣元在k時刻 接收到的信號表示為: yn (k) = a ns (k-t- τ nl) +vn (k) =a ns [k-t-Fn ( τ ) ] +vn (k) =xn(k)+vn(k),n= 1,2, ..., N 其中an(n = 1,2, ···,N)為信號在傳播過程中的衰減,其值介于[0,1]之間;t表示 信號從s(k)傳播到1號陣元之間的傳播時間;vn(k)表示在第η個陣元上接收到的加性噪 聲;τ表不1號麥克風(fēng)陣兀與2號麥克風(fēng)陣兀所接收到的信號時延差;F n( τ )函數(shù)表不第 η個陣元與第一個陣元之間的信號時延。3. 根據(jù)權(quán)利要求1所述的用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,其特征在于所述聲 源定位的具體方法是:根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向角與距離。
【專利摘要】本發(fā)明提供一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法,包括時延估計(jì)和聲源定位,其特征在于:首先,通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差;第二步則利用估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差,然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲源位置。
【IPC分類】G01S5/22
【公開號】CN105607042
【申請?zhí)枴緾N201410663512
【發(fā)明人】張夢巧, 王潔瑩, 張喜明
【申請人】北京航天長峰科技工業(yè)集團(tuán)有限公司
【公開日】2016年5月25日
【申請日】2014年11月19日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1