用麥克風(fēng)陣列時延估計(jì)定位聲源的方法

文檔序號：9843076閱讀：1381來源：國知局

用麥克風(fēng)陣列時延估計(jì)定位聲源的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)信號處理領(lǐng)域，具體涉及一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法。
【背景技術(shù)】
[0002] 20世紀(jì)80年代以來，麥克風(fēng)陣列信號處理技術(shù)得到迅猛的發(fā)展，并在雷達(dá)、聲納及通信中得到廣泛的應(yīng)用。這種陣列信號處理的思想后來應(yīng)用到語音信號處理中。在國際上將麥克風(fēng)陣列系統(tǒng)用于語音信號處理的研究源于1970年。1976年，Gabfid將雷達(dá)和聲納中的自適應(yīng)波束形成技術(shù)直接應(yīng)用于簡單的聲音獲取問題。1985年，美國AT&T/Bell實(shí)驗(yàn) 室的Flanagan采用21個麥克風(fēng)組成現(xiàn)行陣列，首次用電子控制的方式實(shí)現(xiàn)了聲源信號的獲取，該系統(tǒng)采用簡單的波束形成方法，通過計(jì)算預(yù)先設(shè)定位置的能量，找到具有最大能量的方向。同年，F(xiàn)lanagan等人又將二維麥克風(fēng)陣列應(yīng)用于大型房間內(nèi)的聲音拾取，以抑制混響和噪聲對聲源信號的影響。由于當(dāng)時技術(shù)的制約，使得該算法還不能夠借助于數(shù)字信號處理技術(shù)以數(shù)字的方式實(shí)現(xiàn)，而主要采用了模擬器件實(shí)現(xiàn)，1991年，Kellermann借助于數(shù)字信號處理技術(shù)，用全數(shù)字的方式實(shí)現(xiàn)了這一算法，進(jìn)一步改善了算法的性能，降低了硬件成本，提高了系統(tǒng)的靈活性。隨后，麥克風(fēng)陣列系統(tǒng)已經(jīng)應(yīng)用于許多場合，包括視頻會議、語音識別、說話人識別、汽車環(huán)境語音獲取、混響環(huán)境聲音拾取、聲源定位和助聽裝置等。目前，基于麥克風(fēng)陣列的語音處理技術(shù)正成為一個新的研究熱點(diǎn)，但相關(guān)應(yīng)用技術(shù)還不成熟。

【發(fā)明內(nèi)容】

[0003] 鑒于麥克風(fēng)陣列的聲源定位方法具有廣泛的應(yīng)用前景和潛在的經(jīng)濟(jì)效益，本發(fā)明旨在提供一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，以期應(yīng)用在包括語音識別、強(qiáng)噪聲環(huán)境下的語音獲取、大型場所的會議記錄、聲音檢測和助聽裝置等領(lǐng)域。
[0004] 為實(shí)現(xiàn)上述目的，本發(fā)明采用以下技術(shù)方案：
[0005] -種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，包括時延估計(jì)和聲源定位，其特征在于：首先，通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差；第二步則利用估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差，然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲源位置。
[0006] 所述時延估計(jì)的具體方法是：假設(shè)只有唯一的聲源，麥克風(fēng)陣列為均勻直線形陣列的情況，遠(yuǎn)場環(huán)境中有一個待定位的聲源信號S(k)，選擇第一個麥克風(fēng)陣兀為參考點(diǎn)，第 η個陣元在k時刻接收到的信號表示為：
[0007] yn (k) = a ns (k~t~ τ nl) +vn (k)
[0008] = a ns [k-t_Fn ( τ ) ] +Vn (k)
[0009] = xn(k)+vn(k), n = 1,2, ..., N
[0010] 其中an(n = 1，2，···，Ν)為信號在傳播過程中的衰減，其值介于[0，1]之間；t表示信號從s(k)傳播到1號陣元之間的傳播時間；v n(k)表示在第η個陣元上接收到的加性噪聲；τ表τκ 1號麥克風(fēng)陣兀與2號麥克風(fēng)陣兀所接收到的信號時延差；Fn( τ )函數(shù)表τκ 第η個陣元與第一個陣元之間的信號時延。
[0011] 所述聲源定位的具體方法是：根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向角與距離。
[0012] 本發(fā)明可實(shí)際應(yīng)用于以下領(lǐng)域：視頻會議，聲源定位技術(shù)可為視頻會議中的發(fā)言人跟蹤定位；機(jī)器人技術(shù)，利用雙耳時延模型及互相關(guān)操作來實(shí)現(xiàn)機(jī)器人對聲源的定位及跟蹤；噪聲檢測，為了更好的控制汽車、摩托車等發(fā)動機(jī)及大型器械中的噪聲，聲源定位技術(shù)是對發(fā)動機(jī)性能評估、大型機(jī)械穩(wěn)定性測試的重要方法；醫(yī)療診斷及醫(yī)療設(shè)備，在醫(yī)療設(shè) 備中，聲源定位技術(shù)可用于病變部位的分析，疾病的診斷起到極大的促進(jìn)推動作用。
【附圖說明】
[0013] 圖1是本發(fā)明的聲源定位原理圖。
【具體實(shí)施方式】
[0014] 基于時延估計(jì)的聲源定位方法通常分為兩個步驟，即時延估計(jì)和聲源定位。本發(fā) 明首先通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差；第二步則利用估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差，然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲源位置。
[0015] 1.時延估計(jì)
[0016] 陣列的幾何形狀對聲源定位性能至關(guān)重要，根據(jù)麥克風(fēng)陣列所處的環(huán)境，時延估計(jì)的模型可以被分為理想模型與混響模型。我們把麥克風(fēng)陣元這種只接收通過直接路徑到達(dá)麥克風(fēng)陣列的聲音信號的模型稱作理想模型。把這種不僅考慮通過直接路徑到達(dá)的信號，還考慮聲源發(fā)出的信號遇到墻壁、桌子等反射后間接到達(dá)陣列的信號的這種模型稱作混響模型。由于混響信號的路徑的數(shù)量具有不確定性，基于混響模型的算法復(fù)雜度與理想模型相比其算法復(fù)雜度相對比較大，基于混響模型的算法是用數(shù)學(xué)模型去擬合干擾的影響并不像理想模型回避間接路徑信號的干擾，因此基于混響模型的算法的時延估計(jì)效果比較好。盡管如此，為了降低算法的復(fù)雜度，本發(fā)明主要就理想模型來研究麥克風(fēng)陣列的時延估計(jì)。
[0017] 假設(shè)只有唯一的聲源，麥克風(fēng)陣列為均勻直線形陣列的情況。遠(yuǎn)場環(huán)境中有一個待定位的聲源信號S (k)，如果我們選擇第一個麥克風(fēng)陣元為參考點(diǎn)，那么第η個陣元在k時刻接收到的信號可以表示為：
[0018] yn (k) = a ns (k-t- τ nl) +vn (k)
[0019] = a ns [k-t_Fn ( τ ) ]+Vn (k)
[0020] = xn(k)+vn(k), n = 1,2, ..., N
[0021] 其中an(n = 1,2, ···，N)為信號在傳播過程中的衰減，其值介于[0，1]之間。t 表示信號從s(k)傳播到1號陣元之間的傳播時間。vn(k)表示在第η個陣元上接收到的加性噪聲。假設(shè)噪聲與語音信號以及其它陣兀的噪聲信號互不相關(guān)。τ (注意）表不1號麥克風(fēng)陣元與2號麥克風(fēng)陣元所接收到的信號時延差。Fn(〇函數(shù)表示第η個陣元與第一個陣元之間的信號時延。這里假設(shè)使用的麥克風(fēng)陣列模型為位于遠(yuǎn)場環(huán)境中的均勻直線陣列，于是可以得到：
[0022] F!( τ ) = 〇, F2( τ ) = τ，F(xiàn)n( τ ) = (η-1) τ，η = 2,…，N
[0023] 在近場中，信號是以球面波形式到達(dá)麥克風(fēng)陣列的，所以^是τ的非線性函數(shù)。這時Fn既與麥克風(fēng)陣元間距有關(guān)，而且對聲源信號相對于陣列的位置有著很大的依賴性。對于均勻直線形陣列，^函數(shù)已知，所以求時延估計(jì)的問題就等價于估計(jì)τ的問題，通過時延估計(jì)算法，從采集到的有限幀的多通道聲音信號中計(jì)算出；
[0024] 2.聲源定位
[0025] 麥克風(fēng)陣列時延估計(jì)后，就可以根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向角與距離，但在定位精度會受到很多因素的影響，其中影響定位精度的主要因素是時延估計(jì)方法和定位方法。本技術(shù)采用改進(jìn)的聲源定位算法，將聲源看作是點(diǎn)聲源并假設(shè)聲源在無窮遠(yuǎn)處，那么波前就垂直于波面。麥克風(fēng)Α和Β接收到信號的時間先后如圖1所示，其中 L是兩個麥克風(fēng)陣元間的間距，c是聲音在空氣中傳播速度，τ AB是聲源到兩個麥克風(fēng)的時間差也就是陣元間的時延，Θ是聲源的方向角。
【主權(quán)項(xiàng)】
1. 一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，包括時延估計(jì)和聲源定位，其特征在于：首先，通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差；第二步則利用估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差，然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲源位置。2. 根據(jù)權(quán)利要求1所述的用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，其特征在于所述時延估計(jì)的具體方法是：假設(shè)只有唯一的聲源，麥克風(fēng)陣列為均勻直線形陣列的情況，遠(yuǎn)場環(huán) 境中有一個待定位的聲源信號s (k)，選擇第一個麥克風(fēng)陣元為參考點(diǎn)，第η個陣元在k時刻接收到的信號表示為： yn (k) = a ns (k-t- τ nl) +vn (k) =a ns [k-t-Fn ( τ ) ] +vn (k) =xn(k)+vn(k),n= 1,2, ..., N 其中an(n = 1,2, ···，N)為信號在傳播過程中的衰減，其值介于[0，1]之間；t表示信號從s(k)傳播到1號陣元之間的傳播時間；vn(k)表示在第η個陣元上接收到的加性噪聲；τ表不1號麥克風(fēng)陣兀與2號麥克風(fēng)陣兀所接收到的信號時延差；F n( τ )函數(shù)表不第 η個陣元與第一個陣元之間的信號時延。3. 根據(jù)權(quán)利要求1所述的用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，其特征在于所述聲源定位的具體方法是：根據(jù)聲源和陣列之間的幾何關(guān)系確定出聲源方向角與距離。
【專利摘要】本發(fā)明提供一種用麥克風(fēng)陣列時延估計(jì)定位聲源的方法，包括時延估計(jì)和聲源定位，其特征在于：首先，通過算法估計(jì)聲源信號到達(dá)陣列中麥克風(fēng)陣元的相對時間差；第二步則利用估計(jì)時間差來計(jì)算出聲源到達(dá)各陣元的距離差，然后結(jié)合陣列拓?fù)浣Y(jié)構(gòu)用幾何算法或搜索確定聲源位置。
【IPC分類】G01S5/22
【公開號】CN105607042
【申請?zhí)枴緾N201410663512
【發(fā)明人】張夢巧, 王潔瑩, 張喜明
【申請人】北京航天長峰科技工業(yè)集團(tuán)有限公司
【公開日】2016年5月25日
【申請日】2014年11月19日

完整全部詳細(xì)技術(shù)資料下載

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

用麥克風(fēng)陣列時延估計(jì)定位聲源的方法