北理工學子榮獲聲紋識別挑戰(zhàn)賽說話人檢索任務第一名

發(fā)布日期：2022-07-29 供稿：信息與電子學院王晶攝影：信息與電子學院

編輯：艾李麗審核：崔嵬閱讀次數：

日前，在2022年聲紋識別挑戰(zhàn)賽（CNSRC 2022）說話人檢索（Speaker Retrieval,SR）任務中，北京理工大學信息與電子學院教師謝湘帶領的語音識別團隊獲得第一名。

CNSRC 2022是國際上最具影響力的聲紋識別評測比賽之一，由Odyssey 2022會議組委會發(fā)起的說話人識別競賽，吸引了132支海內外隊伍參賽。本次競賽的核心目的是驗證當前說話人識別 (或稱聲紋識別) 技術在實際復雜場景下的真實可用性。

歷經近四個月的角逐，我校BIT_SV隊伍嘗試了多種模型算法對領域內SOTA模型ECAPA進行改進調優(yōu)，最終采用數據增廣、多尺度卷積、多池化融合等方法，在不同階段調整不同的超參，使模型可以在復雜且大量的數據池中檢索出正確的相同說話人句子，有效地提高了模型的魯棒性。

6月27日，蘇欣美同學代表我校參賽隊在CNSRC 2022線上研討會中進行發(fā)言，介紹了隊伍的技術方案。

附獲獎團隊簡介：

信息與電子學院通信技術研究所的語音識別研究團隊多年來致力于人機語音交互領域的研究，承擔了多項國家自然科學基金等國家級項目，特別在多語言語音識別、說話人識別等方向積累了豐富經驗和先進算法。該團隊近年來在2021年全國人機語音通訊學術會議中對話場景下的說話人識別挑戰(zhàn)賽中獲得第1名，在2021年東方語言識別（Oriental Language Recognition, OLR）挑戰(zhàn)賽中受限/不受限多語言語音識別兩項任務中分獲第2名和第3名。