產(chǎn)品分類導(dǎo)航
CPHI制藥在線 資訊 腦機接口新成果!Nature:人工智能破譯大腦信號合成語音

腦機接口新成果!Nature:人工智能破譯大腦信號合成語音

熱門推薦: 大腦信號 Nature 人工智能
來源:生物探索
  2019-04-28
近日,加州大學(xué)舊金山分校(UCSF)語言科學(xué)家Gopala Anumanchipalli博士和Chang實驗室的生物工程研究生Josh Chartier領(lǐng)導(dǎo)開發(fā)了人工智能新系統(tǒng),可以通過控制患者大腦語音中心的活動來創(chuàng)建其聲音的合成版本。

       中風(fēng),創(chuàng)傷性腦損傷和神經(jīng)退行性疾病如帕金森病、多發(fā)性硬化癥和肌萎縮側(cè)索硬化癥(ALS或Lou Gehrig?。┏3?dǎo)致不可逆轉(zhuǎn)的說話能力喪失?;诖耍t(yī)學(xué)上也曾給出相應(yīng)解決辦法,就是借助輔助設(shè)備跟蹤眼睛或面部肌肉運動。然而與正常的語音(每分鐘100-150字)表達相比,這樣輔助表達產(chǎn)生文本和合成語音費力且低效(每分鐘最多10個字)。

       是否可以更好地幫助這類語言嚴重障礙患者恢復(fù)流暢的溝通能力?科學(xué)家們不斷地在努力。

       近日,加州大學(xué)舊金山分校(UCSF)語言科學(xué)家Gopala Anumanchipalli博士和Chang實驗室的生物工程研究生Josh Chartier領(lǐng)導(dǎo)開發(fā)了人工智能新系統(tǒng),可以通過控制患者大腦語音中心的活動來創(chuàng)建其聲音的合成版本。Chang對此最新成果十分興奮,他表示,此項研究首次表明可依據(jù)個人大腦活動生成完整的口語表達,這已然是成熟的技術(shù),臨床應(yīng)用指日可待。相關(guān)研究結(jié)果發(fā)表在《Nature》雜志上。

       這項研究是建立在之前一項研究的基礎(chǔ)之上,該研究首次描述了人類大腦的語音中心是如何編排嘴唇、下巴、舌頭和其他聲道組件的活動,以產(chǎn)生流暢的語音。對此,Anumanchipalli和Chartier意識到,之前直接解碼大腦活動語音的嘗試可能只取得了有限的成功,因為這些大腦區(qū)域并不能直接代表語音的聲學(xué)特性,而是協(xié)調(diào)運動所需的指令。

       他們招募了5名正在接受癲癇治療的志愿者,志愿者的大腦會暫時植入電極來監(jiān)測大腦活動。研究人員在 5 名受試者大聲說出幾百個句子時,記錄下參與語言生成的大腦區(qū)域的活動。由于研究小組無法同時記錄志愿者的神經(jīng)活動及其舌頭、口腔和喉部運動。相反,他們只記錄志愿者的音頻,而這種記錄方法使研究人員卻讓他們發(fā)現(xiàn)了新大陸。通過識別不同的特定發(fā)聲神經(jīng)元群體,發(fā)現(xiàn)聲音運動的神經(jīng)代碼能夠被模擬。

       這種聲音與解剖學(xué)的詳細映射使科學(xué)家能夠為每個參與者創(chuàng)建一個真實的虛擬聲道,這些聲道可以通過他們的大腦活動來控制。這當(dāng)中包括兩個“神經(jīng)網(wǎng)絡(luò)”機器學(xué)習(xí)算法:將語音中產(chǎn)生的大腦活動模式轉(zhuǎn)換為虛擬聲道運動的解碼器,以及將這些聲道運動轉(zhuǎn)換為參與者聲音的合成近似的合成器。

腦機接口新成果!Nature:人工智能破譯大腦信號合成語音

       研究人員還發(fā)現(xiàn),這些算法合成的語音明顯優(yōu)于直接從參與者大腦活動中解碼的合成語音。這些算法所產(chǎn)生的合成語音在進行測試時,效果十分明顯。與自然語言的情況一樣,抄錄員能準確地識別出69%的合成詞,并且能在43%的句子上完成完美精準度的轉(zhuǎn)錄。

       目前研究人員正在試驗更高密度的電極陣列和更先進的機器學(xué)習(xí)算法,他們希望這些算法能夠進一步改善合成語音。該技術(shù)的下一個主要測試是確定一個不會說話的人是否能夠在該系統(tǒng)的學(xué)習(xí)下,表達他們想說的任何內(nèi)容。

       “無法移動手臂和腿的人已經(jīng)學(xué)會用大腦控制機器人肢體,”Chartier希望,“有一天,有語言障礙的人能夠?qū)W會用這種腦控制的人工聲道再次說話。”

       參考文獻:

       [1] Speech synthesis from neural decoding of spoken sentences

       [2] Syntheticspeech generated from brain recordings

       [3] Study reveals brain activity patterns underlying fluent speech

相關(guān)文章

合作咨詢

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2024 上海博華國際展覽有限公司版權(quán)所有(保留一切權(quán)利) 滬ICP備05034851號-57