腦機接口新成果！Nature：人工智能破譯大腦信號合成語音

熱門推薦：大腦信號 , Nature , 人工智能 ,

來源：生物探索

2019-04-28

中風(fēng)，創(chuàng)傷性腦損傷和神經(jīng)退行性疾病如帕金森病、多發(fā)性硬化癥和肌萎縮側(cè)索硬化癥（ALS或Lou Gehrig?。┏３?dǎo)致不可逆轉(zhuǎn)的說話能力喪失?；诖耍t(yī)學(xué)上也曾給出相應(yīng)解決辦法，就是借助輔助設(shè)備跟蹤眼睛或面部肌肉運動。然而與正常的語音（每分鐘100-150字）表達相比，這樣輔助表達產(chǎn)生文本和合成語音費力且低效（每分鐘最多10個字）。

是否可以更好地幫助這類語言嚴重障礙患者恢復(fù)流暢的溝通能力？科學(xué)家們不斷地在努力。

近日，加州大學(xué)舊金山分校（UCSF）語言科學(xué)家Gopala Anumanchipalli博士和Chang實驗室的生物工程研究生Josh Chartier領(lǐng)導(dǎo)開發(fā)了人工智能新系統(tǒng)，可以通過控制患者大腦語音中心的活動來創(chuàng)建其聲音的合成版本。Chang對此最新成果十分興奮，他表示，此項研究首次表明可依據(jù)個人大腦活動生成完整的口語表達，這已然是成熟的技術(shù)，臨床應(yīng)用指日可待。相關(guān)研究結(jié)果發(fā)表在《Nature》雜志上。

這項研究是建立在之前一項研究的基礎(chǔ)之上，該研究首次描述了人類大腦的語音中心是如何編排嘴唇、下巴、舌頭和其他聲道組件的活動，以產(chǎn)生流暢的語音。對此，Anumanchipalli和Chartier意識到，之前直接解碼大腦活動語音的嘗試可能只取得了有限的成功，因為這些大腦區(qū)域并不能直接代表語音的聲學(xué)特性，而是協(xié)調(diào)運動所需的指令。

他們招募了5名正在接受癲癇治療的志愿者，志愿者的大腦會暫時植入電極來監(jiān)測大腦活動。研究人員在 5 名受試者大聲說出幾百個句子時，記錄下參與語言生成的大腦區(qū)域的活動。由于研究小組無法同時記錄志愿者的神經(jīng)活動及其舌頭、口腔和喉部運動。相反，他們只記錄志愿者的音頻，而這種記錄方法使研究人員卻讓他們發(fā)現(xiàn)了新大陸。通過識別不同的特定發(fā)聲神經(jīng)元群體，發(fā)現(xiàn)聲音運動的神經(jīng)代碼能夠被模擬。

這種聲音與解剖學(xué)的詳細映射使科學(xué)家能夠為每個參與者創(chuàng)建一個真實的虛擬聲道，這些聲道可以通過他們的大腦活動來控制。這當(dāng)中包括兩個“神經(jīng)網(wǎng)絡(luò)”機器學(xué)習(xí)算法：將語音中產(chǎn)生的大腦活動模式轉(zhuǎn)換為虛擬聲道運動的解碼器，以及將這些聲道運動轉(zhuǎn)換為參與者聲音的合成近似的合成器。

腦機接口新成果！Nature：人工智能破譯大腦信號合成語音