產(chǎn)品分類導(dǎo)航
CPHI制藥在線 資訊 MIT研究:從氨基酸鏈片段直接預(yù)測蛋白質(zhì)功能

MIT研究:從氨基酸鏈片段直接預(yù)測蛋白質(zhì)功能

熱門推薦: 基因組學(xué) 氨基酸鏈 MIT
來源:學(xué)術(shù)經(jīng)緯
  2019-03-27
就在幾個(gè)月前,DeepMind推出了AlphaFold系統(tǒng),這個(gè)被稱為生物界“AlphaGo”的系統(tǒng)能夠預(yù)測并生成蛋白質(zhì)3D結(jié)構(gòu)。而近日,來自MIT的研究人員開發(fā)了一個(gè)新的研究模型,能夠直接預(yù)測氨基酸鏈片段是如何決定蛋白質(zhì)功能的。這一發(fā)現(xiàn)可以幫助研究人員設(shè)計(jì)和測試新的蛋白質(zhì),從而用于藥物研發(fā)和生物學(xué)研究。

       就在幾個(gè)月前,DeepMind推出了AlphaFold系統(tǒng),這個(gè)被稱為生物界“AlphaGo”的系統(tǒng)能夠預(yù)測并生成蛋白質(zhì)3D結(jié)構(gòu)。而近日,來自MIT的研究人員開發(fā)了一個(gè)新的研究模型,能夠直接預(yù)測氨基酸鏈片段是如何決定蛋白質(zhì)功能的。這一發(fā)現(xiàn)可以幫助研究人員設(shè)計(jì)和測試新的蛋白質(zhì),從而用于藥物研發(fā)和生物學(xué)研究。

       我們都知道,蛋白質(zhì)是維持我們生命所必需的龐大而復(fù)雜的物質(zhì)。蛋白質(zhì)具體能完成什么樣的功能,主要取決于它獨(dú)特的三維結(jié)構(gòu)。因此了解蛋白質(zhì)的結(jié)構(gòu),對于預(yù)測其對某些藥物的反應(yīng)來說,是一個(gè)非常重要的環(huán)節(jié)。

       然而,盡管有了數(shù)十年的研究和多種成像技術(shù)的輔助,我們?nèi)匀恢涣私獾搅藷o數(shù)蛋白質(zhì)結(jié)構(gòu)中的很小一部分,還有很多未知結(jié)構(gòu)的蛋白質(zhì)功能尚未揭曉。針對這一情況,來自MIT的研究人員開發(fā)出了一種方法,“學(xué)習(xí)”了蛋白質(zhì)序列中每個(gè)氨基酸位置上容易計(jì)算的表征。隨后,研究人員將這些表征輸入機(jī)器學(xué)習(xí)模型,讓模型直接預(yù)測單個(gè)氨基酸片段的功能,而無需任何蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù)。

       首先,研究人員使用了來自蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(SCOP)的約22000種蛋白質(zhì),將這些蛋白質(zhì)按照結(jié)構(gòu)和氨基酸序列的相似性進(jìn)行分類,并對機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。對于每一對蛋白質(zhì),研究人員都會(huì)根據(jù)其SCOP類別計(jì)算出一個(gè)結(jié)構(gòu)相似性評(píng)分。然后,研究人員將隨機(jī)的蛋白質(zhì)結(jié)構(gòu)對及其氨基酸序列輸入機(jī)器學(xué)習(xí)模型,通過編碼器將它們轉(zhuǎn)換成數(shù)值表示出來,稱為嵌入(embedding)。每個(gè)嵌入都包含了一對氨基酸序列的相似性信息。

       該模型將兩個(gè)嵌入對齊,然后計(jì)算出相似度評(píng)分,以預(yù)測其代表的蛋白質(zhì)三維結(jié)構(gòu)的相似性。然后,計(jì)算機(jī)會(huì)將這一評(píng)分與真實(shí)的SCOP相似性評(píng)分進(jìn)行比較,并向編碼器發(fā)送反饋信號(hào)。如果模型的預(yù)測分?jǐn)?shù)與真實(shí)分?jǐn)?shù)相差較遠(yuǎn),則會(huì)進(jìn)行一定的調(diào)整。

       同時(shí),該模型預(yù)測了每次嵌入的“接觸圖”(contact map),即每個(gè)氨基酸與該蛋白質(zhì)中其他氨基酸的距離,并將其預(yù)測的接觸圖與來自SCOP的已知接觸圖進(jìn)行比較,然后向編碼器發(fā)送反饋信號(hào)。這一步驟有助于模型更好地明確氨基酸在蛋白質(zhì)結(jié)構(gòu)中的確切位置,從而進(jìn)一步了解每個(gè)氨基酸的功能。

       對于某個(gè)氨基酸鏈,該模型可以為三維結(jié)構(gòu)中的每個(gè)氨基酸位置生成一個(gè)嵌入。然后,機(jī)器學(xué)習(xí)模型可以使用這些序列嵌入,根據(jù)其預(yù)測的三維結(jié)構(gòu)接觸圖,來準(zhǔn)確預(yù)測每個(gè)氨基酸的功能。在一個(gè)應(yīng)用實(shí)例中,研究人員使用該模型預(yù)測有哪些蛋白質(zhì)可以通過細(xì)胞膜,其預(yù)測結(jié)果比現(xiàn)有的先進(jìn)模型還要更加準(zhǔn)確。

       接下來,研究人員計(jì)劃將該模型應(yīng)用到更多的預(yù)測任務(wù)中,例如弄清楚哪些序列片段可以與小分子結(jié)合,這對于藥物研發(fā)工作來說是至關(guān)重要的。研究人員表示,這項(xiàng)研究最終將可以應(yīng)用于人類健康和藥物基因組學(xué),因?yàn)樗兄跈z測破壞蛋白質(zhì)結(jié)構(gòu)的有害突變。

點(diǎn)擊下圖,預(yù)登記觀展

b2bcnbjzixun

相關(guān)文章

合作咨詢

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2024 上海博華國際展覽有限公司版權(quán)所有(保留一切權(quán)利) 滬ICP備05034851號(hào)-57