產(chǎn)品分類導(dǎo)航
CPHI制藥在線 資訊 擁抱AI,顏寧團(tuán)隊連發(fā)兩篇論文,開發(fā)“酷尋”策略,探尋未知新蛋白,開啟結(jié)構(gòu)生物學(xué)新范式

擁抱AI,顏寧團(tuán)隊連發(fā)兩篇論文,開發(fā)“酷尋”策略,探尋未知新蛋白,開啟結(jié)構(gòu)生物學(xué)新范式

作者:王聰  來源:生物世界
  2024-12-19
冷凍電鏡(cryo-EM)技術(shù)帶來了分辨率革命,讓我們能夠以原子級的高分辨率觀察并描繪蛋白質(zhì)結(jié)構(gòu)?;谌斯ぶ悄埽ˋI)的AlphaFold等工具實現(xiàn)了對蛋白質(zhì)結(jié)構(gòu)的快速且精準(zhǔn)的預(yù)測。

       冷凍電鏡(cryo-EM)技術(shù)帶來了分辨率革命,讓我們能夠以原子級的高分辨率觀察并描繪蛋白質(zhì)結(jié)構(gòu)?;谌斯ぶ悄埽ˋI)的AlphaFold等工具實現(xiàn)了對蛋白質(zhì)結(jié)構(gòu)的快速且精準(zhǔn)的預(yù)測,如今,AlphaFold已經(jīng)預(yù)測了地球上幾乎所有已知的蛋白質(zhì)的結(jié)構(gòu)。

       從歷史上來看,結(jié)構(gòu)生物學(xué)(Structural Biology)一直專注于研究已知物質(zhì)。而現(xiàn)在,結(jié)構(gòu)生物學(xué)正經(jīng)歷著一種范式轉(zhuǎn)變——從靶向結(jié)構(gòu)確定到結(jié)構(gòu)引導(dǎo)的發(fā)現(xiàn)先前未被表征的生物實體。而冷凍電鏡的高分辨率能力以及人工智能的結(jié)構(gòu)預(yù)測能力,為探索完全未知的生物實體提供了前所未有的機(jī)會。

       最近,深圳醫(yī)學(xué)科學(xué)院顏寧教授團(tuán)隊接連發(fā)表了兩篇論文,提出了一個名為CryoSeek(酷尋)的新策略,將冷凍電鏡作為一種觀察工具,結(jié)合AI輔助的自動建模和生物信息學(xué)分析,發(fā)現(xiàn)自然界中完全未知的新型生物實體。

       2024年10月9日,顏寧、李張強(qiáng)等人在《美國國家科學(xué)院院刊》(PNAS)發(fā)表了題為:CryoSeek: A strategy for bioentity discovery using cryoelectron microscopy 的研究論文【1】。

CryoSeek: A strategy for bioentity discovery using cryoelectron microscopy

       CryoSeek的工作流程包括以下幾個步驟:1)從自然來源收集樣本;2)用過濾、濃縮等簡單程序處理樣品;3a)執(zhí)行標(biāo)準(zhǔn)冷凍樣品制備和冷凍電鏡數(shù)據(jù)采集,或3b)通過其他方法(例如宏基因組測序和質(zhì)譜分析)來表征樣品;4)冷凍電鏡數(shù)據(jù)處理;5)AI輔助自動建模;6)結(jié)合步驟3b的其他生物信息學(xué)分析結(jié)果,根據(jù)其結(jié)構(gòu)識別相應(yīng)的生物實體。

       首先,顏寧團(tuán)隊使用冷凍電鏡(cryo-EM)對清華荷塘的濾過水樣進(jìn)行觀察分析,發(fā)現(xiàn)了豐富多樣的生物大分子,其中長短、粗細(xì)不一的纖維狀結(jié)構(gòu)在占據(jù)主導(dǎo)地位。然后,顏寧團(tuán)隊通過三維重構(gòu)獲得了多個纖維結(jié)構(gòu)的高分辨率電鏡密度圖。

       接下來,利用清華大學(xué)張強(qiáng)鋒團(tuán)隊開發(fā)的基于AI算法的CryoNet軟件進(jìn)行自動模型搭建,獲得了兩種高度相似的螺旋纖維蛋白的三維結(jié)構(gòu),顏寧團(tuán)隊將其命名為TLP-1a和TLP-1b,每一種直徑約為8 nm。

TLP-1a和TLP-1b

       進(jìn)一步的生物信息學(xué)分析顯示,TLP-1a和TLP-1b這兩種纖維狀蛋白具有獨(dú)特的形狀和厚度,來自完全未知的物種。研究團(tuán)隊認(rèn)為,其很可能是某種細(xì)菌用于物質(zhì)傳遞和輔助運(yùn)動的菌毛。

       總的來說,這項研究展示了結(jié)構(gòu)生物學(xué)的范式轉(zhuǎn)變,之前的結(jié)構(gòu)生物學(xué)總是應(yīng)用于已知的物質(zhì),而現(xiàn)在,在蛋白質(zhì)序列和來源完全未知的情況下,完全基于高分辨率的結(jié)構(gòu)測定實現(xiàn)了對未知生物實體的物質(zhì)鑒定和功能預(yù)測,使結(jié)構(gòu)生物學(xué)成為探索完全未知物質(zhì)的驅(qū)動力。

       此外,該研究提出的CryoSeek策略還可以擴(kuò)展到識別來自河流、海洋、雨滴的生物實體,甚至來自深海、熱液噴口甚至太空等極端環(huán)境的生物實體,從而有助于將結(jié)構(gòu)生物學(xué)擴(kuò)展到結(jié)構(gòu)X學(xué)(Structural X-ology),例如結(jié)構(gòu)病理學(xué)(Structural pathology)、結(jié)構(gòu)生態(tài)學(xué)(Structural ecology)、結(jié)構(gòu)考古學(xué)(Structural archeology)等。

       2024年12月15日,顏寧、李張強(qiáng)等在預(yù)印本平臺 bioRxiv 發(fā)表了題為:The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek 的研究論文【2】。

The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek

       顏寧團(tuán)隊之前開發(fā)了一種名為CryoSeek(酷尋)的研究策略——使用冷凍電鏡(cryo-EM)從自然或內(nèi)源性資源中識別未表征的全新生物實體。

       在這項新研究中,研究團(tuán)隊發(fā)現(xiàn)了一種高度糖基化的蛋白纖維——TLP-4b,其主要分子質(zhì)量歸因于一個厚聚糖殼。由于多個AI輔助軟件都無法自動搭建出其蛋白結(jié)構(gòu),研究團(tuán)隊進(jìn)行了人工手動搭建,確定了其結(jié)構(gòu),3.3 分辨率的冷凍電鏡結(jié)構(gòu)重建揭示了該糖蛋白纖維的唯一蛋白質(zhì)成分——直徑約為8 nm的四肽重復(fù)線性多肽鏈。每個四肽重復(fù)序列包含1個保守的3,4-二羥脯氨酸(diHyp)、1個絲氨酸或蘇氨酸,以及2個較少保守的氨基酸殘基組成。其中,3,4-二羥脯氨酸的3-OH與4-OH均高度O-糖基化,絲氨酸或蘇氨酸同樣存在O-糖基化。

TLP-4b

       在三維重構(gòu)區(qū)段中,該纖維結(jié)構(gòu)高度規(guī)則,其折疊形式完全由糖質(zhì)間的相互作用維持,并且由于高重復(fù)性,這些糖質(zhì)的組裝也是高度有序的。通過計算氨基酸和糖質(zhì)的比例發(fā)現(xiàn),該纖維結(jié)構(gòu)中糖質(zhì)的質(zhì)量占比達(dá)到了驚人的95%以上。

TLP-4b

       總的來說,該研究揭示了聚糖在糖綴合物結(jié)構(gòu)折疊中的關(guān)鍵作用,并有助于理解生物圈中的碳/氮比值。該研究也進(jìn)一步證明了CryoSeek(酷尋)在發(fā)現(xiàn)完全未知的生物實體方面的能力,有望成為推動一系列新研究的起點。

       論文鏈接:

       1. https://www.pnas.org/doi/10.1073/pnas.2417046121

       2. https://www.biorxiv.org/content/10.1101/2024.12.15.627649v1

相關(guān)文章

合作咨詢

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2024 上海博華國際展覽有限公司版權(quán)所有(保留一切權(quán)利) 滬ICP備05034851號-57