承啟生物助力中國科學家發(fā)現(xiàn)“隱藏的蛋白質(zhì)組”

熱門推薦：蛋白質(zhì) , 承啟生物 , 翻譯組測序 ,

來源：美通社

2019-08-21

2019年7月24日，承啟生物支持的中國科學家團隊在生物科學界權威期刊Nucleic Acids Research上發(fā)表論文，通過自主研發(fā)的翻譯組測序技術，發(fā)現(xiàn)了對癌癥等重大病變有重要影響的“隱藏的蛋白質(zhì)組”(Hidden Proteome) -- 這些蛋白質(zhì)長期以來被人們認為不會存在，所以被稱為“隱藏的蛋白質(zhì)組”。

蛋白質(zhì)是氨基酸形成的多肽長鏈。通常認為，至少50個氨基酸以上的為“蛋白質(zhì)”，而50個氨基酸以下的為“小肽”。小肽因長度短，難以形成復雜的空間構象，只能起一些調(diào)控作用；而蛋白質(zhì)較大，能生成較為精密和復雜的空間構象，便可獨立行使細胞結(jié)構、催化酶等較為復雜的功能，也能與其他蛋白質(zhì)相結(jié)合，形成精密的蛋白質(zhì)復合體甚至大分子機器，是生物學功能的主要執(zhí)行者。

在人類基因組已知的約5萬個基因中，其中約2萬個被認為是“編碼基因”(coding genes) ，即其可以被翻譯成蛋白質(zhì)；余下3萬個左右的基因被認為是“非編碼基因”(non-coding genes) ，這些基因被認為不可能翻譯為蛋白質(zhì)。

已有的報道中，除了部分非編碼基因可表達為小肽行使調(diào)控功能外，有發(fā)現(xiàn)個別非編碼基因（如CLUU1、ESRG等）實際上能翻譯成>50氨基酸的蛋白質(zhì)。若這種情況不是個案而是普遍存在的現(xiàn)象，則說明確實存在相當一部分“編碼基因”被錯誤地標注成了“非編碼基因”，這將意味著人基因組需要被系統(tǒng)性地重新注釋。

該問題很早就被學界所關注，但科學界一直未給出有效的解決方法。傳統(tǒng)的蛋白質(zhì)組質(zhì)譜技術難以有效發(fā)現(xiàn)這些“隱藏的蛋白質(zhì)”。2014年，人類蛋白質(zhì)組草圖在Nature上發(fā)表，聲稱發(fā)現(xiàn)千余個“非編碼基因”所編碼的“新蛋白質(zhì)”，但隨后便被人類蛋白質(zhì)組組織 (HUPO) 爆出其分析不合規(guī)范，在用較嚴格的標準進行質(zhì)控后，這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認為是假陽性而不予認定。

承啟生物首席科學家、暨南大學張弓教授于2012年開發(fā)成功翻譯組測序技術 (RNC-seq)，即測定翻譯中的全長mRNA。由于該項技術能準確監(jiān)測翻譯過程，精度比質(zhì)譜高很多，可用于指導蛋白質(zhì)組學，規(guī)避上面提到的問題，因此很快被作為人類蛋白質(zhì)組計劃的核心支柱之一，并在2014年被人類蛋白質(zhì)組組織列為人類蛋白質(zhì)組計劃的首要突出貢獻。

2018年，中山大學張弩教授、暨南大學張弓教授等人便用翻譯組測序技術，發(fā)現(xiàn)了人細胞內(nèi)8000多個環(huán)狀RNA可能翻譯出蛋白質(zhì)，顛覆了“只有極少數(shù)環(huán)狀RNA才能翻譯成蛋白質(zhì)”的傳統(tǒng)觀念，并確證了其中一個蛋白質(zhì)LINC-PINT具有明確的抑癌功能，顯示了翻譯組測序技術在尋找新蛋白方面所起到的積極作用。

而在本次發(fā)表的論文中，暨南大學何慶瑜教授、張弓教授、王通教授研究組發(fā)現(xiàn)了約4700個人類“非編碼基因”實際上可能翻譯成蛋白質(zhì)，并提供了其中314個由長鏈非編碼RNA (lncRNA) 表達的蛋白質(zhì)證據(jù)。這些蛋白質(zhì)不是小肽，而是含50個氨基酸以上的蛋白質(zhì)，它們能穩(wěn)定存在，并可在癌癥等病變中發(fā)揮重要作用。

承啟生物在該研究中提供了系統(tǒng)生物學數(shù)據(jù)分析，準確地預測了這些從未被人們認知的蛋白質(zhì)在細胞中的定位及其可能的功能，相關結(jié)果已通過實驗被證實。

本次研究發(fā)現(xiàn)的大批此前不為人知的新蛋白質(zhì)，大規(guī)模地校正了人類基因組中的錯誤注釋。這些新蛋白質(zhì)中有不少與人類生理病理相關的重要分子，由此打開了一個全新的人類蛋白質(zhì)寶庫，為研究各種重大疾病打開了一扇大門。同時，也使得中國科學家有獨立的方法檢驗與校正人類基因組的注釋，不再依賴美國NCBI等數(shù)據(jù)庫中的注釋。

如果這篇文章侵犯了您的權利，請聯(lián)系我們。