研究對33種癌癥的18116個樣本的癌癥基因組圖譜(TCGA)的全基因組和全轉(zhuǎn)錄組測序結(jié)果進行了分析,在大多數(shù)主要類型的癌癥內(nèi)部和之間的組織和血液中發(fā)現(xiàn)了獨特的微生物特征,并進一步建立了人工智能模型,作為基于微生物組的癌癥診斷工具。
我們生活的世界中到處都有著微生物的存在,它們對我們生活的許多方面都產(chǎn)生了深遠的影響,許多關(guān)于微生物及其基因組(統(tǒng)稱為微生物組)的研究都集中在腸道上,這是人體大多數(shù)微生物所定植的地方,這些微生物會影響癌癥嗎?
2020年3月,加州大學圣地亞哥分校的 Rob Knight 團隊在 Nature 期刊發(fā)表了題為:Microbiome analyses of blood and tissues suggest cancer diagnostic approach 的研究論文。
該研究對33種癌癥的18116個樣本的癌癥基因組圖譜(TCGA)的全基因組和全轉(zhuǎn)錄組測序結(jié)果進行了分析,在大多數(shù)主要類型的癌癥內(nèi)部和之間的組織和血液中發(fā)現(xiàn)了獨特的微生物特征,并進一步建立了人工智能模型,作為基于微生物組的癌癥診斷工具。
然而,近日,Nature 期刊撤回了這篇備受關(guān)注的論文。
撤稿原因是,2023年10月,約翰·霍普金斯大學的研究人員在 mBio 期刊發(fā)表文章,他們重新分析了上述 Nature 論文的數(shù)據(jù),這篇發(fā)表于 Nature 的論文報告了微生物的DNA特征與人類33種不同癌癥類型之間存在很強的相關(guān)性,并創(chuàng)建了在區(qū)分癌癥方面具有近乎完美準確性的機器學習預測器。
然而,約翰·霍普金斯大學的研究人員發(fā)現(xiàn),這些數(shù)據(jù)和方法中發(fā)現(xiàn)了至少兩個根本性的缺陷:
1、基因組數(shù)據(jù)庫和相關(guān)計算方法的錯誤導致所有樣本中出現(xiàn)了數(shù)百萬個細菌讀數(shù)的假陽性結(jié)果,主要是因為大多數(shù)被鑒定為細菌的DNA序列實際上是人源的;
2、原始數(shù)據(jù)轉(zhuǎn)換中的錯誤產(chǎn)生了一種人為特征,即使對于未檢測到讀數(shù)的微生物也是如此,為每種腫瘤類型標記了一個獨特的信號,機器學習程序隨后利用該信號創(chuàng)建了一個看似準確的分類器。
這兩個缺陷中的每一個都使論文的結(jié)論無效,因此,論文基于這些結(jié)論提出的基于微生物組的癌癥識別分類器完全錯誤。
此外,這些錯誤還影響了后續(xù)十多項使用該論文中相同數(shù)據(jù)的已發(fā)表研究,這些研究結(jié)果可能也同樣無效。
Nature 的編輯團隊認為,該論文的一些發(fā)現(xiàn)受到了錯誤數(shù)據(jù)分析的影響,相應的結(jié)論不再得到支持,論文所有作者同意撤稿。
1. https://www.nature.com/articles/s41586-020-2095-1
2. https://journals.asm.org/doi/10.1128/mbio.01607-23