在經(jīng)歷“驟起”、“ 狂歡”、“冷秋”之后,人工智能創(chuàng)投開(kāi)始趨于理性。而在此時(shí),針對(duì)人工智能的下游應(yīng)用也開(kāi)始真正浮出水面,可以看到今年的各大醫(yī)療展會(huì),人工智能成為了真正的主題,從最早的手術(shù)機(jī)器人,再到更深入的智能器械、影像識(shí)別、藥物研發(fā).....而在基因技術(shù)領(lǐng)域,人工智能同樣備受行業(yè)關(guān)注。
“它或許會(huì)成為企業(yè)競(jìng)爭(zhēng)力的加速器。”在日前的2019CHCC上,貝瑞基因CEO兼聯(lián)合創(chuàng)始人周代星博士這樣形容。
盡管美國(guó)平均每年要在醫(yī)療保健行業(yè)投入1萬(wàn)億美元的支出,但極大的支出呈現(xiàn)出的效果差強(qiáng)人意。比如乳腺癌,即便能夠?qū)ζ溥M(jìn)行篩查,但并不能阻止疾病的惡化;再比如處方藥,據(jù)估算有效性只有25%,大量臨床資源被浪費(fèi)。
75%的處方藥沒(méi)有達(dá)到很好的效果
這背后的原因,其實(shí)是個(gè)體間的代謝吸收能力的差異,但目前的用藥并沒(méi)有考慮每個(gè)人的計(jì)量標(biāo)準(zhǔn)。“物聯(lián)網(wǎng)強(qiáng)調(diào)把事物數(shù)字化,我們這一點(diǎn)做得很好。但是對(duì)于人類本身的數(shù)字化,這個(gè)程度很低。”周代星解釋道。基因信息與人密切相關(guān),這30億個(gè)堿基對(duì)是人體的程序代碼,調(diào)控著人體內(nèi)的一系列物理和化學(xué)變化。對(duì)數(shù)字化生命的解釋,莫過(guò)于基因測(cè)序。
指導(dǎo)疾病診療和生活,是基因檢測(cè)的最終意義
在2012年之前,這個(gè)數(shù)字化的成本相當(dāng)高。而當(dāng)測(cè)序成本突破摩爾定律持續(xù)下降時(shí),測(cè)序成本漸漸不再是問(wèn)題。
測(cè)序成本與超摩爾定律
“現(xiàn)在是大家的接受度的問(wèn)題。”他繼續(xù)說(shuō)道。2014年,NIPT試點(diǎn)展開(kāi)意味著基因技術(shù)臨床應(yīng)用邁出了第一步,而今,這項(xiàng)技術(shù)的年檢測(cè)量已突破400萬(wàn)人;第一份基于NGS的腫瘤基因檢測(cè)批件于2018年7月發(fā)出,腫瘤臨床檢測(cè)開(kāi)始起步。此外,輕醫(yī)療概念的消費(fèi)級(jí)基因檢測(cè)在國(guó)外已經(jīng)形成市場(chǎng),2018年年檢測(cè)量突破2600萬(wàn)人。盡管中國(guó)不是人口遷徙國(guó)家,對(duì)祖源檢測(cè)的市場(chǎng)需求不比美國(guó),但大人口基數(shù)以及健康管理需求也造就了消費(fèi)基因檢測(cè)的巨大市場(chǎng)。
在NIPT、腫瘤檢測(cè)、消費(fèi)基因之后,基因檢測(cè)的作用還有什么呢?在半個(gè)小時(shí)的演講中,周代星給大家分享了一個(gè)故事:
生活在遼寧海城一個(gè)普通家庭的姐妹倆,姐姐24歲,妹妹16歲,從小輾轉(zhuǎn)多家醫(yī)院求醫(yī)問(wèn)診,不幸的是,均被診斷為“腦癱”。而姐妹倆在接受全外顯子組檢測(cè)(WES)后發(fā)現(xiàn),她們所患的其實(shí)是一種叫做多巴反應(yīng)性肌張力障礙(DRD)的罕見(jiàn)病。在醫(yī)生進(jìn)行針對(duì)性治療一個(gè)月后,姐妹倆可以自己吃飯;服藥50天后就能自己玩手機(jī)、開(kāi)直播,而每月服藥的費(fèi)用,僅需100多元。
這是一個(gè)極具代表性的案例,通過(guò)分子層面的診斷,對(duì)疾病最根本的原因作出解釋。基因檢測(cè)最終的意義,或許應(yīng)該是像這樣通過(guò)對(duì)遺傳密碼的解析指導(dǎo)診療、指導(dǎo)生活。
人工智能是全外顯子檢測(cè)實(shí)現(xiàn)的前提
“這對(duì)姐妹是比較幸運(yùn)的,能夠找到病因,并且能有治療方案。”周代星告訴記者,“其實(shí)還有相當(dāng)一部分疾病,研究上暫時(shí)沒(méi)有找到對(duì)應(yīng)的基因。”除了染色體疾病和單基因疾病,大多數(shù)疾病由多個(gè)位點(diǎn)控制。位點(diǎn)與位點(diǎn)之間有著復(fù)雜的關(guān)聯(lián),不同位點(diǎn)的變異組合可能會(huì)形成不同的疾病亞型。
而除了遺傳以外,生活習(xí)慣、環(huán)境等因素也與疾病息息相關(guān),帶有致病位點(diǎn)的人并非一定會(huì)發(fā)??;即使發(fā)病,由于個(gè)人耐受不同,最終相同疾病在臨床的表型也存在差異。
因此,盡管理想很豐滿,但我們也不得不承認(rèn)現(xiàn)實(shí)是骨感的,單單依靠人力,很難理清疾病與位點(diǎn)的對(duì)應(yīng)關(guān)系。
人工智能助力未知關(guān)聯(lián)的挖掘
在獲取到一個(gè)人的基因信息后,通常需要與人類基因組匹配來(lái)找出可能存在的突變。而突變與疾病的對(duì)應(yīng)關(guān)系的判斷大部分依靠公共數(shù)據(jù)庫(kù),主要通過(guò)對(duì)已經(jīng)發(fā)表的文獻(xiàn)挖掘得來(lái)。但全球范圍內(nèi)每天更新的論文數(shù)量非常大,全部依賴人工整合并不現(xiàn)實(shí)。這個(gè)時(shí)候便體現(xiàn)出了人工智能的價(jià)值。
目前大部分人工智能的技術(shù)路徑是人工神經(jīng)網(wǎng)絡(luò),其中又有ART網(wǎng)絡(luò)、LVQ網(wǎng)絡(luò)、Kohonen網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)幾種算法的變形。機(jī)器學(xué)習(xí)是目前人工智能的核心,它能夠通過(guò)對(duì)大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行學(xué)習(xí)和整合,挖掘并計(jì)算其中的關(guān)聯(lián)。通過(guò)對(duì)已有文獻(xiàn)和新增文獻(xiàn)的持續(xù)挖掘,人工智能可以持續(xù)不斷的挖掘并更新突變位點(diǎn)和疾病的潛在聯(lián)系。
“這種關(guān)聯(lián)覆蓋的越多,人們對(duì)基因的解讀能力就越強(qiáng),越準(zhǔn)確。”他告訴動(dòng)脈網(wǎng),這也是IBM Watson做的事情。
用“老數(shù)據(jù)”得出新發(fā)現(xiàn)
對(duì)于已經(jīng)覆蓋到的疾病,人工智能之于基因的意義或許還能上升到疾病的輔助診斷。以2019年3月23andme發(fā)布的二型糖尿病研究為例,基于大量的數(shù)據(jù)訓(xùn)練,23andme可以完全只依靠基因數(shù)據(jù)來(lái)判斷用戶是否患有二型糖尿病。
盡管這是一種多基因疾病,在大量數(shù)據(jù)的加持下,23andme可以將準(zhǔn)確性訓(xùn)練到79%。不過(guò),你可能會(huì)想臨床上二型糖尿病的臨床診斷相對(duì)簡(jiǎn)單,為什么反而要通過(guò)更復(fù)雜的手段來(lái)診斷呢?
那么換一個(gè)例子可能會(huì)有更直觀的感受。抑郁癥80%的發(fā)病都與基因有關(guān),且是一種多基因疾病。這種疾病目前在臨床上主要通過(guò)對(duì)患者調(diào)查問(wèn)卷來(lái)確診,極度依賴心理醫(yī)生的個(gè)人經(jīng)驗(yàn)。不夸張的說(shuō),抑郁癥的診斷還停留在經(jīng)驗(yàn)醫(yī)學(xué)時(shí)代。
“如果能夠僅根據(jù)基因?qū)σ钟舭Y進(jìn)行初步診斷,即便50%的準(zhǔn)確率相比目前手段都是巨大突破。”周代星這樣解釋。
大規(guī)模數(shù)據(jù)是智能的前提
始于無(wú)創(chuàng)(產(chǎn)前)、興于腫瘤(檢測(cè)),鼎盛于全基因組測(cè)序。在可預(yù)見(jiàn)的未來(lái)里,全基因組或者全外顯子組的普及是必然趨勢(shì)。但全基因組或者全外顯子組的數(shù)據(jù)解讀一直面臨瓶頸,如果單純依靠人力,一位生物信息工程師一天可能只能出具一份到兩份報(bào)告——這樣的速度幾乎不可能實(shí)現(xiàn)產(chǎn)品的規(guī)?;R虼?,全外顯子要大規(guī)模市場(chǎng)化,人工智能是必選項(xiàng)。
但是,這樣的人工智能要如何實(shí)現(xiàn)呢?。數(shù)字醫(yī)療公司AliveCor的產(chǎn)品審批之路或許值得借鑒。AliveCor 針對(duì) Apple Watch 推出了能夠即時(shí)量測(cè)心電圖的“KardiaBand”表帶,這是數(shù)
110萬(wàn)個(gè)ECG數(shù)據(jù),并將超過(guò)20萬(wàn)條有心房纖顫的狀況的數(shù)據(jù)與70萬(wàn)條正常數(shù)據(jù)比對(duì),再不斷校準(zhǔn)后才通過(guò)考核。
對(duì)所有的人工智能應(yīng)用而言,智能的前提都是大量的數(shù)據(jù)訓(xùn)練。放在基因檢測(cè)領(lǐng)域,大量數(shù)據(jù)訓(xùn)練的前提則是有大量數(shù)據(jù)產(chǎn)生,這意味著需要測(cè)序技術(shù)的大規(guī)模覆蓋。
要拿出社會(huì)所需的檢測(cè)產(chǎn)品
“企業(yè)首先得拿出符合社會(huì)需求的產(chǎn)品。”周代星指出。他認(rèn)為,只有能夠滿足社會(huì)需求的產(chǎn)品,才能被市場(chǎng)所接受。毫無(wú)疑問(wèn),NIPT是成功的先例。但我們也不得不承認(rèn),僅僅是染色體的檢測(cè),覆蓋的信息還太少。“現(xiàn)在我們?cè)趪L試推廣全外顯子檢測(cè),可以覆蓋99%以上的遺傳信息。”他透露,目前該產(chǎn)品價(jià)格低于3000人民幣,且正在持續(xù)下降中。
另外,23andme在消費(fèi)型檢測(cè)市場(chǎng)的成功也給了基因檢測(cè)行業(yè)的從業(yè)者們非常大的啟示。盡管芯片檢測(cè)覆蓋的信息量并不算大,但基于這些信息23andme也已經(jīng)有了不少成果,比如失眠基因和前文提到的二型糖尿病的研究。“全外顯子檢測(cè)的信息量是芯片檢測(cè)的100倍,我想應(yīng)該會(huì)有更多的突破。”周代星表示。
2019年2月,貝瑞基因宣布與在東南亞和歐洲市場(chǎng)具有影響力的基因檢測(cè)公司Prenetics 聯(lián)合投資成立的消費(fèi)級(jí)基因檢測(cè)公司圓基因,并邀請(qǐng)到前谷歌中國(guó)戰(zhàn)略合作總經(jīng)理嚴(yán)峻加盟并擔(dān)任公司首席執(zhí)行官,新公司定名 為“北京源圓基因技術(shù)有限公司(圓基因)”。據(jù)了解,圓基因?qū)⒂?019年第二季度開(kāi)始運(yùn)營(yíng)。周代星在采訪中透露,為了使檢測(cè)報(bào)告內(nèi)容更客觀更充分,圓基因也將采用全外顯子檢測(cè)。
“不管查什么,做檢測(cè)的時(shí)候都應(yīng)該盡可能的全面。”周代星強(qiáng)調(diào),“從發(fā)展歷程來(lái)看,先要有符合社會(huì)需求的產(chǎn)品,才能有數(shù)據(jù)的積累。有了這些基礎(chǔ),才能有人工智能分析,從一個(gè)疾病覆蓋到更多的疾病。”
數(shù)據(jù)規(guī)范與管理
除了數(shù)量,數(shù)據(jù)質(zhì)量一直是人工智能領(lǐng)域熱議的問(wèn)題。數(shù)據(jù)量大并非等同于大數(shù)據(jù),數(shù)據(jù)的結(jié)構(gòu)化、規(guī)范化程度也至關(guān)重要。
而在臨床上,不同醫(yī)生對(duì)同一癥狀可能會(huì)有不同的描述。比如A醫(yī)生描述“腹痛”,可能就是B醫(yī)生所寫(xiě)的“腹部痙攣”;再加之不同個(gè)體間痛感、表述差異,同一表征可能會(huì)有更多五花八門的描述。
在日常診療中,醫(yī)生的各人習(xí)慣對(duì)疾病診療的影響并不是特別大;但當(dāng)這些零星的數(shù)據(jù)匯總到一個(gè)數(shù)據(jù)集中,就很難真實(shí)有效的對(duì)這些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和歸納。更重要的是,企業(yè)的數(shù)據(jù)庫(kù)的來(lái)源可能來(lái)自多個(gè)不同的醫(yī)院,如果數(shù)據(jù)量達(dá)到數(shù)萬(wàn)例,很難想象不同醫(yī)生們對(duì)同一癥狀有多少表達(dá)方式。
如果能夠?qū)⑦@些語(yǔ)言規(guī)范化,形成統(tǒng)一的表達(dá)方式,無(wú)疑將更加有利于數(shù)據(jù)的挖掘和使用?;诖?,貝瑞基因開(kāi)發(fā)了一款叫做NLPearl的計(jì)算軟件,能夠基于自然語(yǔ)言處理將不同用語(yǔ)習(xí)慣形成統(tǒng)一標(biāo)準(zhǔn)。
盡管幾個(gè)層次的學(xué)習(xí),NLPearl就可以對(duì)醫(yī)院的自然語(yǔ)言描述方式進(jìn)行總結(jié),當(dāng)下一次遇到非結(jié)構(gòu)化的自然描述時(shí),系統(tǒng)就能夠自動(dòng)校準(zhǔn)為標(biāo)準(zhǔn)描述。
當(dāng)數(shù)據(jù)積累到足夠大的量級(jí),且有足夠量級(jí)之后,不管什么樣的自然語(yǔ)言描述都有可能找到對(duì)應(yīng)的位點(diǎn);相應(yīng)的,遇到這樣突變的患者,也可以反推他可能會(huì)出現(xiàn)的一系列臨床表征。
或許,當(dāng)系統(tǒng)訓(xùn)練到一定程度時(shí)、全基因組或全外顯子檢測(cè)普及時(shí),患者還未到醫(yī)院醫(yī)生就能夠?qū)ζ溥M(jìn)行初步診斷。而在醫(yī)院就診的環(huán)節(jié),或許將更加注重治療環(huán)節(jié)的討論。
“另外,數(shù)據(jù)的規(guī)范也對(duì)日后的影響非常大。”他指出,如果要想成體量,一家醫(yī)院或者公司的數(shù)據(jù)量是不足夠的,“數(shù)據(jù)能否共享將成為關(guān)鍵議題。”更重要的是,在數(shù)據(jù)共享的過(guò)程中,必須有嚴(yán)格的行業(yè)規(guī)范,在保證數(shù)據(jù)持有者隱私和數(shù)據(jù)安全的前提下進(jìn)行。
而對(duì)于企業(yè)個(gè)體而言,人工智能的意義或許是讓強(qiáng)者恒強(qiáng)的工具。人工智能的助力將進(jìn)一步提升檢測(cè)的效率和精準(zhǔn)度,同時(shí)從側(cè)面降低檢測(cè)的成本。而這些正式企業(yè)市場(chǎng)競(jìng)爭(zhēng)力的體現(xiàn)。而對(duì)整個(gè)行業(yè)而言,人工智能的意義則好比指南針和加速器,它讓基因技術(shù)能夠以更精準(zhǔn)的角度、更快的速度進(jìn)入市場(chǎng)并普及。
或許有一天,基因檢測(cè)會(huì)成為心電圖檢測(cè)一樣普遍的臨床工具,醫(yī)生們不必苦惱沒(méi)有分子遺傳學(xué)背景,人工智能可以幫他們解決數(shù)據(jù)解讀和分析的過(guò)程?;蛟S在基因技術(shù)和人工智能,以及其他技術(shù)的幫助下,阿爾茲海默病的秘密終將被解開(kāi);或許互聯(lián)網(wǎng)問(wèn)診、遠(yuǎn)程醫(yī)療的實(shí)現(xiàn)將會(huì)有更有力的技術(shù)支持......
關(guān)于未來(lái)的設(shè)想還有很多,我們也相信這一切在未來(lái)均有可能。而落到實(shí)處,行業(yè)邁出的第一步應(yīng)該從數(shù)據(jù)的產(chǎn)生開(kāi)始。當(dāng)然,行業(yè)共識(shí)和規(guī)范的達(dá)成無(wú)疑能夠會(huì)讓這一天更快到來(lái)。
點(diǎn)擊下圖,預(yù)登記觀展
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com