李游將電腦上密密麻麻的符號數(shù)據(jù),運用到新藥篩選上來。
提到程序員,人們往往瞬間聯(lián)想到格子襯衫、雙肩包、坐在電腦前敲代碼等畫面,而提到生物藥企實驗室的工作人員,人們眼前又可能會浮現(xiàn)出白大褂、護目鏡以及一堆冰冷的實驗器材。如果程序員與生物藥企實驗室工作人員結(jié)合呢?很多人會覺得難以想象。
其實,在成都先導藥物開發(fā)有限公司(以下簡稱“成都先導”),就有一批“程序員”活躍其中。成都先導有一個在生物藥企不常見的部門——“干實驗室”,其成員幾乎全部是“程序員”。但與傳統(tǒng)意義上程序員不同的是,他們的工作主要是以成都先導的DNA編碼化合物庫為平臺,結(jié)合生物和化學專業(yè)知識,利用人工智能,高效地找到新藥研發(fā)所需的小分子化合物,從而大大減少新藥篩選的時間和成本。在這個過程中,他們也要像程序員那樣寫代碼,建立相關(guān)的數(shù)據(jù)模型。
“程序員”參與新藥研發(fā) 用AI揪出潛在匹配目標
4月24日,記者走進成都先導“干實驗室”。與一般的實驗室不同,這里看不見身穿白大褂的實驗人員,沒有瓶瓶罐罐的實驗器材,也沒有各種名稱復雜的化學試劑。辦公桌、電腦便是實驗室的全部配備。一眼看過去,無論是工作人員的穿著還是辦公場地的布置,很難從中看出傳統(tǒng)生物藥企的影子。
然而,通過實驗室工作人員李游的介紹,深藏在平凡表面背后的生物醫(yī)藥特點絲絲縷縷浮現(xiàn),“你眼前看到的這些電腦,就是我們的實驗器材。”李游說,這些電腦是用來幫助實驗室人員在新藥篩選過程中進行數(shù)據(jù)分析的。
“我的工作就是數(shù)據(jù)分析、算法研發(fā)、大數(shù)據(jù)分析平臺搭建和應(yīng)用。”李游說,DNA編碼化合物庫新藥篩選,發(fā)現(xiàn)與相關(guān)靶點匹配的先導化合物,一般要經(jīng)過7個步驟,數(shù)據(jù)分析是其中一個步驟。“數(shù)據(jù)分析主要是結(jié)合AI,通過序列解析和大數(shù)據(jù)分析找出與靶點匹配的潛在小分子化合物。”
李游打了一個比方——“每個小分子化合物有一個DNA標記。打個比方,這里有一盒糖紙包裝統(tǒng)一、但口味不同的糖果。在沒有品嘗前,你并不知道隨手拿到的糖果會是什么口味。但如果給不同口味的糖果設(shè)計帶有身份標記的二維碼,吃之前先掃一掃二維碼,便能找到你想吃的那顆糖果。”在這個比喻里,糖果便是小分子化合物,二維碼是DNA標記,掃碼的過程就是實驗室“程序員”進行數(shù)據(jù)解析的過程。李游說,成都先導DNA編碼化合物已達到千億級,從中找到目標對象,猶如在汪洋大海里尋找一粒沙子。“不過,通過大數(shù)據(jù)分析,定位與靶標蛋白相互作用的小分子化合物的過程卻很快,一般3天左右即可完成。”
每周處理幾十億條DNA數(shù)據(jù) 新藥篩選減少2/3的時間
在李游的工作電腦上,滿屏都是符號與數(shù)據(jù),讓人有一種看“天書”的茫然,更別說將其運用到新藥篩選上來。但在李游眼里,這些“天書”是世界上最美妙的語言之一。
“我本科是動物醫(yī)學,但因為不喜歡做生物實驗擺弄瓶瓶罐罐,所以后來碩博都選了生物信息專業(yè)。”博士畢業(yè)后,李游來到成都先導,成為“干實驗室”中的一員。在成都先導任職一年多來,前前后后參與新藥篩選也有20多個項目了,“目前針對所有內(nèi)部和客戶的新藥篩選項目,每周至少需處理兩張測序芯片約幾十億條DNA數(shù)據(jù)。”李游介紹,經(jīng)過數(shù)據(jù)分析,再由實驗室進行化合物合成、活性驗證等幾個步驟,整個新藥篩選過程才算完成。
“傳統(tǒng)的化合物庫合成與篩選需要9到18個月左右,但有了‘干實驗室’以后,只需要3到6個月時間,減少了約2/3的時間。”成都先導研發(fā)中心化學總監(jiān)劉觀賽說,藥物研發(fā)速度慢,失敗率高,一直是全世界藥物研發(fā)企業(yè)希望解決的問題,而通過大數(shù)據(jù)和人工智能,讓數(shù)據(jù)的計算模擬新藥篩選、藥品研發(fā)過程,預(yù)測藥品的效果,可以極大避免代價高昂的臨床試驗失敗。在劉觀賽看來,人工智能應(yīng)用與生物醫(yī)藥,將為制藥業(yè)甚至整個社會帶來翻天覆地的變化,在新藥研發(fā)領(lǐng)域大放異彩,為患者帶來更多治愈疾病的好藥。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com