導(dǎo)語(yǔ)
目前,各種測(cè)序技術(shù)已經(jīng)成為了藥物研發(fā)過(guò)程中的得力工具。單細(xì)胞轉(zhuǎn)錄組測(cè)序(single-cell RNA sequencing,scRNA-seq),簡(jiǎn)單從字面理解,就是一種在單細(xì)胞水平上對(duì)轉(zhuǎn)錄組進(jìn)行測(cè)序分析的技術(shù)。目前,這項(xiàng)技術(shù)已經(jīng)得到了廣泛地應(yīng)用,并在應(yīng)用中不斷地快速發(fā)展,成為我們研究細(xì)胞類(lèi)別、疾病發(fā)生過(guò)程等問(wèn)題的有力工具。
PART. 01
為什么要用scRNA-seq?
傳統(tǒng)的批量測(cè)序(bulk RNA sequencing)有一個(gè)繞不過(guò)的難題:細(xì)胞的異質(zhì)性。
眾所周知,對(duì)于多細(xì)胞生物來(lái)說(shuō),盡管由同一個(gè)受精卵發(fā)育而來(lái),但不同細(xì)胞之間的基因表達(dá)必然是有差異的,這些差異導(dǎo)致了細(xì)胞的分化,使不同的細(xì)胞承擔(dān)不同的生理功能。粗糙地看,不同器官、組織的細(xì)胞組成不同,但使分析變得棘手的問(wèn)題在于,即使是在形態(tài)上無(wú)法區(qū)分的細(xì)胞之間基因表達(dá)水平和對(duì)刺激的反應(yīng)方面也存在很大的異質(zhì)性,這種異質(zhì)性在組織生物學(xué)和疾病的發(fā)展中起著重要作用,例如病原體細(xì)胞或癌細(xì)胞之間的表達(dá)異質(zhì)性可能與人類(lèi)疾病有關(guān),在進(jìn)行藥物研發(fā)時(shí),細(xì)胞的異質(zhì)性也往往造成靶點(diǎn)難尋、耐藥性等問(wèn)題。
圖1. 腫瘤異質(zhì)性(Nature 2013 Vol. 501 Issue 7467 Pages 338-345)
在使用多細(xì)胞水平的分析時(shí),每個(gè)細(xì)胞的異質(zhì)信息很容易被掩蓋在多個(gè)細(xì)胞的平均信息中。比如大家非常熟悉的Western blot。當(dāng)我們使用Western blot檢測(cè)蛋白質(zhì)的含量時(shí),我們無(wú)法區(qū)分目標(biāo)蛋白是在10%的細(xì)胞中強(qiáng)表達(dá),還是在50%的細(xì)胞里中等表達(dá),還是在所有細(xì)胞中弱表達(dá)。但如果使用流式細(xì)胞術(shù),我們就可以清晰地區(qū)分上述情況。
圖2. Western blot VS 流式細(xì)胞術(shù)(https://zhuanlan.zhihu.com/p/28844468)
單細(xì)胞轉(zhuǎn)錄組測(cè)序也是一樣的道理。當(dāng)使用bulk RNA-seq時(shí),每個(gè)細(xì)胞的轉(zhuǎn)錄組差異同樣會(huì)被多個(gè)細(xì)胞的平均信息所掩蓋,而如果在單細(xì)胞水平對(duì)每個(gè)細(xì)胞進(jìn)行分析,我們就可以得到異質(zhì)性信息,進(jìn)而可以對(duì)細(xì)胞進(jìn)行更準(zhǔn)確地分群、發(fā)現(xiàn)新的細(xì)胞種類(lèi)、研究隨機(jī)基因的表達(dá),以及對(duì)細(xì)胞譜系路徑進(jìn)行探索。為藥物研發(fā)提供更準(zhǔn)確的信息,開(kāi)辟新的路徑,實(shí)現(xiàn)真正的“對(duì)癥下藥”。
圖3. 單細(xì)胞測(cè)量保存了大量基因組分析丟失的關(guān)鍵信息(Genome Research 2015 Vol. 25 Issue 10 Pages 1491-1498)
自從2009年由湯富酬等人開(kāi)發(fā)出第一種單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù),到今天已經(jīng)有幾十種不同的單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)被開(kāi)發(fā)出來(lái),它們各自有不同的優(yōu)勢(shì)與缺點(diǎn),我們可以在了解不同技術(shù)的優(yōu)缺點(diǎn)之后,選擇最適合自己的研究的技術(shù)。
圖4. scRNA-seq發(fā)展史
圖5. 部分常用的scRNA-seq(Chen, G., et al. (2019). "Single-Cell RNA-Seq Technologies and Related Computational Data Analysis." Frontiers in Genetics 10(317).)
PART. 02
單細(xì)胞RNA測(cè)序技術(shù)原理
單細(xì)胞測(cè)序基本流程通常分為以下幾個(gè)部分:?jiǎn)渭?xì)胞分離、基因擴(kuò)增、構(gòu)建信息庫(kù)、高通量測(cè)序、數(shù)據(jù)分析。單細(xì)胞分離技術(shù)分類(lèi)眾多,單細(xì)胞分離溶解后獲得pg級(jí)的核酸,通過(guò)擴(kuò)增至ng或μg級(jí),然后用于后續(xù)的測(cè)序。目前常用單細(xì)胞分離方法有有限稀釋法、顯微操作(手工細(xì)胞采集)、激光捕獲顯微切割、熒光活化細(xì)胞分選、磁活化細(xì)胞分選、微流體技術(shù)等。
圖6. 單細(xì)胞測(cè)序流程 (李勃,朵泓睿.單細(xì)胞RNA測(cè)序數(shù)據(jù)分析方法研究進(jìn)展[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,38(05):129-135+142.)
目前單細(xì)胞RNA測(cè)序常用技術(shù)有Tang RNA-seq、Smart-seq、Smart-seq 2、CEL-seq、Quartz-seq、STRT-seq、Drop-seq等,而利用這些技術(shù)構(gòu)建的被大規(guī)模使用的測(cè)序平臺(tái)有10xGenomics平臺(tái)、Illumina®Bio-Rad® 平臺(tái)、BD Rhapsody™ 平臺(tái)、ICELL8 平臺(tái)和C1™ 單細(xì)胞全自動(dòng)制備系統(tǒng)等等。接下來(lái)以10xGenomics平臺(tái)為代表具體介紹單細(xì)胞RNA測(cè)序過(guò)程中基因擴(kuò)增與信息庫(kù)構(gòu)建的具體過(guò)程。
10xGenomics
10×Genomics平臺(tái)基于微滴的核酸條形碼分配系統(tǒng),該系統(tǒng)提供了數(shù)以百萬(wàn)計(jì)級(jí)的攜帶唯一DNA條形碼的微滴,通過(guò)微流控技術(shù),首先將帶有條形碼和引物的凝膠珠與單個(gè)細(xì)胞包裹在油滴(GEMs)中。凝膠珠溶解,細(xì)胞裂解釋放mRNA,通過(guò)逆轉(zhuǎn)錄產(chǎn)生用于測(cè)序的帶條形碼和UMI信息的cDNA。液滴油層破碎,cDNA擴(kuò)增,制備cDNA文庫(kù),然后使用Illumina測(cè)序平臺(tái)對(duì)文庫(kù)進(jìn)行測(cè)序檢測(cè),即可獲得大量單細(xì)胞的基因表達(dá)和免疫組庫(kù)數(shù)據(jù)。
圖7. 10xGenomics平臺(tái)流程圖 (https://zhuanlan.zhihu.com/p/269461589)
10xGenomics技術(shù)的核心是油滴包裹的凝膠珠(GEMs)。GEM(10X Genomics Gel in Emulsion)是一個(gè)由 mRNA、磁珠、乳液組成的液滴狀反應(yīng)系統(tǒng),后續(xù)的細(xì)胞分選、反轉(zhuǎn)錄的反應(yīng)都是在這個(gè)液滴反應(yīng)系統(tǒng)中進(jìn)行。GEMs 的結(jié)構(gòu)確保了>90% 的油滴內(nèi)反應(yīng)產(chǎn)物都可以順利用唯一的 barcode 分子標(biāo)記。Gel bead由凝膠珠和磁珠上的一段引物構(gòu)成。Gel bead上連接的引物序列包含四個(gè)部分:Illumina TruSeq Read 1測(cè)序引物、16 nt的條形碼(Barcode)、12 nt的UMI和30 nt的Poly(dT)反轉(zhuǎn)錄引物
圖8. GEM示意圖(左),Gel bead示意圖(右)
具體流程是先將樣本制備成單細(xì)胞懸浮液,細(xì)胞質(zhì)檢然后進(jìn)行細(xì)胞計(jì)數(shù)和細(xì)胞活性測(cè)定,最終使細(xì)胞活性高于90%,細(xì)胞濃度為700~1200個(gè)細(xì)胞/μL。
取75μL Master Mix+細(xì)胞懸浮液、40μL的含有barcode信息的凝膠珠和280μL的油滴分別加入到Chromium Chip B的不同小室,經(jīng)由微流體“雙十字”交叉系統(tǒng)形成油滴包裹的凝膠珠(Gel Bead-In- EMulsions,GEMs)。有效的GEMs包含凝膠珠、單細(xì)胞、Master Mix和油。
收集GEMs,并將其全部混合,凝膠珠在每個(gè)油滴內(nèi)自動(dòng)溶解釋放大量Barcode引物序列,細(xì)胞裂解釋放mRNA,mRNA與逆轉(zhuǎn)錄酶、凝膠珠上的poly dT反轉(zhuǎn)錄引物以及dNTP底物相接觸,在逆轉(zhuǎn)錄酶的作用下發(fā)生逆轉(zhuǎn)錄反應(yīng),產(chǎn)生用于測(cè)序的帶有Barcode和UMI信息的cDNA一鏈,再以SMART擴(kuò)增方法完成第二鏈合成。
cNDA片段化油滴破碎,磁珠純化cDNA一鏈,然后以cDNA為模板進(jìn)行PCR擴(kuò)增。
cDNA擴(kuò)增完成后,首先利用化學(xué)方法將cDNA打斷成200- 300bp左右的片段,通過(guò)末端修復(fù)、加A進(jìn)行cDNA片段篩選,P7 adaptor接頭連接Read2測(cè)序引物,并通過(guò)PCR擴(kuò)引入樣品Index,最后進(jìn)行片段篩選,從而構(gòu)建含有P5和P7接頭的cDNA文庫(kù)。
文庫(kù)完成以后,進(jìn)行庫(kù)檢,cDNA文庫(kù)庫(kù)檢合格后,直接在Illumina的測(cè)序儀上進(jìn)行測(cè)序。測(cè)序完成之后,進(jìn)行數(shù)據(jù)分析。
數(shù)據(jù)分析
單細(xì)胞RNA測(cè)序得到的數(shù)據(jù)通常從這幾個(gè)方面展開(kāi)進(jìn)行:1、序列比對(duì)和表達(dá)水平量化;2、數(shù)據(jù)預(yù)處理;3、數(shù)據(jù)標(biāo)準(zhǔn)化;4、高變異基因的選擇和降維分析;5、聚類(lèi)分析;6、細(xì)胞類(lèi)型注釋;7、差異表達(dá)的鑒定及富集分析;8、進(jìn)階分析:如細(xì)胞譜系追蹤、生物網(wǎng)絡(luò)構(gòu)建、空間轉(zhuǎn)錄組等。
圖9. scRNA-seq的數(shù)據(jù)分析(李勃,朵泓睿.單細(xì)胞RNA測(cè)序數(shù)據(jù)分析方法研究進(jìn)展[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,38(05):129-135+142.)
PART. 03
單細(xì)胞測(cè)序的優(yōu)缺點(diǎn)與
現(xiàn)在一些主流技術(shù)之對(duì)比
單細(xì)胞測(cè)序的第一個(gè)缺陷是樣本制備和建庫(kù)成本更高,數(shù)據(jù)量更大,更加復(fù)雜,需要更多時(shí)間、設(shè)備、容量來(lái)進(jìn)行該項(xiàng)工作。
單細(xì)胞測(cè)序第二個(gè)缺陷是跨細(xì)胞的生物學(xué)誤差,是因?yàn)闃悠芳?xì)胞之間存在一些生物學(xué)變異,主要包括:
1、轉(zhuǎn)錄脈沖,它指的是并不是所有基因的基因轉(zhuǎn)錄都處于啟動(dòng)階段,主要由捕獲時(shí)間來(lái)確定這些基因是打開(kāi)還是關(guān)閉狀態(tài);
2、然后是每條RNA加工速度都不相同;
3、環(huán)境刺激也會(huì)影響基因的表達(dá);
4、時(shí)序改變,指的是像細(xì)胞周期這樣的細(xì)胞時(shí)序變化過(guò)程,會(huì)影響單個(gè)細(xì)胞的基因表達(dá)譜。
單細(xì)胞測(cè)序的第三個(gè)缺陷是樣品之間的技術(shù)差異,主要包括:
1、細(xì)胞特異性捕獲效率不同,不同細(xì)胞捕獲轉(zhuǎn)錄本不同,導(dǎo)致測(cè)序深度不同;
2、文庫(kù)質(zhì)量:獲得的樣品中會(huì)存在降解的RNA、低存活力細(xì)胞、大量自由漂浮的RNA以及細(xì)胞定量不準(zhǔn)確,這些導(dǎo)致質(zhì)量指標(biāo)降低;
3、擴(kuò)增偏差:在文庫(kù)制備的擴(kuò)增步驟中,并非所有轉(zhuǎn)錄本都擴(kuò)增到相同水平;
4、批次效應(yīng):可以從圖中看到因?yàn)榕尾煌斐杉?xì)胞表達(dá)顯著性差異,這就要求在實(shí)驗(yàn)中最好在同一天、同一個(gè)人在同一個(gè)地點(diǎn)完成所有RNA分離及建庫(kù)工作來(lái)盡量避免批次效應(yīng)。
當(dāng)前單細(xì)胞測(cè)序用到的兩種主流技術(shù)主要為10x Genomics和smart-seq,他們有各自的優(yōu)缺點(diǎn)。
首先是smart-seq 的大致步驟:細(xì)胞制成單細(xì)胞懸液、帶poly(A)尾的RNA逆轉(zhuǎn)錄、模版轉(zhuǎn)換、cDNA的擴(kuò)增、cDNA片段化、加入文庫(kù)PCR引物進(jìn)行擴(kuò)增、測(cè)序。
它的優(yōu)點(diǎn)主要在于相對(duì)于截短的cDNAs,該技術(shù)所采用的M-MLV逆轉(zhuǎn)錄酶更傾向于選擇全長(zhǎng)cDNAs作為其末端轉(zhuǎn)移酶活性的底物。因此它的測(cè)序深度大大增加,基本每個(gè)轉(zhuǎn)錄本的所有外顯子都能被檢測(cè)到,這使它可以用于檢測(cè)可變剪接,還可以在轉(zhuǎn)錄本層面進(jìn)行全面的突變分析,擴(kuò)大了其應(yīng)用范圍。
此外它的優(yōu)點(diǎn)還包括:
1、進(jìn)行技術(shù)改進(jìn)后,Smart-seq2利用現(xiàn)成的試劑能生產(chǎn)更高質(zhì)量的文庫(kù),且成本也有所下降,為分析大量細(xì)胞提供了可能性。
2、Smart-seq2的方案組分和原理是公開(kāi)的,讓研究人員可以進(jìn)一步對(duì)其進(jìn)行改良,目前在這個(gè)方案基礎(chǔ)上涌現(xiàn)了許多單細(xì)胞測(cè)序的新成果。
它的缺陷是:建庫(kù)過(guò)程依賴于孔板,這使得它們難以達(dá)到很高的通量,smart-seq是基于96孔板的,那么同批次只能測(cè)96個(gè)細(xì)胞。
Microwell 通過(guò)縮小孔體積來(lái)增加細(xì)胞數(shù)量,但依然受到限制。
它的另一個(gè)缺陷是因?yàn)橐锏脑O(shè)計(jì),只能選擇性識(shí)別聚腺苷酸化的RNA,所以不能分析沒(méi)有poly(A)的RNA。
接下來(lái)是10x Genomics,它是依賴于液滴的,大致步驟就是通過(guò)微流控技術(shù)將單個(gè)細(xì)胞和一個(gè)捕獲RNA的微珠包裹在液滴中,微珠連接的捕獲mRNa上已經(jīng)預(yù)先包含UMI和細(xì)胞條形碼信息,讓每個(gè)液滴帶上獨(dú)特信息,在液滴中完成mRNA的富集后將微珠合并,完成測(cè)序。
它的優(yōu)點(diǎn)在于:
1、在該方法中,含有細(xì)胞的油滴占所有油滴比例大約5%,這樣能夠更好地保證了含細(xì)胞的液滴中只含有一個(gè)細(xì)胞。
2、每個(gè)液滴中均含有獨(dú)特的細(xì)胞條形碼和UMI,能夠區(qū)分單細(xì)胞。
3、而且它不受限于孔板,可以短時(shí)間內(nèi)同批次處理更多的細(xì)胞。
它的缺陷在于:
1、微珠對(duì)mRNA的捕獲效率有限,在獲得細(xì)胞數(shù)量的突破的同時(shí),能夠測(cè)得的細(xì)胞基因數(shù)較少,就是測(cè)序深度比較低。
2、而且該技術(shù)測(cè)序多為3‘端測(cè)序,測(cè)得的序列相同性很高,靈敏度和準(zhǔn)確度都不及全場(chǎng)測(cè)序。
PART. 04
結(jié)語(yǔ)
scRNA-seq為異質(zhì)性問(wèn)題的解決提供轉(zhuǎn)錄組水平的解決方法,自這項(xiàng)技術(shù)問(wèn)世以來(lái),它就在飛速發(fā)展的同時(shí)得到了廣泛的應(yīng)用,從基因表達(dá)到細(xì)胞分群,再到譜系分析,scRNA-seq將這些點(diǎn)連成線,為今天的藥物研發(fā)提供了更多的方向。scRNA-seq在今天大放異彩,在未來(lái)的表現(xiàn)也同樣令人期待。
關(guān)于筆者
尋藥真理團(tuán)
他們是南京大學(xué)新藥研發(fā)策略課程的學(xué)生,本篇為該課程中杜軼翔、徐倩、徐思瓊、李飛4名同學(xué)共同完成。
他們朝氣蓬勃、他們斗志昂揚(yáng),他們腳踏實(shí)地學(xué)習(xí)新藥研發(fā)知識(shí),他們堅(jiān)信吾愛(ài)吾師吾更愛(ài)真理。
他們是新一代醫(yī)藥行業(yè)接班人,他們是新藥研發(fā)領(lǐng)域的未來(lái)之光!
參考文獻(xiàn):
[1] Burrell, R. A., et al. (2013). "The causes and consequences of genetic heterogeneity in cancer evolution." Nature 501(7467): 338-345.
[2] Chen, G., et al. (2019). "Single-Cell RNA-Seq Technologies and Related Computational Data Analysis." Frontiers in Genetics 10(317).
[3] Potter, S. S. (2018). "Single-cell RNA sequencing for the study of development, physiology and disease." Nature Reviews Nephrology 14(8): 479-492.
[4] Picelli, S. (2017). "Single-cell RNA-sequencing: The future of genome biology is now." RNA Biology 14(5): 637-650.
[5] Trapnell, C. (2015). "Defining cell types and states with single-cell genomics." Genome Research 25(10): 1491-1498.
[6] 李勃,朵泓睿.單細(xì)胞RNA測(cè)序數(shù)據(jù)分析方法研究進(jìn)展[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,38(05):129-135+142.
[7] 王磊,楊春艷,李芳芳,穆登彩,沈昊,鄭尚永.單細(xì)胞測(cè)序技術(shù)的發(fā)展及應(yīng)用[J].基因組學(xué)與應(yīng)用生物學(xué),2020,39(11):5381-5388.DOI:10.13417/j.gab.039.005381.
[8] 王權(quán),王鑄,張振,李晨,張萌萌,葉穎江,王杉,姜可偉.單細(xì)胞測(cè)序的技術(shù)概述[J].中國(guó)醫(yī)藥導(dǎo)刊,2020,22(07):433-439.
[9] https://www.jianshu.com/p/e3e015a97812
[10] https://zhuanlan.zhihu.com/p/269461589
[11] https://zhuanlan.zhihu.com/p/28844468
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com