1、第壹代測序
1.1Sanger測序采用的是直接測序法
1977年,FrederickSanger等發明了雙脫氧鏈末端終止法,這壹技術隨後成為最為常用的基因測序技術。2001年,AllanMaxam和WalterGibert發明了Sanger測序法,並在此後的10年裏成為基因檢測的金標準。其基本原理即雙脫氧核苷三磷酸(dideoxyribonucleosidetriphosphate,ddNTP)缺乏PCR延伸所需的3'-OH,因此每當DNA鏈加入分子ddNTP,延伸便終止。每壹次DNA測序是由4個獨立的反應組成,將模板、引物和4種含有不同的放射性同位素標記的核苷酸的ddNTP分別與DNA聚合酶混合形成長短不壹的片段,大量起始點相同、終止點不同的DNA片段存在於反應體系中,具有單個堿基差別的DNA序列可以被聚丙烯酰胺變性凝膠電泳分離出來,得到放射性同位素自顯影條帶。依據電泳條帶讀取DNA雙鏈的堿基序列。
人類基因組的測序正是基於該技術完成的。Sanger測序這種直接測序方法具有高度的準確性和簡單、快捷等特點。目前,依然對於壹些臨床上小樣本遺傳疾病基因的鑒定具有很高的實用價值。例如,臨床上采用Sanger直接測序FGFR2基因證實單基因Apert綜合征和直接測序TCOF1基因可以檢出多達90%的與TreacherCollins綜合征相關的突變。值得註意的是,Sanger測序是針對已知致病基因的突變位點設計引物,進行PCR直接擴增測序。單個突變點的擴增包括該位點在內的外顯子片段即可,不必將該點所在基因的全部外顯子都擴增。
因此,應明確定位要擴增的位點所在的基因外顯子和該點的具體位置,設計包括該點在內的上下遊150~200bp的外顯子片段引物。此外,盡管有NGS的出現,但Sanger測序對於有致病基因位點明確並且數量有限的單基因遺傳疾病的致病基因的檢測是非常經濟和高效的。到目前為止,Sanger測序仍然是作為基因檢測的金標準,也是NGS基因檢測後進行家系內和正常對照組驗證的主要手段。
值得註意的是,Sanger測序目的是尋找與疾病有關的特定的基因突變。對於沒有明確候選基因或候選基因數量較多的大樣本病例篩查是難以完成的,此類測序研究還要依靠具有高通量測序能力的NGS。雖然Sanger測序具有高度的分析準確性,但其準確性還取決於測序儀器以及測序條件的設定。另外,Sanger測序不能檢測出大片段缺失或拷貝數變異等基因突變的類型,因此對於壹些與此相關的遺傳性疾病還不能做出基因學診斷。
1.2連鎖分析采用的是間接測序法
在NGS出現之前,國際通用的疾病基因定位克隆策略是建立在大規模全基因掃描和連鎖分析基礎上的位置候選基因克隆。人類的染色體成對出現,壹條來自父親,壹條來自母親,每壹對染色體在同樣的位置上擁有相同的基因,但是其序列並不完全相同,被稱為父系和母系等位基因。
遺傳標記是指在人群中表現出多態現象的DNA序列,可追蹤染色體、染色體某壹節段或某個基因座在家系中傳遞的任何壹種遺傳特性。它存在於每壹個人,但大小和序列有差別,具有可遺傳性和可識別性。目前采用第二代遺傳標記,即重復序列多態性,特別是短串聯重復序列,又稱微衛星標記。
連鎖分析是以連鎖這種遺傳現象為基礎,研究致病基因與遺傳性標記之間關系的方法。如果控制某壹表型性狀的基因附近存在遺傳標記,那麽利用某個遺傳標記與某個擬定位的基因之間是否存在連鎖關系,以及連鎖的緊密程度就能將該基因定位到染色體某壹位置上。1986年Morton等提出優勢對數記分法(logoddsscoremethod,LOD),主要檢測兩基因以某壹重組率連鎖時的似然性。LOD值為正,支持連鎖;LOD值為負,則否定連鎖。通過計算家系中的微衛星標記與致病位點之間的LOD值,可以初步估算二者間的遺傳距離及連鎖程度,從而確定該基因在染色體上的粗略位置。然後利用該區域的染色體基因圖譜,分析定位區域內所有基因的功能與表達,選擇合適的候選基因進行突變檢測,最終將致病基因定位或克隆。
然而,采用連鎖分析進行基因檢測存在很大的局限性。不但所需遺傳樣本量較大,壹般要求提供三代及以上遺傳家系患者血樣,而且數據量大、處理復雜、產出速度較慢、定位不夠精確(壹般只能定位在染色體某壹區間),這就使得研究工作繁重和定位基因的時間周期特別長。目前,連鎖分析采用的單核苷酸多肽性和短串聯重復序列還在使用,但經典的間接測序方法,如單鏈構象多肽性、變性梯度凝膠電泳和異源雙鏈分析在美國已被淘汰,而在發展中國家作為研究手段還在有限使用。
2、新壹代測序(NGS)
主要包括全基因組重測序(whole-genomesequencing,WGS)、全外顯子組測序(whole-exomesequencing,WES)和目標區域測序(Targetedregionssequencing,TRS),它們同屬於新壹代測序技術。總體而言,NGS技術具有通量大、時間短、精確度高和信息量豐富等優點,使得遺傳學者可以在短時間內對感興趣的基因進行精確定位。但這些不同的測序技術在測序範圍、數據分析量以及測序費用和時間等方面又有很大差別,如果選擇適合的方法,對於臨床診斷和科學研究將起到事半功倍的作用。
2.1目標區域測序目前常用的是基因芯片技術
其測序原理是基於DNA雜交原理,利用目標基因組區域定制的探針與基因組DNA進行芯片雜交或溶液雜交,將目標基因區域DNA富集,再通過NGS技術進行測序。其測序過程是通過把數以萬計的cDNA或寡聚核苷酸置於芯片上制成列陣,將芯片上固定好的已知序列的核苷酸探針與溶液中含有熒光標記的相應核酸序列進行互補配對,根據測序儀所顯示強熒光的位置和強度,獲取每組點陣列信息,再利用生物信息學算法確定目的靶核苷酸的序列組成。測序所選定的目標區域可以是連續的DNA序列,也可以是分布在同壹個染色體不同區域或不同染色體上的片段。目標區域測序技術,對於以往通過連鎖分析將基因突變鎖定在染色體某壹片段區域內,但無法找出突變是壹個非常好的進壹步檢測手段。2010年,Nicholas等使用基因分型芯片聯合連鎖分析技術,成功發現頭小畸形的新基因WDR62,文章發表在《NatGenet》雜誌。類似的研究在家族性胰腺癌中確定8個候選變異位點和在家族性滲出性玻璃體視網膜病變發現易感基因TSPAN12。
基因芯片測序技術可以將經過連鎖分析鎖定了目標範圍或經過全基因組篩選的特定基因或區域進行更深壹層的研究,是解決連鎖分析無法發現致病基因的有效手段。基因芯片技術對於已知基因突變的篩查具有明顯優勢,可以快速、全面地檢測出目標基因突變。同時,由於目標區域受到了限制,測序範圍大幅度減少,測序時間和費用相應降低。但基因芯片檢測所需要的DNA的量要大,由於已提取的DNA存在降解的風險,用於基因芯片研究的血標本最好是冰凍的全血,這樣可以使用於檢測DNA的量有充分保證。
2.2全外顯子組測序(WES)
外顯子組是單個個體的基因組DNA上所有蛋白質編碼序列的總合。人類外顯子組序列約占人類全部基因組序列的1%,但大約包含85%的致病突變。WES是利用序列捕獲技術將全外顯子區域DNA捕捉並富集後進行高通量測序的基因分析方法。采用的技術平臺主要是羅氏公司的SeqCapEZ全外顯子捕獲系統,Illumina公司的Solexa技術和Agilent公司的SureSelect外顯子靶向序列富集系統。其捕獲的目標區在34~62M之間,不僅包括編碼區同時也加入了部分非編碼區。NGS的測序過程主要包括DNA測序文庫的制備、錨定橋接、PCR擴增、單堿基延伸測序和數據分析。研究者根據測序儀捕獲到在測序過程中摻入有不同熒光標記堿基片段,經計算機將熒光信號轉化成不同顏色的測序峰圖和堿基序列。基因測序結果與NCBI的SNP數據庫、千人基因組數據庫等國際權威數據庫比對,最終確定是否為突變基因。
自NGS技術問世以來,利用WES在臨床疾病致病基因的鑒定研究中取得前所未有的成果。這些成果不僅集中在單基因遺傳疾病,還在多基因影響的復雜疾病中獲得大量相關基因的發現。在單基因遺傳性疾病中,如視網膜色素變性、終端骨發育不良等發現新基因或已知基因新突變。在壹些罕見的疾病中,如Kabuki綜合征、家族性混合型低脂血癥和脊髓小腦***濟失調癥等疾病中發現新的致病基因。同時,在小細胞肺癌、慢性淋巴細胞性白血病等腫瘤研究和諸如肥胖癥、腦皮質發育不良等復雜疾病的研究中也取得豐碩成果。
WES技術在篩查範圍和檢出率等方面較其他測序技術具有明顯的優勢。例如,對於采用Sanger測序和基因芯片測序不能篩查出基因的樣本,可以采用WES來進壹步基因篩查鑒定。應用WES技術能夠獲得較傳統Sanger等方法對編碼區測序更深的覆蓋度和更準確的數據。由於信息量的大幅度增加,WES可以獲得更多個體的編碼區信息,因此成為檢測致病基因和易感基因位點的有效手段。與連鎖分析定位方法比較,WES對家系的要求並不十分嚴格,在單基因遺傳病同壹家系中有2~3個患者和1個正常人即可進行致病基因的鑒定研究,而不需要連續三代的遺傳家系。由於不需要嚴格的三代以上的遺傳家系,WES使以前不能進行研究的家系成為可能。不僅對於單基因遺傳病是壹個很好的研究手段,對於許多常見病,如腫瘤、糖尿病等疾病也可進行大規模比較研究。
2.3全基因組重測序(WGS)
WGS是對已知基因組序列的物種進行不同個體的全基因組的測序,經過數據分析後對序列進行拼接、組裝並獲得基因組圖譜,或是對不同組織進行測序並分析體細胞突變的壹種研究方法。盡管WES可以快速全面地找出個體基因組上的所有突變,從而找到個體間的差異,但對於外顯子以外的區域則不能有效地進行基因檢測。對於此種情況,目前還要借助WGS進行全基因組檢測。但由於人類基因組過於龐大,壹次單端全基因組測序很難達到所需要的測序深度。因此,需要重復測序或雙端測序,由此帶來測序成本的大幅度提高和由於不能達到足夠的測序深度所導致的結果準確性的降低。而對於臨床疾病診斷和普通科研工作,其高昂的檢測費用也是難以承受的。盡管如此,對於部分臨床研究和WES不能解決的科研課題還需要借助WGS進行更加全面的基因檢測。
3、展望
NGS的出現為新興的基因組技術增添了無限的活力和想象空間。特別是基因芯片的問世和已在臨床上應用於大樣本的疾病篩查和基因診斷中所展現出的活力,以及其商業化發展的模式都令人鼓舞。在眼科是單基因病最常見的學科,利用芯片技術進行Laber病的篩查已使很多病因不清楚的視神經萎縮得到明確診斷。而原發性開角型青光眼是眼科最具隱蔽性和危險性的致盲性眼病,其致病基因或突變的鑒定研究對疾病篩查將有著非常重要的臨床價值和巨大的商業價值。在新生兒糖尿病的篩查中采用基因芯片技術可以更加快速、全面經濟,避免第壹代測序過於繁瑣和漏檢。
基因芯片技術在產前診斷中更加具有發展前景。只要對孕婦進行DNA血液檢查即可進行遺傳疾病的篩查,避免以往通過羊膜穿刺抽取羊水進行有創檢查的局限性和危險性。目前,基因檢測技術水平的提升和檢測費用的不斷降低,發展大規模個體化基因檢測在不久的將來成為可能。同時,藥物易感性基因和疾病發生的易感基因的檢測的深入開展,個體化醫療將在基因檢測的基礎上得以實現。有理由相信,隨著人們生活水平的不斷提高和健康意識不斷增強,基因檢測在未來醫學發展中應用前景將十分可觀。