壹條染色體上有很多基因,減數分裂時同源染色體是分開的。理想情況下,壹條染色體上的基因應該壹起分配給配子,但事實並非如此。因為在第壹次減數分裂前期,染色單體斷裂,DNA片段互換,所以發生了部分染色體連鎖。在測序發明之前,基因連鎖或部分連鎖是通過表型觀察來確定的。
對於部分連鎖,人們在早期通過表型發現不同基因之間連鎖的頻率不同。因此,摩爾根的學生亞瑟·斯特蒂文特假設特定位點的染色單體交換是壹個隨機事件,壹對並列染色單體在任意位置交換的概率是相同的。基於以上假設,相鄰的兩個基因因交換而分離的概率會低於相距較遠的兩個基因(因為相鄰的基因即使交換也更傾向於在壹起)。此外,由於交換而導致的基因間連鎖丟失的概率與它們在染色體上的距離成正比。因此,重組頻率可以用來衡量兩個基因之間的距離。通過計算不同基因對之間的重組頻率,可以構建壹個顯示基因在染色體上相對位置的圖譜(遺傳圖譜)。
基因圖譜的缺陷:基因圖譜的分辨率取決於獲得的交換次數。對於人類和大多數其他高等真核生物來說,由於基因研究,不可能獲得數量巨大的後代。基因圖譜的準確性是有限的。斯特蒂文特假說認為交換隨機發生在染色單體上,但由於重組熱點的存在,這壹假說並不完全正確。為了獲得更精確的基因組圖譜,發明了物理圖譜的繪制方法。最重要的是限制性作圖、熒光原位雜交(fish)和序列標簽位點作圖(STS)。
這種方法的基本思想是比較兩種識別不同靶序列的限制性內切酶切割壹個DNA分子所產生的片段大小,切割產物可以通過電泳檢測出來(圖1)。對於序列無法確定的片段,可以通過部分限制產生壹組部分消化的產物,從而分析片段的可能序列。還有壹種改進的方法(圖2),即在部分消化前,在待分析的DNA分子兩端加入放射性或其他類型的標記物,這樣在熒光的引導下分選出可見的限制性片段,簡化了部分限制性的篩選過程。
限制性圖譜的規模受到限制性片段大小的限制。由於DNA序列中限制性位點眾多且密集,消化產物在瓊脂糖凝膠中重疊或分散。所以限制性作圖最適合小分子。當然,妳也可以依靠壹些“稀有酶”進行切割,得到數量更少的片段。例如,它可以特異性識別7或8個核苷酸的Sap I和Sgf I。對於GC含量為50%的DNA分子,這些7-核苷酸酶平均每4 ^ 7 = 4^7=16384bp有壹個切點。除了“稀有酶”之外,還有壹些人類基因組中很少發現的特定序列,利用這類序列對應的限制性內切酶進行切割,可以得到類似的結果。
由於使用“稀有酶”制作長序列片段,普通電泳無法勝任其分離,因為長片段容易纏結,分子間相互作用更頻繁。因此,需要用更復雜的電場代替普通的線性電場。比如正交電場凝膠電泳(of age)等等。
除了電泳,其他方法也可用於繪制DNA分子的限制性位點。限制性位點可以通過在顯微鏡下直接觀察來檢測。這種技術被稱為光學繪圖,兩種常用的方法是凝膠拉伸和分子梳理(圖3)。將制備的DNA纖維用熒光染料染色,然後用限制性內切酶切割,並通過熒光顯微鏡觀察切口的相對位置。
與光學作圖類似,FISH可以直接顯示染色體或拉伸的DNA分子上標記序列的位置。在魚類中,標記是DNA序列,通過與熒光探針雜交來顯示。使用這種方法時,需要打開維持染色體DNA雙螺旋結構的堿基配對,使其形成單鏈分子(即DNA“變性”),只有這樣才能形成雜交。使染色體DNA變性而不破壞其形態的標準方法是在載玻片上幹燥染色體,然後用甲酰胺處理。
如果探針是壹個長的DNA片段,可能會有壹些重復的DNA序列(DNA序列中間隔的串聯或非串聯重復片段),因此探針可能會與染色體上的多個位點雜交,而不僅僅是在它精確匹配的特定位點。為了減少這種非特異性雜交,在使用前,探針應該與來自被研究組織的未標記DNA混合,因此加入富含重復序列的片段,以鎖定探針中的重復序列。這樣,原位雜交反應完全由單壹序列驅動。
壹次FISH實驗只能獲得三四個標記位點,數據積累緩慢耗時。因此,需要更高效的技術來使詳細的物理地圖成為現實。目前最有效的作圖技術是STS作圖,它也能產生最詳細的大基因組圖譜。序列標記(STS)是壹種短的DNA序列,通常為100-500bp,易於識別,在待研究的染色體中只出現壹次。為了完成壹組STS圖譜,需要從單個染色體或完整的染色體或基因組中收集重疊的DNA片段。
其基本原理如下圖所示(圖5)。在收集繪圖所需的數據時,有必要排列每個STS,以了解哪些段包含哪些STS。這些可以通過雜交分析來完成,但通常使用PCR,因為PCR更快。具體方法是隨機中斷研究中使用的DNA(中斷需要6組壹致的DNA片段),然後用單個STS依次檢測其所在的DNA片段,其中STS是人工合成的,帶有熒光標記,通過PCR在含有STS對的片段上延伸。如果兩個ST足夠近,它們出現在同壹片段的概率會更大,用熒光顯微鏡可以在多個片段上觀察到兩個間隔相同的標記。反之,兩個標記之間的距離越遠,處於同壹線段的概率越小。其實類似於連鎖分析的方式,STS圖譜距離是根據分離頻率來計算的,而不是觀察到的圖像距離,因為對於距離較近的標記來說,通過有無信號來判斷頻率比通過距離觀察更容易、更準確。以此為基礎,完成了以STS為物理符號的物理地圖。
以上過程有兩個問題需要補充。
首先是關於STS的選擇。任何獨特的DNA序列都可以用作STS,但必須滿足兩個條件。首先,必須知道它的序列,這樣才能通過PCR檢測出STS是否存在於不同的DNA片段中。其次,STS必須在要研究的染色體上有壹個獨特的位置。如果是多個副本,將無法準確獲得標記之間的物理距離。
第二個是關於STS作圖的DNA片段。壹個來源是上面提到的隨機中斷構建的庫。目前中斷整個DNA的方法有兩種:超聲波中斷和酶中斷。超聲波中斷常用的儀器是Covaris系列,酶中斷可以是分段酶。這種隨機中斷的序列片段具有重疊區域,因此可以形成克隆重疊群,從而具備構建克隆文庫的條件。通過將隨機片段克隆到合適的載體中,得到多個克隆文庫的集合(最初有幾組DNA)。另壹方面,如果妳有壹個目標DNA的克隆文庫,它們也可以用於STS分析以及支持測序。第二個來源是輻射雜種,這是壹種含有其他生物染色體片段的嚙齒動物細胞。這項技術最早開發於20世紀70年代,當時人們發現將人體細胞暴露在3000-8000拉德的X射線下會隨機將染色體斷裂成片段,輻射劑量越大,片段就會越小。這種處理對人類細胞是致命的,但如果瘦果受輻射的細胞與未受輻射的倉鼠細胞或其他嚙齒動物細胞融合,染色體片段可以傳遞給後者。化學試劑(如聚乙二醇)或暴露於仙臺病毒可用於促進兩種細胞的融合。該方法為STS作圖提供了所需的DNA片段,在人類基因組計劃的作圖階段發揮了重要作用。但是主題似乎集中在動物上。
總之,繪制基因組圖譜的方式有很多種,可以說每種圖譜所能反映的DNA信息都是不同的,都有其獨特性。比如STS圖譜是最準確的,但它可能不包括所有的限制性位點,它定位的DNA片段沒有靶向性,而限制性圖譜雖然很難標定大的序列片段,但可以準確標定有用的限制性位點。而且熒光原位雜交得到的圖譜比STS圖譜更直觀,更有針對性,操作也不復雜。與物理圖譜相比,基因圖譜出現的更早,精度和分辨率也不高,但其作圖思路為STS作圖提供了壹種思路,即統計頻率,憑借表型或信號作圖。
基因組圖譜有什麽用?這壹點恐怕在上述技術發明之初並不清楚。然而,隨著DNA測序的引入和不再遙不可及的概念,人們意識到基因組圖譜可以為測序提供壹個框架。這是因為高等真核生物的整個基因組中往往存在大量的重復區域,重疊區域的簡單拼接會導致這些區域的錯位。因此,覆蓋整個基因組的各種標記,如基因、限制性位點、STS位點等,都可以在預先繪制的圖譜中找到並修正,基因組圖譜可以為後續的基因組拼接和組裝提供極大的便利。此外,測序結果與基因組圖譜相結合,可以在DNA序列中定位基因等有意義的特征,從而開展後續的限制性酶切、功能分析、基因診斷等研究。只有前期積累不同序列位點的研究成果,測序技術發展後獲得不同類群模式物種和近緣物種的全基因組序列,才能掌握大量關於基因組和轉錄組的信息。
既然基因組作圖可以為檢測序列的拼接和組裝提供參考,那麽作圖是測序的必要前提嗎?這個問題更新到測序相關章節再回答比較合適。但就目前所知,細菌等小基因組的測序完全可以通過鳥槍法拼接,無需圖譜修正。
T.A .布朗基因組3[M]。第壹版。北京:科學出版社,2009。
田豫。基於單拷貝序列的桑樹染色體熒光原位雜交分析[D].西南大學,2021。DOI:10.27684/d . CNKI . gxndx . 20438+0.005438+023。