自20世紀70年代以來,隨著多學科的滲透和實驗方法的快速發展,基因的概念得到了突飛猛進的發展。大量的成果無疑為基因的概念註入了新鮮的科學內容,幫助人們揭開層層面紗,更全面地了解基因的真實面目。隨著時代的發展和科學的進步,基因概念的深入發展必將對人類文明的進步產生強大的推動作用。
(壹)基因的概念
1865年,孟德爾報道了分離現象和性狀遺傳的自由組合規律。為了解釋這些遺傳現象,人們提出了決定性狀遺傳的遺傳因素理論。1910年後,Morgan等人發現了性連鎖遺傳和連鎖現象,首次證明了基因在染色體上呈線性排列,它們之間存在連鎖遺傳的傾向,而不同染色體之間的基因遺傳遵循孟德爾定律。可見,摩爾根的基因理論豐富和發展了孟德爾的遺傳因素理論。
基因是遺傳學最基本的概念,最早由遺傳學家W.L.Johannsen於1909年提出。用來表示遺傳的獨立單位,相當於孟德爾在豌豆實驗中提出的遺傳因子,壹般指控制生物性狀並按孟德爾定律傳遞的遺傳因子。隨著生命科學研究的深入,基因的概念也在不斷修正和發展。20世紀50年代以後,隨著分子遺傳學的發展,Watson和Crick在1953提出DNA的雙螺旋機制後,人們普遍認為基因是DNA的片段,揭示了基因的化學本質,於是基因被定義為“具有特定遺傳效應的DNA片段”。20世紀60年代,S. Benzer (1921 ~)提出基因具有壹定的內部結構,可以分為三個不同的單位:突變體、轉座子和順反式。
(二)人類基因組計劃的完成豐富了基因概念的內涵。
人類基因組的完成極大地豐富了現代基因概念的內涵。基因的定義不再局限於編碼蛋白質的DNA序列的概念,因為通過最近的研究發現,編碼蛋白質的DNA序列在整個基因組序列中所占的比例非常小,而在人類中,蛋白質編碼序列占整個基因組序列的3%~5%。與此同時,越來越多的證據表明,許多RNA基因具有明確的生理功能,但它們不編碼任何蛋白質。它們僅以RNA的形式發揮作用,這些非編碼RNA的數量似乎與物種的責任有關,如rRNA和tRNA。此外,還有壹類基因,如操縱基因,既沒有轉錄產物,也沒有翻譯產物,只有控制和操縱活動。特殊基因的簡單重復序列,不編碼蛋白質,在真核生物生物鐘中大量存在,甚至占到整個基因組的55%以上。這些重復堿基片段的功能目前還不太清楚,可能與某些基因活性的調節和染色體的穩定性有關。因此,基因應被視為對DNA分子具有特定功能(或壹定遺傳效應)的核苷酸序列,而不僅僅是編碼蛋白質的DNA序列。
(C)蛋白質組學研究擴展了基因的概念。
同時,20世紀初(21),蛋白質組學的深入研究使人們重新考慮基因的概念。組成蛋白質的氨基酸有20種,遠遠多於組成脫氧核糖核酸的四種時鐘堿基。蛋白質是多種多樣的,幾乎執行生物體的所有功能。因此,幾十年來,人們壹直認為蛋白質不僅參與生物組織和器官的組成,還可以作為壹種酶來催化和調節生物的各種代謝活動,它可以與特定的DNA或RNA序列結合,調節基因表達,維持有序的生命活動。在測定人類甘油的27000個基因的同時,發現人類大約有65438+萬個蛋白質,顯示了蛋白質水平上基因表達的多樣性。另外,通過基因組比對,發現人類基因只有27000個左右,和其他脊椎動物差不多,遠遠少於人們的估計。雖然由於mRNA的選擇性剪接增加了蛋白質種類,但不同物種的編碼蛋白質相當保守,不足以從蛋白質水平表達物種的復雜性和個體的差異。例如,約99%的人類蛋白質可以在小鼠體內找到其類似物,甚至許多人類蛋白質在結構和功能上與壹些無脊椎動物相似;人類基因組序列在個體水平上有600個堿基差異(0.1%),而編碼蛋白質的基因只有20000個突變,其中大部分是無效突變,不影響蛋白質的氨基酸序列。科學家還發現,就連基因的表達也是時空特異性的。在基因的DNA序列沒有被翻遍的情況下,基因功能發生了遺傳變化,最終導致了表型的變化。比如基因沈默、X染色體劑量補償、DNA甲基化、基因組印記等表觀遺傳現象。不符合孟德爾的核遺傳遺傳規律,但這些特性使核生物在保持遺傳穩定性的同時更好地適應環境。
基因組學的上述進展表明,基因組DNA序列只是表面上的信息模板,如何從中讀出豐富多彩的信息,是生命科學急需研究的新課題。因此,基因可以定義為“既是遺傳的基本動能單位,又是儲存和處理遺傳信息的單位”。在21世紀,基因概念的外延將可能隨著表觀遺傳學的發展而進壹步擴大,其內涵將隨著納米生物學和量子生物學的發展而在量子水平上得到豐富和完善,人們將能夠更加準確和全面地揭示生物遺傳變異的本質規律。