1.取樣策略 遺傳多樣性分析可以在基因型(如自交系、純系和無性繁殖系)、群體、種質材料和種等不同水平上進行,不同水平的遺傳多樣性分析取樣策略不同。這裏著重提到的是群體(雜合的地方品種也可看作群體),因為在壹個群體中的基因型可能並不處於Hardy Weinberg平衡狀態(在壹個大群體內,不論起始群體的基因頻率和基因型頻率是多少,在經過壹代隨機交配之後,基因頻率和基因型頻率在世代間保持恒定,群體處於遺傳平衡狀態,這種群體叫做遺傳平衡群體,它所處的狀態叫做哈迪—溫伯格平衡)。遺傳多樣性估算的取樣方差與每個群體中取樣的個體數量、取樣的位點數目、群體的等位基因組成、繁育系統和有效群體大小有關。現在沒有壹個推薦的標準取樣方案,但基本原則是在財力允許的情況下,取樣的個體越多、取樣的位點越多、取樣的群體越多越好。
2.遺傳距離的估算 遺傳距離指個體、群體或種之間用DNA序列或等位基因頻率來估計的遺傳差異大小。衡量遺傳距離的指標包括用於數量性狀分析的歐式距離(DE),可用於質量性狀和數量性狀的Gower距離(DG)和Roger距離(RD),用於二元數據的改良Roger距離(GDMR)、Nei&Li距離(GDNL)、Jaccard距離(GDJ)和簡單匹配距離(GDSM)等:
D E=[(x1-y1)2+(x2-y2)2+…(xp-yp)2]1/2,這裏x1,x2,…,xp和y1,y2,…,yp分別為兩個個體(或基因型、群體)i和j形態學性狀p的值。
兩個自交系之間的遺傳距離Dsmith= ∑[(xi(p)-yj(p))2/varx(p)]1/2,這裏xi(p)和yj(p)分別為自交系i和j第p個性狀的值,varx(p)為第p個數量性狀在所有自交系中的方差。
DG=1/p∑wkdijk,這裏p為性狀數目,dijk為第k個性狀對兩個個體i和j間總距離的貢獻,dijk=|dik-xjk|,dik和djk分別為i和j的第k個性狀的值,wk=1/Rk,Rk為第k個性狀的範圍(range)。
當用分子標記作遺傳多樣性分析時,可用下式:d(i,j)=constant(∑|Xai-Xaj|r)1/r,這裏Xai為等位基因a在個體i中的頻率,n為每個位點等位基因數目,r為常數。當r=2時,則該公式變為Roger距離,即RD=1/2[∑(Xai-Xaj)2]1/2。
當分子標記數據用二元數據表示時,可用下列距離來表示:
GD NL= 1-2N11/(2N11+ N10+ N01) GD J= 1-N11/(N11+ N10+ N01) GD SM= 1-(N11+ N00)/(N11+ N10+ N01+ N00) GD MR=[(N10+ N01)/2N]1/2這裏N11為兩個個體均出現的等位基因的數目;N00為兩個個體均未出現的等位基因數目;N10為只在個體i中出現的等位基因數目;N01為只在個體j中出現的等位基因數目;N為總的等位基因數目。譜帶在分析時可看成等位基因。
在實際操作過程中,選擇合適的遺傳距離指標相當重要。壹般來說,GDNL和GDJ在處理顯性標記和***顯性標記時是不同的,用這兩個指標分析自交系時排序結果相同,但分析雜交種中的雜合位點和分析雜合基因型出現頻率很高的群體時其遺傳距離就會產生差異。根據以前的研究結果,建議在分析***顯性標記(如RFLP和SSR)時用GDNL,而在分析顯性標記(如AFLP和RAPD)時用GDSM或GDJ。GDSM和GDMR,前者可用於巢式聚類分析和分子方差分析(AMOVA),但後者由於有其重要的遺傳學和統計學意義更受青睞。
在衡量群體(居群)的遺傳分化時,主要有三種統計學方法:壹是χ2測驗,適用於等位基因多樣性較低時的情形;二是F統計(Wright,1951);三是GST統計(Nei,1973)。在研究中涉及到的材料很多時,還可以用到壹些多變量分析技術,如聚類分析和主成分分析等。