康,楊,薩提亞萬,丁,沈,等。赤小豆基因組序列草圖。科學報告5,8069 (2015)。https://doi.org/10.1038/srep08069
單位:首爾國立大學
和2014的綠豆文章是同壹個團隊,分析套路也差不多。
角豇豆變種。angularis是二倍體豆科作物(2n = 2x = 22),估計基因組大小為538 Mb 1。它是亞洲豇豆中的壹種,屬於豆科2的蝴蝶亞科。紅豆因其味甜、蛋白質和澱粉含量豐富,在中國、日本、韓國等東亞國家廣泛種植,並作為傳統甜品食品的原料。中國、日本、朝鮮半島和臺灣省的紅豆年種植面積估計分別為67萬、12萬、3萬、2萬公頃。野生小豆物種,如苦豆品種nipponensis、中島豆和尼泊爾豆,廣泛分布於東亞和喜馬拉雅國家。然而,考古證據表明,在東北亞有多個馴化起源。紅小豆變種苦豆草是綠豆的近親,適應亞熱帶和溫帶氣候區。
、田、、陳春海等。紅小豆基因組測序為高澱粉、低脂肪積累和馴化提供了線索。DOI:10.1073/PNAS . 1420949112
單位:北京農學院萬平教授,中國科學院遺傳與發育生物學研究所淩宏慶研究員和田,深圳華大基因研究所。
角豇豆變種。大約在12,000年前(1)在中國馴化,在世界上30多個國家有種植,特別是東亞地區(2,3)。紅豆種子是蛋白質、澱粉、礦物質和維生素的重要來源(4,5)。由於其低熱量和脂肪含量、可消化的蛋白質和豐富的生物活性化合物,紅豆被稱為“減肥豆”(6,7)。鑒於這些特性,紅豆被廣泛應用於各種食品(如蛋糕、甜點、蛋糕、粥、紅米、果凍、紅豆奶、冰淇淋中的糊)中,至少有6543.8+0億人食用(8)。此外,紅豆是傳統藥物,在中國壹直被用作利尿劑和解毒劑,可以緩解水腫和腳氣的癥狀(9,10)。
紅小豆是壹種高價值的輪作作物,適應性廣,對貧瘠土壤的耐受性強,有助於通過固氮(11,12)改善土壤條件。此外,紅豆生長期短,基因組小,可以作為模式種,特別是非油籽豆。
流分析估計的基因組大小為612 Mb,高於之前估計的538 Mb。22 k-mer估計基因組大小為591 Mb。
測序材料是在韓國廣泛種植的慶元。
各種大小的片段庫,ALLPATHS-LG+Newbler組裝,3883支架,N50=703kb,總長度443Mb(75%)。普通菜豆和綠豆與綠豆變種的* *線性塊。從ks頻率圖的峰中發現輻射體,並提取保守的基因組塊以用作超級折疊橋。基於* * *線性的支架策略將N50增加到1.5Mb,最長從4.4Mb增加到11.1Mb。
GBS共構建了133個F4群體(慶元與野生種IT178530的雜交後代),篩選了814個SNPs構建了11連鎖群,***158支架錨定在65438。
花的組織,豆莢,葉子和根的mRNA,三位壹體從零開始組裝,制作過程。
與大豆、綠豆和菜豆(P. vulgaris)的基因長度、CDS和內含子相比,CEGMA評估了248個核心基因>:86%。小豆的短基因比例較高(250bp)。在這26,857個基因中,65,438+05,976個位於假染色體上。
小豆與擬南芥、水稻、大豆和截形麥的蛋白質聚類分析:* *共有6643個基因簇,而小豆有1,163個基因簇。
紅小豆與大豆、綠豆和蕓豆的線性分析。
在小豆基因組中總共鑒定了2669個編碼轉錄因子(TF)的基因。將相對TF豐度與其他植物基因組進行比較,發現這些植物基因組中TF基因家族的總體比例相似。
基於同源性和結構的分析表明,測序的小豆基因組中約43.1%是重復序列。
馴化特點:種子破碎,種子休眠最小,種子大小和數量增加。
增加了新的測序材料,即尼泊爾葡萄(austcf 85148)和苦皮葡萄變種。日本血吸蟲(IT 241912)。包括之前的調研資料IT178530。與紅小豆參考基因組比較進行突變檢測。
通過比較栽培紅豆和野生紅豆的直向同源,我們計算了每個同義位點的同義替換數(Ks)與同義替換數(Ka)的比率,以估計每個基因的選擇壓力。n .角葉藻變種在Ka/Ks計算中,日本血吸蟲的多態基因數最少(1,823)。當Ka/KS值為0.2時,我們觀察到壹致的峰,表明在栽培和三種野生紅豆(Ka/Ks)之間存在純化選擇
三種材料的Ka/Ks分布高度相似,壹致呈現三個峰值(0.2、0.5和0.7 ~ 0.8)。在這兩次比較中,總共分別在三個峰中發現了*** 307、152和75個基因,表明這些位點的選擇壓力在栽培紅豆和野生紅豆之間是不同的。
雖然Ka/Ks小於1已經被解釋為純化選擇的特征27,但是每個峰中的基因子集可以作為候選基因來解釋野生和栽培小豆之間的差異。例如,在第二個(0.4±0.6)和第三個(0.6±0.9)峰的疾病相關基因的同源物是Vang03g15160、Vang02g14420、Vang0291s00070和Vang0229s0060。
簡單序列重復(SSR)標記由MISA軟件確定。總* * *檢出143,113個SSR,三重SSR(基因分型首選類型)數為1,941。通過翻譯基因組學方法29預測與這些SSR標記相關的QTL。翻譯了大豆中2,065,438+00個QTL相關SSR標記的基因組位置,通過569個直向同源塊將小豆的基因組位置映射到大豆的相應基因組位置,並將開花時間、成熟度、種子大小、產量和抗病性等農業上的重要QTL繪制在circos上。
抗病性的QTL可能圍繞87個編碼核苷酸結合位點(NBS)和富含亮氨酸重復序列(LRR)的基因,這些基因通常與抗病性有關。這些翻譯的QTL側翼標記可用於育種計劃。
菜豆、綠豆、野生紅小豆、中島豆、野生紅小豆、尼泊爾紅小豆和赤小豆的60個直向同源種。用於構建系統進化樹。
紅小豆形成了獨特的進化分支(包括野生紅小豆)。栽培小豆與野生小豆的最小物種形成時間為0.05 MYA,早於小豆栽培的考古證據(距今約5000年)。
Ks密度圖顯示這些物種具有相同的單壹古基因組復制(~53.3 MYA),在紅豆屬植物基因組中鑒定出1,273個串聯復制基因。GO富含防禦反應、氧化還原和磷酸化,與其他植物基因組壹致。
材料:中國品種“京農6號”,49個紅小豆重新測序(11野生,11半野生,17地方種,10栽培種)。
90.88 Gb優質序列(168 ×紅小豆基因組覆蓋),Kmer評估542Mb,SOAPdenovo組裝,contig N50=38 kb,支架N50=1.29 Mb,大小466.7 Mb(86.11%)。GC含量為34.8%,與其他豆科植物的基因組相似。
利用栽培品種Ass001雜交的150個F 2個體,通過RAD-Seq構建了高密度單核苷酸多態性(SNP)遺傳圖譜。該遺傳圖譜由1,571個SNPs組成,覆蓋11個連鎖群,跨度1,031.1.7cM,平均每個支架有4.33個作圖的SNPs,平均標記距離為0.67 cM。通過使用這些SNPs,總長度為372.9 Mb的支架被歸屬於11個假染色體(79.9%)。
紅豆基因組約44.51% (207.7 Mb)由重復DNA組成。高於苜蓿和荷花,低於大豆、鷹嘴豆和木豆,但與普通菜豆(蕓豆)相似。與其他豆科植物的基因組壹致,大多數轉座子為反轉錄轉座子(占基因組的34.57%),而DNA轉座子僅占基因組的5.75%。用MISA鑒定了16230個簡單序列重復(SSR),設計了9038對SSR引物。通過對1,572對引物的分析,發現其中24.7%的引物表現出多態性,可以作為遺傳標記。
RNAseq數據包含三個不同發育階段(初始、發育和成熟種子)的根、莖、葉和種子。轉錄本組裝由59909個單轉錄本組成,其中97.4%被基因組組裝覆蓋,92.6%被捕獲在單轉錄本長度超過90%的支架中,進壹步證明了基因組組裝的高質量。
結合從頭算基因預測、基於同源性的搜索和RNA-Seq預測紅小豆基因組中的基因模型,* * *預測了34,183個蛋白質編碼基因。
與其他6種已測序的豆科植物基因組相比,小豆基因組中預測基因的數目低於大豆、木豆和苜蓿,但高於菜豆、鷹嘴豆和蓮。按基因序列在整個基因組中的比例(總基因長度/基因組大小)來看,紅豆(22.98%)的比例高於除苜蓿以外的其他豆科植物。
* * * 76211個基因家族聚在壹起。發現5種豆科植物(直向同源)的基因組中有65,438+02,582個基因家族,其中827個基因家族含有5,446個小豆特有基因。其功能主要集中在鋅離子結合、蛋白水解、半胱氨酸肽酶活性、雙組分反應調節活性和有絲分裂。
紅豆中的單拷貝基因直向同源明顯多於大豆,與木豆、鷹嘴豆和菜豆相似,而多拷貝基因直向同源則相反。小豆和大豆之間的這種差異可能與大豆中額外的全基因組復制(WGD)有關。
通過與已知轉錄因子的序列比較和搜索已知的DNA結合域,鑒定了屬於63個家族的3508個轉錄因子基因。這些基因占紅小豆總預測基因的10.26%,遠低於普通豆、大豆和蓮,但與其他已測序的豆類物種相似。
此外,對紅小豆基因組中編碼R蛋白的基因進行了分析,並與其他豆科植物進行了比較。* * * 421基因含有NBS或LRR結構域,顯著低於大豆和菜豆。而紅豆基因組中的CC_NBS基因明顯多於大豆。這些信息應該有助於確定引起植物病害的基因和抗病育種。
小豌豆味道清淡,含有易消化的蛋白質和豐富的生物活性化合物。因此,對小豆等豆科植物中與類黃酮生物合成、脂肪氧合酶(LOX)和胰蛋白酶抑制劑相關的基因進行了分析,未觀察到基因數比率(基因組中的基因數/基因總數)的顯著差異。然而,當檢查引起大豆豆腥味的LOX基因的表達時,發現它們在小豆中的轉錄顯著低於大豆,這解釋了小豆的低豆腥味。
豆科植物凝集素廣泛分布於豆科植物中,是壹種蛋白質毒性因子。它與紅細胞表面的糖蛋白相互作用使紅細胞凝集,是抑制動物生長、影響營養價值和營養的主要抗營養因子。大豆中凝集素含量高,而紅豆中凝集素含量低。我們發現紅小豆中豆科植物凝集素基因的基因數比明顯低於除鷹嘴豆以外的其他豆科植物物種。相應地,凝集素基因在紅小豆中的表達明顯低於大豆,尤其是Le1(大豆中壹個重要的凝集素基因(GMX:100818710))。這表明Le1可能在大豆種子凝集素的積累中起主要作用。
分析了7種豆科植物和擬南芥中基因家族的伸縮。在8個物種的全部26120個基因家族中,在普通豆形成後的1400萬年間,紅豆中分別有5.39%(1.407)和7.83%(2046)的基因發生了大幅度的擴展和收縮,而大豆的擴展幅度大於普通豆和紅小豆。小豆擴展基因家族的GO功能富含鋅離子結合、蛋白水解、半胱氨酸肽酶活性、內肽酶活性、內肽酶抑制劑活性、脂質結合和脂質轉運。收縮基因家族富含蛋白絲氨酸/蘇氨酸激酶活性、蛋白激酶活性、蛋白酪氨酸激酶活性和防禦反應。
通過直向同源搜索,在小豆基因組中共檢測到*** 1,501個重復**線性區塊,基因數量從6個到103個不等,平均為11.7個。在紅小豆基因組中,四重簡並第三密碼子改變位點(4DTv)的核苷酸多樣性出現了壹個明顯的峰。0.36),這與鳳蝶科的全基因組重復(WGD)事件壹致。我們還沒有確認最新的WGD (4DTv?0.056),說明小豆和大多數測序豆壹樣,沒有這種甘氨酸特異性事件。進壹步的系統發育分析表明,紅小豆在19.0-32.5萬年前與木豆分支,在169-29萬年前與大豆分支,在0.5-15萬年前與菜豆分支。
* * *線性分析表明,與其他豆科植物相比,紅小豆比普通豆更保守。紅小豆和菜豆的大部分染色體是可以比較的(比如紅小豆2號染色體和菜豆7號染色體,紅小豆5號染色體和菜豆5號染色體,紅小豆1號染色體和菜豆3號染色體,紅小豆4號和3號染色體,菜豆9號染色體)。但紅小豆的部分染色體與普通菜豆的不止壹條染色體匹配,說明物種形成後兩個基因組發生了染色體重排。
還對紅豆和大豆進行了線性比較。結果表明,每條紅豆染色體與大豆的幾條染色體相匹配,說明物種形成後發生了更多的排列,這可能是大豆近期獨立WGD的結果。
豆科是第二重要的作物家族,根據種子中儲存的化合物分為油料和非油料。紅豆是典型的無油豆,而大豆屬於油脂。與大豆相比,紅小豆種子含有更多的澱粉(57.06%比25.3%)和更少的粗脂肪(0.59%比22.5%)。為了研究這種差異背後的基礎,我們分析了與澱粉和油生物合成相關的基因。
使用水稻澱粉生物合成基因作為查詢序列,我們在紅豆和大豆基因組中進行了直向同源搜索。紅豆中發現的澱粉生物合成基因比大豆中發現的少(27對46),但χ 2檢驗表明,兩種基因組中澱粉生物合成基因的比例(澱粉生物合成基因數/基因總數)沒有顯著差異。在2013和2014中,收集了兩個生物重復物種的種子發育的三個階段(初始、發育和成熟種子)以檢測這些基因的轉錄活性。發現小豆種子中澱粉生物合成基因的總轉錄量和單個澱粉生物合成基因的平均轉錄量顯著高於大豆。然而,在種子發育的兩個早期階段沒有觀察到顯著差異。此外,澱粉合成基因的轉錄在小豆中持續增加,尤其是在成熟種子階段,而在大豆中這些基因的發育和成熟階段減少。
隨後,我們在小豆和大豆基因組中尋找與脂肪酸合成、油脂合成和儲存以及脂肪酸降解相關的基因。雖然在大豆中發現的基因比在紅豆中發現的多,但相對於兩個基因組中的基因總數,基因拷貝數沒有顯著差異。質體中脂肪酸合成相關基因的轉錄和油脂的合成與儲存顯著高於大豆和紅小豆。我們還發現這兩類基因表現出不同的表達模式。質體中脂肪酸合成相關基因在紅豆和大豆發育早期表現出較高的轉錄水平,而油脂合成和儲存基因在大豆中的表達保持不變,但在紅豆中後期表達下降。
根據這些結果推測,大豆和紅小豆澱粉和油脂合成相關基因的轉錄是造成兩個物種澱粉和油脂含量差異的原因。未來不同物種的詳細比較基因組分析將有助於回答潛在的機制。
半野生紅小豆的遺傳基礎存在爭議,不清楚半野生紅小豆是與栽培或野生紅小豆親緣關系近,還是屬於地方品種。
49份種質基因組測序深度在5.3×到27.34×之間。* * *共鑒定出5,539,465,438+065,438+0個SNPs。
11野生種質明顯聚為壹類,包括半野生種質、地方品種和改良品種在內的其他39份種質聚為另壹類。11半野生種質分布在地方品種和良種之間。
結果表明,半野生紅小豆與栽培紅小豆的親緣關系小於野生型。主成分分析表明,半野生紅小豆與地方品種和改良品種的親緣關系比野生紅小豆更近。種群結構表明,三種類型分成三組時,K=3沒有明顯的混合。基於所有這些綜合分析,半野生小豆似乎是壹個獨特的生態型,作為栽培種的祖先,而不是從古老的栽培品種和野生品種與栽培品種雜交衍生出來的。因此,我們在下面的選擇分析中將半野生紅豆歸為地方品種。
地方品種與栽培品種之間檢測到的選擇壓力明顯低於野生與栽培品種之間的選擇壓力,地方品種與栽培品種之間的選擇壓力明顯低於野生與栽培品種之間的選擇壓力,如紅豆1號染色體的Fst值(上圖D)。結果表明,從野生種質到栽培品種的馴化是徹底的、連續的。所選區域的基因主要富集在植物-病原互作、植物激素信號轉導、氨基苯甲酸降解、細胞周期和葉酸生物合成的KEGG途徑中。
獲得了高質量的小豆基因組序列草圖,其中超過86%的基因組被組裝,約80%的序列被分配給染色體。總共預測了34,183個蛋白質編碼基因。基因組復制分析表明,與大豆不同,紅小豆基因組缺乏近期全基因組復制事件。與已測序的其他豆科植物基因組相比,紅小豆和菜豆基因組的同源性高於大豆、木豆、苜蓿、鷹嘴豆和蓮。更有趣的是,研究發現紅豆種子的低脂肪高澱粉含量並不是由基因拷貝數的變異引起的,而是由基因表達引起的。此外,通過群體分析發現,半野生紅小豆是初步的地方品種,包括11野生、11半野生種質、17地方品種和11改良品種,在馴化中檢測到較強的選擇信號。