轉錄因子(TF)的調控決定了基因的調控網絡和表達水平。基因表達驅動壹系列細胞活動,這些表達的調控需要通過轉錄因子(蛋白質)與轉錄因子結合位點(DNA元件)的相互作用來實現。轉錄水平的調控不是壹個簡單的獨立過程,而是由數百個轉錄因子、靶序列和* * *調控因子組成的高度相互作用的基因調控網絡。
2.為什麽要研究轉錄因子?
在壹個項目的開始,往往是研究壹個基因的序列信息和基因的功能,屬於基因的下遊研究。但在下遊研究積累了壹些經驗後,老師往往會開始研究基因的上遊調控機制,即不僅關註基因A如何影響細胞活動,還要關註哪些因素影響基因A的功能,理論上,調控機制的研究會涉及很多因素,如轉錄因子、蛋白激酶、miRNA、DNA甲基化、組蛋白修飾、lncRNA……...
轉錄因子成為調控機制的主要研究者是正常的。因為壹個轉錄因子可以同時控制多個基因的表達,所以轉錄因子的功能也可能受到多個因素的影響。如果我們能夠闡明如此復雜的調控網絡,這將是壹個巨大的科學成就。
3.研究方法
現有的主流轉錄因子鑒定方法可分為兩類:傳統的實驗方法和通過計算機的計算方法。簡單來說,實驗方法主要用於尋找不同類型的目標,即通過已知的tfb找到未知的tfb,或者通過已知的tfb找到其對應的TF。生物信息學方法更多用於同類型預測,即通過序列保守性分析,由已知TF預測未知TF,或由已知TFBS預測未知TFBS。這些研究思路之間的關系如圖1所示。
圖1。轉錄因子的研究方法
3.1計算方法
無論是TF或TFBS的相似預測,生物信息的研究方法主要依靠蛋白質或DNA序列保守性。具體的算法和軟件有隱馬爾可夫模型、吉布斯采樣、貪婪算法等。,但這次重點是介紹研究轉錄因子的實驗方法,所以不想過多描述這部分信息。
3.2實驗方法篩選(實驗方法)
實驗方法主要有兩個思路:1。正在搜索未知的TFBS通過已知的TF;2.通過已知的TF b找到未知的TF。無論哪種方式,前提都是基於蛋白質與DNA的結合關系,即交叉搜索目標,這與計算機技術中的同類型搜索不同。
3.2.1通過已知TF搜索未知tfb
如果壹個感興趣的TF已經被鎖定,壹般的想法是確定它的TFBS,然後知道它控制的下遊基因。從已知TF到未知TFBS的過程的主要實驗方法包括體內實驗如ChIP-seq、DNaseI-seq和DamID-seq,以及體外實驗如DIP-seq、SELEX(-seq)和PBM。
這些研究的通量和應用範圍如圖2所示,其中縱坐標表示可檢測TFBS的範圍(檢測通量),橫坐標表示TF-TFBS的結合細節(檢測細度)。以ChIP-seq為例,它可以壹次性找到全基因組水平的20多萬個結合位點,但只能確定TFBS的序列信息(無論是ATTCG還是ACTCG),而很難知道目標TF與TFBS的結合程度(TFBS能與TF結合多長時間,結合有多強等等)。
圖二。轉錄因子研究方法的比較。(CS:共識,PWM:位置權重矩陣)
3.2.1.1SELEX技術
通過信息富集的配體系統進化(SELEX)是體外檢測轉錄因子結合位點的最早技術之壹。這項技術是科學家在20多年前使用的,它可以在沒有已知序列信息的情況下檢測新的結合位點。它的原理是(圖3a): 1。提取和純化轉錄因子;2.隨機中斷的DNA文庫與靶轉錄因子壹起孵育;3.提取與TF結合的DNA,並通過PCR進壹步擴增該片段;4.將PCR擴增片段與TF反復孵育,最終篩選出結合率高的DNA。SELEX技術可以在沒有已知DNA片段信息的情況下檢測新的TFBS,但其缺點是只能發現結合率高的TFBS,因此識別效率較低。
為了解決鑒定效率低的問題,可以將高通量測序技術與SELEX結合起來篩選TFBS。SELEX-seq只需要壹輪篩選,而不是像以前那樣需要多輪篩選,但它的問題是需要大量高質量的純化蛋白,前期實驗操作復雜。
3.2.1.2蛋白質結合微陣列(PBM)技術
PBM技術(圖3b)首先將雙鏈dna陣列固定在芯片中,然後加入感興趣的目標蛋白,孵育並洗脫未結合的蛋白,然後加入帶有熒光標記的抗體靶向目標蛋白,最後通過熒光信號識別蛋白-DNA結合關系。熒光強度最終將被轉換成位置權重矩陣(PWM ),以計算DNA的結合序列。
3 . 2 . 1.3二進制序列
DIP-seq(圖3c)是另壹種在體外檢測轉錄因子和dna之間關系的技術。與PBM不同的是,這項技術不需要事先固定DNA,通過檢測染色質DNA來實現目標識別。壹般的實驗過程可以分為:1。用甲醛交聯轉錄因子和DNA片段;2.切掉100到500bp的DNA片段;3.富集TF結合的DNA通過轉錄因子特異性抗體;4.交聯後,DNA被富集用於芯片或高通量測序。
3 . 2 . 1.4芯片序列
ChIP-seq的實驗過程與DIP-seq非常相似,唯壹不同的是ChIP-seq可以通過甲醛原位交聯TF和DNA,而DIP-seq只能在體外交聯。ChIP-seq的優點是更高的分辨率、更低的噪聲等。但其缺點是1太依賴於蛋白質的數量,2依賴於交聯效率,3依賴於抗體的特異性和可用性。4.很難區分TF是直接結合還是間接結合。
圖3。幾種主流TF識別技術的操作流程。
3.2.1.5 .分子相互作用的機械誘導捕獲(* * * *有絲分裂)
MITOMI是為數不多的可以測量TF和DNA解離系數Kd的實驗技術。它具有中等通量,但不適合從頭鑒定TFBS。MITOMI特定流程圖4:
1.將感興趣的tf固定在玻璃上,連接微流控管,倒入DNA;
2.DNA與固定的tf結合;
3.富集結合的DNA並洗脫未結合的片段;
4.通過富集的DNA量計算蛋白質-DNA解離系數Kd。
圖4。mitomi原理示意圖
3.2.2.通過已知tfb搜索未知****TF。
常見的實驗研究方法有酵母壹雜交(Y1H)和Pich(分離色段蛋白質組學),稱為反向芯片實驗。
3.2.2.1酵母單雜交(Y1H)
可通過酵母單雜交篩選與DNA結合的蛋白質,編碼該蛋白質的核苷酸序列可直接從基因文庫中獲得,無需復雜的蛋白質分離純化操作,在蛋白質研究中具有壹定優勢;而且酵母屬於真核細胞,酵母系統得到的結果比其他體外技術得到的結果更能反映真核細胞中基因表達調控的真實情況。
主要實驗過程如下:
1.將感興趣的TFBS序列(誘餌)插入報告基因的上遊,將帶有TFBS的質粒和報告基因整合到酵母基因組中,構建含有報告基因的酵母;
2.提取mRNA構建轉錄因子cDNA文庫,將文庫與酵母激活因子融合構建“獵物”文庫。將帶有文庫的質粒轉移到步驟1的酵母中。
3.生長酵母的條件篩選。如果TF和TFBS結合,報告基因可以順利表達。
圖5。酵母單雜交技術原理。
3 . 2 . 2 . 2批量實驗
PICh又稱反向芯片實驗,實際上是通過分離出感興趣的DNA片段來富集轉錄因子,最後通過質譜鑒定富集的蛋白質。PICh分離的TF很難被鑒定為直接或間接的結合因子,且目前該技術的通量較低,不適合大規模篩選TF。
需要註意的事項
1.雖然許多蛋白質-DNA相互作用可以在體外鑒定,但由於生物體的復雜性(* * *調節因子、競爭性轉錄因子等。),這些在體外確定的相互作用很難在體內重復或發現。
2.體內實驗實際上減少了轉錄因子與-DNA的相互作用,但很難區分直接或間接的關系。
3.從頭TFBS的鑒定可以通過PBM方法完成。
4.檢測通量通常受限於蛋白質的純化質量和數量。
5.大多數方法很難分析解離系數,因此很難掌握DNA或蛋白質的洗脫情況。
6.除了實驗方法,計算機技術已被廣泛用於識別結合位點的保守性和預測新的轉錄因子靶區域。但是,無論什麽算法,這些預測都過度簡化了TF-DNA之間的關系,導致了非常高的假陽性率。
7.(Chip、HT-SELEX或PBM方法的目的是找到結合序列或PWM。(ii)有絲分裂分析可用於進壹步分析定量信息。(iii)芯片實驗可用於分析體內結合信息。
附錄
TF體內外不同鑒定方法的比較:
方法:方法;
Synomyms:實驗名稱;
通量:檢測通量;
材料需求:必需的實驗材料,其中P代表蛋白質,D代表DNA,“+”到“++++”分別代表可用於定性、半定量、定量和動力學分析的數據;
數據類型:實驗生成的數據類型;
分辨率:分辨率(可檢測堿基的程度)。