讀者:自然界中有壹種跨膜蛋白,可以作為離子或分子通道嵌入細胞膜,具有天然的蛋白質納米孔。經過人工基因工程改造,獲得了納米孔測序所需的閱讀蛋白。
膜:將閱讀蛋白包埋在高電阻率的膜(合成高分子膜)中,膜的兩面都有離子溶液。當兩邊施加不同的電位時,離子會在孔隙中流動,形成電流。
馬達:在納米孔庫的構建中,需要在接頭上連接壹個動力蛋白,將DNA或RNA分子推入納米孔中。以DNA作為馬達(動力蛋白)的解旋酶分解為例,它不僅能解開雙螺旋,使其變成單鏈,還能提供驅動力。
系繩:這種蛋白質用於錨定DNA或RNA鏈,防止它們在溶液中漂移,並使它們進入納米孔。
此時其中壹條未解鏈會穿過蛋白孔,在穿過蛋白孔時會擾亂膜兩側離子的穩定流動。不同的堿基對離子流動的影響不同,也會產生不同的電流大小,進而形成如下電流信號圖。
使用這些電流信號,通過計算機軟件識別後,推斷堿基類型並完成測序。
雖然納米孔測序儀的種類很多,但都是基於納米孔芯片的平臺,從多芯片陣列組成的PromehION和GridION系列測序儀到可以連接手機的Type C和連接電腦USB的MnION系列便攜式測序儀。
其中最著名的是MnION系列。2065438+2006年8月,美國宇航員凱特·魯賓斯在國際空間站微重力環境下完成了DNA測序。
測序的時候壹般是如下圖連接,顯然是便攜的。比如在疫區采集樣本後可以直接用於實時分析,從而為防疫工作贏得大量寶貴的時間和資源。
測序時,將制備好的文庫或樣品溶液滴入芯片的小孔中開始測序。
壹個梅蘭妮芯片有2048個膜孔,也就是芯片上的壹個孔,每個孔包含壹個納米孔閱讀器。
每四個井***享受壹個放大器(信號放大器),壹個梅蘭妮片有512個信號放大器,也就是512組井。
測序儀啟動後,機器進行自檢,每組孔會根據效率進行排序。測序開始時,儀器首先使用每組中效率最高的孔,運行8小時後,更換為效率第二的孔,以此類推。
但實際使用中,只有1200井能正常工作。
油井故障的原因:
1D文庫是DNA雙鏈,融為正義鏈和反義鏈,分別測序,堿基解讀的準確率約為85%。
目前,1D庫有兩種建設方案:
把它連在DNA的兩邊?鏈接器,其他步驟類似1D庫。
在這個圖書館?接頭允許第二條鏈與第壹條鏈壹起測序。
因為可以檢測到兩條鏈,所以可以互相校正,從而提高解釋精度,可以達到基礎解釋精度的90%以上。
然而,由於文庫質量、蛋白質活性和其他因素,在第二條鏈之後,並非所有的第壹條鏈都將被檢測到。
在測序的過程中,獲得的信號不是壹次壹個堿基信號。但是根據閱讀器蛋白孔的縱向長度,R9大概有5個堿基長,也就是說會同時測到5個堿基的電信號,這不是壹個簡單的判斷過程。
目前,納米孔公司使用壹種機器學習方法——遞歸神經網絡(RNN)來解釋堿基。
簡單來說,過程就是把已知堿基序列的波形圖做為訓練集和測試集,通過修改參數得到模型。最後,將新測得的未知層序波形與其進行對比,以提高解釋的準確性。
然而,仍有壹種誤讀:
以R9芯片為例,在測序過程中,每10分鐘以180 mV的電壓短時間反轉電壓方向,激活被堵塞或卡住的閱讀器蛋白孔。不過這個過程也會讓正常排序的丹鏈吐槽回去。
隨著電極使用時間的增加,電極的電壓會發生漂移,所以每兩個小時要增加5mV的電壓來抵消影響。
R9芯片,測序速度為250堿基/秒,壹個芯片大約可以得到5 ~ 10 G堿基序列。
納米孔公司每壹個新的閱讀器蛋白、馬達、膜都會有壹個新的芯片版本號。壹般命名規則如下:
例如,R9是指大腸桿菌的CsgG蛋白修飾的閱讀蛋白..
參考:
/手表?v=RcP85JHLmnI
/手表?v = E9-RM 5 aozgw & amp;t=13s
/手表?v = sv9fFeSd3kE
/