(壹)方法原理
人工神經網絡是由大量的類似人腦神經元的簡單處理單元廣泛地相互連接而成的復雜的網絡系統。理論和實踐表明,在信息處理方面,神經網絡方法比傳統模式識別方法更具有優勢。人工神經元是神經網絡的基本處理單元,其接收的信息為x1,x2,…,xn,而ωij表示第i個神經元到第j個神經元的連接強度或稱權重。神經元的輸入是接收信息X=(x1,x2,…,xn)與權重W={ωij}的點積,將輸入與設定的某壹閾值作比較,再經過某種神經元激活函數f的作用,便得到該神經元的輸出Oi。常見的激活函數為Sigmoid型。人工神經元的輸入與輸出的關系為
地球物理勘探概論
式中:xi為第i個輸入元素,即n維輸入矢量X的第i個分量;ωi為第i個輸入與處理單元間的互聯權重;θ為處理單元的內部閾值;y為處理單元的輸出。
常用的人工神經網絡是BP網絡,它由輸入層、隱含層和輸出層三部分組成。BP算法是壹種有監督的模式識別方法,包括學習和識別兩部分,其中學習過程又可分為正向傳播和反向傳播兩部分。正向傳播開始時,對所有的連接權值置隨機數作為初值,選取模式集的任壹模式作為輸入,轉向隱含層處理,並在輸出層得到該模式對應的輸出值。每壹層神經元狀態只影響下壹層神經元狀態。此時,輸出值壹般與期望值存在較大的誤差,需要通過誤差反向傳遞過程,計算模式的各層神經元權值的變化量 。這個過程不斷重復,直至完成對該模式集所有模式的計算,產生這壹輪訓練值的變化量Δωij。在修正網絡中各種神經元的權值後,網絡重新按照正向傳播方式得到輸出。實際輸出值與期望值之間的誤差可以導致新壹輪的權值修正。正向傳播與反向傳播過程循環往復,直到網絡收斂,得到網絡收斂後的互聯權值和閾值。
(二)BP神經網絡計算步驟
(1)初始化連接權值和閾值為壹小的隨機值,即W(0)=任意值,θ(0)=任意值。
(2)輸入壹個樣本X。
(3)正向傳播,計算實際輸出,即根據輸入樣本值、互聯權值和閾值,計算樣本的實際輸出。其中輸入層的輸出等於輸入樣本值,隱含層和輸出層的輸入為
地球物理勘探概論
輸出為
地球物理勘探概論
式中:f為閾值邏輯函數,壹般取Sigmoid函數,即
地球物理勘探概論
式中:θj表示閾值或偏置;θ0的作用是調節Sigmoid函數的形狀。較小的θ0將使Sigmoid函數逼近於閾值邏輯單元的特征,較大的θ0將導致Sigmoid函數變平緩,壹般取θ0=1。
(4)計算實際輸出與理想輸出的誤差
地球物理勘探概論
式中:tpk為理想輸出;Opk為實際輸出;p為樣本號;k為輸出節點號。
(5)誤差反向傳播,修改權值
地球物理勘探概論
式中:
地球物理勘探概論
地球物理勘探概論
(6)判斷收斂。若誤差小於給定值,則結束,否則轉向步驟(2)。
(三)塔北雅克拉地區BP神經網絡預測實例
以塔北雅克拉地區S4井為已知樣本,取氧化還原電位,放射性元素Rn、Th、Tc、U、K和地震反射 構造面等7個特征為識別的依據。 構造面反映了局部構造的起伏變化,其局部隆起部位應是油氣運移和富集的有利部位,它可以作為判斷含油氣性的諸種因素之壹。在該地區投入了高精度重磁、土壤微磁、頻譜激電等多種方法,壹些參數未入選為判別的特征參數,是因為某些參數是相關的。在使用神經網絡方法判別之前,還采用K-L變換(Karhaem-Loeve)來分析和提取特征。
S4井位於測區西南部5線25點,是區內唯壹已知井。該井在5390.6m的侏羅系地層獲得40.6m厚的油氣層,在5482m深的震旦系地層中獲58m厚的油氣層。取S4井周圍9個點,即4~6線的23~25 點作為已知油氣的訓練樣本;由於區內沒有未見油的鉆井,只好根據地質資料分析,選取14~16線的55~57點作為非油氣的訓練樣本。BP網絡學習叠代17174次,總誤差為0.0001,學習效果相當滿意。以學習後的網絡進行識別,得出結果如圖6-2-4所示。
圖6-2-4 塔北雅克拉地區BP神經網絡聚類結果
(據劉天佑等,1997)
由圖6-2-4可見,由預測值大於0.9可得5個大封閉圈遠景區,其中測區南部①號遠景區對應著已知油井S4井;②、③號油氣遠景區位於地震勘探所查明的托庫1、2號構造,該兩個構造位於沙雅隆起的東段,其西段即為1984年鉆遇高產油氣流的Sch2井,應是含油氣性好的遠景區;④、⑤號遠景區位於大澇壩構造,是yh油田的組成部分。