數(shù)據(jù)分組處理方法(Group Method of Data
Handling,GMDH),它實現(xiàn)數(shù)據(jù)挖掘過程的自組織控制,是一個簡單高效的推導最優(yōu)模型的原始輸入變量表達式的算法,并以客觀的方式建立一個最優(yōu)復雜度模型。Ivakhnenko于1967年提出GMDH方法,也稱多項式網(wǎng)絡(luò),它是前饋神經(jīng)網(wǎng)絡(luò)中常用的一種用于預測的神經(jīng)網(wǎng)絡(luò)。GMDH方法的基本思想是以生物有機體演化的方法構(gòu)造數(shù)學模型。由系統(tǒng)各輸入單元交叉組合產(chǎn)生一系列的活動神經(jīng)元,其中每一神經(jīng)元都具有選擇最優(yōu)傳遞函數(shù)的功能,再從已產(chǎn)生的一代神經(jīng)元選擇若干與目標變量最為接近的神經(jīng)元,被選出的神經(jīng)元強強結(jié)合再次產(chǎn)生新的神經(jīng)元,重復這樣一個優(yōu)勢遺傳,競爭生存和進化的過程,直至新產(chǎn)生的一代神經(jīng)元都不比上一代更加優(yōu)秀,于是最優(yōu)模型被選出。它的特點是網(wǎng)絡(luò)結(jié)構(gòu)不固定,而是在訓練的過程中不斷地改變。作為一個歸納方法,它有效的解決了諸如通常神經(jīng)網(wǎng)絡(luò)運行時間長學習速度慢,小數(shù)據(jù)樣本中噪聲比較大時的多重共線性等問題。

1.3 基于GMDH網(wǎng)絡(luò)的預測
用GMDH網(wǎng)絡(luò)進行預測前,不需要了解時間序列的一些特征,僅僅根據(jù)已知樣本,通過網(wǎng)絡(luò)自組織的形式建立網(wǎng)絡(luò)模型。GMDH網(wǎng)絡(luò)的構(gòu)建過程主要是一個不斷產(chǎn)生活動神經(jīng)元,由外部準則對神經(jīng)元進行篩選,篩選得到的神經(jīng)元再結(jié)合產(chǎn)生下一層神經(jīng)元,直至具有最佳復雜性的模型被選出的這樣一個過程。GMDH模型的建立需要以下幾個步驟:
(1) 數(shù)據(jù)預處理。包括數(shù)據(jù)規(guī)范化和除去數(shù)據(jù)中的靜止直流成分。
(2) 決定網(wǎng)絡(luò)輸入信號。對于預測需要用到n個過去輸出值。
(3) 將實驗數(shù)據(jù)分為訓練樣本和測試樣本。
(4) 建立輸入神經(jīng)元層。神經(jīng)元數(shù)與輸入信號數(shù)i有關(guān)。對于每個輸入信號,都有一個神經(jīng)元與之對應(yīng),因此相應(yīng)的神經(jīng)元數(shù)為。
(5) 將神經(jīng)元權(quán)值的初始值設(shè)為0.
(6) 將訓練數(shù)據(jù)組作用于輸入層的每一個神經(jīng)元。在k時刻取
(k=1,2,…)作為輸入信號,
為期望輸出,計算每一神經(jīng)元的輸出誤差,并修正其權(quán)值和均方誤差和,當均方誤差和大于上一循環(huán)計算值時,訓練停止。
(7) 輸入選擇數(shù)據(jù),計算每一神經(jīng)元的輸出均方差。根據(jù)差值確定一個閾值,選擇方差小于閾值的神經(jīng)元作為下一層神經(jīng)元。
(8) 當本層最小均方差大于前一層神經(jīng)元的最小均方差或本層僅有一個神經(jīng)元時,停止訓練過程。如果訓練是由于最小均方差偏大而停止的,則將前一層神經(jīng)元作為輸出層,并重新整理網(wǎng)絡(luò);若訓練是因本層僅有一個神經(jīng)元而停止的,且本次方差小于前一層時,則以本層神經(jīng)元作為輸出層并重新整理網(wǎng)絡(luò),即舍棄那些與輸出神經(jīng)元沒有聯(lián)系的神經(jīng)元。
(9) 利用評價數(shù)據(jù)組檢查訓練好的網(wǎng)絡(luò)性能。評價數(shù)據(jù)組可以是上述樣本數(shù)據(jù)和測試數(shù)據(jù)的結(jié)合,也可以是一組全新的數(shù)據(jù),從而實現(xiàn)預測功能。
1.4 GMDH在地下水位預測中的應(yīng)用
以B55的地下水位數(shù)據(jù)為例,先將原始數(shù)據(jù)做歸一化處理,然后將其作為輸入信號,再將數(shù)據(jù)的前132作為訓練樣本,建立網(wǎng)絡(luò),后100數(shù)據(jù)作為測試樣本,檢驗網(wǎng)絡(luò)性能。中間的計算過程在MATLAB7.1平臺上實現(xiàn)。
聯(lián)系:highspeedlogic
QQ :1224848052
微信:HuangL1121
郵箱:1224848052@qq.com
網(wǎng)站:http://www.mat7lab.com/
網(wǎng)站:http://www.hslogic.com/
微信掃一掃: