前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡的優缺點主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:負荷預測;神經網絡;唐山電網;電力系統;電力負荷
中圖分類號:TM714文獻標識碼:A文章編號:1009-2374 (2010)13-0124-02
一、預測意義
唐山是具有百年歷史的沿海重工業城市,是河北省經濟中心,同時也是中國經濟發展前景最好的城市之一。特別是最近幾年,隨著國家產業結構與河北戰略布局的調整,重大項目紛紛在唐山興建,預計在未來幾年唐山地區經濟仍將快速增長。根據唐山電網用電情況統計數據,唐山電網2001年用電量158.266億千瓦時,2008年用電量538.509億千瓦時,平均年增長17.9%。綜合考慮唐山地區經濟發展與用電量增長因素,預計未來幾年唐山電網電力負荷將保持較高的增長。中長期電力負荷預測是電力系統規劃的基礎,它在電力系統規劃、新發電廠和發配電系統的建立過程中起到重要的指導作用。為了滿足唐山電網負荷不斷增長的需要,增加供電可靠性,對該地區進行科學合理的電力系統規劃勢在必行。因此,對唐山電網中長期的電力負荷進行預測具有重要意義。
二、預測方法選擇
目前,電力負荷預測的研究已經十分成熟,許多方法和模型被引用到電力負荷預測中,其中比較常用的預測方法有以下幾種:回歸分析法、時間序列法、指數平滑法、神經網絡法、灰色模型法、優選組合預測法、小波分析預測技術等。以上負荷預測的方法都有自身的優缺點以及適用范圍。電力系統專家經過長期負荷預測實踐,建議中長期電力負荷預測使用時間序列法與灰色模型法。由于未來幾年唐山市將投產幾個重大項目,唐山電網負荷將呈現不規則的跳躍式增長。因此,按照常規的預測方法對唐山電網的用電負荷進行預測將無法獲得較滿意的數據擬合度。神經網絡算法能夠實現較復雜的非線性映射,對大量的非結構性、非準確性規律具有自適應能力,應用于電力系統負荷預測,能夠得到比傳統預測方法更好的效果。因此,本文嘗試使用神經網絡算法預測唐山電網的用電負荷。
三、預測模型的建立
(一)確定神經網絡輸入量
輸入層是神經網絡結構的第一層次,該層次輸入量的確定關系到神經網絡訓練的效率。特征量取得太少,則不能起到區分判斷作用;取得太多則影響網絡的訓練速度。因此,合理地選擇輸入量,能提高網絡的訓練速度和預測精度。為了簡化模型的結構,提高預測的精度,本文綜合考慮中長期電力負荷預測的相關因素以及唐山電網的用電特點,確定以下五種影響電力負荷的經濟因素作為神經網絡的輸入量即:“唐山地區的生產總值(GDP);第一產業用電量占總用電量的比重;第二產業用電量占總用電量的比重;第三產業用電量占總用電量的比重;生活用電量占總用電量的比重。”
(二)構造神經網絡結構
本文應用的神經網絡是由輸入層、輸出層和隱含層三層網絡結構構成。理論研究已證明對于任何在閉區間上連續的函數,只要隱含層神經元數目足夠多,就可以用只含一個隱含層的網絡結構以任意精度來逼近,所以本文隱含層只取一層。第一層為輸入層,神經網絡的輸入神經元為五種影響唐山電網用電負荷的經濟因素,因此該層的神經元個數為5個;第二層是隱含層,隱含層神經元數根據下式求得:
或或h=lg2n (1)
其中k為樣本數,n為輸入層神經元數,m為輸出神經元數,h為隱含層神經元數,a為1~10之間的常數。第三層是輸出層,因為輸出結果只有一個指標即唐山電網某年的用電量,所以輸出神經元的個數是1。從而確定本文的神經網絡結構為5×3×1。
(三)神經網絡的訓練算法
由于標準BP算法中,人為憑經驗選取學習率和動量因子,往往會對網絡學習速度產生較大影響,甚至會因為學習率選取不當而導致學習中發生振蕩而不能收斂,這些缺點將影響整個預測的精度。本文采用改進的批處理式Vogl快速算法,進行網絡訓練。在網絡訓練過程中根據訓練的實際情況自適應改變學習率η及動量因子α的大小:當前的誤差梯度修正正確,則增大學習率,加入動量項;否則減少學習率,甩掉動量項。這樣初始η值就可以相對隨意的選取,避免上述缺點。自適應改變η及α的修正公式如下:
(2)
上式中ΔE=E(J)-E(J-1),表示神經網絡前后相鄰兩次學習過程中誤差函數的變化量。φ略大于1,β略小于1。E (J)為神經網絡第J次訓練過程中的誤差函數:
(3)
式中:pt',和Ot分別表示神經網絡對應于第t個輸入向量的期望輸出和實際輸出。
(四)預測實施
唐山電網2001~2008年用電量、生產總值以及各產業用電占比情況的歷史數據見表1:
表12001~2008年唐山電網用電情況統計
年份 生產總值
/萬元 用電量
/億千瓦時 一產用電
/% 二產用電
/% 三產用電
/% 生活用電
/%
2001年 9150473 158.266 3.8 83.4 5.5 7.2
2002年 9993543 180.420 3.3 84.6 5.5 6.6
2003年 11022878 233.638 2.2 87.7 4.8 5.3
2004年 17616311 290.260 1.7 89.1 4.5 4.7
2005年 20276374 358.800 2.4 89.1 4.0 4.5
2006年 23621410 432.752 2.1 89.3 4.2 4.5
2007年 27794190 520.020 1.3 90.5 4.1 4.1
2008年 36132447 538.509 1.2 90.0 4.4 4.4
根據2001~2008年唐山電網用電量的歷史數據,分別使用時間序列法、灰色預測模型與神經網絡算法對唐山電網的用電量進行預測。使用2001~2006年的歷史數據預測2007年、2008年的用電量,并將預測結果與真實數據做對比,以分析三種預測方法的誤差。通過
Matlab軟件計算,三種預測方法的預測結果及誤差情況,見表2:
表2用電量預測值及誤差表
序號 年份 用電量 灰色模型 時間序列法 神經網絡
預測值 誤差 預測值 誤差 預測值 誤差
1 2007年 520.020 501.1 3.64% 487.9 6.41% 531.7 2.25%
2 2008年 538.509 512.4 4.85% 503.9 6.75% 559.4 3.88%
通過上表我們可以看出以上三種預測方法的誤差除了時間序列法的誤差較高外,都在允許的范圍內。灰色模型與神經網絡算法都可以較準確的預測出唐山電網的用電量。相比而言,神經網絡算法預測對于歷史數據的擬合度更高,神經網絡算法更適用于唐山電網中長期的電力負荷預測。因此,本文使用神經網絡算法對唐山電網未來五年的用電負荷進行預測,通過Matlab軟件計算,預測結果見表3:
表3唐山電網用電負荷預測
序號 年份 年用電量(億千瓦時) 年最大負荷(MW)
1 2009 584.282 7637.677
2 2010 625.182 8172.314
3 2011 665.819 8703.514
4 2012 725.077 9478.127
5 2013 781.633 10217.42
四、結論
本文研究了神經網絡算法在唐山電網中長期電力負荷預測中的應用。研究結果表明,應用神經網絡算法比時間序列法、灰色模型有更高的預測精度,神經網絡算法可以較準確的預測唐山電網中長期的電力負荷。
參考文獻
[1]于之虹,郭志忠.數據挖掘與電力系統[J].電網技術,2001,25(8).
關鍵詞:切削數據庫;數據尋優算法;實例推理;粒子群算法;神經網絡算法
中圖分類號:TG506 文獻標志碼:A 文章編號:1007-2683(2013)01-0001-06
0.引言
近年來,隨著數控機床及切削刀具技術的不斷發展,切削數據在機械制造領域中越來越顯示出其重要性,并且已經成為一種極為重要的資源。
數據庫是集中、保存和管理某一領域內所有這些信息的集合,是管理信息系統的核心。切削數據庫是切削加工技術與計算機技術相結合的產物。切削數據庫最初只是管理加工中出現的切削數據,隨著神經網絡算法、粒子群算法等優化算法的應用,切削數據庫中添加了優化切削數據和切削數據的智能化評價等功能,使得切削數據庫系統得到了很大的發展并已受到各相關行業的高度重視。選擇合理的優化算法建立切削數據庫,可以合理地選擇切削參數,對提高生產率、降低生產成本有著非常重要的意義。對于解決某一類問題,可以通過多種算法來實現但并不是每一種算法都能找到最優解,需要根據每個算法自身的優缺點、適合的領域、優化方式等來選擇合適的算法,從而使尋優路徑達到最短,優化效果達到最好。但是傳統的優化算法也存在一定的弊端,為此提出了算法的改進算法,在很大程度上增強了算法的尋優能力。
1.數據獲取技術在切削數據庫中的應用
1.1神經網絡推理技術
神經網絡算法是指模擬生物的神經結構以及其處理信息的方式來進行計算的一種算法。神經網絡可以處理例外及不正常的輸入數據,這對于很多系統都很重要。黃傳真等研究的汽車覆蓋件模具鋼高速切削數據庫將分別基于MATLAB神經網絡和基于指數函數的刀具磨損預報模型的擬合誤差相比較,優選出基于MATLAB神經網絡的刀具磨損預報模型,并將.NET框架和MATLAB環境引入到刀具磨損集成預報系統中,實現了模具鋼精加工過程中對刀具磨損的在線預報,實現了對高速切削加工技術的合理應用。
為了實現神經網絡模型的智能尋優,將其與蟻群算法相結合使用,用蟻群算法的啟發式尋優和全局優化的特點來訓練神經網絡的權值即用蟻群算法來訓練神經網絡,最終解決尋優問題。如詹曉娟等研究的基于蟻群神經網絡銑削數據庫系統就是利用蟻群算法優化神經網絡的方法,使系統在切削參數的選擇具有一定的智力水平,實現了切削參數的合理選擇。這種智能尋優的方法不僅避免了以往算法收斂速度慢易陷入局部最優等缺陷,提高了系統的運行速度和運算效率,還能夠通過自學習提高自身決策能力,使決策結果更趨合理。
神經網絡在解決非線性映射問題如切削用量選擇上可達到良好的效果,在機械工程領域具有很高的利用價值。但是當前的神經網絡仍普遍存在收斂速度慢、計算量大、訓練時間長和不可解釋等缺點。
1.2動力學仿真優化技術
切削參數數據庫的數據主要來源于切削手冊、生產實踐和切削實驗,傳統來源的切削參數難以完全滿足切削加工的要求。為了存儲優化型仿真切削數據,保證切削加工穩定性,趙海洋等在平臺下開發了基于B/S數據庫結構的動力學仿真優化型切削數據庫系統。該系統通過動力學仿真優化方式獲取優化型切削參數,實現了高速加工過程中的穩定高效切削。
將動力學仿真優化技術引入到切削數據庫及其應用系統中,不僅能使系統具有良好的結構和可擴展性,還能提供工藝人員合理的切削參數,大大減少了以往試切所帶來的經濟和時間上的浪費,從而提高了生產效率,降低了生產成本。
1.3實例推理技術
1982年Schank通過研究人和機器學習的動態存儲理論,提出了基于實例的推理(case-based reason-ing,CBR)其本質是利用舊問題的解決方案來解決新問題,并且具有自學習功能,CBR原理如圖1所示。
利用實例推理技術,將其與規則推理相結合使用,把以往取得的經驗應用于新問題的解決上,減少知識獲取的工作量,不僅可以為建立切削參數數據庫提供一個有效可行的方法,還可以為新的工件加工問題提供參考解決方案,對切削技術的推廣應用具有非常重要的意義。
CBR是一種人工智能的推理方法,廣泛應用于問題求解領域,在一定程度上突破了知識獲取的瓶頸問題。由于CBR中實例都是以往問題的優化結果,因此其本身就包含了大量的設計經驗知識,不僅避免了在獲取知識上的時間的浪費,而且設計結果的實用性也很強。CBR為快速設計新的工藝提供了依據。
2.切削數據優化算法分析對比
2.1多目標優化算法的比較
從古老的時代開始,人們就力求在解決一個問題的眾多方案中尋求一種最優方案,因此實際中優化問題大多數是多目標優化問題,它也是一類普遍存在的問題。基于群體智能進化的群體智能優化算法在解決多目標優化問題上提高了人們解決和處理優化問題的能力。但是粒子群算法等群體智能優化算法在解決多目標優化問題時有著各自的優缺點,需要對它們進行比較以選擇合適的算法。表1是幾種智能優化算法的比較。
通過表1中幾種算法的對比可以看出,每種優化算法都有自己獨特的優缺點,但是在處理高維復雜問題時都出現易陷入局部最優、收斂效果不好的問題。粒子群算法和遺傳算法都屬于全局優化算法,利用目標函數來衡量個體的優劣程度,粒子群算法計算復雜度比遺傳算法低,可以短時間內找到最優解,但粒子群算法在搜索性能上好于混洗蛙跳算法。可以將幾種算法結合使用或者對某種算法進行改進,彌補以往算法的缺點,從而達到更好的解決多目標優化問題的目的。
2.2知識獲取的推理方式比較
規則推理、人工神經網絡、實例推理、模糊邏輯、遺傳算法和混合推理等智能推理方法被普遍應用在工程中。實例推理作為基于規則推理技術的一個重要補充,已受到人們越來越廣泛的關注。但目前比較常用的智能推理方法有規則推理、神經網絡和實例推理,它們在解決不同問題上表現出各自的優缺點,如表2所示。
根據表2列出的3種智能推理方式的比較可以看出,在總體上來看實例推理表現最好,但在解決復雜知識獲取問題上仍表現出明顯的不足。針對這一問題研究人員將實例推理、規則推理、人工神經網絡三者結合,產生了各種各樣的混合推理,這些推理不僅結合了它們各自的優點,而且很大程度上克服了單個方法的缺點,可
以很好的解決復雜問題,如高速切削數據庫系統的建立就是采用規則推理和實例相結合的混合推理方式,通過這一方式使該系統的數據采集和知識更新變得簡單易行。
2.3數據查詢優化算法比較
隨著現代切削數據庫規模的不斷擴大,高效率的信息提取技術逐漸成為人們研究的熱點。高效的查詢被用來體現一個系統性能的好壞,查詢的效率也就成為了評價切削數據庫系統的重要指標。提高查詢效率是建立一個系統首要解決的問題之一,因此對作為有效手段的查詢優化的研究就顯得尤為重要。但是一個較好的優化算法,并不是通用和萬能的,根據不同的環境不同的優化算法適用于不同的的問題及用戶。目前常用的數據查尋優化算法有啟發式搜索算法又稱為A算法,它是在貪婪算法的基礎上提出的一種基于人工智能理論的改進算法;基于Agent的分布式查詢優化算法,它結合了分布式人工智能與切削數據庫管理系統兩個領域;遺傳算法,它是模擬生物在環境中遺傳和進化過程而形成得一種自適應的全局優化概率搜索算法;全局查詢優化算法如模擬退火算法、快速分解模擬退火等,能夠找出全局最優解;等聯結操作結果估算模型,它是一種改進算法,能保證優化方法在一定條件下生成的任意兩個相鄰的操作次序是最優的;分裂大表算法即將大表分成若干個子表和一個索引表,將子表放在不同的邏輯設備上,各子表的名稱和分裂條件存放在索引表里來提高查詢速度;神經網絡技術的異構數據庫集成,它可以通過將全局查詢快速地分解為各個子查詢,來進行優化操作;多元連接查詢優化算法,針對遠程網和局域網這兩種不同的網絡,提出了最小生成樹算法和改進的最小生成樹算法兩種全局優化算法,反復使用此算法可使預先估計的總代價最小;分布式查詢優化算法,它的核心是SDD-1查詢優化算法,該算法在一定程度上可以使整個網絡上的傳輸量保持最小。對數據庫進行查詢時,可供選擇查詢優化算法很多,需要根據一定的標準來評價各算法是否適用于此環境,以提高效率的目的。為此研究人員提出了評價算法的4個標準:一是否適用于大數據量;二是否能應付異構數據庫的要求;三是局部優化還是全局優化;四是算法的效率是否滿足大數據量、高復雜性的要求。表3是幾種數據查詢優化算法的比較。
由表3可知,對數據庫進行查詢時,對查詢優化算法的選擇需要考慮很多因素,不能通過一個固定的原則來評價優化算法的優劣,需要根據當時的系統環境來選擇合適的優化算法,這樣才能充分利用算法的優點。
3.數據尋優算法的改進
目前許多數據優化算法被廣泛應用在機械加工領域,在一定程度上達到了數據尋優的目的,提高了系統的尋優能力,但是面臨一些復雜的問題時一些算法表現出收斂速度慢、陷入局優等問題,為了解決這一問題,對一些算法提出了改進,下面介紹了幾種算法的改進算法。
3.1變形遺傳算法
變形遺傳算法是從簡單遺傳算法發展而來的,是對其運算因子的擴展和補充。簡單遺傳算法存在許多的不足之處,變形遺傳算法在此基礎上進行了一些改進:改進編碼方式,改進初始群體的生成方式,改進適應度函數的定義方式,改進選擇算子操作方式,改進變異算子操作方式,改進算法終止條件。這些算法增強了變形遺傳算法搜索過程的方向性,從而增強了算法搜索尋優的方向性。圖2為切削用量優化的變形遺傳算法的流程圖。
變形遺傳算法有兩個優點:一是具有局部的隨機搜索能力;二是可維持群體多樣性,防止出現未成熟收斂現象,從而使收斂概率達到大值。
3.2改進的粒子群算法
粒子群優化算法在函數優化等領域蘊涵了廣闊的應用前景,利用粒子群優化參數原理(如圖3),并與局部搜索算法混合,可以提高了算法在局部區域內進行精細搜索的能力。尋找到最優化的加工參數。目前針對粒子群算法存在的問題,已提出了多種粒子群算法改進算法,并且這些改進的算法廣泛應用于函數優化,神經網絡訓練,模式分類等領域。其中一種改進的粒子群算法是針對粒子群算法在求解高維函數時易陷入局部最優的問題提出的,該算法通過對粒子的速度和位置更新公式進行改進,使粒子在其最優位置的基礎上進行位置更新,從而增強算法的尋優能力。如圖4為改進的粒子群算法流程圖。
另外兩種典型的粒子群算法的改進算法為:①全局鄰域模式和局部鄰域模式粒子群優化算法,前者收斂速度快,但易陷入局部極小值;后者收斂速度慢,但能在較大程度上避開局部極小值;②混沌粒子群優化算法,它不但具有混沌的隨機性、遍歷性、規律性等特性,還能引導粒子及其組成的群落搜索全局最優解。
3.3協同優化算法的改進
協同優化算法(eollaborati Veoptimization,CO)是多學科設計優化方法中應用最廣、效果最好的算法,但是在應用中存在計算困難的問題,根據這一問題提出了改進的協同優化算法一ICO(Improvedeollaborati Veoptimization)多學科設計優化方法。
ICO多學科設計優化方法保持了CO算法模塊化和學科自治性的優點,以新的表達方式來克服CO算法的計算困難。ICO算法利用快速啟動方法提高了計算速度,使得ICO算法比標準CO算法更加穩定、可靠,計算效率明顯提高。以往協同粒子群算法不能保證全局收斂,易產生偽最優值的問題,根據這一問題提出改進的協同粒子群優化算法,它將混沌理論引入協同粒子群算法中,改善了協同粒子群算法的性能,使其具備了求解高維優化問題的優越性。但是IC0算法還需要在大型復雜工程系統設計優化中進行應用、檢驗及進一步完善。
Matherton提出Kriging數學理論之后,Kriging技術在許多領域得到應用,研究人員以此為基礎并基于統計學理論提出了Kriging模型,Kriging模型被視為一種最優的線性無偏估計。對于計算量大的問題可以利用基于Kriging模型的改進協同優化算法(Kriging-CO算法)來提高系統的優化效率,該改進算法的原理如圖5所示。Kriging-CO算法適用于解決共享變量多、子模型復雜的問題,應用該算法減少迭代次數,提高運算效率。
雖然一些改進算法彌補了以往算法一些不足,但切削數據庫技術的發展越來越快,對切削數據庫性能的要求越來越高,出現的問題也會越來越多,因此對算法的研究也必須更加深入。
4.結語
關鍵詞:神經網絡; 技術開發;成果;評價;指標
Abstract: The method of artificial neural networks is the combination qualitative analysis with quantitative analysis and both fuzzy reasoning and expert appraisal advantage after all methods of evaluation are studied in the paper. Then refinement awards indicators and defining the weight on science and technology progress award conditions of Heilongjiang. The correlation coefficient of the calibration set is 0.912 and that of prediction set is 0.903. The standard error of calibration set is 0.00736 and that of prediction set is 0.00692. The variation coefficient of calibration set is 8.02% and that of prediction set is 7.36%. Evaluation results show that the data is high accuracy and adaptability general.
Keywords: Neural network; Technology development; Achievement; Evaluation; Index
中圖分類號:TN711 文獻標識碼:A 文章編號:
1前言
2012年我國科研經費支出高達10240億元,各類科技成果登記數量較往年都有大幅增長。在技術發展的關鍵時期,科技成果不該只重數量,更應該關注質量。一直以來被各級各類權力機關普遍采用的是專家評議法,其簡單實用但是主觀性太強。與專家評議不同的是德爾菲法采用背對背方式評價,避免了專家之間互相干擾,缺點是溝通周期過長[1、2]。20世紀60年展起來文獻計量法,開創了量化評價新紀元,但也未免刻板單一無法推廣[3、4]。70年代美國運籌學家Saaty T.L教授提出層次分析法(AHP),該方法將主觀評價客觀量化,使定性和定量分析結合,拓展了量化評價新內涵[5、6]。近年有學者提出模糊綜合評價法,是專家系統定量轉化的又一完美體現,但是隸屬函數的多樣性使得該方法不具備標準化可能[7、8]。人工神經網絡從1943年的MP模型提出至今成功解決了許多非線性系統建模、判決、優化等問題。適當選取科技成果屬性作為神經網絡輸入元,通過學習機制訓練可以得到一個類專家判斷結果[9、10]。采用專家定性評價作為輸入神經元,非線性映射模擬專家思維過程,輸入至推理過程兼顧了模糊推理和專家評議優勢,神經元輸出數字結果,清晰明了。
2技術開發科學技術進步獎指標分解
在各類科技成果中基礎理論和軟科學成果適合用文獻計量法定量客觀評價,而應用型技術成果由于涉及學科領域差異大,成果形式差異大,適合運用神經網絡模型非線性評價。
黑龍江省科學技術進步類獎根據科技成果特點劃分為社會公益類項目、技術開發類項目、重大工程類項目、技術改造類項目分別評定。以技術開發類科技成果評價為例說明神經網絡評價過程,其他類別項目同樣適用。現行黑龍江省技術開發進步獎評審一級指標及其權重如下表一所示(指標來源于黑龍江省科學技術獎勵辦法實施細則)。考慮到這些指標比較含義比較大,有實際操作困難,細化各類指標并分配權重(咨詢有關專家)得到二級指標及其權重。
表一指標及權重
Table1 Index and weight
專家評價對象過程尊重主觀思維特點,只需針對27個二級指標作出定性判斷,即優加、優秀、良加、良好、中加、中等、一般。模糊輸入歸一化后對應1.0,0.9,0.8,0.7,0.6,0.5,0.4數字量。
3神經網絡評價模型
神經網絡通過期望輸出與實際輸出之間差值反向影響輸入到輸出的路徑,自適應調整訓練過程,目標使偏差最小達到期望輸出。本研究中擬用BP算法訓練神經網絡模型。
以三層結構BP網絡為例。輸入向量;隱含層輸出向量;輸出層輸出向量;期望輸出向量;輸入層到隱含層之間的權值矩陣用表示,;隱含層到輸出層之間的權值矩陣用表示,,則網絡輸出誤差、權值變化率如下公式(1)(2)定義,其中為學習速率。
有50個待評估科技成果,劃分30個為校正集合,20個為預測集。30位專家針對二級指標給出模糊評價量化之后,與二級指標權重乘積作為三層BP神經網絡輸入向量。
BP神經網絡中, 隱含層節點數的選擇對網絡的性能影響較大。若隱含層節點數過少,則局部極小值過多,不能達到網絡訓練的效果;若隱含節點數過多,網絡擬合函數復雜,容易過擬合,使得網絡泛化能力變差。根據公式:
式中m為輸入節點數,n為輸出節點數,為隱含層節點數,a為1~10之間的常數。
輸入節點數為17,輸出節點數為1,計算出,分別采用5~14作為隱含層節點個數,多次訓練結果表明隱含層節點數為6的時候,模型預測效果最好。各層的激活函數均采用S型函數,目標誤差為0.01,最大迭代次數為1000次。網絡輸出用a,b,c,d分別表示一等、二等、三等獎和落選,其期望值分別是0.9,0.7,0.5,0.3,校正集和預測集合泛化結果見表二。
表二 神經網絡模型評價結果分析
Table2 Analysis of neutral network evaluation
評價結果分析表明,基于BP神經網絡的評價模型相關系數較高,誤差較小,滿足目標要求,復現性較高,可應用于實際技術開發類科技進步獎項評定。
[1] 劉學毅. 德爾菲法在交叉學科研究評價中的運用. 西南交通大學學報(社會科學版)[J]. 2007(8),2: 21-25.
[2] 劉明壽. 采用德爾菲法評價高校學報學術影響力. 貴州大學學報(自然科學版) [J].2004(21),4:437-440.
[3] 張鳳. 采用文獻計量法評價高校科研水平. 鞍山師范學院學報[J]. 2005(7),2:98-100
[4] 李興敏. 利用文獻計量法分析國內成人教育管理改革方向. 成人教育[J]. 2012(306),7:20-21.
[5] 劉仁山, 孟祥宏.基于層次分析法的信息系統安全評價研究. 河北工業科技[J]. 2013(30),1:17-21.
[6] 趙昱, 劉行, 徐佳等. 基于層次分析法—灰色聚類的PFI 模式下公租房建設的風險評價方法工程管理學報[J].2013(27),1:69-73.
[7] 王琳; 劉保東隨機可變模糊識別模型在清潔生產評價中的應用. 山東大學學報(工學版) [J].2012(42),6:1-10.
[8] 彭亮. Groupon模式下團購網站消費者信任度的模糊綜合評價. 企業經濟[J]. 2011(366),2:85-88.
關鍵字:預測模型
一.時間序列分析法
(一)原理
ARMA模型被廣泛的應用于時間序列的分析和預測。ARMA(p,q)模型中包括了p自回歸項和q滑動平均項,它是自回歸模型(AR模型)和滑動平均模型(MA模型)的一般形式,下面就分別介紹AR模型,MA模型和ARMA模型。
(1)自回歸AR(P)模型
AR模型即自回歸模型,滿足: 其中 是模型的參數,c是常數項, 是誤差項,E( )=0,E( )= ,E( )=0,t=s。為了簡化,常省去常數項c。為了保持AR模型的穩定性,對于模型的參數常有些限制條件,如誤差項 是均值為0方差為 的白噪聲。
(2)滑動平均MA(q)模型
MA模型既滑動平均模型,滿足: ,其中 ,i=1,…,q是模型的參數, ,i=1,…,q是誤差項。滿足以上方程的時間序列{ }是q―階滑動平均過程,記為MA(q)。
(3)自回歸滑動平均ARMA(p,q)模型
ARMA(p,q)模型中包含了p自回歸項和q滑動平均項,它是自回歸模型(ARMA模型)和滑動平均模型(MA模型)的一般形式,ARMA(p,q)模型可以表示為 = + ,其中 ,…, 是模型的參數, 是常數項, 是誤差項。如果q=0,則ARMA模型就簡化成AR模型,如果p=0,則ARMA模型就簡化成MA模型。
由此可以看出AR(p),MA(q),ARMA(p,q)模型之間存在著深刻的聯系。
(二)模型評價
時間序列預測法期限是短期,中期預測。主要適用于經濟預測,商業預測,需求預測,庫存預測等。時間序列分析預測法是根據市場過去的變化趨勢未來的發展,它的前提是假定事物的過去會同樣延續到未來。事物的現實是歷史發展的結果,而事物的未來又是顯示的延伸,事物的過去和未來是有聯系的。優點是簡單易行,便于掌握,能夠充分運用原時間序列的各項數據,計算速度快。采用組合的時間序列或者把時間序列和其他模型組合效果更好。缺點是不能反映事物的內在聯系,不能分析兩個因素的相關關系。當遇到外界發生較大變化往往會有較大偏差。
二.神經網絡(BP)預測模型
(一)原理
BP網絡是采用Widrow―Hoff學習算法和非線性可轉移函數的多層網絡。典型的BP算法采用梯度下降法,也就是Widrow―Hoff算法。現在有許多基本的優化算法,例如變尺度算法和牛頓算法。BP神經網絡包括一下單元:①處理單元(神經元),級神經網絡的基本組成部分。輸入層的處理單元只是將輸入值轉入相鄰的聯接權重,隱層和輸出層的處理單元將它們的輸出值求和并根據轉移函數計算輸出值。②聯接權重。它將神經網絡中的處理單元聯系起來,其值隨各處理單元的聯接程度而變化。③層。神經網絡一般具有輸入層x、隱層y和輸入層o。④閾值。其值可為恒值或可變值,它可使網絡能更自由地獲取所要描述的函數關系。⑤轉移函數F。它是將輸入的數據轉化為輸出的處理單元,通常為非線性函數。
(二)模型評價
BP神經網絡模型適用于中長期的預測。優點:逼近效果好,計算速度快。不需要建立數學模型,精度高。具有強非線性擬合能力。缺點是無法表達和分析被預測系統的輸入和輸出間的關系,預測人員無法參與預測過程,收斂速度慢,難以處理海量數據,得到的網絡容錯能力差,算法不完備。
三.灰色預測模型
灰色系統理論以“部分信息已知,部分信息未知”的“小樣本”,“貧信息”不確定型系統的研究對象。
(一)原理
灰色系統有多種模型。n階h個變量的灰色模型幾座GM(n,h)。預測模型中,最常用的是GM(1,1)模型。GM(1,1)模型的微分方式為
d+a其中t表示時間序號;a,u表示原始數據
灰色模型的基本思路可以概括為以下幾點:
(1)建立模型常用數據有以下幾種:1.科學實驗數據;2.經驗數據;3.生產數據;4.決策數據。
(2)序列生成數據是建立灰色模型的基礎數據。
(3)一般非負序列累加生成后,得到準光滑序列。對于滿足光滑條件的序列,即可建立GM微分模型。
(4)模型精度可以通過不同的會輸生成方式。數據的取舍,序列的調整,修正以及不同級別的殘差GM模型補充得到提高。
(5)灰色系統理論采用殘差大小檢驗,關聯度檢驗,后嚴查檢驗三種方法檢驗,判斷模型的精度。
(二)模型評價
核心體系是灰色模型,即對原始數據作累加生成得到近似的指數規律再進行建模的模型方法。優點是不需要很多的數據,一般只需要4個數據就夠了,能解決歷史數據少。序列的完整性及可靠性低的問題。運算簡便,易于檢驗。具有不考慮分布規律和變化趨勢的特點。缺點是只適合用與中長期的預測,只適合指數增長的預測,數據波動性大對預測精度有較大影響,預測結果較差。
以上三種預測模型有各自的優缺點,針對數據的特點,有針對性的選擇合適的預測模型。有時也可以結合模型的優點進行組合應用。
參考文獻
[1]陳蓉 話務量分析和多種預測模型的比較研究
[2]朱峰 淺談數學建模中預測方法 --- 高校講壇
關鍵詞:模擬電路;故障診斷;模糊數學;bp網絡;模糊bp網絡
0引言
電路故障是指在規定的條件下,電路工作時它的一個或幾個性能參數不能保持在要求的上、下限之間,其結構、組件、元器件等出現性能減退、老化、破損、斷裂、擊穿等現象,喪失了在規定條件和環境下完成所需功能的能力。
長期以來,學界對模擬電路工作特點的研究已相當深入,但對于故障診斷方法的研究卻困難較大,這是由于模擬電路本身的特性決定的:1)輸入激勵和輸出響應都是連續量,模擬電路中的故障模型復雜,量化難度大;2)模擬電路信號量程寬,不管電壓、電流的量程還是頻率都可達十幾個數量級,測量難度大;3)模擬電路中的元器件參數具有容差,導致電路的故障狀態的模糊性,而無法準確定位;4)模擬電路中存在廣泛的反饋回路和非線性問題,使計算的難度更加復雜。因此,學界提出了許多模型和方法來完成對某些符合特定條件的模擬電路的故障診斷。其中神經網絡法的使用就相當普遍,在硬和軟故障診斷中都有應用,因為神經網絡的技術優勢針對模擬電路故障診斷有較好的適用性,這主要體現在:1)神經網絡的大規模并行處理特點,大大提高了診斷效率;2)自適應與自組織能力使神經網絡在學習和訓練中改變權重值,發展出新的功能。同時,模糊數學也與神經網絡相結合,這是利用了模糊數學對待診斷模擬元器件的故障不確定性進行量化處理,能夠有效克服模擬電路元器件因為容差、非線性及噪聲造成的電路參數模糊性。
本文的研究目的就是分別利用單純bp神經網絡和模糊bp神經網絡的方法建立模擬電路故障診斷模型,利用電路仿真收集電路不同工作狀態下的關鍵點電壓,代入診斷模型并得到診斷結果。根據各網絡的結果分析比較各診斷模型的優缺點,找出模糊數學對改進模擬電路故障診斷模型的具體表現。
1模糊神經網絡的故障診斷模型
1.1典型模糊神經網絡診斷模型介紹
圖1顯示的是一個典型的模糊神經網絡模型,該模型由原始知識獲取(fundamental knowledge acquire,fka)、特征參數處理(characteristic parameter produce,cdp)、知識提取(knowledge extracted,ke)、經驗知識庫(experience knowledge base,ekb)、學習樣本集(learning sample set,lss)和模糊神經網絡(fuzzy neural networks,fnn)共6個模塊共同組成,其工作流程是:
圖1 典型模糊神經網絡診斷模型
1)原始知識獲取模塊通過對電路工作原理進行分析,模擬或仿真各類故障發生時輸入和輸出參數,從而獲取原始知識(x,y),將其傳入知識提取模塊中供系統學習,所得經驗集存入經驗知識庫中;
2)將原始知識和已經存放在經驗知識庫中的經驗知識(初始庫可為空)一起輸入學習樣本組織模塊中,進行學習樣本的構建,合成訓練樣本集為(x1,y1);
3)將(x1,y1)輸入到模糊神經網絡模塊,學習訓練,并在達到指定精度后停止;
4)將從模擬電路中獲得的實測參數xc輸入至特征參數提取模塊中,完成數據分析和處理,輸出特征參數數據xc';
5)將特征參數數據輸入到學習收斂后的模糊神經網絡中,進行診斷推理,得出診斷結果yc';
6)將得到的實測數據集(xc',yc')輸入學習樣本組織模塊,動態增強模糊神經網絡的自適應能力;
7)將得到的實測數據集(xc',yc')輸入知識提取模塊,進行分析和處理,如能提取出經驗知識,則歸入經驗知識庫中[1]。
1.2模糊神經網絡結構
模糊神經網絡的結構應該包括4層,如圖2所示。
模糊層的作用是將輸入量進行模糊化。每一個模糊層節點對應一個該論域中的模糊子集和隸屬函數。該層接收精確數值輸入,經過模糊化計算得出對應的隸屬度并輸出。
圖2 模糊神經網絡結構圖
輸入層、隱含層和輸出層共同構成一個完整的神經網絡。輸入層不具有運算功能,它只是將所感知的輸入值精確傳遞到神經網絡中;隱含層的作用相當于特征檢測器,提取輸入模式中包含的有效特征信息,使輸出層所處理的模式是線性可分的,該層節點是模糊神經元,與輸入層間的連接權值是隨機設定的固定值;輸出層節點也是模糊神經元,與隱含層之間采用全連接方式,其連接權值是可調的,作用是輸出用模糊量表示的結果[2]。
1.3輸入層、輸出層和隱含層節點數確定
輸入層的個數代表了電路故障診斷的關鍵測試點的個數n1,輸出點為電路所具有的潛在故障模式種類數n3。
根據輸入層和輸出層的個數,隱含層節點數n2的確定有以下4種經驗公式[3]:
(1)
(為0~10之間的常數)(2)
(為0~10之間的常數)(3)
(4)
2模糊數學和神經網絡的算法介紹
2.1模糊數學和隸屬度函數
模糊數學的作用是對測試點測得的電壓信號進行特征提取——模糊化處理。因為在模擬電路測試中,參數值會隨著故障原因的不同和故障階段不同而發生變化,所以在進行數據處理時常用方法是使用精確事實規則。即用正態分布函數作為隸屬度函數表示“大約為a”的模糊概念,此外還有如三角分布和梯形分布等[4]。在使用中,正態分布使用較多,其中的a是該測試點的理想狀態工作點,b為該測試點在各種可能狀態下的工作電壓均方差。
2.2bp神經網絡與算法
圖3bp神經網絡模型結構圖
反向傳播網絡(back-propagation network,簡稱bp網絡),是一種有隱含層的多層前饋網絡。每一層均有一個或多個神經元節點,信息從輸入層依次經各隱含層向輸出層傳遞,層間的連接關系強弱由連接權值w來表征。bp算法是一種監督的學習,基本原理是梯度最速下降法,中心思想是調整權值使網絡總誤差最小。通過連續不斷地在相對于誤差函數斜率下降的方向上計算網絡權值和偏差值的變化而逐漸逼近目標的。每一次權值和偏差的變化都與網絡的誤差的影響成正比,并以反向傳播的方式傳遞到每一層。bp網絡模型結構如圖3所示。
以bp神經網絡模型結構圖為例進行bp算法推導,其輸入為p,輸入神經元有r個,隱含層內有s1個神經元,激活函數為f1,輸入層內有s2個神經元,對應的激活函數為f2,輸出為a,目標矢量為t。
1)隱含層輸出:(i=1,2,…,s1)(5)
2)輸出層輸出: (k=1,2,…,s2) (6)
3)定義誤差函數:(7)
4)輸入層的權值變化量:(8)
其中:
同理可得:(9)
5)隱含層權值變化有: (10)
其中:
同理: (11)
bp網絡經常使用的是s型的對數、正切激活函數或線性函數[5]。
3電路故障診斷算法驗證
圖4 共集-共射電路的直流通路圖
例:如圖4所示的直流通路圖,電阻的標稱值如圖中所注。利用multism軟件在直流狀態下進行多次monte carlo分析仿真該電路[6],并考慮電阻的容差影響,取40個樣本作為模糊神經網絡的訓練樣本,另取5個樣本為測試樣本。設電阻r1~r5的容差值為-5%~5%。測試點選為a、b、c、d和e五點,所測電壓值為va、vb、vc、vd和ve。
表1 部分電路實驗樣本原始數據
表2 測試樣本原始數據
表1列舉了40組電路實驗樣本原始數據的11組,包含了該電路在11種工作狀態下的五個關鍵點電壓值,所以n1=5,n2=11,隱含層的節點數可以依據公式2.3確定為12個,其中a為5。
表2則列舉了5組測試樣本的原始數據。
步驟一:數據模糊化
根據用正態分布函數作為隸屬度函數表示“大約為a”模糊概念的思路,可以分別得到各測試點上電壓隸屬度函數的參數值。
a1=5.57、a2=4.97、a3=4.9、a4=5.7和a5=5.69以及b1=4.3729、b2=4.4817、b3=3.9091、b4=4.2870和b5=3.7944。
由各測試點的隸屬度函數可得到網絡的訓練樣本見表3。
表3 神經網絡部分輸入、輸出訓練樣本
步驟二:將訓練樣本輸入神經網絡進行訓練
將全部40個原始值和模糊化值的輸入樣本和對應的輸出樣本分別輸入bp神經網絡中進行訓練。
步驟三:將測試樣本輸入神經網絡進行檢測
將全部5個原始值和模糊化值的輸入樣本和對應的輸出樣本分別輸入已經訓練好的bp神經網絡中,輸出診斷結果見表4。
表4 輸出診斷結果
表4中的數據是經過故障診斷后得到的結果,在此只是各隨機選用了一組數據加以比較說明。通過對故障診斷的試驗觀察和結果的比較可以作出以下分析。
1)模糊化數據能夠有效減少神經網絡的收斂次數。如在bp網絡診斷中,使用模糊化數據的迭代次數由886減少到263次,收斂速度明顯加快;
2)模糊化數據能夠有效提高神經網絡訓練的效果。通過表4中數據的對比可以發現對于相同的神經網絡,經過模糊化數據的訓練,其準確性更高。這主要表現在電路所對應的狀態結果普遍高于未經模糊化數據訓練的網絡得出的結果;同時,其他狀態對應的機率更低,皆低于0.1,且更多值為0,說明數據模糊化能使神經網絡的診斷結果更集中,正確率更高,有效性更加明顯。
4結論
通過分別采用bp網絡和模糊bp網絡建立了電路故障診斷模型,對電路相同工作狀態參數的診斷結果進行比較,得出了模糊數學對提高電路故障診斷模型精度和有效性效果明顯的結論。模糊數學和神經網路理論的組合有效地提高了模擬電路故障診斷模型的收斂速度,提高了故障診斷的工作效率,還提高了診斷的準確性,有效性得到了充分顯示。
參考文獻:
[1] 呂律,魏蛟龍.基于模糊神經網絡的板級電路故障診斷研究[j].計算機與數字工程,2003(3):21-23.
[2] 李國勇.智能預測控制及其matlab實現[m].北京:電子工業出版社,2010.
[3] matlab中文論壇.matlab神經網絡30個案例分析[m].北京:北京航空航天大學出版社,2010.
[4] 朱大奇.電子設備故障診斷原理與實踐[m].北京:電子工業出版社,2004.
1 模糊系統的Takagi-Sugeno模型
模糊系統理論[11]是溝通經典數學的精確性與現實世界中大量存在的不精確性之間的橋梁。它是以模糊集合的形式表示系統所含的模糊性并能處理這些模糊性的系統理論,能夠有效地處理系統的不確定性、測量的不精確性等模糊性。Takagi-Sugeno模糊系統(T -S模糊系統)作為函數模糊系統的一種特例,由于構成的各條規則采用線性方程式作為結論,使得模型的全局輸出具有良好的數學表達特性,這在處理多變量系統時能有效地減少模糊規則個數,具有很大的優越性[12]。其規則表達如下[13]:
2 T-S模糊神經網絡
模糊系統在模糊建模的過程中常存在學習能力缺乏,辨識過程復雜,模型參數優化困難等問題。而人工神經網絡具有自學習、自組織和自適應的能力,具有強大的非線性處理能力。二者的結合構成模糊神經網絡,可以有效地發揮模糊邏輯與神經網絡的各自優勢,彌補各自的不足[14]。
2.1 T-S模糊神經網絡的結構
基于標準型的T -S模糊神經網絡結構如圖1所示。圖1中第1層為輸入層;第2層每個結點表示一個語言變量值;第3層用來匹配模糊規則前件,計算出每條規則的隸屬度;第4層用于歸一化計算,輸出第 條規則的平均激活度[14];第5層是輸出層,它所實現的是清晰化計算。T -S模糊神經網絡由前件網絡和后件網絡兩部分組成。前件網絡用來匹配模糊規則的前件,其結構與圖1的前4層結構完全相同;后件網絡用來產生模糊規則的后件,由N個結構相同的并列子網絡組成[15]。
2.2 T-S模糊神經網絡的學習算法
T -S模糊神經網絡需要學習的參數主要有后件網絡的連接權pkki以及前件網絡第二層各結點隸屬函數的中心值ckj及寬度σkj。設取誤差代價函數為:
3 應用研究
以下通過實例介紹T -S模糊神經網絡在地下水水質評價中的應用。
3.1 研究區概況
吉林省西部地區位于松嫩平原的西南部,地理坐標為東經123°09′~124°22′,北緯44°57′~45°46′。研究區東接吉林省長春市,南接四平市及遼寧省,西鄰,北接黑龍江省,東北以嫩江、松花江和拉林河與黑龍江省為界。吉林省西部屬半干旱半濕潤的大陸性季風氣候區,四季變化明顯。該區多年平均氣溫3~6℃,多年平均降雨量為400~500mm。研究區大部分屬于松嫩盆地,該盆地為一個巨大的含水層系統,埋藏有多層含水層,包括孔隙潛水含水層和承壓水含水層(分別為淺層、中深層)、上第三系大安組、泰康組孔隙-裂隙含水層(深層)和白堊系下統及上統裂隙孔隙含水層(深層)。研究區的地下水補給來源主要為降水入滲,排泄以潛水蒸發和人工開采為主。
3.2 原始數據
原始數據取自于吉林西部2005年50個地下水水化學監測點的水質監測數據,結合研究區地下水水質狀況,有針對性地選擇了鐵、氨氮、硝酸鹽、亞硝酸鹽、硫酸鹽、氯化物、溶解性總固體、氟化物和總硬度共9項指標作為評價因子。地下水水質評價標準參照GB/T 14848-93《地下水質量標準》,評價標準見表1。
3.3 神經網絡的準備工作
(1)訓練樣本、檢驗樣本及其期望目標的生成。采用Mat-lab7.0的linspace函數在各級評價標準之間按隨機均勻分布方式內插生 成 訓 練 樣 本。各 級 評 價 標 準 之 間 生 成500個,共2 000個訓練樣本,以解決僅利用各級評價標準作為訓練樣本,導致訓練樣本數過少的問題[16]。檢驗樣本用生成訓練樣本同理的方法生成400個樣本。小于一級標準的訓練樣本和檢驗樣本的期望目標為按照生成訓練樣本和檢驗樣本的內例產生對應的0~1.5之間的數值;一、二級標準之間的訓練樣本和檢驗樣本的期望目標為按照生成訓練樣本和檢驗樣本的內例產生對應的1.5~2.5之間的數值;同理,二、三級和三、四級標準之間的訓練樣本和檢驗樣本的期望目標為2.5~3.5、3.5~4.5之間的數值。(2)水質評價等級的劃分界限。據上述生成訓練樣本與檢驗樣本目標輸出的思路可以確定一、二、三、四、五各級水的網絡輸出范圍分別為:<1.5、1.5~2.5、2.5~3.5、3.5~4.5、>4.5。(3)原始數據的預處理。利用Matlab7.0中的mapminmax函數將原始數據歸一化到0與1之間。
3.4 T-S模糊神經網絡的建立、訓練、檢驗及水質評價
3.4.1 T-S模糊神經網絡的建立
模糊神經網絡的構建根據訓練樣本維數確定模糊神經網絡輸入/輸出結點數、模糊隸屬度函數個數。由于輸入數據為9維,輸出數據為1維,通過試錯法確定模糊神經網絡結構為9-18-1,即有18個隸屬度函數。選擇10組系數p0-p9,模糊隸屬度函數中心和寬度c和σ隨機得到,通過動態BP算法對網絡的權值在線調整。隸屬度函數采用高斯函數,模糊推理采用sum-product[14],解模糊采用加權平均法。網絡模型的概化如圖1所示。T -S模糊神經網絡的第3層輸出為輸入數據的隸屬度函數;第4層輸出為第 條規則的平均激活度;后件網絡實現了T -S模型模糊規則空間到輸出空間的映射,輸出為yj=pjk0+pjk1x1+…+pjkmxm和y=∑αk×yj。
3.4.2 網絡的訓練、檢驗及水質評價
采用歸一化的訓練樣本和檢驗樣本數據,對網絡進行訓練和檢驗。以10個水質待評點的基礎數據(表2)為例,利用已訓練好的模糊神經網絡對其進行水質評價。網絡輸出結果見表3。
3.4.3 不同水質評價方法的對比分析
利用內梅羅指數法和BP人工神經網絡法分別對上述水質待評點進行水質評價。BP人工神經網絡的訓練與檢驗樣本生成方式同T -S模糊神經網絡,確定BP神經網絡的結構為9-3-1。規定各等級的期望輸出值,為0.1,0.3,0.5,0.7,0.9。兩種方法得到的評價結果如表3。由表3可知,3種方法的評價結果大體相同。利用訓練好的模糊神經網絡模型對50個待評點水質進行評價,結果如表4所示。由表4可以看出,吉林西部地區地下水資源已經遭受不同程度的污染,且部分地區地下水資源污染嚴重,需要進行有效的保護。
關鍵詞:神經網絡;模式;分類
中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2009)04-0922-02
The Research of the Classification of Model with Neural Network
GUO Xiao-yan
(Gansu Agriculture University, Information & Science Technology College, Lanzhou 730070, China)
Abstract: The problems of classification of model with neural network can be solved by the help oftutors information, and also be solved by the help of clustering without the tutors information.This article analyzes andcompares several neural network models being used for classification of model,reach a conclusionthat inparticular situation different models of neural network can bechoiced , and if nessesary aintegratedway can be used.
Key words: neural network; classification; model
傳統的分類方法對于同類相聚,異類分離比較有優勢,但客觀世界中許多事物在樣本空間中的區域分割曲面非常復雜,相近的樣本可能屬于不同的類,而遠離的樣本可能屬于同一類1。模式是對某些感興趣的客體的定量描述或結構描述,模式類是具有某些共同特征的模式的集合。模式分類可分為兩種類型,分類和聚類,分類是在類別知識等導師信息的指導下,將待識別的輸入模式分配到各自的模式類中去。聚類是無導師的分類方法,它是將相似的模式樣本劃歸為一類,而將不相似的分離開,實現了模式樣本類內相似性和類間分離性。通過聚類,可以發現原始樣本的分布特性。
神經網絡對外界的輸入樣本具有很強的識別能力,可以發現輸入樣本自身的聯系和規律以及輸入樣本和期望輸出之間的非線性規律,因此在模式分類方面具有傳統分類方法無法比擬的優點。人工神經網絡在模式分類方面提出了大量了網絡模型,發現了許多學習算法。
1 無導師分類機制
對于無導師的模式分類只從輸入樣本入手,通過分析與比較,找到輸入樣本的特征和內在規律,從而將具有相似性的樣本聚為一類。
1.1 SOM網
SOM 網屬于自組織映射神經網絡,SOM神經網絡接收外界的輸入模式時,會分為不同的對應區域,各區域對不同的輸入模式會有不同的響應特征,利用這個特征可以對輸入模式進行分類。
算法思想:
它的學習規則是“勝者為王”。找出和輸入向量最為相似的競爭層神經元(即獲勝神經元),在一個以該神經元為中心的鄰域內對本區域內的所有神經元的權值進行不同程度的調整,調整的原則是由遠及近,由興奮變為抑制,權值調整的結果是使競爭層的特定神經元變得對輸入層的某些樣本敏感,從而達到分類的目的。
算法步驟:
1) 找出獲勝神經元
對于每一個輸入模式向量 X,競爭層的所有神經元對應的內星權向量Wj(j=1,2,…,m)均與X進行比較,將與X最為相似的神經元判為獲勝神經元。其權值記為Wj*。相似性量度為X和W的歐氏距離或夾角余弦。
■
m是競爭層神經元個數。
d=||X-Wj*||=min||X-Wj*||(j=1,2,…,n)
d為輸入向量X離獲勝神經元的距離
2) 找出一個Wj*的一個鄰域Sj,對于Sj內的所有權值進行調整。
3) 權值調整
Wj(t+1)=Wj(t)+α[X-Wj(t)]
α為學習率,隨著t的增加,α的值在不斷地減小。
權值的調整是使得獲勝結點更加接近輸入樣本,從而使競爭層的每一個神經元變為一個聚類中心。當向網絡輸入一個模式時,競爭層中哪個神經元獲勝使輸出為1,當前輸入就歸為哪類。
通過聚類進行模式劃分的方法還有模糊聚類,K-均值聚類,HCM,最近鄰聚類(NN算法)等,這些算法的最主要優點就是不需要導師信號,這對于一些無法得到導師信號的模式分類情況來說是有優勢的。
2 有導師分類機制
基于無導師的聚類算法只考慮輸入樣本,而沒有考慮輸入樣本所對應的輸出、這就使得這樣的分類不是最優的。
2.1 BP神經網絡
BP神經網絡利用導師信號和輸入樣本來訓練網絡的權值,從而找到從輸入樣本到導師信號(期望輸出)之間的非經性變幻規律來修整權值,經過測試樣本和期望輸出的多次訓練來使成熟的網絡穩定,當有新的輸入時,就可根據此規律對它樣本進行正確的分類。
BP神經網絡的算法思想是:輸入樣本自輸入層傳入,由各隱層處理后,傳向輸出層,這屬于正向傳播;如果輸出與期望輸出(導師信號)不符,得到誤差值,輸出誤差通過隱層向輸入層逐反向傳播,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號成為修正各單元權值的依據。
2.1.1 BP神經網絡的描述1(圖2)
1) 正向傳播
對于有單個隱層單元的BP神經網絡而言
隱層輸出:
■
輸出層:
■
l 為輸出層神經元的個數m為隱層神經元的個數n為輸入層神經元的個數
f(x)可采用單極性的Sigmoid函數:
■
2)反向修正權值
輸出誤差E定義如下:
■
其中d為導師信號(期望輸出),o為實際輸出
進一步展開至輸入層,有:
■
權值修正:
■
η是學習率,可以控制學習的時間和快慢。
在BP神經網絡中,利用導師信號和神經網絡的輸出得到總誤差E,調整權值時,按誤差梯度下降的原則進行。利用BP神經網絡進行分類時,可以利用導師信息先規定類別信息,再利用輸入樣本和類別信息得出E,從而反向調整ω,ν值,如果網絡的總誤差小于一個特定的值,可認為網絡訓練結束,得到最終的ω,ν值。對于新的樣本,此訓練好的網絡便可進行正確分類。
3 徑向基函數神經網絡
利用BP網絡進行分類時,完全沒有考慮輸入樣本的特征,只利用導師信息進行權值的修正,因此學習時間很長,分類的精度也不是非常高,錯分的情況很多。通常,輸入樣本本身具有某種規律性,利用現有樣本的自身規律加上導師信號的限制,可以大大提高分類的精度,同時可以縮短學習的時間。徑向基函數網絡就是基于這種思想。
用徑向基函數作為隱單元的“基”,構成隱含層空間。隱含層對輸入向量進行變換,將低維空間的模式變到高維空間中,使低維空間中的不可分問題在高維空間中變得可分。
算法思想:
1)找到分類中心向量,也稱基向量,(一般用K-均值法,動態聚類法等),假定分類中心向量個數為 個,這也就決定隱層神經元的個數。
2)算出輸入樣本到各個分類中心向量的距離d,利用基函數f(x),自變量為d,得到隱層輸出,只有離分類中心最近的向量得到較大的輸出。
■
p是輸入樣本個數,j是聚類中心的個數,k是樣本和聚類中心向量的維數。
■
3)最后通過隱層到輸出層的線性變換得到最終的輸出,則:
■
學習算法:
1)利用無導師機制選取分類中心向量;
2)利用有導師信號修正隱層到輸出層的權值,權值的修正仍用類似BP神經網絡的梯度下降算法。
徑向基函數網絡對于輸入層向隱層的變換是非線性的,而隱層到輸出層變換進線性的,在確定中心結點時,可采用無導師的聚類機制,當修正隱層到輸出層的權值時可采用有導師機制,此兩種方法結合即可發現輸入樣本中的內在規律,又可利用導師信號進行約束從而提高分類的精度和縮短學習的時間。
3 結論
利用神經網絡進行分類時,如果可以得到導師信號,可采用徑向基神經網絡,或BP神經網絡,徑向基神經網絡收縮速度快,不容易陷入局部極小值,在解決分類時和般優越于BP神經網絡,如果無法得到導師信號,則可采用自組織神經網絡SOM網絡,通常SOM也可以用在徑向基神經網絡的選用中心向量問題上。
參考文獻:
[1] 韓力群.人工神經網絡理論、設計及應用[M].2版.北京:化學工業出版社,2007.
關鍵詞:綜合評價方法;比較
中圖分類號:F2文獻標識碼:A文章編號:16723198(2014)07002001
1引言
綜合評價是指對以多屬性體系結構描述的對象系統作出全局性、整體性的評價,即根據條件運用一定方法對評價對象全體中的每一個評價對象賦予評價值,并排序、擇優。20世紀70~80年代,現代綜合評價方法蓬勃興起,產生了多種評價方法。但因各評價方法的使用條件、優缺點及適用對象不同,故文章在對多屬性指標常用綜合評價方法的基本思想和步驟概述的基礎上,對各評價方法優缺點及適用情況的對比,為應用研究中的合理選擇使用提供參考。
2常用綜合評價方法
2.1層次分析法
層次分析法(Analytic Hierarchy Process,AHP)是20世紀70年代由著名運籌學家T.L.Saaty提出,用于解決多因素復雜問題,經過多年發展已成為一種較為成熟的評價方法。該方法將定性分析與定量分析相結合,通過全面分析待評價系統的性質和影響因素將備選方案的各要素按層次分解,構造出自下而上的遞階層次結構,再對同層次要素比較,判斷得出重要度并排序。
AHP方法大致步驟如下:(1)根據評價對象的性質和目標,建立系統的遞階層次結構;(2)對同一層次上的各要素對其上一層次的相對重要性進行兩兩比較,構造判斷矩陣;(3)計算各要素的相對權重,進行層次單排序和一致性檢驗;(4)逐層合成計算每個判斷矩陣各因素對目標層的相對權重,進行層次總排序,并對排序結果進行一致性檢驗。
2.2模糊綜合評價法
模糊綜合評價(Fuzzy Comprehensive Evaluation,FCE)以模糊數學為基礎,運用模糊關系合成的原理,針對評價對象因素的模糊性,將邊界不清晰的因素定量化,根據多個評價因素對被評價對象隸屬等級狀況進行評價的一種方法。該方法依據評價條件,對評價對象全體的每一個對象賦予一個非負實數,據此進行排序并擇優。
FCE方法的基本步驟如下:(1)確定評價對象的因素集U和評語集V;(2)對各因素賦予相應的權數,得到權重集A;(3)單因素評價,得到模糊關系矩陣R;(4)將A與R合成計算得到各模糊綜合評價結果向量B;(5)對B進行分析、排序和擇優。
2.3BP神經網絡評價法
BP(Back Propagation)神經網絡又稱為誤差反向傳播網絡,實現一種從輸入到輸出的映射關系,由輸入層、隱含層和輸出層組成,是一種典型的多層前饋網絡。BP神經網絡的學習過程包括信息正向傳播和誤差反向傳播兩部分,正向傳播時輸入樣本從輸入層節點輸入,經過隱含層處理并傳向輸出層,若輸出層未得到期望輸出,則轉入反向傳播。
標準BP神經網絡學習算法的步驟如下:(1)網絡初始化,給定各連接權值、誤差函數、計算精度值和最大學習次數;(2)隨機選取輸入樣本及對應期望輸出,計算隱含層各神經元的輸入輸出;(3)計算誤差函數對輸出層的各神經元的偏導數;(4)計算誤差函數對隱含層各神經元的偏導數;(5)對連接權值進行修正并計算全局誤差;(6)對計算結果進行評判。
2.4數據包絡分析法
數據包絡分析(Data Envelopment Analysis, DEA)是美國著名運籌學家A.Charnes和W.W.Cooper等學者提出,以相對效率概念為基礎發展起來的一種綜合評價方法。DEA使用數學規劃模型比較決策單元(DMU)之間的相對效率對DMU做出評價,不僅能對同類型DMU的相對有效性進行評定、排序,而且能夠分析其非DEA有效的原因及改進放方向。
DEA評價方法步驟如下:(1)明確評價目標,并圍繞目標對評價對象進行分析;(2)選擇DMU,并對其結構、層次進行分析;(3)建立能夠全面反映評價目標和評價內容的輸入輸出指標體系;(4)收集并整理數據,根據研究問題的實際背景選擇DEA模型進行計算;(5)對計算結果進行分析。
3多指標綜合評價方法比較分析
通過上述分析,根據常用綜合評價方法的特性,歸納整理各方法的優缺點及適用情況如表1所示。
表1常用多指標綜合評價方法比較
方法1優點1缺點1適用情況AHP1定性與定量相結合,原理簡單,評價結果可靠性高,誤差小1評價對象因素數量限制,權重確定易受主觀因素影響1適用于總目標不明確,難以完全定量化的復雜問題FCE1模型簡單易懂,將不確定信息定量化,評價結果包含信息豐富,實用性強1未能有效解決指標間信息重疊,權重確定主觀性較強1適用于權數確定、邊界描述不清晰的多因素、多層次的復雜問題BP1具有自適應能力、可容錯性,可實現輸入與輸出間的任意非線性映射1需要大量訓練樣本,計算結果精度不高1處理非線性、非局域性與非凸性的大型復雜系統DEA1對數據和函數形式無具體要求,信息利用率較高,客觀性強,評價結果明確1對數據極為敏感,且有效決策單元所提供信息較少1適用于評價多輸入多輸出的大系統參考文獻
[1]王宗軍.綜合評價的方法、問題及其研究[J].管理科學學報,1998,1(1):7379.
[2]T.L.Saaty. Theory of analytical hierarchies applied to political candidacy[J].Behavioral Science,1977,22(4):237.
[3]楊綸標,高英儀,凌衛新.模糊數學原理及應用(第五版)[M].廣州:華南理工大學出版社,2011.
在綜合考慮地震致災因子、抗震設防因子、經濟指標因子的基礎上,選取地震震級、震源深度、受災面積、受災人口、設計基本地震加速度、人均GDP和產業機構比例等7個因素作為主要評價指標,運用神經網絡分析方法,建立了基于LM-BP神經網絡的地震直接經濟損失評估模型。從歷史地震事件中提取相關數據作為樣本,并使用該樣本對網絡進行訓練。最后對模型輸出結果的誤差率和模型的泛化能力進行分析,認為該模型可以有效評估地震直接經濟損失,并具有較高的穩定性。
關鍵詞:地震災害;災害評估;直接經濟損失;LM-BP神經網絡
中圖分類號:P315-39文獻標識碼:A文章編號:1000-0666(2016)03-0500-07
0引言
隨著我國經濟的快速增長、城市規模的不斷擴大,地震災害對社會造成的影響也在不斷加大,防震減災工作顯得尤為重要(趙士達等,2014a)。作為防震減災工作一部分的震后應急救援和抗震救災可以有效地減少地震造成的經濟損失和人員傷亡(趙士達等,2014b;王東明等,2015),快速、準確地對地震災區人員傷亡和經濟損失做出評估是震后應急救援和抗震救災工作能否收到實效的前提條件(劉如山等,2014)。
近年來,諸多學者使用不同的方法對震后經濟損失快速評估進行了深入的研究,這些評估方法可分為5大類:分類清單法(陳洪富等,2013)、經濟法(陳棋福等,1997)、遙感法(陳鑫連,謝廣林,1996)、信息法(劉洋等,2009;劉佳友,徐琳瑜,2007)和神經網絡法(范傳鑫,2014)。其中分類清單法的應用最為廣泛,該方法通過地震烈度衰減關系計算出地震影響場烈度空間分布,再綜合分析各個烈度等級建筑物的類型、數量、空間分布以及建筑物的易損特性等,計算出各類建筑物的損失情況。但使用該方法進行地震災害快速評估時對災區的基礎數據庫要求比較高,基礎數據庫數據不完整、數據更新過慢、數據細化程度不夠等都會使評估結果出現嚴重的偏差。隨著神經網絡技術的不斷成熟,其在模式識別、函數逼近等方面得到了廣泛的應用,一些學者也將這一技術應用到地震災害損失評估中。
BP(Back Propagation,反向誤差傳播算法)神經網絡算法是應用最廣泛的一種神經網絡算法,具有較強的非線性映射能力、自適應能力、容錯能力和泛化能力(孫艷萍等,2010),但也存在收斂速度慢和容易陷入局部極小值等問題。為了克服這些問題,本文提出一種改進型LM-BP神經網絡,并基于此建立了地震直接經濟損失評估模型。
1影響地震直接經濟損失的因素
11地震直接經濟損失的界定
從災害學的角度分析,災害損失評估是對災害造成的人員傷亡、直接經濟損失和間接經濟損失的評估,因此地震災害損失可劃分為人員傷亡、經濟損失和救災投入3部分,其中經濟損失包括直接經濟損失和間接經濟損失。地震直接經濟損失又包括地震災害和地震次生災害造成的建筑物、工程設施、設備、物品破壞導致的經濟損失(王偉哲,2012)。
12地震災害影響因子的分類研究
121地震致災因子
震級是表征地震強弱的量度,是劃分震源釋放能量大小的等級。震級越大,地震釋放的能量就越大,破壞能力就越強,相同條件下造成的直接經濟損失也就越大。通常講震級每相差10級,能量相差30倍,由此可見,震級是地震造成經濟損失的重要因素之一。震源深度對地震破壞程度的影響也很大,相同震級的地震,震源深度越淺,造成的破壞就越嚴重。有統計表明,相同震級的地震震源深度從10 km減小到5 km,或是從20 km減小到10 km時,震中區域烈度平均會提高1度,故震源深度也是地震造成經濟損失的重要因素之一。地震烈度是指地震發生時,在波及范圍內一定地點地面振動的激烈程度(或解釋為地震影響和破壞的程度)。一般來講,距離震源越近,破壞就越大,烈度也就越高。在一次地震的受災區域內會存在多個烈度區,而且這些烈度區的面積和分布并不規則。地震災區的烈度評定在現場工作人員完成災情調查后才能給出,在時間上不能滿足地震經濟損失快速評估的要求,且如果逐一計算各個烈度區的損失情況也會大幅度地增加計算的復雜程度。所以本文以總受災面積為災害承載體,選取地震震級和震源深度為主要致災因素,對災區進行經濟損失評估。災區面積的大小與地震直接經濟損失成正相關關系,其他條件相同的情況下,災區面積越大,經濟損失也就越大。
122抗震設防因子
一個地區在遭受地震破氖保其自身的抗震設防能力會對其產生重要的保護作用,抗震設防能力越強其抗御地震破壞的能力也就越強。抗震設防烈度是各類建筑物建設時采用設防標準的重要依據。各地區的建筑物都要按照該地區的抗震設防烈度要求進行建設。雖然地區建筑物實際設防烈度和地區的抗震設防烈度會存在一定的差距,但整體上抗震設防烈度可以反映出一個地區的抗震設防能力。
在以烈度為基礎作為抗震設防標準時,由烈度給出相應的峰值加速度,烈度與設計加速度并不是一一對應的,在同一個設防烈度下,可能會對應不同的加速度值。這主要是由于同一烈度下,不同的場地類型地震加速度也有所不同。所以本文在評估一個地區的抗震設防能力時,主要考慮該地區的設計基本地震加速度。
123社會經濟指標因子
一般來講,在遭受同等地震的情況下,地區經濟越發達,經濟損失就越嚴重。這主要是因為經濟越發達,地區人口越集中、生命線工程集中和地上地下管網越密集。人均GDP是衡量一個地區經濟發展水平最重要的指標之一,人均GDP越高,該地區的經濟基礎和經濟發展狀況就越好,同等地震破壞的情況下,損失也就越大。不同的產業結構受地震破壞影響程度也不同。第一產業和第二產業所占的比重越大,受到地震破壞時相比第三產業經濟損失也就越大。
除了以上兩個重要因素外,受災人數也與地震直接經濟損失成正相關關系,其他條件相同的情況下,受災人數越多,所涉及的社會財富越大,經濟損失也就越大。
124其它因素
地震間接引起的火災、水災、毒氣泄漏、疫病蔓延、海嘯等,稱為地震的次生災害。次生災害造成的經濟損失是地震直接經濟損失的一部分,嚴重的次生災害造成的經濟損失甚至比各類建筑物損毀造成的損失還要大。
地震后,地區的應急處置和搶險救災能力與諸多因素有關,如交通條件、生命線工程搶修速度、有無應急預案等,這些因素決定了該地區降低地震災害經濟損失和人員傷亡的能力以及地區的應急處置和搶險救災能力。
13地震災害影響因子的提取
地震災害樣本信息選取的原則是容易獲取的,對于一些記錄不全面或者信息準確性存在問題的樣本應舍棄。本文地震災害信息的樣本主要選自《2001~2005中國大陸地震災害損失評估報告匯編》(中國地震局震災應急救援司,2010)中記錄完整的歷史地震,其中震級、震源深度、災區面積、受災人口和地震直接經濟損失可在災害評估報告中查到。各地區的設計基本地震加速度通過查閱《建筑抗震設計規范》(GB 50011―2001)來獲取。人均GDP和產業結構比例是通過查閱各地區統計公報或地區年鑒獲取的。在《中國大陸地震災害損失評估報告匯編》(中國地震局震災應急救援司,2010)中記錄的地震次生災害造成的經濟損失不多,一般都在總直接經濟損失的5%以內,所以筆者不直接考慮次生災害的影響,而是得出總的直接經濟損失評估后,按照次生災害的嚴重程度,對總的直接經濟損失進行修正。由于筆者無法獲取足夠的資料對各個地區的防災減災能力做出評價,所以沒有將地區防災減能力作為影響因子。
一次地震經常會對多個地區產生影響,而各個地區的經濟水平和產業結構也各不相同,所以需要對受災區域的GDP和產業結構重新評估,估算公式分別為
G=∑ni=0GiSiS, (1)
R=∑ni=0RiSiS.(2)
式中,G為災區人均GDP;n為地震造成的受災區域數量;Gi為第i個地區的人均GDP;S為災區總面積;Ri為第i個地區第一、二產業占GDP的比例。
2LM-BP神經網絡
21BP神經網絡的優缺點
在BP神經網絡中,輸入層的神經元用于接收外界信息并將信息傳給隱含層(郭章林等,2004)。隱含層神經元主要負責對接收的信息進行變換,并將信息傳給輸出層。隱含層的層數不是固定的,而是根據信息變化復雜程度的需要而定的。輸出層主要負責將信息向外界輸出(田鑫,朱冉冉,2012)。BP神經網絡結構如圖1所示。
假設某個神經元的輸入信號x=(x1,x2,…,xn)T,可調節的連續權值w=(w1,w2,…,wn)T,θ為神經元的興奮閾值,u(*)為基函數,該神經元的輸出則為u(x,w,θ)。輸出信號u需要經過激活函數的擠壓,即y=f(u),將輸出值的范圍壓縮到非常小的范圍內。
雖然BP神經網絡具有以上優點,但自身也存在著局限性。BP神經網絡采用的是梯度下降算法,而梯度下降算法在其誤差曲面中會出現平坦區域和多個極小值點。在平坦的誤差曲面中,誤差下降速度慢,網絡的訓練速度也會變慢。當遇到局部極小值時,網絡會誤認為是最優解,導致仿真失敗。
22LM-BP網絡
Levenberg-Marquardt算法(簡稱LM算法),是一種非線性最小二乘算法,是用模型函數對待估參數向量在其領域內做線性近似,忽略掉二階以上的導數項,從而轉化為線性最小二乘問題,所以該算法的收斂速度比梯度算法要快很多。LM算法雖然在收斂速度上有明顯的提升,但仍然可能陷入局部極小值,導致仿真失敗。因此,在進行仿真時需要對迭代次數進行限定,防止陷入局部極值。當迭代次數超過限定就自動跳出,重新給網絡賦予權值和閾值,然后重新迭代,直到得出預期的結果。
23網絡的構建與訓練
筆者在計算時主要考慮震級、震源深度、受災面積、受災人口、設計基本地震加速度、地區人均GDP和產業結構比例7個因素,所以設計的網絡輸入層為7個節點,輸出層為1個節點。隱含層的節點數量需要在仿真中進行逐一嘗試才能確定下來。隱含層節點數量經驗參考公式為
h=p+q+a.(3)
其中,p為輸入層節點數量,q為輸出層節點數量,a為0~10的自然數。神經網絡的訓練能力和泛化能力在一定程度是存在矛盾的。訓練初期,隨著網絡訓練能力的提高,泛化能力也在提高。當訓練能力提高到一定程度后,隨著網絡訓練能力的提高,泛化能力就會下降。出現這一問題的原因是網絡訓練的樣本過多,練精度過于高,產生了過擬合現象,當遇到非訓練集中的樣本時,網絡輸出精度就會大幅度下降。為了避免過擬合現象的出現,筆者在網絡訓練時將樣本分為訓練樣本、測試樣本和確認樣本3部分。訓練樣本用于調整網絡連接的權值和閾值,提高訓練精度。測試樣本用來評價訓練后的網絡,如果訓練后的網絡滿足測試樣本的要求就結束訓練。確認樣本用于防止過擬合訓練,當確認樣本的精度隨著網絡精度提升而下降時,就強行結束訓練。筆者選取的樣本是按照地震發生時間順序排列的,不能直接進行樣本分組和訓練,需要先將樣本的順序隨機打亂后,再進行樣本分組和訓練。圖2為整個網絡訓練設計流程圖。
3LM-BP神經網絡的實例應用
31數據歸一化處理
本文選取了《2001~2005年中國大陸地震災害損失評估報告匯編》(中國地震局震災應急救援司,2010)中記錄的30次地震作為樣本,樣本數據如表1所示。其中訓練樣本占總樣本的80%,測試樣本和驗證樣本各占10%。由于樣本中的數據單位不統一且數值取值范圍很大,所以需要對樣本中的數據進行無量綱處理,并將數據取值范圍壓縮到一個很小的區域內。本文所選取的樣本數據均為正數,可選取logsig函數作為激活函數,將樣本數據擠壓到(0,1)之間。但logsig函數曲線在數軸0和1兩點附近曲線平緩,影響網絡訓練的速度和網絡的靈敏性。因此,在進行數據歸一化處理時,需要將樣本集的數據按類型歸一化到(01,09)區域內。
32LM-BP神經網絡的構建
本文所設計的LM-BP網絡輸入層、隱含層和輸出層均為1層,其中輸入層有7個節點,隱含層節點數目范圍是3~13,輸出層有1個節點。使用Matlab2010對LM-BP神經網絡進行訓練和仿真,逐一嘗試隱含層節點數目,最終確定隱含層節點數為8時,網絡擬合的效果最佳。LM-BP網絡結構示意圖如圖3所示。
33LM-BP神經網絡的訓練與仿真分析
圖4為LM-BP神經網絡訓練樣本、測試樣本和確認樣本的誤差曲線圖。從圖中可以看出,在訓練初期3種樣本的誤差曲線都隨著訓練的進程而顯著下降,這表明該網絡具有十分良好的泛化能力。筆者在設計中設定確認樣本誤差曲線連續5步上升就結束仿真,防止網絡進入過擬合狀態。從圖中可以看出,在訓練進行到第13步時,確認樣本誤差曲線開始上升,并且一直保持上升到第18步。這主要是由于網絡產生了過擬合所導致的。在第13~18步中,訓練樣本誤差曲線保持下降,而測試樣本誤差曲線卻一直上升,也印證了網絡開始進入過擬合狀態。
圖5為30個樣本的訓練和預測情況示意圖,其中橫軸第1~24個數據為訓練樣本,第25~27個數據為確認樣本,第28~30個數據為預測樣本。從圖中可以看出訓練樣本和確認樣本的擬合度非常高,測試樣本的預測值與真實值也十分接近,其預測相對誤差如表3所示。
34LM-BP神經網絡在地震直快速評估中的應用
以2012年6月24日寧蒗―鹽源57級地震為例,使用LM-BP神經網絡進行地震直接經濟損失評估。該次地震的震源深度為11 km,受災人口1162萬人,受災面積2 218 km2。寧蒗彝族自治縣和鹽源縣兩地地震設防加速度同為015g,所以設防加速度取015g。2011年寧蒗彝族自治縣和鹽源縣人均GDP分別為7 445元和18 045元,產業結構比分別為598%和795%,同時兩個縣的受災面積分別為1 365 km2和853 km2。根據式(1)和(2)可得平均GDP為11 522元,產業結構比為6738%。
將上述7個因素作為輸入條件,使用訓練好的網絡進行仿真,得出直接經濟損失為653億元,本次地震的實際直接經濟損失為772億元。仿真結果和實際結果存在1541%的相對誤差,可以滿足經濟損失快速評估的要求。進一步分析仿真結果可以發現,該次仿真的相對誤差比網絡訓練時的相對誤差要大,且仿真結果比實際值要小。這主要是因為訓練網絡時采用的樣本選取的是2000~2005年地震事件,當時我國各地區GDP很低。而筆者選取的是2012年的寧蒗―鹽源地震,2012年我國GDP已經比2000時大幅度提高。當輸入2012年GDP時,網絡會認為該輸入為奇異值,會對該數據進行壓縮,導致仿真結果比實際結果小,且相對誤差增大。這一問題可以待地震災害損失評估報告更新后,加入近年來的地震事件樣本繼續訓練來解決。
4結論
本文主要分析影響地震直接經濟損失的主要因素,并選取地震震級、震源深度、受災面積、受災人口、設防加速度、人均GDP和產業結構比例作為主要影響因素。通過分析BP神經網絡的優缺點,提出改進型LM-BP神經網絡作為地震直接經濟損失評估模型。使用歷史地震樣本對該網絡進行訓練,最終得到同時具備較強泛化能力和擬合能力的預測模型。同時該模型也存在一定的局限性,例如訓練樣本震級都小于7級,對于7級以上地震直接經濟損失評估會產生較大的偏差。造成這一問題的主要原因是目前可以查閱到的記錄全面的地震災害評估報告較少,地震事件樣本不充足。待2005年以后的地震災害評估數據更新后,使用更加充足的樣本再重新訓練,可以有效地解決這一問題。
參考文獻:
陳洪富,孫波濤,陳相兆等. 2013. 基于云計算的中國地震災害損失評估系統研究[J].地震工程與工程振動, 33(1):198-203.
陳棋福,陳J,陳凌. 1997. 利用國內生產總值和人口數據進行地震災害損失預測評估[J].地震學報,19(6):640-649.
陳鑫連,謝廣林. 1996. 航空遙感的震害快速評估與救災決策[J].自然災害學報,34(5):29-34.
范傳鑫. 2014. 基于改進型的RBF神經網絡的城市震害損失評估模型[D]. 黑龍江:哈爾濱工業大學,17-34.
郭章林,劉明廣,解德才.2004. 震災經濟損失評估的遺傳神經網絡模型[J]. 自然災害學報,13(6): 92-96.
劉佳友,徐琳瑜. 2007. 一種區域環境風險評價方法――信息擴散法[J]. 環境科學學報,27(9):1549-1556
劉如山,余世舟,顏冬啟等. 2014. 地震破壞與經濟損失快速評估精細化方法研究[J].應用基礎與工程科學學報, 22(5):928-940.
劉洋,唐川,馮毅. 2009. 基于AHP信息量法的地質災害危險性評價[J].地球與環境,41(2):173-178
孫艷萍,竇玉丹,張明媛等.2010. 基于神經網絡的震害損失評估模型[J].防災減災工程學報,30(9):168-171.
田鑫,朱冉冉. 2012. 基于主要成分分析及BP神經網絡分析的地震人員傷亡預測模型研究[J]. 西北地震學報,34(4):365-368.
王東明,朱達邈,李永佳. 2015.中國地震災害損失調查評估培訓系統在線考試子系統的設計與實現[J].地震研究,38(3):508-516.
王偉哲.2012.地震直接經濟損失評估:BP神經網路及其應用[D]. 成都:西南財經大學,12-15.
趙士達,張楠,楊爽 . 2014a. 基于云計算和Android的地震急信息獲取系統[J]. 計算機應用, 34(S1): 298-300.
趙士達,張楠,楊爽. 2014b. 基于Android系統的避難場所查詢軟件開發[J]. 電子技術應用,40(3): 133-136.