氧化溝系統(tǒng)出水COD預報的神經(jīng)網(wǎng)絡模型
摘要:以漯河市污水凈化中心的Carrousel氧化溝(以下簡稱氧化溝)系統(tǒng)為考察對象,針對該系統(tǒng)進水水質(zhì)復雜,控制滯后的難點,引入人工神經(jīng) 網(wǎng)絡 的 理論 和 方法 ,對其模擬 分析 ,建立了基于BP網(wǎng)絡的氧化溝系統(tǒng)出水COD預報模型。模型性能檢驗和靈敏度檢驗表明,建成的模型準確度高,適應性強,可直接用于該系統(tǒng)出水COD預報,這為氧化溝工藝在線控制提供了一條簡便的途徑。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡 氧化溝系統(tǒng) 出水COD
The ANN Model Predicting Effluent COD of Carrousel Oxidation Ditch System.
Abstract: The carrousel oxidation ditch system in Luohe Center of Wastewater Treatment is difficult to control on-line because the influent characteristics are complex and vary significantly. To resolve the problem, advanced artificial neural network (ANN) was employed to simulate the correlation between water parameters of oxidation ditch system and a BPNN model predicting effluent COD was built up. Sentivity and performance tests showed that the model can adapt to different situations and has good ability to generalize. It can be directly used to predict effluent COD concentration, which is very helpful to oxidation ditch system control on-line.
Keywords: ANN; oxidation ditch system; effluent COD
漯河市污水凈化中心于2000年7月正式投產(chǎn),采用的是典型的極具代表性的Carrousel氧化溝工藝,污水來源主要是屠宰廢水、食品加工廢水、化工廢水和生活污水,其主要技術(shù)指標:一期工程:2000年7.7萬噸/日(生活污水2萬噸/日, 工業(yè) 污水5.7萬噸/日),設計流量8萬噸/日,設計的進水負荷:COD≤500mg/l,BOD5≤200mg/l,SS≤200mg/l,設計出水指標:COD≤120mg/l,BOD5≤30mg/l,SS≤30mg/l,實際出水水質(zhì)狀況(建模(用人工神經(jīng)網(wǎng)絡建立的氧化溝出水COD預報的模型的簡稱)數(shù)學數(shù)據(jù)范圍,其它不完整記錄中有超出以下范圍的記錄):SS:10~170mg/l,COD:16~77mg/l,TN:2.9~56mg/l,TP:0.03~0.91mg/l ;二期工程2010年11.8萬噸/日(生活污水2.6萬噸/日,工業(yè)污水9.2萬噸/日)。由于進水中工業(yè)污水成分達到約74%,實際運行水質(zhì)波動極大,對系統(tǒng)構(gòu)成強烈沖擊,進水COD最高記錄超過600mg/l,進水SS經(jīng)常維持在115~600mg/l,不同工作日進水水質(zhì)強烈起伏,使工藝在線控制比較棘手,出水達標排放難以保證。對氧化溝這一復雜的活性污泥系統(tǒng),由于 影響 工藝過程的因素反應的復雜性和高度非線性,常規(guī)的模型適應能力有限,而以機理分析為基礎(chǔ)的動力學模型要求信息完備,參數(shù)齊全,實際生產(chǎn)中不便于推廣。人工神經(jīng)網(wǎng)絡(ANN)以其連續(xù)時間的動力學行為、良好的非線性品質(zhì)、大規(guī)模并行分布處理、高度穩(wěn)健性和 學習 聯(lián)想能力等特點,被廣泛 應用 于模式識別、信號處理、系統(tǒng)控制中。并且ANN可以不完備信息建模,不需要被辨識對象階次結(jié)構(gòu)等先驗知識,建模方法簡單[1-3]。本 研究 針對該凈化中心氧化溝系統(tǒng)進水水質(zhì)復雜、起伏大,控制滯后的難點,通過使用BP模型,直接以正常運行時的生產(chǎn)數(shù)據(jù)為學習樣本建模,預報出水COD,詳細探討了模型設計、訓練及檢驗等環(huán)節(jié),建成的模型準確度較高,適應性強,可作為一種定性與定量相結(jié)合的有效工具,直接用于該系統(tǒng)出水COD預報。
1 模型原理及設計
1.1 BP網(wǎng)絡模型
按誤差反向傳播原則建立的BP(Back Propoga--tion)學習算法,是當前ANN技術(shù)中最成功的學習算法,前饋型BP網(wǎng)絡及在此基礎(chǔ)上改進的神經(jīng)網(wǎng)絡,是當前應用最廣泛的網(wǎng)絡類型[4]。本研究以MATLAB環(huán)境下的神經(jīng)網(wǎng)絡工具箱與統(tǒng)計工具箱[5]為數(shù)學工具,編制的BP模型由三層神經(jīng)元組成,其主要特點是:
1.1.1 輸入層由影響出水COD的各因素組成,為使樣本信息盡量豐富,并考慮到指標監(jiān)測方便可行,選擇以下參數(shù)作為輸入矢量:X1:水溫,X2:進水SS濃度,X3:進水COD濃度,X4:進水氨氮濃度,X5:MLSS,X6:MLVSS,X7:SV30(沉降30分鐘污泥體積比)。輸出層產(chǎn)生ANN輸出矢量Y,本研究希望輸出的是出水COD濃度Y。隱含層層數(shù)的選擇與 問題 的復雜性有關(guān),隱含層層數(shù)的增加將使訓練費用急劇上升,本研究采用一層隱含層,隱節(jié)點數(shù)的確定考慮到兩原則:①樣本數(shù)大于網(wǎng)絡可調(diào)數(shù)[6];②幾何平均規(guī)則[7]:對一個三層網(wǎng)絡,具有n個輸入節(jié)點,m個輸出節(jié)點,則中間層節(jié)點數(shù)H= 。本研究取節(jié)點數(shù)4~14,以期對其在更大范圍優(yōu)化。圖1給出了訓練成功的一組網(wǎng)絡結(jié)構(gòu)。
1.1.2 以logsig或tansig函數(shù)作為隱含層激活函數(shù),分別使用這兩種函數(shù)作網(wǎng)絡訓練,擇優(yōu)而用。以logsig作為輸出層激活函數(shù),將輸出結(jié)果控制在[0,1],式中,b為偏差值,x表示隱含層中的節(jié)點數(shù)值。
logsig函數(shù):
tansig函數(shù):
1.1.3 采用Levenberg-Marquart收斂規(guī)則,該規(guī)則采用了數(shù)值優(yōu)化算法,可根據(jù)誤差大小自動調(diào)整牛頓法與梯度法在訓練中的比重,是 目前 最快的收斂算法,大大降低了訓練費用。
1.2 訓練集與檢驗集
ANN模型的預報能力與學習樣本質(zhì)量及信息量緊密相關(guān),出水COD預報的BP網(wǎng)絡模型(以下簡稱模型)樣本數(shù)據(jù)取自漯河市污水凈化中心2000年8月至2002年2月間生產(chǎn)數(shù)據(jù),完整記錄(包括全部模型輸入輸出參數(shù))共89組,剔除發(fā)生生產(chǎn)事故(有記載的酸堿中毒、活性污泥膨脹等)狀態(tài)下記錄7組,剩余82組(考慮到數(shù)據(jù)樣本集規(guī)模不大,故包括了一些超標排放數(shù)據(jù)),初步確定為學習樣本集。進水水質(zhì)參數(shù)變化范圍:水溫:10.8~3℃;SS:139~1062mg/l;COD:109~694mg/l;NH4+-N:12.88~496mg/l;控制參數(shù):SV30:12~93;MLVSS:1107~3484 mg/l;MLSS:2226~6226 mg/l。生產(chǎn)報表無進水水量記載,故假定每個工作日進水水量連續(xù)穩(wěn)定,但建成模型檢驗結(jié)果反映出進水水量是一個重要模型參數(shù),由于缺乏相關(guān)數(shù)據(jù),使得模型性能欠佳。篩選出82組代表性數(shù)據(jù)中,通過主要成分分析及聚類分析[8],發(fā)現(xiàn)三組樣本有離群傾向,但不太突出,不做去除,以防止信息量的損失,最終確定學習樣本規(guī)模為82組。
以歐氏距離作為表征相似性的統(tǒng)計量,采用平均距離判斷依據(jù)將原始樣本分為10類,根據(jù)聚類結(jié)果,從各類中隨機挑選1/3左右的樣本歸入檢驗集,剩余的歸入訓練集。最終確定47組用于訓練,35組用于檢驗。聚類分析,保證了所取的訓練樣本分布均勻且能覆蓋原始樣本提供的結(jié)構(gòu)信息,彌補了原始數(shù)據(jù)量較少的不足。
對訓練集與檢驗集數(shù)據(jù)做預處理,筆者在此提出三點規(guī)范:①保持原始樣本統(tǒng)計 規(guī)律 ,數(shù)據(jù)拓撲結(jié)構(gòu)。②絕大部分網(wǎng)絡期望輸出要在輸出層激活函數(shù)的敏感區(qū)內(nèi),避免進入不應區(qū)。對logsig函數(shù)而言,敏感區(qū)為[0.15,0.85]。③網(wǎng)絡輸出逆變換不能放大誤差。本研究對原始數(shù)據(jù)作如下預處理,式中x表是原始值, xmin與xmax分別表示原始值中的最小值與最大值,xnorm表示訓練輸入值:
1.3 建模試驗要點
1.3.1 由于訓練、檢驗樣本自身含有噪聲,其大小未知,故建模應以預報準確度作為首要目標,精度作為次要目標。這里引入①檢驗誤差E:檢驗樣本網(wǎng)絡輸出值允許誤差的上限;②準確度:不大于E的檢驗合格率。用訓練總平方誤差G衡量模型精度,精度不可過高,否則會誘導網(wǎng)絡記住噪聲。如何協(xié)調(diào)精度與準確度之間的矛盾,找出二者最佳組合,盡可能達到模型性能最優(yōu)化是數(shù)值試驗的重中之重。
1.3.2 BP網(wǎng)絡學習收斂速度及局部最小點的性能對初始化權(quán)值、偏差矩陣十分敏感,本研究通過加大隨機初始化次數(shù)來搜索模型滿意解,對給定的網(wǎng)絡結(jié)構(gòu)及參數(shù)組合實行1000次隨機初始化權(quán)值、偏差矩陣搜索。
1.3.3 模型性能檢驗,采用四項指標[9-12]:相關(guān)系數(shù)C,均方根誤差R,標準均方根誤差N,平均相對誤差A,如下式中x、y分別表示輸入與輸出樣本值,下標i表示第i次訓練時對應樣本值,n表示訓練次數(shù), 、 表示相應樣本均值,x1i表示輸入第一個變量的第i個樣本值,x2i類推:
對網(wǎng)絡實際輸出與期望輸出(觀測值)作指標檢驗,可反映出模型的逼近性能。
1.3.4 模型的靈敏度檢驗[13]:目標值在多維空間中每一點隨各個自變量改變而改變的趨勢。靈敏度曲線平緩表明該項輸入對網(wǎng)絡輸出的影響過弱,靈敏度曲線出現(xiàn)突變或中斷表示該項輸入對網(wǎng)絡輸出的影響過強,此時模型模擬性能不穩(wěn)定,碰到這兩種情況,應繼續(xù)搜索或調(diào)整輸入變量個數(shù)重新訓練。
2 模型訓練及檢驗
建模數(shù)值試驗參數(shù)調(diào)整范圍設定:E:0.2~0.4;G:0.001~0.5;隱節(jié)點數(shù)H:4~14;隱含層激活函數(shù):tansig或logsig;輸出層激活函數(shù):logsig;訓練最大迭代次數(shù):1000。從72,000次搜索訓練中篩選出最佳的一組解: 網(wǎng)絡 結(jié)構(gòu)7-6-1(三層神經(jīng)網(wǎng)絡每層節(jié)點數(shù)), E=0.3, G=0.15,H=6,隱含層函數(shù):tansig。模型訓練經(jīng)過18次迭代達到穩(wěn)定,訓練總平方誤差0.13,圖2為誤差下降曲線;模型模擬及檢驗(預報)結(jié)果見圖3。
圖2 誤差下降曲線
Fig 2. The Error Curve of Training
模型性能指標值見表1。
表1 模型性能指標
Tab 1 The Values of Model Performance Testing
指標 |
C |
R | N | A |
模擬 |
0.9517 |
5.0152 |
0.1309 |
0.1214 |
預報 |
0.7399 |
9.9225 |
0.2645 |
0.2436 |
綜合 |
0.8709 |
7.5127 |
0.1978 |
0.1736 |
從 學習 樣本集檢驗合格的樣本中任取一組樣本,對應輸入矢量X1…X7分別為:{14.3,273,292,33,5479,3394,44},考察網(wǎng)絡輸出隨單項輸入變化而改變的趨勢,靈敏度曲線見圖4
圖3 出水COD原始值與模擬/預報結(jié)果
Fig.3. Observed and Simulated/Predicted Results of Effluent COD
圖4 模型靈敏度曲線
Fig 4. The Sentivity Curves of Model
3 討論
3.1 學習樣本的質(zhì)量對模型預報精度及準確度 影響 極大。學習樣本自身的噪聲干擾降低了模型的預報精度及準確度。盡管通過主成分 分析 與聚類分析有效挖掘了樣本信息,噪聲干擾與訓練樣本規(guī)模較小是模型訓練準確度與精度進一步提高的主要障礙。
3.2 模型性能檢驗基本合格,檢驗集對應的平均相對誤差<0.25,相關(guān)系數(shù)接近0.75,標準均方根誤差0.26,通過圖3可看出,模型在預報區(qū)能對出水COD峰值作出正確響應,表明網(wǎng)絡在訓練中捕捉到了氧化溝系統(tǒng)參數(shù)間關(guān)系的本質(zhì)。在E≤0.3的前提下,預報準確率達到82.9%,在E≤0.35的前提下,預報準確率達到88.6%,綜合相關(guān)系數(shù)0.87,綜合標準均方根誤差0.19,建成的模型可行。
3.3 數(shù)值試驗中,提高精度,準確度下降;降低精度,準確度上升。對含較大噪聲的樣本訓練而言,適當降低精度,把檢驗重點放在準確度上是可取的。
3.4 從靈敏度曲線分析可見,出水COD對7項輸入?yún)?shù)的靈敏度均較高,靈敏度曲線光滑,并且能定量反映出給定水質(zhì)條件下出水COD與單項輸入?yún)?shù)的相關(guān)性及單項參數(shù)對出水COD的最佳控制點。
4 結(jié)論
1 以漯河市污水凈化中心氧化溝系統(tǒng)為考察對象,采用人工神經(jīng)網(wǎng)絡 方法 對其進行模擬分析,建立了氧化溝系統(tǒng)出水COD預報模型(以下簡稱預報模型)。
2 建立的預報模型,在E ≤0.3的前提下,預報準確率達到82.9%,在E≤0.35的前提下,預報準確率達到88.6%,綜合相關(guān)系數(shù)0.87,綜合標準均方根誤差0.19。
3 建立的預報模型,出水COD對7項輸入?yún)?shù)的靈敏度均較高,靈敏度曲線光滑,并且能定量反映出給定水質(zhì)條件下出水COD與單項輸入?yún)?shù)的相關(guān)性及單項參數(shù)對出水COD的最佳控制點,為建立水質(zhì)參數(shù)的反饋控制模型,將預報與反饋控制相結(jié)合,實現(xiàn)氧化溝系統(tǒng)在線智能控制奠定了基礎(chǔ)。
參考 文獻 :
1 靳蕃. 神經(jīng) 計算 智能基礎(chǔ)原理、方法[M]. 成都: 西南 交通 大學出出版社,2000.
2 田禹,王寶貞,周定.人工神經(jīng)網(wǎng)絡對水處理系統(tǒng)建模適應性 研究 [J]. 環(huán)境 科學 學報,1999,19(1):33-36.
3 郭勁松,龍騰銳,高旭等. 間歇曝氣活性污泥系統(tǒng)神經(jīng)網(wǎng)絡水質(zhì)模型[J]. 中國 給水排水,2000,16(11):15-18.
4 楊建剛. 人工神經(jīng)網(wǎng)絡實用教程[M]. 杭州: 浙江大學出版社,2001.
5 聞新,周露,王丹力等. MATLAB神經(jīng)網(wǎng)絡 應用 設計[M]. 北京: 科學出版社,2000.
6 張愛茜,韓朔睽, 沈洲等. 運用回歸分析與人工神經(jīng)網(wǎng)絡預測含硫芳香族化合物好氧生物降解速率常數(shù)[J].環(huán)境科學,1998,
19(1):37-40.
7 朱東海,張土喬,任愛珠等. BP神經(jīng)網(wǎng)絡用于給水管網(wǎng)模擬試驗時的構(gòu)造參數(shù)設計[J]. 給水排水,2001,27(2):10-13.
8 蘇金明,阮沈勇. MATLAB6.1實用指南(上冊)[M]. 北京: 電子 工業(yè) 出版社,2002.
9 Sang H S, Sea C O, Byung W J, etc. Prediction of Ozone Formation Based on Neural Network[J].J. Envir. Engrg.,ASCE,2000, 8:688-696.
10 . Cameron M Z, Donald H B,, Slobodan P S. Short term streamflow forecasting using artificial neural networks[J]. J.Hydro, 1999,214(1):32-48.
11 .Catherine F.B, Pierre L.C..Neural Network Modeling of Organics Removal by Activated Carbon Cloths[J].J.Envir.Engrg,2001,(10):889-894.
12 . Tay J.H, Zhang Xie-yue. Neural Fuzzy Modelling of Anaerobic Biological Wastewater Treatment Systems[J].J. Envir. Engrg.,ASCE,1999,12:1149-1159.
13 .陳念貽,欽佩,陳瑞亮等. 模式識別方法在化學化工中的應用[M].北京:科學出版社.2000.
使用微信“掃一掃”功能添加“谷騰環(huán)保網(wǎng)”