DCS故障分析及其技術(shù)措施
一、概述
鎮(zhèn)海電廠#3-#6215MW機(jī)組從1998年開(kāi)始進(jìn)行自動(dòng)化改造,選用國(guó)產(chǎn)的DCS系統(tǒng),2007年起各臺(tái)機(jī)組陸續(xù)進(jìn)行升級(jí)改造,目前已完成三臺(tái)機(jī)組的升級(jí)工作。鎮(zhèn)海電廠DCS的網(wǎng)絡(luò)結(jié)構(gòu)由上到下分為監(jiān)控網(wǎng)絡(luò)、系統(tǒng)網(wǎng)絡(luò)和控制網(wǎng)絡(luò)三個(gè)層次,如圖1所示。其中監(jiān)控網(wǎng)絡(luò)中的工程師站、操作員站。
高級(jí)計(jì)算站等和系統(tǒng)網(wǎng)絡(luò)中的現(xiàn)場(chǎng)控制站。

通過(guò)系統(tǒng)服務(wù)器實(shí)現(xiàn)互連;控制網(wǎng)絡(luò)由ProfiBus-DP構(gòu)成,實(shí)現(xiàn)現(xiàn)場(chǎng)控制站與過(guò)程I/O單元的通訊。該系統(tǒng)可由多組服務(wù)器組成,由此可將系統(tǒng)劃分為多個(gè)域。鎮(zhèn)海電廠215MW機(jī)組的DCS均劃分為兩個(gè)域,即主機(jī)域和輔機(jī)域。每個(gè)域由獨(dú)立的服務(wù)器、系統(tǒng)網(wǎng)絡(luò)和多個(gè)現(xiàn)場(chǎng)控制站組成,域內(nèi)的數(shù)據(jù)單獨(dú)組態(tài)和管理,完成相對(duì)獨(dú)立的采集和控制功能;兩個(gè)域共享監(jiān)控網(wǎng)絡(luò)和工程師站,操作員站等則通過(guò)域名登錄到不同的域進(jìn)行操作。
鎮(zhèn)海電廠DCS系統(tǒng)在升級(jí)改造前故障率相對(duì)較高,經(jīng)過(guò)對(duì)歷年來(lái)故障統(tǒng)計(jì)的分析,主要故障有主控制器故障、I/O模件故障、服務(wù)器故障、控制網(wǎng)絡(luò)故障和其它因素等引起,以2006年度為例,#3-#6機(jī)組共發(fā)生DCS相關(guān)故障39起,其中主控制器故障13起,模件故障8起,占故障總數(shù)的53.8%,因此控制系統(tǒng)故障是熱工系統(tǒng)故障的主要因素,其分類統(tǒng)計(jì)情況,如圖2所示。

二、DCS故障現(xiàn)象及其分析
根據(jù)上述DCS系統(tǒng)所發(fā)生的主要故障發(fā)生類型,下面對(duì)鎮(zhèn)海電廠近年來(lái)應(yīng)用DCS過(guò)程中比較典型的軟、硬件故障進(jìn)行分析。
2.1主控制器故障
主控制器故障在鎮(zhèn)海電廠DCS故障中占有較大比例,而且引起主控制器故障的原因也各不相同,部分故障在單純復(fù)位或重新啟動(dòng)后能夠恢復(fù)正常,部分故障則對(duì)機(jī)組運(yùn)行產(chǎn)生了嚴(yán)重影響。
(l)異常控制器不能自動(dòng)切換
2009年8月31日,現(xiàn)場(chǎng)檢查時(shí)發(fā)現(xiàn)#5機(jī)#11 I/O站和#26 I/O站主控器故障,均為A主控故障燈閃亮,雙機(jī)冗余通訊燈不亮,B主控備用。從工程師站上查看,主控制器顯示A主控為主,B主控備用,狀態(tài)顯示正常;查閱DCS歷史記錄,無(wú)相關(guān)故障記錄;相關(guān)I/O站內(nèi)各參數(shù)采集、控制設(shè)備動(dòng)作均正常。經(jīng)分析,認(rèn)為主控制器當(dāng)前仍正常運(yùn)行,但雙機(jī)冗余的同步性存在問(wèn)題,如果這時(shí)發(fā)生主控切換將會(huì)出現(xiàn)較大擾動(dòng)。而在這之前異常控制器不能冗余切換故障已發(fā)生過(guò)多次,如#3爐DCS系統(tǒng)曾發(fā)生一次風(fēng)壓自動(dòng)調(diào)節(jié)偏差大于36OPa時(shí),運(yùn)行人員手動(dòng)干預(yù)操作送風(fēng)機(jī)勺管調(diào)節(jié)執(zhí)行機(jī)構(gòu)無(wú)效,急忙至就地進(jìn)行手操。熱工通過(guò)工程師站,檢查對(duì)應(yīng)的#12 I/O站,發(fā)現(xiàn)A主控離線,B主控備用,在I/O站上查看A主控系統(tǒng)燈1和系統(tǒng)燈2均不亮,故障燈未亮,表明該主控已失去與系統(tǒng)網(wǎng)的數(shù)據(jù)交流,但主控未實(shí)現(xiàn)冗余切換。另#3爐#23 I/O站也曾發(fā)生過(guò)A主控故障離線,故障燈與雙機(jī)冗余數(shù)據(jù)交換燈均不亮,主控制器未自動(dòng)切換。這些故障案例表明,MACS系統(tǒng)主控制器冗余切換功能不完善,某種故障狀態(tài)下該功能失效。
(2)散熱風(fēng)扇故障導(dǎo)致主控制器故障
主控制器內(nèi)的散熱風(fēng)扇如果故障,將使主控制器故障率大大增加。自2005年以來(lái),鎮(zhèn)海電廠統(tǒng)計(jì)的因主控制器內(nèi)散熱風(fēng)扇異產(chǎn)常導(dǎo)致的主控制器故障共計(jì)13次(這類故障的主控制器內(nèi)散熱風(fēng)扇均有一個(gè)或幾個(gè)運(yùn)轉(zhuǎn)不正常或完全不運(yùn)轉(zhuǎn),一般在更換散熱風(fēng)扇后仍能恢復(fù)正常運(yùn)行)。
(3)電子室環(huán)境對(duì)主控制器的影響
電子室內(nèi)的溫、濕度對(duì)主控制器有一定影響,強(qiáng)制散熱的主控制器影響更大。溫、濕度過(guò)高不一定使主控制器立即發(fā)生故障,但長(zhǎng)期處于這種環(huán)境下必定會(huì)使主控制器故障率增高,而且從我們的統(tǒng)計(jì)來(lái)看,濕度的影響比溫度的影響更大。根據(jù)2005年以來(lái)的統(tǒng)計(jì),每年3-6月份的主控制器故障次數(shù)約占到全年總數(shù)的1/3到一半多,這段時(shí)期正值南方濕熱的雨季,中央空調(diào)往往會(huì)補(bǔ)充大量的新風(fēng),電子室內(nèi)濕度會(huì)有所增大。這種情況下發(fā)生的主控制器異常,一般均通過(guò)復(fù)位或重新啟動(dòng)后可以恢復(fù),只有個(gè)別需要更換新的主控制器。
2.2模件故障
與主控制器故障相比,模件故障相對(duì)容易解決,一般通過(guò)模件復(fù)位和更換模件就能恢復(fù)正常。但有些故障由于受其它因素影響,比較特別。
(l)外部千擾引起I/O模件離線
2007年1月,#5機(jī)組按計(jì)劃轉(zhuǎn)入小修。停機(jī)過(guò)程中,運(yùn)行人員投微油點(diǎn)火裝置助燃,不久發(fā)生用于微油燃燒器壁溫測(cè)量的熱電偶測(cè)量模件故障,微油燃燒器壁溫顯示無(wú)效。熱工人員對(duì)模件復(fù)位后恢復(fù)正常。之后在小修和開(kāi)機(jī)過(guò)程中多次發(fā)生該模件故障,均能夠通過(guò)復(fù)位得以解決,期間也更換過(guò)模件,但故障依舊。機(jī)組復(fù)役后該模件運(yùn)行穩(wěn)定,直至3月4日再次發(fā)生該模件故障。經(jīng)現(xiàn)場(chǎng)檢查,接入該模件的二支熱電偶元件安裝位置與微油點(diǎn)火槍距離過(guò)近,當(dāng)微油點(diǎn)火槍點(diǎn)火時(shí)高能電磁干擾通過(guò)電纜串入模件中,造成模件離線,并在試驗(yàn)后得到確認(rèn)。在調(diào)整熱電偶與點(diǎn)火槍的安裝位置后,此故障排除。
(2)單一通道的故障
模件故障有硬性和軟性二種,需通過(guò)更換模件來(lái)解決的我們稱之為硬性故障,而通過(guò)對(duì)模件進(jìn)行復(fù)位可以解決的故障,我們稱之為軟故障,這種故障也有可能只反映在其中的某一個(gè)通道上,可以通過(guò)實(shí)際測(cè)量來(lái)判定。如2007年l月15日,#5機(jī)化補(bǔ)水調(diào)節(jié)閥不能開(kāi)啟,無(wú)論DCS中給出的指令是多少,現(xiàn)場(chǎng)測(cè)量電流值始終為4mA。之后對(duì)該模件進(jìn)行復(fù)位后控制復(fù)正常。另有一次#4爐定排疏水電動(dòng)門開(kāi)啟且無(wú)法關(guān)閉。現(xiàn)場(chǎng)檢查對(duì)應(yīng)的開(kāi)關(guān)量輸出模件,第一通道輸出為“1”(對(duì)應(yīng)該電動(dòng)門的開(kāi)指令),而DCS中查看該通道的狀態(tài)為“0”,更換模件無(wú)效,對(duì)主控制器進(jìn)行下裝后控制恢復(fù)正常。
2.3服務(wù)器故障
鎮(zhèn)海電廠DCS的監(jiān)控網(wǎng)絡(luò)和系統(tǒng)網(wǎng)絡(luò)通過(guò)服務(wù)器實(shí)現(xiàn)互連,因此服務(wù)器故障將使處在上層監(jiān)控網(wǎng)絡(luò)操作員站失去對(duì)下層系統(tǒng)網(wǎng)絡(luò)中的運(yùn)行參數(shù)和控制設(shè)備的監(jiān)視和控制,給機(jī)組的安全穩(wěn)定運(yùn)行造成嚴(yán)重的影響。2007年6月11日,#6機(jī)主機(jī)域主服務(wù)器故障,服務(wù)器未能自動(dòng)切換,所有操作站上參數(shù)失效,控制失靈,運(yùn)行人員依靠DEH和后備儀表維持機(jī)組運(yùn)行。熱工人員在手動(dòng)切換到B服務(wù)器后DCS恢復(fù)運(yùn)行,但從系統(tǒng)狀態(tài)圖中查看A服務(wù)器連接系統(tǒng)網(wǎng)的下層網(wǎng)絡(luò)仍然處于故障狀態(tài),本地網(wǎng)絡(luò)沒(méi)有連接,重新啟動(dòng)服務(wù)器后網(wǎng)絡(luò)連接恢復(fù)。之后#6機(jī)又多次發(fā)生同類故障,檢查服務(wù)器主機(jī)及網(wǎng)卡均未發(fā)現(xiàn)異常,也更換過(guò)服務(wù)器,但至今原因不明。目前采取定期切換、重啟服務(wù)器的方法,有一定效果。
2.4控制網(wǎng)絡(luò)故障
一般來(lái)說(shuō),DCS網(wǎng)絡(luò)故障多發(fā)生在網(wǎng)絡(luò)設(shè)備如交換機(jī)、光端機(jī)的故障,往往在更換硬件后故障現(xiàn)象能得到解決。2007年1月29日,#3機(jī)一臺(tái)交換機(jī)故障導(dǎo)致監(jiān)控網(wǎng)B網(wǎng)離線;之前#3機(jī)一臺(tái)交換機(jī)死機(jī),導(dǎo)致系統(tǒng)網(wǎng)A網(wǎng)離線;#5機(jī)一臺(tái)光端機(jī)故障,導(dǎo)致#30站遠(yuǎn)程I/O站離線;這些故障均在復(fù)位或更換網(wǎng)絡(luò)設(shè)備后恢復(fù)正常。
由于DCS的控制網(wǎng)絡(luò)連接主控制器和過(guò)程I/O模件,控制網(wǎng)絡(luò)故障對(duì)系統(tǒng)的影響范圍較大,往往是一段鏈路中的多個(gè)模件同時(shí)離線,其原因具有多樣性:
(l)網(wǎng)線連接配件故障
2007年2月5日,#3機(jī)組正常運(yùn)行,#20 I/O站內(nèi)多個(gè)參數(shù)顯示無(wú)效,控制設(shè)備操作失靈。現(xiàn)場(chǎng)檢查,#20 I/O站A主控運(yùn)行,B主控備用,A列模件運(yùn)行正常,B列、C列模件均離線。在做好必要的安全措施后切換主控制器,則B列、C列模件大部分恢復(fù)運(yùn)行,個(gè)別仍有間歇性離線,而A列模件則都出現(xiàn)間歇性離線,間隔時(shí)間在幾秒到幾分鐘不等。查明的原因是B主控控制網(wǎng)的DP線插頭故障(DP插頭內(nèi)部配有終端電阻,是否使用可選擇),導(dǎo)致鏈路中斷或阻抗不匹配,更換DP插頭后恢復(fù)正常。之后類似故障#3機(jī)還發(fā)生過(guò)兩次,均在更換DP頭后得以恢復(fù),于是在機(jī)組檢修期間,我們對(duì)所有同類型的DP插頭進(jìn)行了更換。
(2)DP總線“虛接”
鎮(zhèn)海電廠DCS遠(yuǎn)程I/O站的控制網(wǎng)絡(luò)采用底座串接的方式擴(kuò)展I/O模塊,這種連接方式靈活度高,便于分散連接,但同時(shí)存在DP通信的故障點(diǎn)多,通信總線的特性阻抗不穩(wěn)定等缺點(diǎn)。2006年4月,#4機(jī)組發(fā)電機(jī)溫度測(cè)量遠(yuǎn)程柜自第二個(gè)模塊以下全部離線,在按壓或觸碰這幾個(gè)模件后則能夠恢復(fù),之后多次發(fā)生類似故障,基本以同樣方式解決。經(jīng)分析,這類故障原因是因?yàn)榇怪卑惭b的模塊底座受機(jī)械振動(dòng)引起觸點(diǎn)松動(dòng)和現(xiàn)場(chǎng)環(huán)境不佳如濕熱等將引起觸點(diǎn)氧化,會(huì)造成DP總線的“虛接”,特性阻抗不匹配。這類故障在安裝于現(xiàn)場(chǎng)的遠(yuǎn)程I/O柜發(fā)生較多,而安裝于電子室內(nèi)的I/O站則基本未發(fā)生。#4機(jī)發(fā)電機(jī)溫度柜在機(jī)組檢修時(shí)更換了所有底座并重新安裝后,這類情況有了較大好轉(zhuǎn)。
(3)故障模件對(duì)DP總線的影響
一段DP總線上幾個(gè)模件的通訊接口故障時(shí),可能會(huì)引起一段DP鏈路上的所有模塊離線。如#4機(jī)給泵溫度遠(yuǎn)程I/O柜內(nèi)曾發(fā)生多個(gè)模件頻繁離線,離線間隔時(shí)間短則幾秒鐘,長(zhǎng)則幾分鐘甚至更長(zhǎng),DP總線無(wú)虛接現(xiàn)象。采取下裝主控、更換模件等手段均無(wú)效。在插拔模件的過(guò)程中,當(dāng)拔到某一個(gè)模件則DP鏈路恢復(fù)正常,再插回則又有模件開(kāi)始離線,因此判斷是模件故障引起整個(gè)一段DP鏈路上模件離線。通過(guò)逐一排除的方法共查到有一塊模件故障,事后拆開(kāi)模件肉眼能看到有電容元件不同程度爆裂的跡象。
模件故障影響一段DP總線上模件離線的故障點(diǎn)較難判斷,離線的不一定是故障模件,故障模件也不一定會(huì)離線,但沒(méi)有好的測(cè)試手段,只能用逐一排除法來(lái)進(jìn)行故障點(diǎn)的判斷,在機(jī)組運(yùn)行時(shí)有一定的難度和風(fēng)險(xiǎn)。但這種總線故障在只有一個(gè)模件故障時(shí)不會(huì)出現(xiàn),而且模件內(nèi)的故障點(diǎn)能用肉眼觀察到,因此機(jī)組檢修時(shí)可以對(duì)模件拆開(kāi)檢查,能起到很好的預(yù)防效果。
2.5其它因素引起的故障
(1)GPS時(shí)鐘對(duì)DCS的影響
鎮(zhèn)海電廠DCS的系統(tǒng)時(shí)鐘是由服務(wù)器通過(guò)與GPS電子鐘通訊進(jìn)行校時(shí)的。2006年9月17日,#4機(jī)組正常運(yùn)行時(shí)發(fā)生DCS操作員站均離線退出運(yùn)行,主機(jī)域和輔機(jī)域兩個(gè)冗余服務(wù)器中的主服務(wù)器均離線退出運(yùn)行,工程師站離線退出運(yùn)行,主機(jī)域和輔機(jī)域的冗余服務(wù)器自動(dòng)切換成功。正在現(xiàn)場(chǎng)的熱工人員立即啟動(dòng)工程師站,運(yùn)行人員通過(guò)工程師站維持機(jī)組運(yùn)行。經(jīng)現(xiàn)場(chǎng)分析,由于GPS電子鐘故障,DCS系統(tǒng)時(shí)鐘被錯(cuò)誤地校成了2178年,而因此造成操作員站離線則應(yīng)是系統(tǒng)程序的bug。在恢復(fù)系統(tǒng)時(shí)鐘后,逐一啟動(dòng)操作員站和服務(wù)器,DCS恢復(fù)正常運(yùn)行。
(2)控制系統(tǒng)邏輯不完善
控制邏輯組態(tài)的不完善,很難通過(guò)正常的試驗(yàn)發(fā)現(xiàn),正常運(yùn)行中也不會(huì)有問(wèn)題,但在某種特定條件下會(huì)影響到機(jī)組安全穩(wěn)定運(yùn)行,甚至聯(lián)鎖保護(hù)誤動(dòng)。如#5機(jī)組215MW滿負(fù)荷運(yùn)行,甲給水泵運(yùn)行,乙給水泵備用時(shí),甲泵前置泵流量超限報(bào)警(超量程上限800t/h),隨后甲泵再循環(huán)調(diào)節(jié)閥自動(dòng)開(kāi)啟,給泵出口壓力低報(bào)警,汽包水位低至-120mm。經(jīng)檢查設(shè)主給水最大設(shè)計(jì)流量為680t/h,前置泵流量變送器量程設(shè)置為0-800t/h。DCS組態(tài)中,前置泵流量的判斷使用“幅值報(bào)警”模塊來(lái)實(shí)現(xiàn),該模塊低報(bào)警、低低報(bào)警值均設(shè)置為200,高報(bào)警、高高報(bào)警值則均設(shè)置為800,當(dāng)前置泵流量前置泵流量小于200t/h(給水泵小流量保護(hù))或超過(guò)800t/h時(shí),均聯(lián)鎖開(kāi)啟給泵再循環(huán)調(diào)節(jié)閥。這種組態(tài)沒(méi)有考慮極端情況,后改為“比較器”模塊,只發(fā)出單一判斷信。
(3)維護(hù)措施不當(dāng)
不適當(dāng)?shù)厥褂贸?jí)權(quán)限,可能會(huì)導(dǎo)致控制器邏輯運(yùn)算錯(cuò)誤。如#3機(jī)組曾因RB邏輯不完善,熱工技術(shù)人員使用超級(jí)用戶權(quán)限在線修改定時(shí)器類型時(shí),定時(shí)器輸出變位而觸發(fā)機(jī)組RB保護(hù)動(dòng)作。實(shí)際上超級(jí)用戶權(quán)限是DCS廠家限制使用的權(quán)限,有其不確定性,在安全措施不完善的情況下極易引發(fā)事故,因此其使用要非常慎重。
三、提高Dcs可靠性的技術(shù)措施
隨著DCS在火電廠中的廣泛應(yīng)用,其在機(jī)組安全穩(wěn)定運(yùn)行中所占據(jù)的主導(dǎo)地位愈加突出。由于DCS設(shè)備軟硬件的可靠性、控制邏輯的完善和合理性、熱工人員維護(hù)和檢修水平等諸多因素的影響,使機(jī)組誤跳閘事件仍時(shí)有發(fā)生。因此進(jìn)行有效的技術(shù)管理和正確的檢修維護(hù),保持火電機(jī)組DCS的穩(wěn)定、可靠運(yùn)行也就日漸成為熱工人員日常管理、維護(hù)的重點(diǎn)。為此筆者結(jié)合上述案例分析,從提高控制系統(tǒng)可靠性著手,提出一些防范措施供檢修維護(hù)中參考:
(l)對(duì)DCS設(shè)備和檢修維護(hù)實(shí)行全過(guò)程管理,盡早發(fā)現(xiàn)缺陷并及時(shí)處理。完善DCS自診斷和故障報(bào)警功能,對(duì)DCS運(yùn)行狀況的實(shí)時(shí)監(jiān)控不僅要監(jiān)視主控制器的狀態(tài),還要監(jiān)視主控制器網(wǎng)絡(luò)的狀態(tài)。
(2)制定合理的定期維護(hù)制度,詳細(xì)規(guī)定檢查維護(hù)的內(nèi)容、方法和周期,并對(duì)檢查結(jié)果進(jìn)行分析,采取針對(duì)性的預(yù)防措施。鎮(zhèn)海電廠自從試行這項(xiàng)制度以來(lái),有效地控制了DCS故障的發(fā)生。
(3)制訂DCS應(yīng)急預(yù)案和典型故障處理方案,防止因維護(hù)不當(dāng)引起的DCS故障。
(4)選用品質(zhì)較好的備品配件,如主控制器的散熱風(fēng)扇、DP插頭等,對(duì)于易損部件實(shí)行定期更換。
(5)對(duì)電子室的環(huán)境溫度進(jìn)行遠(yuǎn)程監(jiān)測(cè),接入DCS顯示,實(shí)時(shí)掌握電子室環(huán)境溫度的變化。使用中央空調(diào)的電子室還應(yīng)注意濕度的控制,如有必要應(yīng)增裝獨(dú)立的空調(diào)或除濕裝置。
(6)檢修時(shí)對(duì)模件電路板外觀進(jìn)行檢查,能起到很好的預(yù)防效果。
(7)深入了解DCS軟件性能,采取合理的組態(tài)方法防止極端工況下的誤動(dòng);禁止使用“超級(jí)用戶”等不規(guī)范的手段進(jìn)行軟件修改。
文章版權(quán)歸西部工控xbgk所有,未經(jīng)許可不得轉(zhuǎn)載。