工業(yè)網(wǎng)絡故障及應對方案
在當今網(wǎng)絡的分級管理幾乎遍布所有較大型的工業(yè)控制網(wǎng)絡,一般都劃分為level1基礎自動化級、level2過程自動化級、level3生產(chǎn)控制級。在濟南鋼鐵集團,這樣的工業(yè)網(wǎng)絡系統(tǒng)也是遍布整個工藝流程。雖然工業(yè)網(wǎng)絡控制功能強大,但也需要有好的維護以及正確實用的應用程序來適應。下面就是在濟鋼集團某分廠發(fā)生的一例網(wǎng)絡故障的情況。
1基本情況
2002年12月濟鋼集團自動化部與某分廠聯(lián)合進行了該分廠整個生產(chǎn)線的自動化控制改造,其中,改造過程很重要的一部分就是在原有的level1基礎自動化級上,擴展level2過程自動化級,由于是改造工程、同時也為了節(jié)約投資。level2過程自動化級并沒有遍及整個基礎自動化級。作為初期目標,在level2過程自動化級上,設置了一臺服務器,另有10臺左右的工作站,構成了該分廠核心的生產(chǎn)管理控制中心,幾乎全部的生產(chǎn)線啟停操作、目標設置、數(shù)據(jù)管理都由該中心完成。整個網(wǎng)絡拓撲結構、實際排列順序及類型,
其中l(wèi)evel1基礎自動化部分:PLC1~4為操作控制基礎自動化控制器,機型為E984-685,屬于此次改造僅存的未變動部分,其余全部是新增部分;PLC5~6為基礎自動化一級模型運算處理控制器,機型為Quantum140-CPU-434-12。所有PLC1~6之間的數(shù)據(jù)通訊都通過1Mbit/s的MODBUSPLUSE網(wǎng)絡完成。由于該網(wǎng)絡線路較長中間增設了2臺中繼器,并按布線要求,在網(wǎng)絡兩端各配備有120Ω的終端電阻。在level2過程自動化部分設有服務器SERVERC1~C10共10臺工作站,另外PLC5~6也起到類似網(wǎng)關作用,同時也連接在level2過程自動化部分,通過交換機連接在一起。網(wǎng)絡類型為100Mbit/s的以太網(wǎng)。這里舉例說明數(shù)據(jù)流向:當C1對PLC1的數(shù)據(jù)進行寫操作時,首先,向服務器SERVER申請,服務器SERVER接到申請后,將所寫內容,通過以太網(wǎng)寫入PLC6中相對應的寄存器。至此2級操作即告完成。然后PLC6中所寫內容寄存器會按照PLC6中的邏輯程序進行MSTR傳送,通過1級的MODBUSPLUSE網(wǎng)絡寫入PLC1中所對應的寄存器。從而達到C1控制PLC1的目的。讀操作也是類似此法處理的。
2故障現(xiàn)象及原因分析
12月16日,該分廠改造結束,剛投入生產(chǎn)不久,突然發(fā)現(xiàn)C1~C10上顯示的數(shù)據(jù)全部不隨現(xiàn)場設備狀態(tài)更新了,緊接著檢查服務器SERVER,發(fā)現(xiàn)SERVER數(shù)據(jù)也不刷新。當時,檢查人員認為SERVER服務不響應了,于是重新啟動服務器SERVER,一次重啟后,全部系統(tǒng)恢復正常。其后的1~2天里,此現(xiàn)象時斷時續(xù)又發(fā)生了多次,有時服務器SERVER,還需重啟兩次,才恢復正常。也就是說故障時間一般不超過30分鐘。還有一個特點,故障從不發(fā)生在深夜,另外該現(xiàn)象也給故障排查帶來了一定困難:通訊中斷的數(shù)據(jù)處理是保持最終狀態(tài)的,很可能雖然故障發(fā)生,但由于現(xiàn)場設備狀態(tài)未發(fā)生改變而不易被操作者發(fā)現(xiàn),從而忽略過去。這種現(xiàn)象的發(fā)生極大的影響了生產(chǎn)的正常運行,導致了多次生產(chǎn)線停機。
12月18日此故障再次出現(xiàn),工作站數(shù)據(jù)標簽與服務器數(shù)據(jù)標簽內容吻合,證明2級網(wǎng)絡通訊正常。服務器數(shù)據(jù)標簽與PLC6的寄存器數(shù)據(jù)標簽內容吻合。證明服務器數(shù)據(jù)交換正常。當檢查PLC6與PLC2通訊時,發(fā)現(xiàn)PLC1、PLC2的MODBUSPLUSE的通訊指示燈閃爍均不正常,而PLC6的閃爍正常。按理說PLC6、PLC2、PLC1之間為柜間線,也無人接觸不該導致通訊中斷。經(jīng)簡單目視檢查后,沒有發(fā)現(xiàn)問題。由于PLC1、PLC2同處于網(wǎng)路后半段,遂認為有因素在影響整個網(wǎng)路后半段。立即前往距離約50米外的網(wǎng)路后半段終端點-電氣值班室。經(jīng)檢查MODBUSPLUSE網(wǎng)絡終端電阻接線接觸不良,引起短路,導致網(wǎng)絡阻抗不匹配,信號反射率上升,引起波形失真,從而影響到網(wǎng)路后半段最近的3個節(jié)點不能正常工作。重新接線后,系統(tǒng)立即恢復正常。事后詢問得知,電氣值班室這幾日一直在裝修,白天屢屢搬動設備可能就是因為設備移動導致終端電阻時好時壞,這也解釋了為何故障從不發(fā)生在深夜的疑問。
3改進措施
現(xiàn)在網(wǎng)絡化工業(yè)控制在工業(yè)生產(chǎn)中處于至關重要的地位,其通訊安全理應得到足夠的重視。一些次重要或可有可無的網(wǎng)絡節(jié)點應盡量減少或做分段處理。布線點一定要確保網(wǎng)路安全可靠。這一點尤其在總線式網(wǎng)絡上特別突出。從而在根源上減少甚至杜絕故障。除了在硬件設置上進行了重新安置,還在網(wǎng)絡故障軟件診斷上,下了很大功夫。經(jīng)過反復論證,實現(xiàn)了網(wǎng)路故障的即時診斷。即使出問題的不單單是網(wǎng)路線路,還包括電源中斷、CPU損壞、通訊輔助設備損壞等,也能夠在極短的時間內判斷故障點及故障范圍。具體做法如下:在PLC1~6以及服務器分別設置一個動態(tài)變化的位寄存器和位數(shù)據(jù)標簽,它們不斷地以1秒一次的頻率變化,由0→1再由1→0。這樣在C1~C10上可以清楚的看到PLC1~6以及服務器中,誰與工作站通訊中斷了。同時配合PLC以及服務器的狀態(tài)字傳輸,可以方便的得到通訊故障原因,如果應用數(shù)據(jù)庫技術還可以進行網(wǎng)絡故障的歷史記錄和查詢。
文章版權歸西部工控xbgk所有,未經(jīng)許可不得轉載。