工業交換機網管運維方案
工業交換機作為工業網絡中的關鍵設備,承擔著數據傳輸和交換的重要任務,其穩定運行直接關系到整個工業生產系統的可靠性和效率。隨著工業數字化轉型的加速,工業網絡的規模和復雜性不斷增加,對工業交換機的運維管理提出了更高的要求。
智和信通工業交換機監控運維方案,憑借全面且系統化的運維管理能力,保障工業交換機持續穩定運行在最佳狀態,為工業生產場景提供高可靠的網絡支撐。
第一章 工業交換機監控運維需求
網絡和工業交換機的可管理性,已經被越來越多的用戶所重視,對工業交換機的管理需求主要集中在以下幾方面:
- 設備高可用:確保工業交換機在復雜的工業環境下長期穩定運行,避免出現頻繁宕機或性能下降的情況。
- 優化性能:通過對設備的合理配置與調整,使數據傳輸效率達到最佳狀態,滿足工業生產對實時性和高速率的要求。
- 快速故障恢復:建立有效的故障監測與應急處理機制,能夠在最短時間內定位并解決出現的各類問題,將停機時間降至最低限度。
第二章 智和網管平臺介紹
智和網管平臺(SugarNMS)是由北京智和信通技術有限公司自主設計和研發的一款智能化監控運維平臺。軟件結合工業交換機網絡和設備的特性,在具有通用監控運維平臺的功能的基礎上集成了如工業環網自動發現、備用鏈路的識別、堵塞點識別、設備配置文件備份、設備軟件升級等特有功能,最大程度的滿足工業交換機監控運維需求。
智和網管平臺(SugarNMS)具備的功能如下:
- 自動發現核心、匯聚、接入層交換機、以及設備之間的鏈路關系;
- 自動掃描發現全網交換機設備、識別廠商型號和設備網口圖;
- 自動掃描工業環網、識別備用鏈路和堵塞點;
- 自動匹配設備面板圖、可基于圖形化面板方式管理設備;
- 管理設備的端口、帶寬、吞吐量、流量、丟包率、錯誤包、運行狀況等;
- 圖形化監視網絡鏈路的故障、流量、網絡數據;
- 圖形化方式采集流量、帶寬、吞吐率性能數據;
- 管理設備MAC、接口、端口表、VLAN、QOS、轉發表、ARP、廣播數據、IP地址等;
- 通過郵件、短信、狀態燈、界面提示等方式對故障、狀態、消息進行分發;
- 深入了解設備內部配置信息、運行信息、性能圖表、故障圖表等;
第三章 工業交換機監控指標
3.1.支持的工業交換機品牌
方 案可對各個品牌、型號的工業交換機統一監管,獲取最新運行狀態。目前,已實現對國內外常見交換機品牌進行監控管理,小眾或較為老舊的品牌型號也可通過靈活可配的模型庫進行擴展適配。
目前已適配的品牌包括并不限于:
|
威斯特摩Westermo |
赫斯曼HIRSCHMANN |
東土 |
MOXA |
|
西門子 |
三旺 |
西斯奈特 |
華為 |
|
華三 |
銳捷 |
思科 |
映瀚通 |
|
施耐德電氣 |
寬域 |
宇泰科技 |
歐邁特 |
|
卓越信通 |
邁威通信 |
研華 |
上海博瀛 |
|
上海博達 |
四通工控 |
宇航光通 |
更多…… |
3.2.常見監控指標
內置端口、帶寬、吞吐量、流量、丟包率、錯誤包、運行狀況等多種資源監測點和監測指標,未覆蓋的資源和指標也可以通過模型庫不斷進行拓展。
|
設備類型 |
資源監測點 |
監測指標 |
|
工業交換機 |
Ping |
狀態、平均響應時間、抖動等 |
|
設備運行時間 |
交換機本次啟動后運行時間 |
|
|
電源 |
電源狀態、輸入電壓、功耗、備用電源狀態等 |
|
|
風扇 |
風扇狀態、風扇編號、轉速等 |
|
|
溫度 |
溫度狀態、當前溫度等 |
|
|
CPU |
CPU大小、CPU空閑、CPU使用率等 |
|
|
內存 |
內存大小、內存使用率、空閑內存 |
|
|
網絡接口 |
網口狀態、廣播包、每秒發送/接收數據包、發送/接收包錯誤率、發送/接收丟包率、發送/接收帶寬使用率、發送/接收流量、誤碼率、時延、抖動等 |
|
|
光口 |
光口狀態、發送/接收光功率、每秒發送/接收數據包、發送/接收包錯誤率、發送/接收丟包率、發送/接收帶寬使用率、發送/接收流量、誤碼率等 |
3.3.工業交換機品牌型號及指標擴展
方案采取用戶自定義擴展交換機品牌、類型及其資源的方式,賦予用戶強大的適配能力,最大可能地實現對不同時期、不同品牌、不同型號工業交換機的管控。支持自定義工業交換機類型、工業交換機資源、故障監視器、性能監視器、TRAP監視器等,提供配置工業交換機模板的功能,允許用戶自定義工業交換機真實面板圖。
第四章 智和信通工業交換機監控運維方案
智和信通工業交換機網管運維方案是基于智和網管平臺,面向二層/三層工業交換機,推出的集設備發現、環網識別、端口管理、鏈路監控、交換機配置、故障監控、網絡安全、性能采集等于一體的綜合監控運維方案。
4.1.一鍵式智能發現
在網絡可達范圍內,用戶只需輸入IP范圍,自動獲取網絡中的交換機及其他設備,識別設備間的連接關系。智能識別交換機的廠商、型號,生成資源邏輯拓撲或交換機面板圖,匹配故障/性能監視器,通過可視拓撲動態展示交換機、鏈路的運行狀態。
4.1.1.自動發現工業交換機
方案提供了按IP范圍、網絡范圍、路由搜索、漫游發現四種方式發現拓撲,支持的設備發現協議有SNMP、Ping等,在發現的過程中可以自動搜索到交換機設備,并識別設備類型和廠商型號,生成設備的面板圖。并能將設備的板卡、端口、風扇、狀態燈、CPU、內存搜索出來進行監控。同時還能發現設備之間的鏈路關系。
4.1.2.自動發現鏈路
軟件支持LLDP、CDP、ICMP、ARP技術、鄰居路由、端口轉發表、生成樹協議等物理拓撲發現技術。自動發現設備的物理鏈接,識別備用鏈路,鏈路堵塞點,自動勾畫出工業環網。智能分析網絡拓撲結構,自動勾畫出整個網絡的真實物理拓撲圖。
通過圖形界面顯示鏈路上實時的流量、帶寬、故障等,并通過不同的顏色直觀的區分出鏈路狀態。支持展示上傳流量、下載流量、狀態、接收/發送數據包量、上傳下載丟包率、包錯誤率、上傳下載帶寬使用率、連通狀態、管理狀態等。
4.1.3.智能識別聚合鏈路
自動發現聚合鏈路并可視化呈現,鏈路中斷即秒級告警。
4.1.4.智能搜索下掛設備
軟件通過多種發現算法,智能分析設備端口轉發表、LLDP表、MAC-IP表、路由轉發表,自動搜索發現交換機的下掛設備。分析下掛設備的IP、MAC、端口等信息。
4.2.可視化呈現網絡架構
5.2.1.自動識別工業環網
方案以圖形化方式系統展現網絡拓撲關系,支持樹形結構和平面結構的聯動展示,也可以按片區、按地域、按層級等多種布局方式劃分網絡,在拓撲中以不同顏色圖標展現工業交換機的實時狀態信息。
同時,基于智和網管平臺特有的工業環網識別技術,能自動搜索展現網絡中的工業環網。并能識別備用鏈路、堵塞點,實現工業交換機網絡的特有功能。
4.2.2.工業交換機資源邏輯拓撲
在拓撲圖的基礎上,進一步展示工業交換機的細節,可以是其物理組件,也可以是用戶定義的其他監控對象。
提供資源邏輯拓撲,以圖形方式展示內存、CPU、端口、光口、電源等資源信息,對交換機進行細化監控,實時告警,對設備進行事前管理,降低故障發生率。
4.2.3.工業交換機真實面板圖
方案支持以設備真實面板圖的方式管理工業交換機,形象逼真的在設備面板圖中實時展現端口、風扇、電源、CPU等資源的最新狀態。此外還支持編輯設備邏輯面板圖顯示設備資源。
4.3.高效并發的秒級監控
工業交換機所應用的領域環境苛刻,對設備性能要求嚴格。智和網管平臺領先的秒級監控能力和多線程任務并發技術,把監測頻率提升到秒級,以保證監測數據的實時性和精確性。監視頻率最低可設為5秒,為高效實時監測關鍵設備指標提供技術保障。
4.3.1.全面采集工業交換機性能
實時采集工業交換機端口流量、帶寬、丟包率,CPU負載、內存使用率、系統響應時間等性能數據。通過曲線圖、趨勢圖等展示性能指標。
可以按天、星期、月 、任意時間段查看性能指標變化。
4.3.2.實時、歷史性能分析
對實時、歷史性能數據進行統計分析,通過曲線圖、柱狀圖或表格等形象化地展示,按天、星期、月查看性能指標變化。
運維人員能隨時把握交換機性能變化態勢,防患于未然。
4.3.3.多設備、多資源性能對比
支持選擇多個工業交換機進行同維度性能數據分析,提供可視化性能對比視圖
4.4.故障告警與智能收斂
4.4.1.故障告警管理
搭載多種告警機制,自定義配置告警閾值,具備主動的故障監控功能,從眾多的事件和狀態中,系統地將零散的狀態信息,總結成為當前狀態,并對異常狀態進行告警,第一時間獲取準確的 告警信息,快速標示已執行操作的告警,迅速定位產生告警的工業交換機,提升告警處理效率,極大降低因工業交換機故障帶來的損失。
通過對告警機制以及閥值的設置,第一時間獲取準確的告警信息,快速定位告警設備,提升告警處理效率,極大的降低了因設備故障給企業帶來的損失。
- 故障采集:具備主動的故障監控功能,能從眾多的事件和狀態中,系統將零散的狀態信息,總結成為當前工作狀態,并產生告警。
- 故障優化:包括事件過濾機制、故障事件上報機制、故障事件呈現過濾、故障事件入庫過濾、故障事件確認等處理機制,有效避免誤報和漏報。
- 故障定位:可實現快速的故障定位,能一步定位到發生故障的源頭設備,及時處理好故障,有效地預防故障發生。支持以拓撲圖的方式回放歷史告警下的設備告警變化、拓撲圖和鏈路告警變化,支持快進、后退等播放操作。
- 故障處理:通過故障閥門值的設置,可以在故障真正到來之前,提前觸發通知機制。并支持三級逐步預警。在故障消失后,系統能自動檢測到先前故障,并做自動清除告警處理。
- 故障通知:故障可以通過界面顏色、告警列表、Email、釘釘、企業微信等方式發出通知,告警可以向上逐步追溯,按照從全局→網絡→設備→資源的管理習慣來組織故障顯示。
4.4.2.告警智能收斂
告警管理采用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告降噪機制,通過AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,有效避免誤報和漏報,直達故障根因。
4.5.日志與事件管理
接收交換機主動發送如接口狀態、接口速率、IP地址沖突、廣播風暴、配置修改、權限變更等事件與日志消息,集中存儲、解析處理后,異常信息及時地通知用戶。通過統一界面集中管理事件與日志,提高其完整性和可追溯性,幫助用戶快速定位問題并采取相應的解決措施。
4.6.自動化運行狀態巡檢
工業現場分散,人工巡檢耗時耗力。智和網管平臺自動化巡檢模塊,可自定義巡檢策略,預設執行時間進行自動化巡檢,巡查交換機實時運行狀態,并向指定郵箱發送結果報告,實現對交換機的定期檢查,把握網絡運行中的易出現問題的環節,做到預防為先。
可自行選擇要統計的網絡、交換機、資源、流量、性能、故障類型、監視器類型、時間范圍、報表排序規則、過濾規則等生成巡檢報表。支持統計圖表導出或打印。
4.7.逐層下鉆的流量透視
提供端到端的流量透視能力,從交換機、接口、IP、服務、應用、會話等層級的實時流量監控和歷史流量分析,識別帶寬消耗較大的應用程序、服務、協議或IP地址,避免網絡容量過載,并提升最終用戶網絡體驗。
幫助用戶進行流量趨勢分析、網絡優化、網絡監控等工作,并為網絡規劃、優化調整和業務發展提供基礎依據。
4.8.工業交換機遠程控制和編排式配置
方案提供交換機遠程控制的能力,采用“監控+運維+控制”的方式,將不同類型、不同型號、不同廠商的交換機統一納入控制,集中管理。
4.8.1.工業交換機遠程配置執行
將周期性、重復性、規律性的大量日常運維工作,如交換機策略配置、故障自愈、自動巡檢等,轉化為依托于平臺的自動化執行。
通過深入交換機協議的控制能力,實現對工業交換機諸如準入控制、訪問控制、賬號安全、QOS策略配置、路由配置、全網流量策略配置、端口限速、端口開啟關閉、一鍵開關機、策略備份對比等功能。通過多設備、多資源批量策略下發和周期性執行,滿足運維人員日常基本運維需求。
4.8.2.工業交換機遠程配置──以(訪問控制為例)
以對華為工業交換機進行配置,使用高級ACL限制不同網段用戶互相訪問為例。
效果要求:為工業網絡中不同部門劃分不同網段的IP地址,并將不同網段劃分在不同VLAN中,限制不同網段之間的相互訪問。
第一步:將工業交換機納入平臺進行統一監管。
第二步,配置工業交換機策略。主要策略包括:配置高級ACL和基于ACL的流分類,使交換機可以對不同部門間互訪的報文進行過濾。配置流行為,拒絕匹配上ACL的報文通過。 配置并應用流策略,使ACL和流行為生效。
第三步,查看交換機策略,并與前期策略進行對比。對比基準可以是某一次的備份或專用的基線文件,對策略異常變化進行告警。
4.8.3.配置備份、對比與恢復
支持配置文件批量備份、下載、周期性備份、查看等,對交換機的多個備份文件進行對比。定期自動對交換機配置進行巡檢備份,并可進行對比分析,為用戶管理網絡做出合理的建議提供數據支撐,支持進行已備份配置間的對比分析和針對性的配置恢復。
4.8.4.配置合規性審計
交換機配置的穩定與合規至關重要,錯誤或未經認證的配置變更都可能導致嚴重的網絡故障,方案通過本次執行結果與上次執行結果或基線文件的對比,當配置出現異常時進行自動告警,并可結合故障自愈能力,自動回滾到信任的版本。
4.9.設備參數查看
智和網管平臺提供的設備信息配置管理功能如下:
|
設備網絡接口信息 |
設備硬件設施信息 |
設備接口流量信息 |
|
設備磁盤內存信息 |
設備CPU信息 |
主MAC和端口信息 |
|
設備基本參數 |
設備IP地址配置管理 |
設備TCP連接信息 |
|
設備UDP連接信息 |
Telnet、Web訪問配置 |
全網MAC-IP信息 |
|
設備SNMP統計信息 |
ARP(MAC-IP)信息表 |
端口轉發表 |
|
查看設備IP層輸入輸出信息 |
路由信息 |
非法設備管理 |
|
設備VLAN管理 |
邊緣接入設備管理 |
LLDP管理信息 |
|
MIB數據瀏覽器 |
|
|
4.10.工業交換機運行數據分析
4.10.1.運維大屏
適配各種應用場景,二十四小時不間斷監控,細粒度可達網絡中每個設備、資源和鏈路。所有的網絡故障都一目了然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網絡提供了可靠的保證。
4.10.2.統計分析報表
方案具有強大的報表管理功能,可自定義運維數據報表能力,實現運維數據的靈活展現和統計分析,通過自助式數據對比、TOPN等分析方式及周期自動生成報表功能,實現運維數據有效利用。
4.11.資產全生命周期監管
采取統一數據標準,對整體網絡資產進行梳理和調用,構建交換機資產數據庫,將工業交換機的信息包括資產編號、資產名稱、品牌型號、來源、購買日期、端口數量、接口類型、負責人等,以及維保到期時間、維保單位等維保信息統一管理。
避免資產信息在運維系統和實物間的差異,減少網絡運維過程中信息不一致、數據不統一等問題通過平臺將資產實物與運維數據庫一一對應,建立健全資產臺賬,實現一機一檔,通過自定義多級資產分類,細化資產類別。
動態感知納入監控的資產運行狀態,并以圖譜的方式呈現資產與其他資產、配品配件、網絡鏈路、使用人等靜態關聯關系。
實現資產分類管控,提高資產精細管理程度。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支持追溯,通過平臺實現資產整個生命周期的全流程閉環管理,使得IT資產每一次生命周期變更,都有流程可依、都有跡可循,從而實現全面的IT資產監管。
4.12.定制化運維工單體系
通過方案實現運維工單“無紙化”,支持于設備和故障管理頁面快速創建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。
第五章 標桿案例五.1.全路通信號安全數據網EMS
中國通號集團全路通公司承建鐵總客運線路信號安全數據網的建設。其中智和網管工業交換機解決方案成功應用于該項目中。主要監控管理赫斯曼和摩莎兩大工業設備廠商的八款交換機設備,該項目也是智和信通公司在工業交換機監控管理領域方案的一次飛躍。
5.2.某化工廠工業交換機智能管理
隨著某化工廠數字化轉型的加速推進,其生產過程對復雜網絡和IT設備的依賴程度日益加深。當前的網絡不僅承載著生產控制系統(如DCS、PLC等)的通信需求,還同時支持辦公自動化、安防監控、工業物聯網(IoT)等多種業務,傳統的運維方式已難以應對當前復雜多變的運維需求。在此背景下,化工廠引入智和信通運維平臺,實現了網絡和IT設備的智能化管理。
5.2.1.化工廠運維目標
- 化工廠網絡內主要采用西斯奈特工業交換機,需對其進行合理監控,確保工業交換機高可用。
- 對網絡流量進行分析,優化網絡配置,避免網絡擁塞,確保關鍵業務的網絡質量。
- 實現網絡可視化,解決故障難定位,響應滯后的問題。
- 改善運維工作依賴人工巡檢和被動處理開展的現狀,實現更高效、精準的問題發現與處置。
- 將IT資產進行統一管理,解決設備資產臺賬混亂難管理的問題。
5.2.2.智和信通解決方案
智和信通與運維團隊經過深入溝通,共同確定了集中部署方案,對化工廠內的網絡設備進行統一管理。通過實時監控網絡設備的關鍵性能指標,并運用大數據分析技術自動識別異常波動,實現故障的預警與定位,有效提升了化工廠網絡運維的效率與可靠性。
(1)智能發現工業交換機和其他IT設備
智和信通提供一鍵式智能發現功能,快速識別網絡中的工業交換機和其他網絡設備。以化工廠所使用的西斯奈特工業交換機為例,在實施工程師根據運維團隊的監控需要搭建完成設備模型和監控指標后,僅需輸入IP范圍即可快速發現網絡內的西斯奈特工業交換機,定位到其型號并自動進行監控。
(2)自動生成網絡拓撲結構
自動發現網絡內IT設備的同時,平臺可識別設備間的連接關系,并生成網絡拓撲圖。以直觀平鋪形式呈現清晰的網絡拓撲,幫助用戶更好地理解和管理網絡架構。當設備、資源或鏈路出現異常告警時,平臺通過不同顏色直觀展示故障等級和異常位置,幫助運維人員實時掌握網絡架構及全網運行狀態,快速定位故障。
(3)實時監控網絡設備運行狀態
7*24小時不間斷監控網絡設備運行狀態,對設備CPU、內存、帶寬利用率、端口狀態等進行實時監測,并通過可視化圖表的形式展示實時數據和歷史態勢,幫助運維團隊快速掌握網絡設備健康狀態。
(4)多級故障告警與響應機制
方案提供智能故障告警管理,通過主動性能輪詢和事件日志接收,實時捕獲網絡設備、鏈路和服務的異常。并結合告警收斂降噪策略,過濾冗余告警,減少無效告警的干擾。
平臺提供多種通知渠道,包括界面顏色變化、提示音、光效閃爍、信息列表展示、Email、短信、釘釘、企業微信以及個人微信等,確保告警信息能夠及時、準確地傳達給相關人員,從而提高運維響應速度和效率。
(5)自動性能與故障巡檢
平臺支持自定義巡檢報告,運維團隊可自行選擇要統計的網絡、設備、資源、流量、性能、故障類型、監視器類型等內容生成巡檢報表。并可預設精確至分鐘的巡檢執行周期,通過自動化巡檢將傳統耗時數天的手工任務縮短至分鐘級,極大地降低了人工巡檢所需的人力投入,提高了巡檢效率,同時減少了人為因素可能導致的錯誤,使巡檢結果更加準確可靠。
(6)資產與監控結合管理
從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支持追溯,通過平臺實現資產整個生命周期的全流程閉環管理,使得IT資產每一次生命周期變更,都有流程可依、都有跡可循。同時,資產實物與運維數據庫一一對應,建立健全“一機一檔”的精細化臺賬,有效解決傳統運維中信息不一致、數據孤島等問題,提升資產管理的準確性和效率。
5.2.3.方案應用效果
智和信通運維方案的應用實現了化工廠關鍵IT設備(如服務器、交換機、路由器等)的運行狀態監測,一旦發現設備性能異常或即將出現故障,平臺會立即發出告警信息,提醒運維人員及時采取措施進行處理,從而有效避免因設備故障導致的生產中斷,確保生產流程的連續性。
在此基礎上,智和信通的運維方案還融入了智能化預測分析功能,通過深度挖掘歷史運維數據,并結合先進的機器學習算法,能夠精準預測關鍵IT設備的未來運行狀態趨勢。使運維團隊能夠提前洞察潛在故障風險,在故障發生前制定并執行預防性維護計劃。不僅大幅降低了突發故障的概率,更進一步提升了化工廠的運營穩定性和安全性。
智和信通的運維方案不僅為化工廠打造了穩固的IT運維保障體系,更憑借其智能化與自動化的優勢,為化工廠的數字化轉型和智能化升級注入了強大動力。
5.3.某煤礦井上井下網絡一體化管理項目
隨著某煤礦智能化建設的不斷推進,全礦網絡內部署了大量網絡設備、智能傳感器、攝像頭及環境監測器等關鍵設施。在此背景下,如何確保全網設備的敏捷響應與穩定運行,保障井上井下高速數據傳輸的暢通,以及實現全礦高效運維和安全生產,已成為該煤礦運維團隊關注的核心。
- 設備類型:環網設備、交換機、視頻交換機、路由器、AC、AP、PLC、硬盤錄像機、攝像頭、堡壘機、日志審計系統、上網行為管理等。
- 設備品牌:邁威、赫斯曼、東土、華為、華三、信銳、閩蘭之星、Windows操作系統、深信服、威努特等
- 網絡場景:井上井下網絡
5.3.1.項目期望
某煤礦期望通過構建智能化運維平臺,實現對IT資源的全面監控和管理,可以更加精準地預測和預防潛在問題的發生。
- 對環網、視頻網、辦公網等井上井下網絡統一管理;
- 可自動發現全礦網絡內的環網設備、交換機、視頻交換機、路由器、PLC、硬盤錄像機、攝像頭、堡壘機、日志審計系統、上網行為管理等設備和應用系統,解決基礎設施硬件和應用系統層監控脫節的問題;
- 支持多級告警,提供不同級別的告警閾值配置功能,能夠在網絡拓撲圖中清晰地標識出故障節點的位置,有效解決故障定位困難的問題;
- 提供性能檢測分析,可對設備運行狀態、資源占用情況、異常走勢等進行實時監控和統計分析,幫助運維團隊及時發現并解決潛在的性能問題;
- 具備自動化運維工具和手段,定期對井下巷道、設備進行檢查,尤其針對井下設備實現無人值守的遠程管理;
5.3.2.智和信通方案
北京智和信通智和網管平臺通過跨平臺、跨網絡的監控運維能力,對某煤礦中的環網、視頻網、辦公網等井上井下網絡統一管理,運維人員可以實時掌握各設備的運行狀況與性能指標,迅速定位故障并采取相應措施予以解決。
(1)設備和應用統一監控
通過構建具有可擴展性的設備監控模型,針對煤礦環網內的所有設備——包括但不限于環網設備、交換機、視頻交換機、路由器、AC、AP、PLC、硬盤錄像機、攝像頭、堡壘機、日志審計系統、上網行為管理等,配置專屬的監控模型。這些模型將涵蓋設備的品牌、型號、內部資源及監控指標等關鍵信息,并依據煤礦的具體監管需求實施差異化管理策略。
(2)設備自動發現
通過先進的智能自動發現技術,自動發現并記錄全礦網絡中的各類設備,識別設備類型和廠商型號,生成設備的面板圖或搜索設備資源,如:CPU、內存、端口等,發現設備之間的連接關系,并自動匹配故障和性能監視器。在短時間內構建起全礦網絡設備的詳盡檔案,實現對設備狀態的實時監測。
(3)環網自動識別
通過特有的工業環網識別技術,能夠自動搜索并展示網絡中的工業環網結構。同時,還能智能地識別和顯示環網中存在的阻塞端口及冗余鏈路。無論是新設備的快速接入,還是網絡架構的動態調整,均可通過自動識別實現迅速響應與調整,從而顯著減少了人工干預的需求,大幅提升了網絡的整體穩定性和安全性。
(4)全礦網絡拓撲自動生成
平臺提供自動生成拓撲圖及手動布局的功能,根據某煤礦的整體網絡架構,采用平面展開方式清晰展現網絡拓撲結構。當遇到設備故障、資源異常或鏈路問題時,通過不同顏色的標識來區分各類故障的嚴重程度,從而協助運維團隊即時掌握整個網絡的結構狀況以及全網運行狀態,并迅速準確地定位到具體的問題點。
(5)設備性能實時監控
方案采用主動輪詢與日志解析技術,對全礦設備實施實時監控。監控指標涵蓋但不限于CPU使用率、內存使用率、磁盤使用率、網絡接口流量及帶寬、視頻畫面質量等。此外,除內置的常見指標外,其他資源和指標亦可通過模型庫不斷進行擴充。
多維度處理、分析及展示全礦設備的實時性能、歷史態勢和性能對比分析。通過曲線圖、柱狀圖或表格等形象化的方式展示,按天、周、月查看性能指標的變化情況。運維團隊能夠隨時掌握設備性能的變化趨勢,從而預防潛在問題的發生。
(6)智能故障管理和告警機制
通過完備的故障管理和告警機制,靈活的告警管理策略,對全礦內的各種設備進行故障監測。利用主動輪詢技術持續檢測各設備的運行狀態,將眾多事件和狀態中的零散信息主動匯總,形成當前的整體狀況,并進行整合分析,出現異常情況及時告警。
在告警通知途徑上,提供多種渠道,包括界面顏色變化、提示音、燈光閃爍、信息列表展示、電子郵件、短信、釘釘、企業微信以及個人微信等,確保運維團隊可以第一時間獲取告警信息。
(7)遠程控制與編排化運維
通過設備遠程控制與自動化運維編排功能,實現對礦山網絡設備的遠程配置、升級及維護,從而有效降低現場維護的成本和時間。當設備發生告警時,常規告警能夠通過故障自愈流程得到自動處理,解決了被動式、事后響應的故障風險監測問題。此外,大多數基于經驗判斷的風險和解決問題的方法可以被固化到平臺上,以促進運維知識的積累與傳承。
(8)可視化統計分析報表
平臺提供了豐富的可視化統計分析界面,用于對整個礦山網絡中各類設備和應用的運行故障及性能進行深入分析與展示。此外,還具備自動化巡檢功能,用戶可根據需要自定義配置巡檢策略,依據實際需求選擇關注的網絡區域、設備類型、資源或鏈路等范圍,并設定特定時間自動執行巡檢任務。該功能能夠定期檢查設備的實際運行狀況,并將檢測結果以報告形式發送至預設的電子郵件地址。
5.3.3.應用價值
北京智和信通礦山網絡監控運維方案可實時監測網絡運行狀態,自動預警異常情況,提高運維效率。通過這一方案的部署與實施,某煤礦企業在網絡運維管理方面實現了質的飛躍。
井下網絡環境錯綜復雜,各類設備分布廣泛且數量龐大。一旦發生故障,通常需要技術人員逐一進行人工排查。這種方式不僅耗時費力,而且效率低下,難以迅速定位問題所在。然而,自從引入了北京智和信通提供的礦山網絡監控運維解決方案之后,這一局面得到了根本性的轉變。
方案能夠對礦區內所有關鍵IT基礎設施的狀態進行全天候24小時不間斷監控。一旦檢測到可能影響正常生產與辦公活動的潛在風險或已發生的故障,將立即向相關人員發送通知,并提供詳盡的故障信息及建議的處理措施。此舉不僅顯著縮短了響應時間,減少了因停機導致的經濟損失;同時也有效降低了維護成本,提升了整體運營效率和水平。
與此同時,借助遠程控制和編排功能,運維團隊能夠無需親臨現場即可完成大部分日常管理及緊急修復任務。對于地處偏遠地區或環境惡劣條件下的礦井而言尤為重要,因為它極大地簡化了工作流程,保證了即使在極端條件下也能保持高效穩定的網絡通信連接。
北京智和信通的礦山網絡監控運維方案,憑借其卓越的性能與顯著的效果,獲得了某煤礦的高度贊揚。方案不僅為煤礦安全生產提供了堅實的保障,同時也為礦山企業的數字化轉型注入了強大動力。展望未來,隨著某煤礦業務范圍的不斷擴展,網絡架構及其復雜性預計將持續增長。在此背景下,智和信通將持續對其監控運維方案進行優化升級,為企業帶來更加高效、智能化的網絡運維體驗。






















浙公網安備 33010602011771號