國家電網某地電力公司網絡硬件綜合監控運維項目
國家電網某地電力公司是國家電網有限公司的子公司,負責當地電網規劃、建設、運營和供電服務,下屬多家地市供電企業和檢修公司、信息通信公司等業務支撐實施機構。
項目現狀
隨著公司信息化建設加速,其信息內網中存在大量物理服務器、存儲設備、光纖交換機等設備,缺少監控設備細顆粒度部件狀態的運維工具,無法滿足實際運維需求。
設備類型:存儲設備、服務器、光纖交換機、交換機等
設備品牌:華為、H3C、浪潮、惠普、IBM、中興、聯想、DELL、曙光、南瑞、神州鯤泰、超聚變、沃趣、長城超云、Brocade、MELLANOX、貝爾、銳捷等
設備數量:2000+臺
項目期望:
- 將網絡內近200種不同品牌、不同型號、不同類型的設備統一、集中監控;
- 提供詳細的、粒度細設備監控指標庫,支持監控的指標包括但不限于:CPU、內存、磁盤、網口、溫度等;
- 能夠實時監控設備的運行數據,快速判斷出硬件部件故障位置與級別,提供高效的故障排查和處理手段;
- 解決設備產生的事件和日志信息格式多樣、復雜不一致的問題,可以對其進行集中管理,并轉化為清晰易于理解的告警信息;
- 具有多種可供選擇的告警通知方式,包括但不限于郵件、短信、微信等;
- 解決目前主要依賴人工巡檢,造成的巡檢頻度低,人力耗費大的問題;
- 解決不同類型設備配置復雜和設備配置工作量大的問題,能夠對設備的配置文件進行管理;
- 能夠與SG-I6000設備狀態評價模塊進行對接。
智和信通方案
經過與用戶一線運維工程師的深入交流,智和信通充分明確了其對監控運維平臺的核心需求,并通過對其日常運維工作的分析提供出針對性的解決方案。
海量異構設備統一納管
內置大量不同類型、不同品牌型號設備監控模型,通過多維度監控設備,獲取網絡最新運行狀態。監控指標涵蓋在線狀態、Ping、CPU、內存、網絡接口、磁盤、進程、電源、風扇、溫度等各方面。且不同類型和應用場景下的設備具備差異監控資源和監視指標,在設備統一納管的情況下,實現差異化故障告警。
提供設備、資源、設備間連接關系自動化發現繪制能力,以圖形方式實現設備、資源、鏈路狀態的直觀展示,為設備部件故障的實時發現和有效處理提供便利。
靈活可配的設備、資源、監視任務模型庫
支持自定義配置設備類型、設備資源模型和故障監視器、性能監視器監視任務等模型,實現對電力公司內部覆蓋存儲設備、服務器、光纖交換機、交換機等設備類型,華為、H3C、浪潮、惠普、IBM、中興、聯想、DELL、曙光、南瑞、神州鯤泰、超聚變、沃趣、長城超云、Brocade、MELLANOX、貝爾、銳捷等設備品牌的近200個品牌型號的監控支持。
全面監控設備性能,感知網絡運行態勢
全面采集網絡內存儲、服務器、光纖交換機、交換機等設備的性能信息,按照時間、資源、性能類型等多種維度,圖形、表格等多種形式進行實時性能和歷史性能的展示。并通過智能算法分析歷史數據,對磁盤容量、交換機端口容量、機房機柜容量進行展示和預測分析,并根據容量可使用時間進行自定義預警。
多種告警機制,可自定義告警閾值
支持多種告警機制,自定義配置告警閾值,從眾多的事件、日志和狀態信息中分析提煉異常數據并轉化為告警。第一時間獲取準確的告警信息,快速標示已執行操作的告警,迅速定位告警設備。
智能告警降噪,快速定位故障根因
采用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,對各類告警進行自動壓縮收斂,減少無效告警,一步定位發生故障的源頭設備。快速檢索異常問題關聯涉及的各項維度與影響范圍,快速定位問題邊界,直達故障根因。
多種告警通知途徑結合故障自愈能力,實現快速排障
通過故障閾值的設置,在故障真正到來前,提前觸發通知機制,三級逐步預警。告警發生中,自動關聯調取內置的故障處置預案,配合告警自愈及自動派單能力,快速實現排障處置;在故障消失后,系統能自動檢測到先前故障,并做自動清除告警處理。
提供界面顏色、提示聲、光效閃爍、信息列表、Email、短信、釘釘、企業微信、個人微信等多種通知渠道。
匹配真實運維場景的自動化巡檢
可自定義巡檢策略對設備的運行情況進行統計和報表生成,并可預設時間巡檢策略執行時間,進行自動化巡檢,可向指定郵箱發送巡檢結果報告。通過平臺內人工觸發或定時觸發的方式,將巡檢工作托管至平臺自動執行,解放人力,實現對設備的定期快速檢查。
設備配置文件備份、對比、恢復
定期自動對設備策略進行巡檢備份,可在線查看、下載保留或通過本次執行結果與上次執行結果或基線文件的對比,當配置出現異常時進行自動告警,并可結合故障自愈能力,自動回滾到信任的版本。
全網IT資產統一管理
提供網絡內IT設備一鍵同步資產數據庫的功能,快速同步拓撲內的監控設備,并對其進行資產生命周期管理。以圖譜的方式呈現資產與其他資產、配品配件、網絡鏈路、使用人等靜態關聯關系。
對接I6000系統,實時推送告警與設備狀態數據
方案實現與I6000系統的對接,將設備的異常告警信息集中存儲,統一分析處理,轉化為I6000可識別的、符合國網要求的標準格式。通過設備信息同步功能,將設備資產、監控信息快速同步至I6000,豐富I6000內關于設備的性能、告警、基本信息等內容。
應用價值
通過部署智和信通綜合監控運維方案,7*24小時實時監控全網設備,獲取IT設備的狀態信息,真正滿足用戶硬件資源精細化監控需求。
通過精細化監控設備的各項硬件指標,實時了解設備的運行狀態和負載情況,及時發現硬件組件可能出現的性能瓶頸和故障,不但為設備配置調整和優化提供數據支撐,而且提前預警設備可能出現的故障,以便運維人員有充足的時間準備排障操作。同時,在故障出現后快速診斷故障產生的根本原因,提升排障效率,減少因設備故障帶來的業務中斷和損失。
在整體運維工作中通過智和信通綜合監控運維方案自動采集、存儲、分析設備狀態數據,通過設備遠程控制和自動化編排運維的能力,對設備進行遠程調控和維護,快速提高工作效率的同時,降低IT運維成本,保障電力信息系統穩定、高效運行。
綜合監控運維方案自動采集、存儲、分析設備狀態數據,通過設備遠程控制和自動化編排運維的能力,對設備進行遠程調控和維護,快速提高工作效率的同時,降低IT運維成本,保障電力信息系統穩定、高效運行。



浙公網安備 33010602011771號