某塑料科技公司網絡與機房監控運維項目
某塑料科技公司是由日本知名株式會社在中國投資的,以從事橡膠和塑料制品業為主的生產制造企業。隨著企業信息化建設提速,信息化運用程度不斷提高,對網絡基礎設施的管理也提出了更高要求,因此公司急需上線一款綜合運維平臺加強對整體網絡的管理和維護。
項目現狀
隨著公司向智能制造轉型,網絡架構日趨復雜,支撐公司網絡通信和業務開展的軟硬件IT設施種類繁多,給運維工作造成極大壓力。
設備類型:交換機、路由器、POE交換機、服務器、AC、AP、數據庫、防火墻、虛擬機、語音網關、硬盤錄像機、行為管理、光端機、打印機、動環監控等
設備品牌:H3C、華為、ARUBA阿魯巴、HP、Lenovo、??低暋w塔、深信服、Cisco、國威、Windows Server、MySQL、PostgreSQL、SQL Server、Oracle、富士等
項目期望:
- 對網絡中的所有網絡設備、虛擬機、數據庫等進行統一管理,并提供清晰的網絡拓撲圖;
- 對設備進行實時監控,在出現故障時可以及時預警;
- 解決告警數量多,誤報、錯報情況嚴重,無法獲取真實故障信息的問題;
- 解決設備產生的trap日志存儲展示分散,難以查看的問題;
- 解決目前巡檢主要依靠人工進行的問題,提高巡檢效率和準確率;
- 具有美觀、清晰的界面和大屏,大屏支持上墻;
- 能夠和動環系統進行對接。
智和信通方案
通過多次溝通了解到其網絡內的設備種類、品牌型號均比較復雜,用戶對設備監控運維的期待也較高,因此智和信通采用遠程+現場支持的方式進行安裝部署與支持,最終達成用戶期待的效果。
自動發現異構設備并生成網絡拓撲圖
智和信通充分利用產品自身強大的模型庫配置能力,在現有的監控模型基礎進行豐富,快速實現了對用戶全部品牌、型號設備的納管。在項目部署過程中,僅需輸入IP地址,即實現了設備發現與類型、品牌型號的識別,并自動搜索出相應的設備資源與設備間的鏈接關系,自動生成網絡拓撲。
更細節的設備監控指標支持
智和信通對現有指標進行快速調整并根據用戶需要新增了大量用戶關注的核心指標,以滿足用戶對監控閾值、監控周期的需求。部分監控指標如下:
|
設備類型 |
監控指標 |
|
交換機/路由器 |
在線狀態、響應時間、運行時間、CPU使用率、內存使用率、接口接收/發送流量、接口接收/發送帶寬、接口接收/發送丟包率等 |
|
POE交換機 |
在線狀態、電源狀態、響應時間、運行時間、CPU使用率、內存使用率、端口狀態、端口流量、光口、電口、語音口、包轉發率等 |
|
服務器 |
在線狀態、響應時間、CPU使用率、內存使用率、磁盤使用率、磁盤容量預測、進程、接口接收/發送流量等 |
|
AC |
在線狀態、響應時間、CPU使用率、內存使用率、接口接收/發送流量、射頻傳輸重傳幀比率、當前連接用戶數、當前斷開連接用戶數等 |
|
AP |
在線狀態、接口接收/發送流量、關聯的站點總數、關聯失敗的站點總數、用戶在線時間等 |
|
數據庫 |
在線狀態、連接數、并發連接數、最大連接數、表空間、死鎖等 |
|
防火墻 |
在線狀態、CPU使用率、內存使用率、接口接收/發送流量、接口接收/發送速率、HTTP請求數、錯誤率等 |
|
虛擬機 |
在線狀態、CPU使用率、內存使用率、磁盤讀寫IO、磁盤讀寫速率、網絡接收/發送速率等 |
|
硬盤錄像機 |
在線狀態、CPU使用率、內存使用率、磁盤使用率、磁盤容量預測、 |
|
行為管理 |
在線狀態、CPU使用率、內存使用率、活躍用戶數、上線用戶數等 |
差異呈現設備核心性能指標,感知設備運行態勢
為不同類型和應用場景下的設備創建差異化性能指標,全面采集、存儲、分析性能信息,并按照時間、資源、性能類型等多種維度,圖形、表格等多種形式展示實時性能和歷史性能。通過智能算法分析歷史數據,對磁盤容量、交換機端口容量、機房機柜容量進行展示和預測分析,并根據容量可使用時間進行自定義預警。
事件、日志集中治理,異常告警
全面收集設備發送的Trap、Syslog、Filter Alarm等事件、日志數據,解析、提取有效信息,將其存儲、展示為可統計分析的結構化數據,通過配置告警規則和場景,將異常事件、日志自動轉化為告警,定位其影響范圍。
自定義配置告警閾值,并從眾多的事件、日志和狀態信息中分析提煉異常數據并轉化為告警。在告警信息產生后,采用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,對各類告警進行自動壓縮收斂,減少無效告警,一步定位發生故障的源頭設備??焖贆z索異常問題關聯涉及的各項維度與影響范圍,快速定位問題邊界,直達故障根因。
提供界面顏色、提示聲、光效閃爍、信息列表、Email、短信、釘釘、企業微信、個人微信等多種通知渠道。
自動化巡檢、全面解放人力
根據用戶日常運維工作流程自定義巡檢策略,對設備的運行情況進行統計和報表生成。通過平臺內人工觸發或定時觸發的方式,將巡檢工作托管至平臺自動執行,減少人工干預,實現對設備的定期快速檢查。
大屏上墻運維信息更集中
在實施的過程中,僅通過智能電視上的安卓瀏覽器訪問平臺,即實現運維大屏上墻,直觀清晰地傳達運維數據分析結果,幫助用戶由宏觀到微觀更快地了解網絡運維現狀,做出更具時效性的決策。
用戶現場已在使用某廠商的動環監控系統,智和信通采取快速對接的方式打通和此系統間的數據流轉。在智和信通平臺內接收溫度、濕度、漏水、煙感、配電、UPS、空調等設備的實時狀態信息,并對異常數據進行清洗、告警。
應用價值
在項目的實施過程中,我們清晰地感知到納入方案中監管的IT軟硬件設施支撐著用戶上層眾多的,如品控、防錯料、文件管理、合同管理、薪資、預算、人事等業務系統,網絡的狀態強烈影響著用戶業務系統的可用性和性能,最終也將影響整體企業的辦公體驗。
通過部署智和信通綜合監控運維方案實時監控用戶網絡與機房內大量異構的交換機、路由器、服務器、AC/AP、數據庫、防火墻、虛擬機、語音網關、硬盤錄像機、行為管理等設備,及時發現并預警潛在問題,從而避免或減少故障帶來的負面影響。同時,通過快速對接現有動環系統的方式,實現機房動力、環境系統的補充監控,保障機房運行的物理安全和環境穩定。
通過部署智和信通綜合監控運維方案實時監控用戶網絡與機房內大量異構的交換機、路由器、服務器、AC/AP、數據庫、防火墻、虛擬機、語音網關、硬盤錄像機、行為管理等設備,及時發現并預警潛在問題,從而避免或減少故障帶來的負面影響。


浙公網安備 33010602011771號