全面監控PTN設備,動態感知運行態勢
隨著通信技術的快速發展,PTN已已經成為絡架構中的重要組成部分。在大規模PTN網絡建設后,面對激增的PTN網絡規模和多樣化的承載業務,運維人員的維護工作量和難度大幅增長,如何進行高效監管和維護,正在成為用戶的重要關注點。
北京智和信通PTN設備管控方案通過對PTN設備自動檢測、自動報警、自動修復等功能,實現告警抑制定位、各類故障情況下業務快速恢復、業務配置及調整等多需求場景的響應。并將智能數據分析和可視化呈現結合,動態感知PTN設備的運行態勢,通過對PTN設備的有效監控和管理,提升運維效率,保障網絡穩定。
第1章 PTN設備監控指標
方案無品牌型號限制,可對各個品牌、型號PTN設備的統一監管,獲取最新運行狀態。目前,已實現對國內外常見PTN設備品牌,如:華為、中興、烽火、瑞斯康達等,小眾或較為老舊的品牌型號也可通過靈活可配的模型庫進行擴展適配。
1.1.常見監控指標
內置電源、風扇、端口、板卡等多種資源監測點和監測指標,未覆蓋的資源和指標也可以通過模型庫不斷進行拓展。
|
設備類型 |
資源監測點 |
監測指標 |
|
PTN設備 |
Ping |
狀態、平均響應時間、抖動等 |
|
設備運行時間 |
本次啟動后運行時間等 |
|
|
系統 |
系統時鐘等 |
|
|
電源 |
電源狀態、單板供電電壓、核心電壓等 |
|
|
風扇 |
風扇狀態、風扇編號、轉速等 |
|
|
溫度 |
溫度狀態、當前溫度等 |
|
|
CPU |
CPU大小、CPU使用率、CPU空閑、CPU計算資源利用率、CPU協議通道利用率等 |
|
|
內存 |
內存大小、內存使用率、空閑內存等 |
|
|
網絡接口 |
狀態(up、down)、索引號、名稱、描述、IP地址、子網掩碼、廣播包、數據包、包錯誤率、丟包率、過載丟包率、接收/發送最大帶寬、接收/發送帶寬使用率、接收/發送流量、接收/發送速率、時延、抖動、接收/發送字節數、誤碼率等 |
|
|
光口 |
狀態(up、down)、平均接收/發送光功率、最小過載光功率、傳輸距離、最小消光比、最大帶寬、帶寬使用率、流量、速率、時延、丟包率、過載丟包率、背靠背等 |
|
|
電口 |
狀態(up、down)、速率、輸入口衰減、輸入口頻偏等 |
|
|
時鐘性能 |
處理PTP節點(邊界時鐘)數、處理E2E節點數、處理P2P節點數、經過邊界時鐘背靠背的相位精度、經過邊界時鐘單節點輸出頻率精度、輸出相位精度、輸出頻率精度、輸出抖動等 |
|
|
板卡 |
板卡溫度、單板CPU溫度、單板核心器件溫度等 |
1.2.品牌型號及指標擴展
方案采取用戶自定義擴展PTN設備品牌、類型及其資源的方式,賦予用戶強大的適配能力,最大可能地實現對不同時期、不同品牌、不同型號PTN設備的管控。
支持自定義PTN設備類型、PTN設備資源、故障監視器、性能監視器、TRAP監視器等,提供配置PTN設備模板的功能,允許用戶自定義PTN設備真實面板圖。
第2章 PTN設備實時監控
方案通過智能算法自動發現核心、匯聚、接入層PTN設備以及PTN設備間、PTN設備和其他設備間的鏈路關系,自動生成網絡拓撲,實時監控各項運行指標,感知網絡態勢。
2.1.一鍵式自動發現
在網絡可達范圍內,自動獲取網絡中的PTN設備及其他設備的各項信息,識別設備間的連接關系。智能識別PTN設備的廠商、型號、網絡接口、板卡、CPU、內存等資源信息,生成資源邏輯拓撲或PTN設備面板圖,匹配故障/性能監視器,通過可視拓撲動態展示PTN設備、鏈路的運行狀態。
2.2.自動生成網絡拓撲
方案以圖形化方式直觀的組織和呈現被管網絡內的設備、鏈路和資源,支持樹形結構和平面結構的聯動展示,也可以按片區、按地域、按層級等多種布局方式劃分網絡,支持設備、管道、業務多級拓撲展示。
在拓撲中以不同顏色圖標展現PTN設備的設備故障、鏈路流量、鏈路故障、網絡接口故障、接口狀態等實時狀態信息。
2.3.邏輯展示內部資源
在拓撲圖的基礎上,進一步展示PTN設備的細節,可以是其物理組件,也可以是用戶定義的其他監控對象。提供資源邏輯拓撲,以圖形方式展示內存、CPU、網口、光口、電源等資源信息,對PTN設備進行細化監控,實時告警,對設備進行事前管理,降低故障發生率。
2.4.設備真實面板圖
提供PTN設備真實面板圖,展現網口、板卡、光口、燈、電源、風扇等PTN設備面板信息,并能直接在操作界面方便的配置和操作機架圖、面板圖。
2.5.可視化鏈路管理
智能識別鏈路關系,支持自動發現或手動編輯PTN設備之間、PTN設備和其他設備之間的鏈路、運行狀態、流量性能數據。通過直觀的拓撲圖幫助運維人員了解設備間鏈路環回、業務管道環回、業務管道路徑通告等的實時狀態、配置情況及設備運行情況。
支持展示上傳流量、下載流量、狀態、接收/發送數據包量、上傳下載丟包率、包錯誤率、上傳下載帶寬使用率、連通狀態、管理狀態信息等。
2.6.多維度性能態勢感知
全面采集業務流流量、業務量數量、端口占用、帶寬占用、邏輯管道占用等性能信息,支持按照時間、資源、性能類型等多種維度,圖形、表格等多種形式展示PTN設備可用性、鏈路可用性、DCN通道可用性等關鍵性能信息。
對實時、歷史性能數據進行統計分析,通過曲線圖、柱狀圖或表格等形象化地展示,按天、星期、月查看性能指標變化。也可選擇多個PTN設備進行同維度性能數據分析,提供可視化性能對比視圖。運維人員能隨時把握PTN設備性能變化態勢,防患于未然。
2.7.自動化運行狀態巡檢
可自定義巡檢策略,預設執行時間進行自動化巡檢,巡查PTN設備實時運行狀態,并向指定郵箱發送結果報告,實現對PTN設備的定期檢查,把握網絡運行中的易出現問題的環節,做到預防為先。可自行選擇要統計的網絡、PTN設備、資源、流量、性能、故障類型、監視器類型、時間范圍、報表排序規則、過濾規則等生成巡檢報表。
第3章 告警與日志管理
充分利用積累的有效定障、排障經驗,打通基礎設施監控、IP合規性監測、流量透視、自動運維、運維工單等關聯數據,實現從告警檢測到排障恢復的全生命周期閉環管理。
3.1.日志與事件管理
接收PTN設備主動發送如配置失配、系統時鐘丟失、PTP同步丟失、機盤通信終端、機盤故障、直流電壓過高/過低、盤溫過高、鎖定源頻率超過鎖定范圍、倒收、倒換失敗、連接確認信號丟失等事件與日志消息,集中存儲、解析處理后,異常信息及時地通知用戶。通過統一界面集中管理事件與日志,提高其完整性和可追溯性,幫助用戶快速定位問題并采取相應的解決措施。
3.2.故障告警管理
搭載多種告警機制,自定義配置告警閾值,具備主動的故障監控功能,從眾多的事件和狀態中,系統地將零散的狀態信息,總結成為當前狀態,并對異常狀態進行告警,第一時間獲取準確的告警信息,快速標示已執行操作的告警,迅速定位產生告警的PTN設備,提升告警處理效率,極大降低因PTN設備故障帶來的損失。
3.3.智能告警降噪
告警管理采用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告降噪機制,通過AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,有效避免誤報和漏報,直達故障根因。
3.4.多途徑告警通知
提供界面顏色、提示聲、光效閃爍、信息列表、Email、短信、釘釘、企業微信、個人微信等多種通知渠道,告警通知無延遲,告警渠道全覆蓋。告警可以向上逐步追溯,按照從全局→網絡→設備→資源的管理習慣來組織故障顯示。
3.5.運維知識庫
將各類運維操作、故障判斷等經驗,轉化為存在于平臺內的知識,形成團隊知識庫。涵蓋知識的存儲、檢索、更新、維護、審核,將運維工作中所需的運維文檔、操作指南、排障實踐、處置流程和配置信息等進行分類管理,所有成員均可進行知識分享,從而加速問題解決過程,促進團隊間的知識共享和協作,提升整體運維效率。
第4章 逐層下鉆的流量透視
從PTN設備的設備層級、接口層級到IP、服務、應用、會話等的實時流量監控和歷史流量分析幫助用戶進行流量趨勢分析、網絡優化、網絡監控等工作,并為網絡規劃、優化調整和業務發展提供基礎依據。
4.1.流量、帶寬監控
提供端到端的流量、帶寬使用監控能力,識別帶寬消耗較大的應用程序、服務、協議或IP地址,監控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網絡帶寬濫用,分析高帶寬使用情況,避免網絡容量過載,并提升最終用戶網絡體驗。
4.2.流量趨勢分析
從設備、接口、IP、服務、應用、會話等層級出發,提供歷史流量趨勢圖譜,通過應用、端口、協議等對流量進行監控和多維度分析,支持按源和目的地進行流量,流量監控粒度可達大小、速率、帶寬使用率、包等。
4.3.回溯分析
大容量、長時間存儲流量數據,長期實時保存原始數據包。通過高效的數據檢索,實現流量數據的快速回溯。對已發生的流量行為進行回溯分析,迅速定位異常流量,對其進行挖掘、分析、取證,實現多維根因追溯,為迅速定位問題發生原因提供更全面的分析依據,同時為網絡安全提供強有力的數據分析保障。
第5章 遠程控制和編排式配置
方案提供PTN設備遠程控制的能力,將周期性、重復性、規律性的大量日常運維工作,如PTN設備策略配置、故障自愈、自動巡檢等,轉化為依托于平臺的自動化執行。將不同品牌、不同型號的PTN設備統一納入控制,集中管理。
5.1.遠程配置執行
通過深入PTN設備協議的控制能力,實現對PTN設備端口、VLAN、三層IP、Tunnel、PW、VPN、ACL、QOS、路由、STP、保護、OAM等業務配置,也可實現管道整形、管道擁塞策略、管道隔離和調度、通信鏈路選路策略的調整。
常用遠程配置能力:
- 用戶可通過平臺下發預設的默認配置給新入網的PTN設備,實現新入網設備的一鍵配置同步。
- 基于路由策略,進行指定管道或跨段的信道、調整管道或跨段優先級、調整管道或跨段帶寬等業務流管道全局、管道或管道某跨段策略調整。
- 指定業務流的帶寬、服務保障等級、業務接口、業務特征碼等QOS參數調整。
- 一鍵調整設備間的信道選路策略配置,指定信道優先級。
- 快速進行管道帶寬、擁塞避免策略、調度策略等負載調配。
5.2.策略編排──以(配置QoS策略為例)
以對PTN設備進行遠程配置,調整QoS策略為例。
效果要求:為不同業務配置不同QoS策略,保障核心業務通信質量。
第一步:將PTN設備納入平臺進行統一監管。
第二步,配置PTN設備策略。主要策略包括:配置信道容量、配置peak burst、配置隊列限制等。配置并應用流策略,使QoS策略生效。
第三步,查看PTN設備策略,并與前期策略進行對比。對比基準可以是某一次的備份或專用的基線文件,對策略異常變化進行告警。
5.3.配置備份、對比與恢復
支持配置文件批量備份、下載、周期性備份、查看等,對PTN設備的多個備份文件進行對比。定期自動對PTN設備配置進行巡檢備份,并可進行對比分析,為用戶管理網絡做出合理的建議提供數據支撐,支持進行已備份配置間的對比分析和針對性的配置恢復。
5.4.配置合規性審計
PTN設備配置的穩定與合規至關重要,錯誤或未經認證的配置變更都可能導致嚴重的網絡故障,方案通過本次執行結果與上次執行結果或基線文件的對比,當配置出現異常時進行自動告警,并可結合故障自愈能力,自動回滾到信任的版本。
第6章 資產CMDB管理
通過構建PTN設備資產數據庫,將PTN設備的信息包括資產編號、資產名稱、品牌型號、來源、購買日期、端口數量、接口類型、負責人等,以及維保到期時間、維保單位等維保信息統一管理。
動態感知納入監控的資產運行狀態,并以圖譜的方式呈現資產與其他資產、配品配件、網絡鏈路、使用人等靜態關聯關系。每個資產對應唯一的二維碼標簽,用戶可通過手機端直接掃碼查看資產信息。
第7章 方案應用價值
北京智和信通PTN設備管控方案在實現對PTN設備跨品牌、跨型號統一管理的基礎上,同時可納管多種網絡設備、服務器、多媒體設備、衛星通訊設備、無線設備、微波設備、安全設備等,真正實現一個平臺管理全網。此外,針對多廠商設備間兼容性問題,平臺內置了設備模型庫和無需開發即可使用的模型庫擴展功能,確保無論設備來自何種品牌、型號,都能無縫接入管理平臺,實現統一監控與配置。
通過簡單便捷的操作界面,將用戶關注的核心信息直觀的呈現給用戶,極大的降低了平臺的上手難度,大幅減少維護工作量。
在此基礎上,北京智和信通PTN設備管控方案更進一步引入了智能化運維分析功能。實時收集并分析各類設備的運行狀態數據,利用大數據和AI算法,預測潛在故障點,提前預警,實現從被動應對到主動預防的轉變。同時,該方案支持自定義告警規則,滿足不同用戶對于告警信息敏感度的個性化需求,確保關鍵業務系統的穩定運行。
同時,為了提升應急響應速度,方案還支持遠程故障診斷與修復功能。在面對常規故障時,可通過運維編排自動觸發自愈流程,實現無人值守的排障處置;而面對非常規故障時,運維人員也可通過平臺遠程訪問問題設備,快速定位故障原因,并執行遠程修復操作,極大地縮短了故障恢復時間,保障了業務連續性。
綜上,北京智和信通PTN設備管控方案以其全面的兼容性、智能化的運維分析、個性化的告警策略以及高效的遠程運維能力,為現代網絡環境的運維管理提供了強有力的支持,助力企業構建更加穩定、高效、智能的網絡體系。
通過對PTN設備自動檢測、自動報警、自動修復等功能,實現告警抑制定位、各類故障情況下業務快速恢復、業務配置及調整等多需求場景的響應。并將智能數據分析和可視化呈現結合,動態感知PTN設備的運行態勢,通過對PTN設備的有效監控和管理,提升運維效率,保障網絡穩定。








浙公網安備 33010602011771號