無線AC AP監控運維方案,保障無線網絡穩定運行
當前,無線網絡已經成為企業信息化建設不可或缺的一部分,因其高效率、高可用和低成本的特性被廣泛應用于IT基礎設施建設中。如何保障網線網絡的暢通和穩定,正在成為IT運維人員的一項重點任務。
面對無線網絡的大規模和高復雜特點,北京智和信通無線網絡運維方案以主動監控、實時告警、故障自愈、智能分析的運維管理方式,跟蹤無線AC/AP設備的關鍵性能指標和運行態勢,幫助運維人員更好地管理無線網絡,更輕松地解決無線網絡中的問題。
第1章 無線設備的監控范圍與指標
智和信通方案將跨區域、跨廠商、跨型號的AC/AP設備納入統一管理,針對無線AC控制器、瘦AP、胖AP采取差異化的監控策略,對其健康狀態、響應時間、連接信息、流量數據等進行監控管理。
1.1.常見無線設備品牌支持
目前,已實現對國內外常見無線設備品牌,如:華為、銳捷、H3C、思科、TP-Link、Tenda、D-Link、NETGEAR、極進等,小眾或較為老舊的品牌型號也可通過靈活可配的模型庫進行擴展適配。
1.2.常見資源監測點和指標
智和信通全棧式智慧運維平臺內置基礎信息識別和CPU、內存、射頻、關聯站點數、連接用戶數等多種資源監測點和對應的監測指標,未覆蓋的資源和指標也可以通過模型庫不斷進行拓展。
|
設備類型 |
資源監測點 |
監測指標 |
|
無線AC |
基礎信息 |
設備名稱、品牌、型號MAC地址、序列號、版本信息、運行時間等 |
|
Ping |
狀態、平均響應時間、丟包率、抖動等 |
|
|
CPU |
使用率等 |
|
|
內存 |
使用率、可用內存大小、總內存空間等 |
|
|
網絡接口 |
狀態、輸入/輸出流量、輸入/輸出帶寬、輸入/輸出速率、丟包率、利用率、誤碼率等 |
|
|
瘦AP |
IP地址、設備名稱、接口數量、內存大小、SSID、射頻傳輸重傳幀比率、射頻傳輸錯誤幀比率、射頻傳輸總幀數、關聯的站點總數、關聯失敗的站點總數、當前連接用戶數、當前斷開連接用戶數、成功驗證的用戶的在線時間、空口下行隊列平均時延/丟包率、弱/一般/良好/優覆蓋區占比等 |
|
|
電源 |
狀態 |
|
|
SysLog |
監測SysLog事件日志 |
|
|
胖AP |
基礎信息 |
設備名稱、品牌、型號、MAC地址、序列號、版本信息、重啟次數、運行時間等 |
|
Ping |
狀態、平均響應時間、丟包率、抖動等 |
|
|
CPU |
使用率等 |
|
|
內存 |
使用率、可用內存大小、總內存空間等 |
|
|
電源 |
狀態 |
|
|
用戶接入 |
最大支持用戶數、用戶關聯成功率、用戶認證成功率、用戶平均上線成功率、平均在線用戶數、平均激活用戶數、累計關聯次數等 |
|
|
網絡傳輸 |
狀態、輸入/輸出流量、輸入/輸出帶寬、輸入/輸出速率、空口上下行隊列平均時延、空口上下行隊列平均丟包率、丟包率、利用率、誤碼率等 |
|
|
信號覆蓋 |
弱/一般/良好/優覆蓋區占比等 |
|
|
SysLog |
監測SysLog事件日志 |
1.3.無線設備的品牌型號及指標擴展
方案采取用戶自定義擴展無線設備的品牌、類型及其資源的方式,賦予用戶強大的適配能力,最大可能地實現對不同時期、不同品牌、不同型號無線AC控制器、瘦AP、胖AP的管控。
支持自定義無線設備的類型、資源、故障監視器、性能監視器、TRAP監視器等,提供配置無線AC/AP設備的模板的功能,允許用戶自定義無線設備的真實面板圖。
第2章 無線AC/AP設備實時全面監控
隨著無線網絡在生產辦公環境中的應用場景逐漸廣泛,無線AC、胖瘦AP因其廠商眾多、位置分散的特點,給運維工作帶來了不小挑戰。因此對其各項性能指標進行實時監控,發現性能瓶頸和潛在的故障風險。
2.1.無線AC/AP設備的可視化監控
2.1.1.設備自動發現
在網絡可達范圍內,僅需輸入IP范圍即可自動發現網絡中的無線設備,識別其廠商、型號,生成資源邏輯拓撲或真實面板圖,匹配故障與性能監視器。并自動識別AC控制器和無線AP、無線AP與終端設備間連接關系,生成可視化鏈路,通過可視拓撲動態展示無線AC、胖瘦AP運行狀態。
2.1.2.自動生成AP設備點位拓撲
通過智能發現技術,快速識別無線AC控制器和胖瘦AP并通過多種方式進行管理。對于瘦AP可通過AC進行管理,并基于智和信通特有的拓撲技術,運維人員可以選擇將瘦AP作為AC的資源或將其升級為設備節點進行管理,在瘦AP升級為設備節點后,即可在拓撲上直觀顯示。對于胖AP則可通過智和信通全棧智慧運維平臺直接納管。
智和信通全棧智慧運維平臺具備強大的拓撲編輯能力,支持在平臺內繪制拓撲背景,提供多種基礎圖形、文字、圖片等素材。通過拓撲編輯構建AP點位圖,直觀展示AP安裝位置和覆蓋范圍,以光效、顏色實時顯示區域AP設備的運行狀態。
2.1.3.資源邏輯與物理界面展示
在拓撲圖的基礎上,進一步展示無線AC控制器和胖瘦AP的細節,可以是其物理組件,也可以是用戶定義的其他監控對象。提供資源邏輯拓撲,以圖形方式展示內存、CPU、電源、用戶接入、網絡傳輸等信息,對設備進行細化監控,實時告警,對設備進行事前管理,降低故障發生率。
2.2.無線網絡性能態勢感知
實時監測并感知無線AC控制器和胖瘦AP的性能狀態,多維度處理、分析、展示無線AC/AP設備的性能態勢,實現“可觀、可管、可控”。
2.2.1.全面監控性能
全面采集無線AC/AP設備的各項性能指標,如CPU使用率、內存使用率、用戶關聯成功率、用戶認證成功率、網絡帶寬、電源狀態等,并可按照時間范圍、資源類型、性能指標等多種維度,以圖形、表格等多種形式進行展示。
2.2.2.實時、歷史性能分析
對實時、歷史性能數據進行統計分析,通過曲線圖、柱狀圖或表格等形象化地展示,按天、星期、月查看性能指標變化。運維人員能隨時把握無線AC/AP設備的性能變化態勢,防患于未然。
2.2.3.多設備的性能對比
支持選擇多臺無線AC/AP設備進行同維度性能數據分析,提供可視化性能對比視圖,通過性能對比分析無線AC/AP設備的性能變化趨勢。
2.3.日志與事件管理
接收無線AC/AP設備的主動發送如CPU信息、內存信息、端口UP/DOWN、AP死機日志、重復關聯請求、未認證通過、認證失敗、報文超時、AP重啟失敗等事件與日志消息,集中存儲、解析處理后,將錯誤、告警、失敗等異常信息及時地通知用戶。通過統一界面集中管理事件與日志,提高其完整性和可追溯性,幫助用戶快速定位問題并采取相應的解決措施。
2.4.故障告警與智能收斂
搭載多種告警機制,自定義配置告警閾值,具備主動的故障監控功能,從眾多的事件和狀態中,系統地將零散的狀態信息,總結成為當前狀態,并對異常狀態進行告警,第一時間獲取準確的告警信息,快速標示已執行操作的告警,迅速定位產生告警的AP設備。
采用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告降噪機制,通過AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,有效避免誤報和漏報,直達故障根因。提升告警處理效率,極大降低因AP設備故障帶來的損失。
2.5.自動巡檢
可自定義巡檢策略,預設執行時間進行自動化巡檢,定期巡查無線AC控制器和胖瘦AP的實時運行狀態,并向指定郵箱發送結果報告,把握網絡運行中的易出現問題的環節,做到預防為先。可自行選擇要統計的網絡范圍、無線AC/AP設備、設備資源類型、關聯業務、關聯鏈路等生成巡檢報表。
第3章 統計報表和大屏展示
通過定義數據報表的能力,實現無線AC/AP設備的性能和狀態的統計分析和靈活展現,通過同比、環比、TOPN等分析方式并結合報表排序規則、過濾規則等能力,周期自動生成報表,幫助用戶更好地了解無線AC/AP設備的各項負載情況和運行態勢,為優化資源配置和性能調整提供依據。
通過大屏展示核心運維數據態勢,所有的網絡故障與性能瓶頸都一目了然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網絡提供了可靠的保證。
第4章 AP設備的遠程控制和編排式配置
方案提供AP設備的遠程控制的能力,采用“監控+運維+控制”的方式,將不同類型、不同型號、不同廠商的AP設備統一納入控制,集中管理。通過智能算法對AP設備的資源配置進行智能動態調整,以便更高效地利用資源,降低能耗。
4.1.AP設備的遠程配置執行
將周期性、重復性、規律性的大量日常AP配置管理工作,如配置AP上線參數、修改AP名稱、修改AP組、在線升級AP、切換AP運行模式、復位AP、恢復AP出廠設置、配置上報STA流量、配置AP流量限速、配置AP的LLDP等,轉化為依托于平臺的自動執行工作流,實現對無線AC/AP設備的批量、定時等自動化控制。
4.2.以配置AP流量限速為例
通過批量為AP設置智能流量控制限速值的方式,在大量的廣播、組播和未知單播報文產生時,實現AP自動啟動廣播、組播和未知單播流量限速,且限速為配置的限速值的效果。從而保障網絡穩定與流暢。
效果要求:當大量的廣播、組播和未知單播報文產生導致AP的CPU繁忙,使入方向收包隊列的buffer減少到一定閾值時,AP自動啟動上行、下行的入方向流量限速,限速為配置的限速值。
第一步:統一納管。將需要管理的瘦AP及其AC控制器或胖AP納入平臺進行監控管理。
第二步:策略流程編排。進入安管模塊的運維編排菜單,創建AP流量限速策略。通過進行策略節點拖拽編排的方式規劃自愈流程。
第三步:配置觸發方式。方式支持通過定時執行和手動執行兩種方式觸發進行,根據AP日常管理維護要求,我們選擇通過手動執行方式觸發策略。
第四步:批量或單獨執行。在拓撲選中要執行的設備通過右鍵快速下發策略,或通過列表視圖多選設備批量執行。
4.3.配置備份、對比與恢復
支持配置文件批量備份、下載、周期性備份、查看等,對無線AC和AP的多個備份文件進行對比。定期自動對無線AC和AP設備的配置進行巡檢備份,并可進行對比分析,為用戶管理網絡做出合理的建議提供數據支撐,支持進行已備份配置間的對比分析和針對性的配置恢復。
第5章 資產CMDB管理
通過構建無線AC/AP設備的資產數據庫,將無線AC/AP設備的信息包括資產編號、資產名稱、品牌型號、來源、購買日期、安裝方式負責人等信息以及維保到期時間、維保單位等維保信息統一管理。
分別配置AC控制器和AP的資產管理模板,細化資產類別,實現資產分類管控。如AC 資產模板增加字段:適用面積、總帶機量、缺省可管理AP數、最大可配置AP數、最大可管理AP數、最大可管理用戶數、供電方式、WAN口、LAN口等信息。而AP則關注安裝方式、射頻規格、傳輸速率、最大發射功率、用戶數限制等信息。
動態感知納入監控的無線AC/AP設備的運行狀態,并以圖譜的方式呈現無線AC/AP設備的與其他資產、配品配件、機房、機柜、網絡鏈路、使用人等靜態關聯關系。
第6章 應用價值
通過北京智和信通無線網絡運維方案實現無線AC和AP設備的統一管理,并在統一管理的基礎上,智和信通全棧運維平臺進一步提供了詳盡的監視器功能。這些監視器實時對組網設備進行監控管理,無論是設備運行狀態、在網信息,還是接入AP數、使用用戶數等關鍵信息,都能一目了然地展現在集中管理視圖中。這使得運維人員能夠隨時掌握網絡設備的運行狀況,及時發現并解決潛在問題。
為了應對可能出現的網絡中斷問題,智和信通無線網絡運維方案具備實時網絡流量監測能力。通過對網絡流量的實時監測,平臺能夠及時發現流量異常情況,并在流量超過安全帶寬限制時采取相應的措施,從而有效減少因流量過大導致的連接中斷問題。
同時,基于強大的可視化引擎,將復雜的網絡以可視化拓撲的方式進行呈現。并且在拓撲樣式的選擇上,提供給用戶樹形結構、平面結構、 區域地圖、2.5D機房圖、機架圖、 面板圖等多種樣式,滿足各類應用場景需求。
在AC或AP設備出現故障時,通過光效、顏色等效果在拓撲圖上精準而直觀地展示故障位置,幫助運維人員快速定位網絡異常節點。這種視覺化的呈現方式,極大的縮短了運維人員排查故障的時間,使得其能夠迅速定位到網絡異常的節點,進而有針對性地采取措施。
在排障過程中,提供了基于故障設備的鏈路一鍵排障功能。運維人員只需輕輕一點,平臺便能自動分析故障鏈路,提出相應的排障建議,甚至能夠自動執行排障操作,極大地提高了排障效率。而更加智能的場景化運維編排能力,不僅可以實現對AC或AP設備的遠程控制,在此基礎上也可針對工作中常見的故障問題和業務配置規劃自動執行的編排流程,使得故障自愈和業務批量、快速處置成為可能,大大提高了運維工作的效率和準確性。
智和信通無線網絡運維方案通過統一管理跨區域、跨廠商、跨型號的AC/AP設備,對關鍵性能指標和運行態勢進行監控管理。提供常見無線設備品牌支持和資源監測點及指標,實現對不同時期、不同品牌、不同型號無線AC控制器、瘦AP、胖AP的管控。









浙公網安備 33010602011771號