石油石化行業網絡監控運維方案,全局態勢感知,實時預警
石油石化行業是一個高科技密集型行業,投資巨大、人員眾多,各產業價值鏈的關聯度較高,大型石油石化企業實現了上中下游產業的一體化協同發展。隨著工業4.0時代的來臨,信息化和工業化融合,物聯網、云計算等新技術的普及推廣,在駛入智能化賽道后,石油石化行業也在經濟高速發展的大背景下,面臨著經濟全球化與社會信息化的雙重挑戰。
在能源企業信息化進程中,隨著石油石化行業信息化投資的不斷增加,其IT基礎設施規模和應用復雜度也不斷增高,因分支站點眾多且分布范圍廣泛,也對運維人員提出了高效管控多個數據中心及保障數據鏈路暢通等新技術要求。加上數據中心是7*24小時不間斷運行,企業還面臨著實現IT運維管理人員快速響應和處置、人機分離的高效運營管理以及智能化節能與可控等多重挑戰。
第1章 石油石化企業網絡運維痛點
伴隨著“互聯網+”的提出以及“兩化融合”不斷深入推進,石油化工企業信息化建設取得了一系列重大成果和重要進展,對企業提質增效、轉型升級起到了重要支撐作用,但同時,因其網絡覆蓋面大、數據中心眾多、終端眾多,整體網絡架構復雜性不斷增高,在網絡運維中面臨種種難題。
具體表現為如下:
- 網絡中存在大量的 IT 基礎架構設施、云、虛擬化等,各種設備類型和設備廠家眾多,難以統一管理;
- 業務系統眾多,網絡使用情況缺乏有效監控,應用可用性要求高;
- 網絡結構復雜,鏈路多,運維人力不足,網絡維護、業務保障工作量大;
- 監控系統與告警平臺缺乏聯動,設備監察依賴人工巡檢,告警發生僅靠被動發現,常常出現“救火式”被動運維場景;
- 難以把控網絡總體運行狀況,各個地市、油庫、加油站設備狀態難把握;
- 各地區,時段網絡負載狀況難以實時獲取,故障節點難、問題根源,排障困難;
- 缺乏可視化智能報表,其數據總覽、運維指標不能直觀呈現,缺乏提供管理決策依據的工具。
第2章 智和信通石油石化行業IT運維方案
石油化工行業信息化架構通常包括網絡基礎設施架構、業務架構以及應用架構三部分,一般而言網絡基礎設施架構,油田企業多采取集中分散式網絡,煉化企業多采取園區式網絡,銷售企業多采取分布式網絡。同時,運營逐步向總部集中,總部數據中心肩負不間斷運營的重擔,實現快速實時響應,第一時間完成故障排查、遠程恢復與重啟更新等自愈,成為運維人員最為關注的問題。
北京智和信通石油石化IT運維方案,通過“智和網管平臺”實現智能化集中運維管理,對全部IT基礎設施進行跨區域、跨平臺、跨設備遠程集中管控,真正實現遠程集中管控,有效提升管理效率。
2.1.分布式部署網絡可視化
石油石化企業采取在總部設立網絡運營中心,各企業設立分中心,協同進行態勢監控和運維響應,形成上下一體、內外結合、協同聯動的運維體系。但由于整體網絡架構中軟硬件環境涉及的技術復雜,廠商眾多,協同運維具有一定難度。北京智和信通選擇通過網絡架構拓撲可視化能力,將網絡數據從離線表格轉移至平臺內,從靜態的網絡架構數據轉化為動態智能拓撲,實現全網設備、資源、鏈接關系、IP等實時更新、快速定位。
在動態拓撲上展現設備實時狀態,通過樹形、平面結構聯動展示設備間鏈接關系,通過按片區、按地域、按層級等多種布局方式劃分網絡,使用不同顏色、粗細、圖標表示被管理對象的狀態信息,助力運維人員實時了解網絡架構及全網運行狀態,快速感知資源、鏈路、流量等異常信息。

2.2.全網IT資源可視化監控
本方案實現IT設備信息高頻采集,并結合智能算法,實現對整體網絡架構、設備運行狀態、業務可用狀態的實時信息采集和感知。針對石油石化企業網絡內各類IT設備、業務系統構建統一、智能監控體系,屏蔽廠商、型號差異,全面掌握石油石化企業網絡整體運行情況和運行效能,能高效、快速、精準進行故障定位診斷。
2.3.視頻設備集中監控
本方案可對不同品牌、不同型號的攝像頭進行統一運維,融合網絡高清、智能分析、多級管控為一體。支持監管視頻監控體系涉及的視頻前端設備(攝像頭、卡口、編解碼器),傳輸設備(光纖收發器、EPON 等)內場設備(網絡與安全設備、主機/虛擬機、存儲設備)、機房動力環境等多種設備,等統一接入、集中管理。
2.4.端到端全鏈路可視化
從整體維度到局部維度全面展示石油石化企業網絡內IT設備間鏈路各項指標,整體可觀測、可告警、可分析、可統計,通過實時監控各個端口以及每條線路的通斷情況和性能指標,結合專業的流量監控分析能力,對鏈路容量進行即時監控,并生成流量分析報告,為容量規劃提供依據。
2.5.設備模型庫監管無限制
方案采取用戶自定義設備類型及其設備資源的方式,賦予用戶自定義適配設備的能力,最大可能地支持對不同設備類型的支持。通過自定義設備類型及其設備資源,最大限度上提高了智和網管平臺的管理范圍,真正實現了對設備及其資源的全面化管理,達到管控萬物的目標。
2.6.實時故障預警,及時洞察異常信息
方案通過統一的故障管理平臺,將各個模塊中的監控信息統一采集、分析,實現整個石油石化企業網絡中各種事件信息、設備故障、網絡異常、流量異常等告警,以智能化手段進行標準化的分析、壓縮、并歸關聯等,通過多種方式實時傳達告警信息,保證落實到指定人員進行處理,為石油石化企業提供主動式的故障解決方案。
全面采集石油石化企業內所有聯網設備,如存儲、服務器、路由器、工業交換機、安全設備、虛擬化、云、OLT、ONU、PLC、無線ACAP等設備、資源、應用、服務等狀態信息,通過對告警機制以及閾值的設置,第一時間獲取準確的告警信息,快速定位告警設備,提升告警處理效率,降低因設備故障帶來的損失。

實現快速的故障定位,一步定位到發生故障的源頭設備,及時處理好故障,有效地預防故障發生。支持以拓撲圖的方式回放歷史告警下的設備告警變化、拓撲圖和鏈路告警變化,支持快進、后退等播放操作。
2.7.異常事件管理
將事件和告警分離管理,接收設備/服務器主動發送的消息,集中處理后,及時地通知用戶,并可以通過集中的管理界面進行管理。接收設備/服務器主動發送的消息,極大地提高了管理的主動性,通過統一界面集中管理事件,降低了管理的難度。
2.8.全覆蓋IT資源自動巡檢
傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統計,工作效率比較低,同時耗費較大的人力資源。
本方案依托平臺將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略。制定統一的巡檢指標、巡檢方式、巡檢頻度等,保證巡檢標準化、巡檢范圍、巡檢深度;通過設計巡檢作業、數據采集方式、自動化作業調度等實現日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。
2.9.IP地址全生命周期監管
對于石油石化企業的網絡IP資產,采取統一數據標準,對整體網絡中的IP和MAC進行梳理和管理,建立健全IP資產臺賬,端到端規劃、部署、管理和監控IP 地址。通過智能IP掃描能力,定義多層次子網,然后掃描其范圍內每個IP地址的當前狀態,包括IP地址,MAC地址等信息,也可以查看IP段內地址使用詳情,便于IP地址分配管理等。
可手動、自動獲取子網信息,并根據網絡結構對子網信息進行管理。定時獲取全網的MAC-IP信息,并自動保存,可根據MAC或IP對在線設備進行查詢。以端口圖的形式顯示當前網段內端口的使用情況。
支持通過端口視圖及列表視圖的形式,展示當前IP地址的使用情況,可查看某個子網的IP現網詳情信息,如IP、掩碼、主機名、設備類型、現網MAC、現網接入設備、現網接入端口、規劃MAC、規劃接入設備、使用人等,可批量分配IP地址。
2.10.業務可用性管理
中國石化業務應用復雜,上中下游、科研、工程、貿易、金融、電商,相應的業務信息系統復雜度極高。本方案以保障業務可用性為基礎,通過對承載業務的IT基礎設施構建真實的業務模型。
針對業務應用性能與用戶體驗進行檢測分析,無需安裝插件即可提供開箱即用的主動撥測試業務監測。從前端用戶體驗、網絡延遲到后端的業務服務和基礎架構,全棧溯源為用戶提供端到端的完整全鏈路數據融合和關聯分析,為用戶快速發現業務性能瓶頸,提升用戶體驗奠定基礎。
直觀、便捷地幫助運維人員對石油石化企業內部辦公系統、物資采購電子商務系統、ERP、語音業務系統、CRM系統、供應鏈/物流管理系統、油田開采與生產系統等進行監控,掌握業務的運行狀態和健康水平,了解業務動態變化趨勢,快速定位故障源,降低運營風險。
方案實現完整全鏈路調用鏈追蹤,包含詳細的調用鏈訪問路徑和性能等訪問信息,以及相關的各類請求參數等業務數據指標,為故障定位、根因分析提供詳盡的參考數據。
通過構建包含各業務整體流程的調用依賴關系圖譜,展示業務部署中網絡設備間多維度關系拓撲。對從業務的前臺受理到真正完成的整個業務流程所依賴的業務應用、服務器、中間件、數據庫、操作系統等進行實時監控分析,通過可視化的方式呈現業務健康狀況,聯動設備監控,快速定位導致業務健康指數波動的原因,保障核心業務流程穩定、高效。
2.11.全網帶寬、流量監控與回溯分析
隨著石油石化企業信息化建設的加速,其業務、應用層出不窮,對網絡帶寬的需求越來越高。正常的業務需要良好的帶寬環境保障機制,避免被一些與業務無關的雜事干擾,影響工作效率。方案基于海量流量數據的存儲挖掘,實現對網絡流量的偵測分析。
提供設備、接口、IP、服務、應用、會話等層級的帶寬監控,實時監控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網絡帶寬濫用,分析高帶寬使用情況,識別帶寬消耗較大的應用程序、服務、協議或 IP 地址,避免網絡容量過載,并提升最終用戶網絡體驗。
2.12.無人值守的設備遠程配置
網絡承載的業務經常發生變更,面對業務的變更運維工程師往往要對大量設備進行操作,此時如果依靠工程師逐一登錄設備進行命令下發、策略配置,將產生大量重復性的工作,不但導致運維效率低下,也不可避免地產生人為配置錯誤。
用戶可通過網頁對智和網管平臺進行訪問,通過對納入監控的設備進行單獨、批量的配置操作,設備策略遠程配置管理,可以自動批量進行設備配置修改,并可對設備配置進行備份、對比、恢復,宕機后設備配置可快速復原,保障設備及時恢復運行,全面提升配置效率、質量和安全性。
通過批量作業并行處理能力,實現多設備并發批處理操作。通過自動化流程,將簡單的設備控制操作在大批量設備進行執行,并對執行過程進行監督,對執行結果進行檢查。在安全合規的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現網絡變更、設備配置自動化。
對不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網絡設備。
方案通過配置文件批量備份、下載、周期性備份、查看等功能,為用戶管理網絡做出合理的建議提供數據支撐。
2.13.全場景自動化運維
方案將石油石化企業網絡運維中涉及的服務、命令、操作、執行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式托管至平臺中進行維護和管理,通過簡單靈活地編排能力,使用者可以選擇業務場景所需地測,通過可視化拖拽的編排方式進行組合,即可完成應用場景端到端的圖形化編排,最后以多種方式觸發執行即可完成期望的運維變更任務,從而實現高效、穩定、安全的智能運維。
自動化運維編排,可實現完全根據用戶場景,定制化設計運維劇本,真正將運維任務托管至平臺,全面解放人力。
- 故障自愈能力,如網口異常自動關閉、磁盤爆滿自動清理、非法設備入侵阻斷、CPU空間不足自動重啟等。
- 定時服務重啟,如在工作日每天晚上定時關閉應用,每天早上自動重啟應用等。
- 智能批量設備管控,如批量設備策略執行,當設備的配置狀態不一時,能夠基于當前設備自身的狀態自動決策適合于本設備的管控操作等。
- 定期設備健康狀況自檢,如定期設備健康狀態自檢、服務運行狀態自檢等。
- 虛擬化、云服務資源自動化擴容,如在虛擬化環境資源不足時自動化根據實際情況進行擴容。
- 日常運維自動化,如自動化定期執行批處理cmd\sh腳本、自動化定期數據清洗、自動化定期環境檢查并導出報表等。
2.14.積累形成運維知識庫
在石油石化企業日常網絡運維服務中,重復的故障和請求約占到70%,只有30%的故障真正需要專業人員來解決,知識經驗對提升重復工作的效率起到了至關重要的作用。
通過智和網管平臺自動化運維的能力,將只能由專家處理的各類操作和判斷轉化為可存在于平臺內的流程,形成可保留可復用的運維知識,減少因誤操作帶來的損失,保障運維效率。以規范的流程進行運維作業,保障關鍵數據的完整合規。
2.15.可視化運維數據駕駛艙
利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復雜的石油石化企業網絡中各類運維數據,呈現分析結果,從而幫助運維人員在短時間內更好地理解和獲得更多的信息,幫助運維部門能夠實時了解業務和其所依賴IT資源的運行狀況,以及提供系統運維和優化的指示和依據。
2.16.資產生命周期管理
由于石油石化企業IT資產數量巨大,管理困難,一些防護薄弱、疏于管理以及廢棄老舊資產成為網絡故障的隱患,通過資產管理,將企業的網絡資產管理,采取統一數據標準梳理和調用,明確資產歸屬,形成臺賬,免資產信息在運維系統和實物間的差異,減少網絡運維過程中信息不一致、數據不統一等問題通過平臺將資產實物與運維數據庫一一對應,解決網絡設備在日常運維過程中出現“脫管”或“半脫管”的問題。
實現一機一檔,通過自定義多級資產分類,細化資產類別,實現資產分類管控,提高資產精細管理程度。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支持追溯,通過平臺實現資產整個生命周期的全流程閉環管理,使得IT資產每一次生命周期變更,都有流程可依、都有跡可循,從而實現全面的IT資產監管。
2.17.定制化工單體系
通過方案實現運維工單“無紙化”,支持于設備和故障管理頁面快速創建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。
結合石油石化的業務需求場景,自定義工單模板內的字段,并對字段排序進行調整,使工單根據業務的不同更加貼合用戶實際使用情況,提供為不同工單模板設置不同狀態的能力。
第3章 自主研發安全可控 全面適配國產信創環境
信創產業包含了從IT底層的基礎軟硬件到上層應用軟件的全產業鏈的安全可控,涵蓋了應用軟件、信息安全、IT基礎設施、基礎軟件四個領域。其中,基礎軟件是信息系統最核心的部件,是保障信息系統安全的重要陣地和最后一道防線,其創新應用與自主可控關系到國家安全和利益,也是產業自主發展的基礎。
本方案支持部署運行在中標麒麟、銀河麒麟、紅旗Linux等國產操作系統,支持在達夢、金倉、神州等國產數據庫進行數據存儲,通過東方通等國產中間件提供對外服務[8],支持龍芯、申威等國產CPU架構,并實現對國產化CPU、服務器、數據庫、中間件等IT軟硬件設備的綜合監控與運維管理。
第4章 方案應用價值
隨著5G、大數據、物聯網、云計算、人工智能等高新技術的不斷發展和應用,越來越多的石油石化企業正在由傳統管理模式逐步向智能化、無人化運維模式發展。我國“十四五”規劃綱要明確提出,“要加快數字化發展,建設數字中國”。在此背景下,數智化轉型逐漸成為企業所關注的焦點,“少人化或無人化”、“可預測性維護”的運維模式已經成為石油石化企業數字化轉型、強化本質安全、提高系統效率、實現高質量發展的關鍵支撐。
通過部署北京智和信通石油石化企業一體化運維監控方案,通過遠程集中管理,實現對所有IT設施的集中管控,對不同角色的人員進行分級授權訪問權限,在發生故障的第一時間進行排、處置和恢復,改善石油石化企業網絡運行環境、降低運維成本、提升運維效率,為其安全、智慧、低碳發展不斷賦能。
第5章 標桿案例
智和信通石油石化企業IT運維方案成果,其可靠性在石油石化企業大規模、高復雜地網環境下得到了驗證,并得到用戶的充分認可。
5.1.山東墾利石化集團-生產網絡管理
山東墾利石化集團有限公司始建于1970年,占地350萬平方米,員工3123人,注冊資本10339.18萬元。是以石油化工為主業,集石油加工、石油化工、紡織、熱電、釀酒、供熱、科研為一體的綜合性企業集團。
5.1.1.核心需求
隨著集團的發展,生產規模的擴大,集團生產網絡越加的復雜,因此,墾利石化急需一套網管軟件對生產網絡進行管理,并提出以下需求:
- 用于管理生產網絡;
- 具有清晰明了地網絡拓撲圖;
- 具有及時告警功能,支持告警信息通過短信發送;
- 具有性能管理功能,能夠監控設備性能;
- 具有數據統計分析能力,提供網絡/設備情況報表。
5.1.2.智和信通方案
經過和墾利石化的深入溝通,智和信通公司決定采用智和網管平臺綜合網管解決方案實現墾利石化的網管需求,具體方案如下:
- 支持自動發現設備生成網絡拓撲圖,并識別設備類型、資源,生成設備的面板圖;
- 支持多種告警機制,自定義配置告警閾值,支持快速標示已經執行操作的告警,迅速定位告警設備;
- 提供界面顏色、告警列表、Email、短信等告警方式;
- 提供了多項已定義好的數據對象,用于從設備上采集系統信息、網絡信息、交換信息、軟件信息、磁盤CPU資源、流量信息,可以通過曲線圖、趨勢圖等展示性能指標,可以按天、星期、月、任意時間段查看性能指標變化;
- 支持多項數據的統計功能,包括對全網設備、資源、鏈路、性能、故障等進行統計,并支持將軟件中的統計圖表導出或打印,以便備份或對比查看。
5.1.3.方案成果
通過部署智和網管平臺墾利石化實現了對集團生產網絡的統一管理,將所有設備都被納入網管軟件中集中管理。通過清晰的網絡拓撲使設備情況一目了然,設備出現故障時,做到了數秒內即可發現故障,極大地提高了設備故障的處理效率。
5.2.東營石化-全網實時監控
東營石化是大型國有企業,集團下設多家公司。由于集團的愈加發展壯大,集團網絡環境愈加地復雜,網絡設備數量不斷增加,人工管理已經難以滿足其需求。
5.2.1.核心需求
目前東營石化對網管軟件的需求主要集中在能夠對當前的網絡情況整體監控,并對其進行梳理。因此,東營石化提出了以下核心需求:
- 完善的拓撲圖功能,能夠自動發現網絡設備,識別設備IP地址和MAC信息;
- 故障告警功能,能夠通過短信發送告警信息;
- 能夠對設備資源進行管理;
- 能夠通過手機對系統進行訪問;
- 能夠對網絡狀況生產統計報表。
5.2.2.智和信通方案
經過和東營石化多次溝通,智和信通公司決定通過智和網管平臺一體化網絡管理解決方案實現東營石化的網管需求,具體方案如下:
- 支持通過圖形化的方式,將網絡拓撲關系展示出來,支持樹形結構和平面結構的聯動展示,也可以按片區、按地域、按層級等多種布局方式劃分網絡。
- 在拓撲中以不同顏色設備圖標實時展現設備的實時狀態信息,通過拓撲圖對設備、設備資源、鏈路進行管理。
- 支持進一步展示設備的細節,包括設備的物理組件、服務器上的服務:比如:Web服務器、中間件應用服務、數據庫服務器、郵件服務器等;還可以用戶定義的其他監控對象。
- 支持多種告警機制,自定義配置告警閾值,支持快速標示已經執行操作的告警,迅速定位告警設備。
- 故障可以通過界面顏色、告警列表、Email等方式發出通知,告警可以向上逐步追溯,按照從全局→網絡→設備→設備資源的管理習慣來組織故障顯示。
- 支持多項數據的統計功能,通過多種類型的圖表進行展現。
- 智和網管平臺支持B/S和C/S構架,支持通過PC端、Pad端以及手機端對平臺進行訪問。
5.2.3.方案成果
通過部署智和網管平臺,東營石化實現了對集團網絡的一體化管理。平臺提供的拓撲圖可以圖像化、實時地展現集團網絡結構和狀態,可以在最短的時間內發現設備的故障,并直接定位故障設備,進行排查,極大地降低了因設備故障給集團帶來的損失。網絡部通過報表,對周、月、年的網絡狀況進行匯總,為網絡結構的調整提供了依據。
石油化工行業信息化架構通常包括網絡基礎設施架構、業務架構以及應用架構三部分,一般而言網絡基礎設施架構,油田企業多采取集中分散式網絡,煉化企業多采取園區式網絡,銷售企業多采取分布式網絡。同時,運營逐步向總部集中,總部數據中心肩負不間斷運營的重擔,實現快速實時響應,第一時間完成故障排查、遠程恢復與重啟更新等自愈,成為運維人員最為關注的問題。

















浙公網安備 33010602011771號