智能運維管理系統解決方案
自動化運維管理架構,為系統提供全面可靠的監管,最大程度降低故障時間造成的服務質量下降和業務損失,建立一套監測、響應、分析、管理的監管機制,有效提高業務系統的支撐能力。
智能運維管理系統解決方案優勢
智能監控,高效運維,讓企業洞悉IT管理情況。
智能運維管理系統模塊設計
智能運維管理系統數據價值鏈
提升運維數據的應用價值,盤活數據資產
提高運維管理精細化和智能化水平
科技管理創新,提升IT服務價值
精準分析,未來IT發展決策支持
全層次、全管理域、全周期自動化運維管理,是智能運維基礎。
采集配置層:負責實時性能數據、告警數據的采集、解析、上傳,網元的統一操作配置;
應用處理層:完成事件流處理、相關資源、性能等數據的處理并入庫;
業務視圖層:通過歸一化呈現方式,確保業務信息數據的快速呈現和管理。
數據獲取方式有:
監控范圍,分業務監控和設備監控2大類:
設備監控:主要監控主機、網絡、數據庫、存儲、中間件等的基礎體系指標;
業務監控:主要監控業務可用性、業務流量、業務服務能力等;
日常監控指標有:
主機:Ping、Ping丟包率、Ping時延、CPU占用率、內存占用率、虛擬內存占用率、分區占用率、采集登錄異常、采集數據異常、磁盤IO讀寫速度(非Windows主機)、磁盤IO繁忙度(非Windows主機)、登陸用戶數(非Windows主機)、系統總進程數(非Windows主機)、電源總狀態(Dell)、風扇轉速(Dell)、硬盤狀態(Dell)、總體溫度值(Dell)。
數據庫:MSSQL表空間大小、MSSQL連接數、MSSQL日志空間占用率、MSSQL鎖數量、MySQL表鎖數量、MySQL流量、MySQL吞吐率、Oracle表空間占用率、Oracle當前連接數、Sysbase表空間占用率、Sysbase當前連接數 網絡:Ping、Ping丟包率、Ping時延、CPU占用率、內存占用率、采集數據異常、端口流量、端口狀態變更監控、開機時長。
中間件:JVM CPU占用率(JMX)、JVM live狀態線程總數(JMX)、JVM內存堆占用率(JMX)、JVM內存非堆占用率(JMX)。
應用:采集數據異常、進程數量、進程占用CPU前N監控、進程占用內存量、連接/監聽端口監控、網頁登錄狀態監控、文件修改時間跟主機時間之差、應用端口檢測。
其他個性化監控指標:根據客戶需求來定制。
設備監控:
業務監控:
告警管理:
自動巡檢:
統計分析:
設備資料管理:
系統拓撲:
機房資源管理效果圖:
基于大數據分析技術的智能化IT運維,預測式的挖掘用戶剛需,使營銷更精準。
居民生活時空分析:基于A口信令數據挖掘分析居民生活時空軌跡、社交關系、出行路線等。達到大數據處理實時化,用戶軌跡直觀化,廣告營銷精準化。
公安110系統:基于基站位置信息,在GIS上及時呈現人員位置信息。
故障管理:跨業務領域的全面監控,通過聲音、色彩、短信、郵件等方式通知用戶告警消息,為解決故障提供建議的解決辦法和案例。
應用范圍:中國電信集團公司、廣東分公司、佛山分公司、西藏分公司、公安局、房管局等領域。
目前已經應用到廣東電信、集團電信的網管中,涉及電信移動、接入、交換、數據、業務平臺、傳輸6個專業,納入管控的設備將近12W臺(其中包括10W個左右的WIFI-AP) ,約500多個業務系統。審計49億3千萬次操作,發現IPTV、短信等9個平臺/系統共3101148次攻擊;500多個賬號出現11類違規使用問題近30萬次;敏感信息不合規訪問3000多次。
可監控的設備廠家:
隨著數據量的龐大,實時數據的價值也將逐步降低,需要不斷的將歷史數據歸檔管理,為后續的關聯性分析提供更有效的依據價值。