目前來說,傳統企業的IT運維大部分還是用戶在使用過程中發現故障,然后通知運維人員,再郵運維人員確定是什么問題,采用哪種方式可以解決。大部分的運維人員目前還是充當的只是一個救火員的身份,沒有起到真正的IT運維監控的作用。運維人員的大部分時間和經歷都花在了處理簡單而重復的問題上,導致同事及領導的不滿。
現在各大企業在運維管理過程中沒有明確的定義和責任劃分也沒有一個自動的運維監控工具,所以等到問題出現后,不能很快的查出問題找到原因,而在問題出現后,也沒有必要的跟蹤和記錄,導致同樣的問題可能會不斷的出現,浪費大量的人力資源
2、安全運維挑戰目前的運維現狀
運維工程師在目前的大數據下,對大量網絡安全事件,若沒有有效的運維監控工具沒法完成有效的分析工作 。每天出現巨大數量的安全報警,管理員很難對這些報警做出響應。誤報嚴重,管理員無法判斷故障
大量重復,零散而沒有規律的報警,黑客的一次攻擊行為會在不同階段觸發不同的安全調備告警,這樣導致報警數據之間在時間和空間上存大量的重復數據 ,如果不實現安全事件的關聯處理,就無法有效的提高告警質量。
出現這些問題有一部分是因為企業沒有一個事件監控和運維監控工具,如果沒有一個有效的管理工具支持就很難讓故障得到主動快速處理,隨著網絡化的不斷擴大,市面上有很多的運維監控工具,例如商業版的Cisco Works 2000、Solarwinds、ManageEngine 開源領域極MRTG、Ngios、cacti等 這些運維監控工具之前并沒有必然的聯第,即便是你用了這些工具,很多運維人員并沒有真正的從運維中解脫出來,原因是有一部分監控工具雖然能獲取計算機設備,服務器,網絡流量,甚至是數據庫的告警信息,但成千上萬的告警告信息讓運維人員根本分不清故障根源在哪里,缺乏對信息進行篩選。數據挖掘的能力。但是pigoss bdm在這方面就做了優化,告警信息出現后,平臺自動分析大體是屬于哪方面故障,提高故障修復效率。
另外還有很多的運維監控工具需要登錄多次,查看很多的界面才能了解整個被監控系統的運行情況。當設備數量達到一定數量后,工作量之大無法想像所以運維監控人員需要像pigoss這樣的集成安全管理的運維監控工具。
過 去是僅靠幾個技術大拿就可以包打天下的時代已經沒有了,企業需要一種安全的運維平臺。滿足專業化,標準化,流程化的需要來實現運維工作的自動化管理。通過 這種集成的運維監控工具可以實發發現故障,主動的告訴用戶需要關注的資源,降低運維人員的工作負擔,最大限度的減少維修時間,提高IT運維部門的服務質量。
運維監控工具的選擇
一個好的安全運維平臺需要將事件與IT 流程相關聯,一旦監控系統發現性能超標或出現宕機現象,就會觸發相關事件以及事先定義好的流程,自動啟動故障響應和恢復機制。還需要能夠篩選出運維人員完 成日常的重復性工作,提高運維效率。要實現這些功能都是常規監控軟件Cacti、Zabbix所無法實現。
同時,還要求能夠預測網絡蠕蟲威脅,在故障發生前能夠報警,讓運維人員把故障消除在萌芽狀態,將所產生損失減到最低。總的來說運維人需要能夠在一個平臺中 實現資產管理、分布式部署、漏洞掃描、風險評估、策略管理、實時流量監控、異常流量分析、攻擊檢測報警、關聯分析、風險計算、安全事件告警、事件聚合、日 志收集與分析、知識庫、時間線分析、統一報表輸出、多用戶權限管理的功能,這種集成開源工具到底有沒有?它去哪兒啦?
目前國產的運維監控工具pigoss 可以實現以上的大部分監控功能,實 現了對客戶數據中心所有IT系統的全方位運行監控。 監控范圍覆蓋網絡運行監控,主機運行監控,數據庫運行監控,中間件運行監控,虛擬化平臺運行監控, 存儲運行監控,Web服務質量監控等等。同時幫助客戶梳理IT組件運行狀態對每一個業務的關聯影響關系,生成可視化的業務拓撲監控視圖。
了解更多關于運維監控的消息 可關注pigoss bsm 官網 www.netistate.com