監控的目標?
發現問題:當系統發生故障報警,我們會收到故障報警的信息。定位問題:故障郵件一般都會寫某某主機故障、具體故障的內容,我們需要對報警內容進行分析。比如一臺服務器連不上,我們就需要考慮是網絡問題、還是負載太高導致長時間無法連接,又或者某開發觸發了防火墻禁止的相關策略等,我們就需要去分析故障具體原因。解決問題:當然我們了解到故障的原因后,就需要通過故障解決的優先級去解決該故障。總結問題:當我們解決完重大故障后,需要對故障原因以及防范進行總結歸納,避免以后重復出現。
具體而言?
對系統不間斷的實時監控:實際上是對系統不間斷的實時監控(這就是監控);實時反饋系統當前狀態:我們監控某個硬件、或者某個系統,都是需要能實時看到當前系統的狀態,是正常、異常、或者故障。保證服務可靠性安全性:我們監控的目的就是要保證系統、服務、業務正常運行保證業務持續穩定運行:如果我們的監控做得很完善,即使出現故障,能時間接收到故障報警,在時間處理解決,從而保證業務持續性的穩定運行。