監控我們的環境對于服務器運維來說至關重要,尤其是在部署新的應用程序時。如今,公司每天都使用開源解決方案來監控系統資源。但是,當出于測試的目的來監控一定時間時,bash 腳本會派上用場。
在本教程中,我們將編寫一個 bash shell 腳本,它將輸出一個三列表,來顯示我們機器上的內存、磁盤和 CPU 的百分比。讓我們開始吧!
該腳本基本上由三個主要部分組成:
1.監控內存:
free -m 是用于顯示已使用和空閑內存的命令,輸出如下:
但是,我們需要從上面的輸出中獲取第二行的總內存和已用內存。我們可以使用 AWK 來從給定輸出中提取數據。
AWK 是一種用于文本處理和數據提取的編程語言。它是大多數 UNIX 系統的標準功能。awk ‘NR==2’ 從第二行提取數據。和2 分別充當已用量和總量。
監控磁盤
第二個命令輸出使用的磁盤百分比。df -h 輸出與磁盤使用情況和分區相關的數據。
awk 輸出字段數。但是,NF=="/" 將轉到包含字符 / 的那一行。$5 將從該行中選擇第 5 個字段。這可確保該命令能夠提取正確的磁盤使用百分比(在我們的示例中為 %7)。
監控 CPU
top -bn1 命令將只執行一次 top 命令(n1 = 一次迭代),當我們想在 bash 腳本中使用 top 或將其數據輸出到文件時使用可以使用 -b 選項。
grep load 將輸出包含字符串 load 的行。$(NF-2) 將計算該行上的字段數并減 2。
在瀏覽完 bash 腳本的基本部分之后,我們需要將這些命令保存到變量 MEMORY、DISK 和 CPU 中:
我們需要腳本運行一段時間(比如,一個小時)。為了做到這一點,我們需要使用 while do 循環,每次循環后延遲 x 秒(取決于您的測試):
為了在一定時間內運行一次循環,我們可以定義一個變量 $end,它從 bash 腳本開始的時間開始計算當前的秒數,因此是 SECONDS,并在當前秒數上加上一個數字。所以一個小時就是 3600 秒。
上述代碼片段的第二行指出,只要(當前秒數)小于SECONDS+3600,while 循環就會繼續執行。因此,我們定義了循環的開始時間和結束時間,以及將每個循環暫停 5 秒的睡眠時間。循環內部是每 5 秒將那三個變量分配一次新值,以及將輸出三個資源使用情況的 echo "DISK$CPU"。
完整代碼如下:
上面的代碼將輸出以下內容:
您始終可以將數據輸出到日志文件:
Stress 測試
由于機器上幾乎沒有任何負載,我們可以使用 stress 來使 CPU 和內存負載一段時間。
使用以下命令安裝(在 CentOS 上):
現在我們可以使用命令 stress 來負載我們的機器。例如,通過指定兩個 CPU 密集型進程、一個 I/O 密集型進程和一個內存分配器進程,對系統施加 4 個平均負載,如下所示。以下壓力測試將運行 1 小時。
關于如何為所有系統管理員創建一個非常容易且有用的 bash 腳本的教程到此結束。