監(jiān)視服務器負載是管理服務器時的一項重要任務。確保負載不會太高會使硬件更安全并防止停機和停機。本文解釋了如何找到服務器負載,理解它并提供管理它的解決方案的細節(jié)。
一旦您獲得了對新服務器的訪問權限,就可以通過運行top來檢查服務器負載。Top是一個應用程序,它提供基本的硬件信息,如正常運行時間,CPU和內存使用情況以及服務器負載。運行該命令將為您提供如下所示的屏幕:
在右上角,您會看到“平均負載”,旁邊有3個數字。這些數字代表不同的時間長度:分別為1分鐘,5分鐘和15分鐘。數字本身表示當前正在運行的進程數加上等待運行的數。由于處理器一次只能運行一定數量的進程,因此該指標旨在通過包括排隊進程來表示服務器正在完成的工作的全部潛力。因此,運行和排隊的更多進程意味著更高的服務器負載。
為了更好地了解這一點,我們假設我們在服務器中有一個單核處理器??梢园阉胂蟪蓹C場的單一跑道。空氣控制器必須協(xié)調飛機著陸和起飛。如果有足夠的飛機使跑道在沒有任何飛機等待的情況下保持100%使用,我們可以將運行隊列長度指定為1.0。但是,如果有多個平面比跑道可以同時處理的那樣,則會形成一條線并且數量會增加。例如,如果有兩倍的平面,那么運行隊列長度將達到2.0。反之亦然,如果有一半,它將下降到0.50。
這并不意味著我們希望始終保持在1.0。尖峰是可以的,但如果你一直處于或高于1,那么你應該查看服務器可能出現的問題。這就是3的集合。您可以使用15分鐘的平均值來衡量服務器上是否存在一致的負載和潛在問題。理想的負載應該是長期約0.70。應該持續(xù)監(jiān)控此指標,以便采取主動措施并防止停機。
那么多核處理器呢?嗯,經驗法則是每核1.0。因此,如果你有一個4核處理器,你正在尋找高達4.0的負載(或者更確切地說是2.80,即4.0的70%)。您可以通過在服務器上運行nproc來確定您擁有的核心數。它將顯示您具有多少核心的輸出。這也適用于多處理器服務器。無論配置如何,核心總數都可以讓您準確了解服務器負載指標。運行nproc將為您提供計算機上所有核心的完整列表,以及監(jiān)控服務器負載的良好基線。
總結一下,基本的經驗法則是每個核心1.0。如果你在1分鐘的平均時間內看到這一點,你可能會沒問題。如果您在5或15分鐘的平均值中看到這個或更高的數字,那么就應該在事情??變得 更糟之前進行調查。
我們知道不斷檢查這些指標可能會很痛苦。在滴盾安全,我們提供可以為您完成所有工作。我們安裝的工具可以主動監(jiān)控您的服務器以及服務器的許多其他指標,并在出現任何問題時提醒我們。這樣可以讓您高枕無憂,確保您的硬件得到仔細觀察,而無需經常自行監(jiān)控。因此,停機風險較小,您可以節(jié)省時間和精力。要了解有關服務器租用的更多信息,請打開聊天會話,我們的客戶經理將很樂意為您提供幫助。