時(shí)間:2015-06-28 00:00:00 來(lái)源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評(píng)論(2)
top命令中l(wèi)oad average顯示的是最近1分鐘、5分鐘和15分鐘的系統(tǒng)平均負(fù)載。系統(tǒng)平均負(fù)載表示
系統(tǒng)平均負(fù)載被定義為在特定時(shí)間間隔內(nèi)運(yùn)行隊(duì)列中(在CPU上運(yùn)行或者等待運(yùn)行多少進(jìn)程)的平均進(jìn)程樹。如果一個(gè)進(jìn)程滿足以下條件則其就會(huì)位于運(yùn)行隊(duì)列中:
- 它沒(méi)有在等待I/O操作的結(jié)果
- 它沒(méi)有主動(dòng)進(jìn)入等待狀態(tài)(也就是沒(méi)有調(diào)用’wait’)
- 沒(méi)有被停止(例如:等待終止)
Update:在Linux中,進(jìn)程分為三種狀態(tài),一種是阻塞的進(jìn)程blocked process,一種是可運(yùn)行的進(jìn)程runnable process,另外就是正在運(yùn)行的進(jìn)程running process。當(dāng)進(jìn)程阻塞時(shí),進(jìn)程會(huì)等待I/O設(shè)備的數(shù)據(jù)或者系統(tǒng)調(diào)用。
進(jìn)程可運(yùn)行狀態(tài)時(shí),它處在一個(gè)運(yùn)行隊(duì)列run queue中,與其他可運(yùn)行進(jìn)程爭(zhēng)奪CPU時(shí)間。 系統(tǒng)的load是指正在運(yùn)行running one和準(zhǔn)備好運(yùn)行runnable one的進(jìn)程的總數(shù)。比如現(xiàn)在系統(tǒng)有2個(gè)正在運(yùn)行的進(jìn)程,3個(gè)可運(yùn)行進(jìn)程,那么系統(tǒng)的load就是5。load average就是一定時(shí)間內(nèi)的load數(shù)量。
一般來(lái)說(shuō)只要每個(gè)CPU的當(dāng)前活動(dòng)進(jìn)程數(shù)不大于3那么系統(tǒng)的性能就是良好的,如果每個(gè)CPU的任務(wù)數(shù)大于5,那么就表示這臺(tái)機(jī)器的性能有嚴(yán)重問(wèn)題。對(duì)于上面的例子來(lái)說(shuō),假設(shè)系統(tǒng)有兩個(gè)CPU,那么其每個(gè)CPU的當(dāng)前任務(wù)數(shù)為:8.13/2=4.065。這表示該系統(tǒng)的性能是可以接受的。
在Linux系統(tǒng)中,uptime、w、top等命令都會(huì)有系統(tǒng)平均負(fù)載load average的輸出
load average: 0.09, 0.05, 0.01
很多人會(huì)這樣理解負(fù)載均值:三個(gè)數(shù)分別代表不同時(shí)間段的系統(tǒng)平均負(fù)載(一分鐘、五 分鐘、以及十五分鐘),它們的數(shù)字當(dāng)然是越小越好。數(shù)字越高,說(shuō)明服務(wù)器的負(fù)載越 大,這也可能是服務(wù)器出現(xiàn)某種問(wèn)題的信號(hào)。
而事實(shí)不完全如此,是什么因素構(gòu)成了負(fù)載均值的大小,以及如何區(qū)分它們目前的狀況是 "好"還是"糟糕"?什么時(shí)候應(yīng)該注意哪些不正常的數(shù)值?
回答這些問(wèn)題之前,首先需要了解下這些數(shù)值背后的些知識(shí)。我們先用最簡(jiǎn)單的例子說(shuō)明, 一臺(tái)只配備一塊單核處理器的服務(wù)器。
行車過(guò)橋
一只單核的處理器可以形象得比喻成一條單車道。設(shè)想下,你現(xiàn)在需要收取這條道路的過(guò)橋 費(fèi) — 忙于處理那些將要過(guò)橋的車輛。你首先當(dāng)然需要了解些信息,例如車輛的載重、以及 還有多少車輛正在等待過(guò)橋。如果前面沒(méi)有車輛在等待,那么你可以告訴后面的司機(jī)通過(guò)。 如果車輛眾多,那么需要告知他們可能需要稍等一會(huì)。
因此,需要些特定的代號(hào)表示目前的車流情況,例如:
0.00 表示目前橋面上沒(méi)有任何的車流。 實(shí)際上這種情況與 0.00 和 1.00 之間是相同的,總而言之很通暢,過(guò)往的車輛可以絲毫不用等待的通過(guò)。
1.00 表示剛好是在這座橋的承受范圍內(nèi)。 這種情況不算糟糕,只是車流會(huì)有些堵,不過(guò)這種情況可能會(huì)造成交通越來(lái)越慢。
超過(guò) 1.00,那么說(shuō)明這座橋已經(jīng)超出負(fù)荷,交通嚴(yán)重的擁堵。 那么情況有多糟糕? 例如 2.00 的情況說(shuō)明車流已經(jīng)超出了橋所能承受的一倍,那么將有多余過(guò)橋一倍的車輛正在焦急的等待。3.00 的話情況就更不妙了,說(shuō)明這座橋基本上已經(jīng)快承受不了,還有超出橋負(fù)載兩倍多的車輛正在等待。
上面的情況和處理器的負(fù)載情況非常相似。一輛汽車的過(guò)橋時(shí)間就好比是處理器處理某線程 的實(shí)際時(shí)間。Unix 系統(tǒng)定義的進(jìn)程運(yùn)行時(shí)長(zhǎng)為所有處理器內(nèi)核的處理時(shí)間加上線程 在隊(duì)列中等待的時(shí)間。
和收過(guò)橋費(fèi)的管理員一樣,你當(dāng)然希望你的汽車(操作)不會(huì)被焦急的等待。所以,理想狀態(tài) 下,都希望負(fù)載平均值小于 1.00 。當(dāng)然不排除部分峰值會(huì)超過(guò) 1.00,但長(zhǎng)此以往保持這 個(gè)狀態(tài),就說(shuō)明會(huì)有問(wèn)題,這時(shí)候你應(yīng)該會(huì)很焦急。
"所以你說(shuō)的理想負(fù)荷為 1.00 ?"
嗯,這種情況其實(shí)并不完全正確。負(fù)荷 1.00 說(shuō)明系統(tǒng)已經(jīng)沒(méi)有剩余的資源了。在實(shí)際情況中 ,有經(jīng)驗(yàn)的系統(tǒng)管理員都會(huì)將這條線劃在 0.70:
"需要進(jìn)行調(diào)查法則": 如果長(zhǎng)期你的系統(tǒng)負(fù)載在 0.70 上下,那么你需要在事情變得更糟糕之前,花些時(shí)間了解其原因。
"現(xiàn)在就要修復(fù)法則":1.00 。 如果你的服務(wù)器系統(tǒng)負(fù)載長(zhǎng)期徘徊于 1.00,那么就應(yīng)該馬上解決這個(gè)問(wèn)題。否則,你將半夜接到你上司的電話,這可不是件令人愉快的事情。
"凌晨三點(diǎn)半鍛煉身體法則":5.00。 如果你的服務(wù)器負(fù)載超過(guò)了 5.00 這個(gè)數(shù)字,那么你將失去你的睡眠,還得在會(huì)議中說(shuō)明這情況發(fā)生的原因,總之千萬(wàn)不要讓它發(fā)生。
那么多個(gè)處理器呢?我的均值是 3.00,但是系統(tǒng)運(yùn)行正常!
哇喔,你有四個(gè)處理器的主機(jī)?那么它的負(fù)載均值在 3.00 是很正常的。
在多處理器系統(tǒng)中,負(fù)載均值是基于內(nèi)核的數(shù)量決定的。以 100% 負(fù)載計(jì)算,1.00 表示單個(gè)處理器,而 2.00 則說(shuō)明有兩個(gè)雙處理器,那么 4.00 就說(shuō)明主機(jī)具有四個(gè)處理器。
回到我們上面有關(guān)車輛過(guò)橋的比喻。1.00 我說(shuō)過(guò)是"一條單車道的道路"。那么在單車道 1.00 情況中,說(shuō)明這橋梁已經(jīng)被車塞滿了。而在雙處理器系統(tǒng)中,這意味著多出了一倍的 負(fù)載,也就是說(shuō)還有 50% 的剩余系統(tǒng)資源 — 因?yàn)檫€有另外條車道可以通行。
所以,單處理器已經(jīng)在負(fù)載的情況下,雙處理器的負(fù)載滿額的情況是 2.00,它還有一倍的資源可以利用。
多核與多處理器
先脫離下主題,我們來(lái)討論下多核心處理器與多處理器的區(qū)別。從性能的角度上理解,一臺(tái)主 機(jī)擁有多核心的處理器與另臺(tái)擁有同樣數(shù)目的處理性能基本上可以認(rèn)為是相差無(wú)幾。當(dāng)然實(shí)際 情況會(huì)復(fù)雜得多,不同數(shù)量的緩存、處理器的頻率等因素都可能造成性能的差異。
但即便這些因素造成的實(shí)際性能稍有不同,其實(shí)系統(tǒng)還是以處理器的核心數(shù)量計(jì)算負(fù)載均值 。這使我們有了兩個(gè)新的法則:
"有多少核心即為有多少負(fù)荷"法則: 在多核處理中,你的系統(tǒng)均值不應(yīng)該高于處理器核心的總數(shù)量。
"核心的核心"法則: 核心分布在分別幾個(gè)單個(gè)物理處理中并不重要,其實(shí)兩顆四核的處理器 等于 四個(gè)雙核處理器 等于 八個(gè)單處理器。所以,它應(yīng)該有八個(gè)處理器內(nèi)核。
審視我們自己
讓我們?cè)賮?lái)看看 uptime 的輸出
~ $ uptime
23:05 up 14 days, 6:08, 7 users, load averages: 0.65 0.42 0.36
這是個(gè)雙核處理器,從結(jié)果也說(shuō)明有很多的空閑資源。實(shí)際情況是即便它的峰值會(huì)到 1.7,我也從來(lái)沒(méi)有考慮過(guò)它的負(fù)載問(wèn)題。
那么,怎么會(huì)有三個(gè)數(shù)字的確讓人困擾。我們知道,0.65、0.42、0.36 分別說(shuō)明上一分鐘、最后五分鐘以及最后十五分鐘的系統(tǒng)負(fù)載均值。那么這又帶來(lái)了一個(gè)問(wèn)題:
我們以哪個(gè)數(shù)字為準(zhǔn)?一分鐘?五分鐘?還是十五分鐘?
其實(shí)對(duì)于這些數(shù)字我們已經(jīng)談?wù)摿撕芏?,我認(rèn)為你應(yīng)該著眼于五分鐘或者十五分鐘的平均數(shù) 值。坦白講,如果前一分鐘的負(fù)載情況是 1.00,那么仍可以說(shuō)明認(rèn)定服務(wù)器情況還是正常的。 但是如果十五分鐘的數(shù)值仍然保持在 1.00,那么就值得注意了(根據(jù)我的經(jīng)驗(yàn),這時(shí)候你應(yīng) 該增加的處理器數(shù)量了)。
那么我如何得知我的系統(tǒng)裝備了多少核心的處理器?
在 Linux 下,可以使用
cat /proc/cpuinfo
獲取你系統(tǒng)上的每個(gè)處理器的信息。如果你只想得到數(shù)字,那么就使用下面的命令:
grep 'model name' /proc/cpuinfo | wc -l
Popularity: 11% [?]
關(guān)鍵詞標(biāo)簽:linux,average負(fù)載
相關(guān)閱讀
熱門文章 安裝紅帽子RedHat Linux9.0操作系統(tǒng)教程 Tomcat9.0如何安裝_Tomcat9.0環(huán)境變量配置方法 多種操作系統(tǒng)NTP客戶端配置 Linux操作系統(tǒng)修改IP
人氣排行 Linux下獲取CPUID、硬盤序列號(hào)與MAC地址 dmidecode命令查看內(nèi)存型號(hào) linux tc實(shí)現(xiàn)ip流量限制 安裝紅帽子RedHat Linux9.0操作系統(tǒng)教程 linux下解壓rar文件 lcx.exe、nc.exe、sc.exe入侵中的使用方法 Ubuntu linux 關(guān)機(jī)、重啟、注銷 命令 查看linux服務(wù)器硬盤IO讀寫負(fù)載