サーバの現在の負荷情報の表示方法


linuxサーバの負荷が大きすぎるかどうかを調べるには、どのような方法がありますか?
topコマンドによるサーバ負荷の表示
さらにLinuxサーバのパフォーマンスを分析する前に、LinuxシステムのLoad average負荷の知識を理解しておきます.負荷平均値はuptimeまたはtopコマンドで見ることができます.load average:0.15,0.14,0.11負荷平均値を理解する人が多いかもしれません.3つの数はそれぞれ異なる時間帯のシステム平均負荷(1分、5分、および15分)を表しています.それらの数字はもちろん小さいほどいいです.数字が高いほど、サーバの負荷が大きいことを示します.これは、サーバに何らかの問題が発生した信号でもある可能性があります.
1つのシングルコアプロセッサは、1つのシングルレーンにたとえることができます.前に車が待っていない場合は、後ろの運転手に通過するように伝えることができます.車が多い場合は、少し待つ必要があるかもしれないことを伝える必要があります.
そのため、現在の車の流れを表す特定の番号が必要です.例えば、0.00は現在の橋面に車の流れがないことを示します.実際、この状況は0.00と1.00の間と同じで、要するにスムーズで、過去の車両は少しも待たずに通過することができます.1.00はちょうどこの橋の受け範囲内であることを示しています.この状況は悪くないが、車の流れが渋滞しているだけだが、交通がますます遅くなる可能性がある.1.00を超えると、この橋は負荷を超え、交通渋滞が深刻であることを示しています.では、状況はどのくらい悪いですか.例えば2.00の場合、車の流れが橋の耐えられる倍を超えていることを示すと、橋の倍を越える余分な車両が待ち焦がれている.3.00だと状況はさらに悪化し、この橋は基本的に耐えられなくなり、橋の負荷の2倍以上の車両が待っていることを示しています.
上記の状況は、プロセッサの負荷状況と非常に似ています.1台の自動車のブリッジ時間は、プロセッサがスレッドを処理する実際の時間のようなものです.Unixシステムで定義されたプロセスの実行時間は、すべてのプロセッサカーネルの処理時間にスレッドがキュー内で待機する時間を加えます.
橋代を受け取った管理人と同じように、車が焦らずに待っていてほしいのは当然です.したがって、理想的な状態では、負荷平均値が1.00未満であることが望ましい.もちろん一部のピークは1.00を超えることは排除されませんが、これまでこの状態を維持していると、問題があることを示しています.この時、あなたは焦っているはずです.
「だから理想の負荷は1.00?」
うん、この状況は実は完全に正しいわけではない.負荷1.00は、システムに残りのリソースがないことを示します.実際には、経験のあるシステム管理者が0.70に線を引いています.
「調査法則が必要」:長期にわたってシステム負荷が0.70前後であれば、事態がさらに悪化する前に、その原因を理解するのに時間がかかります.
「これから法則を修復する」:1.00.サーバシステムの負荷が1.00を長期にわたってさまよっている場合は、すぐにこの問題を解決する必要があります.さもないと、夜中に上司から電話がかかってきます.これは楽しいことではありません.
「午前3時半に体を鍛える法則」:5.00.サーバーの負荷が5.00を超えると、睡眠を失い、会議で原因を説明しなければなりません.とにかく発生させないでください.
では、複数のプロセッサは?私の平均値は3.00ですが、システムは正常に動作しています.わあ、プロセッサを4つ持ってるの?では、その負荷平均値は3.00で正常です.マルチプロセッサシステムでは、負荷平均値はカーネルの数に基づいて決定されます.100%負荷で計算すると、1.00は単一のプロセッサを表し、2.00は2つのデュアルプロセッサがあることを示し、4.00はホストが4つのプロセッサを持っていることを示します.
私たちの上の車が橋を渡る比喩に戻ります.1.00「1車線の道」と言ったことがあります.では、単車線1.00の場合、この橋は車でいっぱいになっていることを示します.デュアルプロセッサシステムでは、負荷の2倍以上、つまり残りのシステムリソースの50%が残っていることを意味します.他の車線が通行できるためです.
したがって、シングルプロセッサはすでに負荷の場合、デュアルプロセッサの負荷が満額の場合は2.00であり、リソースの2倍を利用することができます.
 
上の図のtopコマンドから分かるように、Linuxサーバは5日間23時間20分稼働しており、load averageのデータを見ると、この高速バーLinuxディスクレスサーバは圧力ゼロとも言える、非常にスムーズに稼働している. 
方法2:iostat-x-k-tを入力する
説明:%util:I/O操作に使用される時間が1秒にどのくらいあるか、またはI/Oキューが空でない時間が1秒にどのくらいあるか.すなわちdelta(use)/s/1000(useの単位がミリ秒であるため)%utilが100%に近い場合、発生したI/O要求が多すぎて、I/Oシステムがフル負荷になっていることを示し、ディスクにボトルネックがある可能性がある.
方法3:
ゲームをプレイする場合は、hdparm–t/dev/ディスク名でディスクのパフォーマンスが基準に達しているかどうかをテストできます.下図は、単一の希捷1 Tのディスクテストの結果です.sdはハードディスクがSATA、SCSIまたはSAS、aはシリアルポートの最初のハードディスクを表しています.
この文書は次のとおりです.http://www.flybaaa.com/help/69_1.html
今までtopを通して数字の1ボタンを押して、調べたcpuの個数はサーバーの物理cpuの個数だと思っていましたが、今日サーバーのハードウェア構成リストを見てみると、サーバーの物理cpuの個数が4つであることがわかりました.私は不思議です.この機械は私の影響が深くて、48だったのに、その時top 1でcpuの情報を見て「Sorry,terminal is not big enough」とヒントを与えました.当初サーバは32個しか認識できなかったと思います.やはりカーネルを再コンパイルしてできました.その後、クエリーを経てもそうではありませんでしたが、top 1は論理cpuの数を見て、すぐに覚えています.LinuxサーバのCPU詳細を見てLinuxサーバのCPU状況を判断する根拠は、同じcore idを持つCPUが同じcoreのハイパースレッドであることである.(Any cpu with the same core id are hyperthreads in the same core.) 同じphysical idを持つCPUは、同じCPUパッケージのスレッドまたはコアである.(Any cpu with the same physical id are threads or cores in the same physical socket.) 次に例を挙げて説明する.物理CPUの個数は以下の通りである.
[[email protected] ~]# cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
4

各物理CPUにおけるcoreの個数(すなわちコア数)は以下の通りである.
[[email protected] ~]# cat /proc/cpuinfo| grep "cpu cores"| uniq
cpu cores       : 12

論理CPUの個数は以下の通りである.
[email protected] ~]#cat /proc/cpuinfo| grep "processor"| wc -l
48

物理CPU個数×コア数は論理CPUの
Dbabc.Net [http://dbabc.net]本リンク:http://dbabc.net/archives/2012/02/13/linux-cpu-info-count.shtml