CPU監視とは
CPU監視とは、主にサーバー管理者が、運用しているサーバーのCPU使用率の異常をリアルタイムに把握する作業です。
クラウド型監視サービス「Site24x7(サイトトゥエンティーフォーセブン)」の場合、サーバー監視機能を利用することでCPU監視を簡単に実現できます。上のスクリーンショットはLinuxサーバーのCPU監視画面です。画面上部の「メモリ」タブ、「ディスク」タブをクリックすると同様にそれらの統計データに簡単にアクセスできます。
また、デフォルトでしきい値が設定されており、しきい値を超えるとユーザーにメール通知が届きます。そのため、監視設定や通知設定をすることなく、CPU監視を始めることができます。
CPU使用率の監視手順
ここからはSite24x7でCPU使用率の監視と通知の設定までの具体的な方法を紹介します。障害が発生した時の通知方法は一般的なメールで行う事にします。必要なものは、監視対象のサーバーとメールアドレス、電話番号のみです。実際にやっていただくと本当に5分で開始できることをご理解いただけると思いますのでお試しください。
ステップ1:サインアップ
このページの右上にある「サインアップ」をクリックし、4つの項目を入力するだけでアカウントを作成できます。クレジットカード情報などは必要ないので安心です。
サインアップすると次の画面が表示されます。CPU監視をするために「サーバー監視」をクリックします。
ステップ2:エージェントのインストール
次に、監視対象サーバーにエージェントをインストールします。Windows編とLinux編、それぞれの手順を紹介します。
Windows編
Windowsの手順は次のリンクでわかりやすく説明されているのでそちらをご確認ください。
Windows監視を5分で始める方法:
https://www.site24x7.jp/simple-server-monitoring.html
Linux編
「Linux」をクリックします。
Linux上で実行するコマンドが表示されますので「クリップボードへコピー」をクリックします。
Linuxサーバーに接続します。ここではAmazon Linux2を例に紹介します。
コピーしたコマンドを実行します。wgetなどインターネット接続出来ていることが前提となりますので、オンプレミス環境などの場合は作業前に確認が必要です。
シェルを実行します。
successfullyと表示されたら完了です。エージェントのインストールも数分で完了できます。
しばらく経つとSite24x7の管理画面上に監視対象サーバーの情報が表示されます。次の画面では、LinuxサーバーとWindowsサーバー、計2台が表示されています。
これだけで、デフォルト設定のCPU監視を開始することができます。
ステップ3:CPU監視設定の確認
次に、CPU監視設定について、デフォルトで設定されている内容を確認しておきます。必要に応じて変更しましょう。
「管理」→「設定プロファイル」→「しきい値と可用性」→「Default Threshold – SERVER」をクリックします(サーバー毎に分けたい場合は自身でプロファイルを作成できます)。
CPU使用率、メモリ使用率、ディスク使用率のしきい値が設定されています。CPU使用率の場合、デフォルトでは65%を超えるとトラブルとして通知、90%を超えるとクリティカルとして通知してくれます。
運用していく中で、より最適な数値を見い出すことができれば、この画面から簡単に変更できます。
実際にCPU使用率がしきい値を超えると、ポータル上では次のようにアラートとして表示されます。
ステップ4:通知設定の確認
最後に、通知設定についても、デフォルトで設定されている内容を確認します。こちらも設定変更は簡単です。
Site24x7はクラウドサービスのため、アカウント作成時のメールアドレスに障害の通知が飛ぶように設定されています。もちろんメールサーバーなどの用意は必要ありません。
「管理」→「ユーザーとアラートの管理」→「ユーザー&アラート」をクリックすると自身のアカウントが登録されていますのでクリックします。
自身のアカウントのメールアドレスや権限、どのグループに所属しているかを確認できます。「アラート設定」でメールによるアラートが設定されていることが分かります。
アラート期間やアラートをしない曜日、メールをHTMLかテキストで受け取るかなども選択できます。
ユーザーグループとは「ユーザーアラートグループ」と紐づいており、デフォルトではアプリケーションチーム、ネットワークチーム、管理グループというグループがあります。自分自身はすべてのグループに登録されています。運用に沿って必要なだけアカウントを作成し、グループにユーザーを追加したり、新たなグループを追加することができます。
エージェントをインストールしたサーバーは管理グループに紐づいています。「ホーム」→「監視」から対象のサーバーの右端にあるメニューアイコンから「編集」をクリックしてそれを確認できます。
ユーザーアラートグループが「管理グループ」に設定されていることがわかります。WindowsもLinuxもデフォルトは同じです。
障害発生時は、Site24x7の監視画面にアラートとして表示されます。
メール通知は次のような内容で届きます。何が起こっているかもメールの内容で把握できます。
グラフ表示や該当プロセスなどデフォルト設定のままで知りたい情報が送られて来ていることがわかります。
次のメールは復旧メールです。緑色で正常であることが直感的に伝わります。
次の例は、Windowsサーバーがダウンしたケースです。ダウンは最もクリティカルなので赤色となります。
ここまで、Site24x7でCPUを監視する方法をご紹介しました。このように簡単にCPU監視が出来るSite24x7。是非、みなさんもお試しください。
参考情報
OSの標準機能でCPU使用率を確認する方法
LinuxとWindowsのそれぞれのサーバーでCPU使用率を確認できます。ここではその概要を紹介します。
LinuxでCPU使用率を確認する方法
利用するディストリビューションにもよりますがGNU/Linuxでは基本的にvmstat、top、free、dfなどのコマンドが用意されています。各種リソースの使用率の他、ファイルシステムの容量や使用率の高いプロセスの特定など選択肢は豊富です。
自身でシェルを作成したり、cron処理で目当ての監視項目に作成したシェルを実行させる事も可能です。OSSなので有志が作成しているパッケージサービス(Cactiなどリポジトリにある)もあります。
出来ることは多く、一般的な事は全て実現できますが、OSSについての理解と向き合う根気が必要です。
例えば、Amazon Linux 2のtopコマンドを実行した画面が以下です。メモリやディスクの使用率やプロセスなどが分かります。
WindowsでCPU使用率を確認する方法
Windowsでは標準でタスクマネージャーがあります。画面を開けば現在の使用率がリアルタイムで表示され、異常があれば一目で把握できます。
しかし常に目視している訳にもいきませんのでWindows Serverには自動的にリソース状況が取得できるパフォーマンスモニターが用意されています。これはリソースの値を取得する間隔や、ログの書き出し方法など細かな設定ができ、条件をつけてバッチなどの実行も可能です。
しきい値を設定して値を超えた際にメールを送る(バッチなどで実現)という基本的な監視も行えますが、設定にはOSに関するバッチや運用の知識が必要です。
次の画面はWinSrv2016でのパフォーマンスモニターです。プロセス毎のCPU使用率など取得できます。
ご覧いただいてわかる通り、これらの方法はあくまでも「確認」です。異常や問題があった際に直ちに把握しようとする「監視」としては不十分であることがわかります。そのため、多くの担当者がCPU監視を効率化できるSite24x7のようなツールを導入しています。
是非この機会に、無料かつ5分で始められるSaaS型監視ツール「Site24x7」をお試しください。