ヘルプ サーバー メトリック Linuxサーバー監視
Linuxサーバー監視では、LinuxサーバーのCPU、メモリ、ディスク利用状況、プロセス、ネットワーク トラフィックなどの重要メトリックの監視が、統一ダッシュボードで可能です。Linuxサーバーのパフォーマンス関連レポートをすべて表示するには、ホームページへ移動し、設定したLinuxサーバーをクリックしてください。
各種のレポートは、次のタブへ移動し、表示します。
Linuxパフォーマンスの重要パラメーターすべてが、1つのコンソールで把握できます。ヒートマップ分析では、サーバーの直近7日の、ステータスとパフォーマンスが、手早く確認できます。サーバーが利用しているCPU、メモリ、ディスクなどの、重要サーバー メトリックをご確認ください。
詳細ページに表示されたメトリックをクリックすれば、それぞれの説明が詳しく表示され、包括的な関連レポートを見ることが可能です。アイコンをクリックすると、CPU、メモリ、ディスク利用状況などのパフォーマンス レポートが表示されます。ドロップダウンから値を適宜、選択し、期間を指定しての、レポート作成も可能です。レポートは、CSV/PDFにエクスポートすることも、メールで送ることも可能です。
平均負荷は、特定期間における平均システム負荷です。平均負荷のデータは、物理CPUが過負荷であるか、負荷が軽すぎるかの判断に利用できます。過負荷であれば、リソースを無駄にしているプロセスを検討したり、ハードウェア リソースを増強したり、負荷を他のシステムに動かしたりの対策が取れます。
システム過負荷を避けるには、利用状況の確認が必要なこともあります。アイドル時間が長い場合、サーバーの過負荷が考えられ、サーバー内のリソース分配が最適ではない可能性があります。
CPU利用量の定期監視は、指定期間でのCPU負荷の分析や、パフォーマンス低下の克服には重要です。
とはいえ、CPU利用量の増大は、いつでも重大事態とは言えません。Site24x7の期間を区切ってカスタム レポートを表示する機能は、CPU利用状況が、現実の問題かを判定する際、有用です。CPU利用のスパイク(突出値)を起こしている実際の理由まで、ドリルダウンするのにも役立ちます。この分析にもとづき、CPUハードのアップグレード、CPU追加、リソースを無駄に追い回す些末なサービスの停止など、解決策を見つけることができます。
CPU利用状況は、topコマンドを利用し計算します。詳細はこちら。
CPU利用状況=100-アイドル時間 |
CPU利用時間のパフォーマンス レポートは、アイコンをクリックすると利用でき、次のメトリックが表示されます。
Linuxサーバーでの、実行中プロセスとブロックされたプロセスを、手早く確認するのに利用できます。それぞれのアプリケーションや各種サービスに関連する、プロセスごとのパフォーマンスを把握することは、Linuxサーバーへの負荷発生原因を理解するうえで重要です。
メモリ利用量の監視により、利用率の低いサーバーを特定し、効率的な負荷の再配分が可能となります。これによって、障害やデータ損失の発生前に、 サーバー過負荷を検知します。
メモリ利用量は、freeコマンドを利用して計算します。詳細はこちら。
メモリ利用率={(総量ー空き容量)÷総量}×100 |
メモリ利用量の パフォーマンス レポートは、アイコンをクリックすると利用でき、次のメトリックが表示されます。
サーバー内の、空きメモリとスワップメモリの内訳けも把握できます。あまり利用されないファイルは、必要時まで、スワップへ移動されることがあり、新しいファイルはRAMへと格納されます。これによって、リソース配分を改善、サーバーの過負荷とデータ損失を回避できます。
Site24x7 Linuxサーバー監視では、ディスク利用量を注視しており、サーバー内のディスク空き容量について、情報更新を行います。サーバーの空きディスク容量と利用済み容量は、円グラフで表示します。
ディスク パーティション情報では、使用済み容量と空き容量の内訳けを、データ量(MB)と割合(%)で表示します。アクションからアイコンをクリックすると、しきい値は、ディスクごとの設定も、ディスク全体での設定も可能です。
ディスク利用状況のパフォーマンス レポートでは、次のメトリックを表示します。
サーバーで動作している、Dockerなどのアプリケーションは、Linuxエージェントが自動検出し、ここに表示されます。サーバーで実行中のプロセスにもとづきエージェントは該当するプラグインを選択、推奨プラグインで表示して、監視を容易なものにします。
サーバーのステータス(ダウンやトラブル)、その継続時間、詳細情報、根本原因分析 (RCA)は表形式で提示されます。
Linuxサーバーで動作しているプロセスの監視を始めます。Linuxサーバーで稼働中のプロセスが見つからない場合は、プロセスのディスカバリを利用し、マニュアルで追加してください。
詳細は、プロセス監視で実行できるメトリックとアクションの見つけ方を参照ください。
プロセスごとのしきい値は、下記のように、セットできます。詳細はこちらです。
ネットワーク統計では、次の情報を表示します。
入出力トラフィック アイコンのそれぞれをクリックすると、属性レポートを作成できます。次の追加メトリックをレポートから算出可能です。
プラグインを利用すれば、ニーズにあわせ、監視データをテーラーメイドにできます。
Site24x7の50以上のプラグイン連携を利用すれば、MySQL、Redis、MongoDB、nginx、HAProxy、ZooKeeper、WordPress、Apache、ゾンビ プロセスなどを含め、インフラ全体を把握できます。さらに、当社はNagiosをサポートしており、あらゆるNagiosプラグインがSite24x7で実行可能で、オープンソース コミュニティ(英語)の活力を共有できます。
Site24x7のオープンなエコシステムでは、カスタム プラグインをPythonやShellスクリプトで作成でき、必要データを、希望の方法で監視できます。
パラメーター | 説明 |
ステータス | プラグインが利用可能な状態か、ダウンしているかを示します。 |
バージョン | これは必須項目で、プラグインのバージョン番号を表します。ユーザーが、属性を追加・修正・削除するには、プラグイン バージョンを変更してから、新規テンプレートを作成してください。プラグインのバージョン変更が必要となるケースも確認ください。 |
テンプレート名 | 監視する属性リストを掌握する、プラグイン テンプレートに、名前をつけてください。テンプレート設定方法は、プラグイン テンプレートを参照ください。 |
属性 | 当該プラグインにリストアップされた属性の総数をさします。 |
パフォーマンス分析 | プラグイン テンプレートの設定の間に、ここにリストアップする属性を決めてください。詳細はこちらです。 |
アクション | プラグイン監視の編集・削除ができます。 |
インストール・削除のステータスや、発生しうるエラー メッセージを知れば、アカウントに追加したプラグインごとのトラブルシュート方法が分かります。この情報は、プラグインのフォルダー構造に変更があった場合のみ更新されます。
プラグインの再登録を利用すれば、サーバーに追加したプラグインのリロードが可能です。それぞれのプラグインからのメッセージにもとづき、次の作業のアクションを呼び出し、次の手順へ進んでください。
サーバーで稼働中のプロセスにもとづき、エージェントは該当するプラグインを選択、ここへのリストアップによって、プラグイン監視をアカウントに容易に追加できるようにします。
ファイル、ディレクトリ、syslogなど、Linuxサーバー上のリソースを監視します。監視リソースをチェックとして追加し、ことなるチェックをグループにまとめて、リソース チェック プロファイルを作成することが可能。1つのリソース チェック プロファイルを、複数のサーバー監視に関連付けることもできます。
Linux syslogでは、十分な量のデータを、グラフにします。情報には、障害、パフォーマンス低下、セキュリティ侵害が含まれます。プログラム メッセージのログとプロセス重要度の詳細メトリックは、外挿法でsyslogグラフから算出できます。
ユーザーは、キーワードを指定し、syslogでの出現状況を確認できます。ログは、IDと送信元でフィルターし、予期せぬ挙動があれば、即時アラートできます。
各種アクションの管理、タスクの実行を、サーバー ツール1つで、すべて容易に実行できます。
プロセスは、画面トップの検索バーから検索可能です。プロセスにマウスカーソルをあてると、次の項目を表示します。
必要なパフォーマンス メトリックを、望みの方法で、監視・分析できます。このビューは、各ユーザー アカウントで、すべてのサーバー監視のタブとして利用できます。
カスタム ビューの追加手順:
障害検知のたびに、根本原因分析レポート(RCA)が起動し、連絡先と手段に応じて、ユーザーにアラートを送ります。作成されたLinuxサーバー監視のRCAは、接続の問題を分析するためのトレースルート マップとあわせ、障害の背後にある実際の理由を提示します。
Linuxサーバー監視1つで取得できるメトリックについて、詳細はこちらを参照ください。