根本原因分析(RCA)レポート:

Site24x7では、障害検知のたびに、根本原因分析レポート(RCA)が起動し、連絡先と手段に応じ、ユーザーにアラートを送ります。WindowsやLinuxのサーバー監視では、RCAは障害背後の実際の原因を明らかにし、接続の問題を分析するためトレース結果を提供します。

WindowsとLinuxでの、RCAレポート項目の違いについては、下記を参照ください。

Windows ServerむけRCA:

Windows Serverの障害時にRCAレポートに含まれる基礎項目は、次の通りです。

  1. 監視情報:監視の名称とタイプ、IPアドレス、ホスト名、障害継続時間など、ベーシック監視情報が表示されます。
  2. CPU利用のTopプロセス(直近5分平均も併記):CPU利用量がトップのプロセスをグラフで表示します。別途、直近5分においてCPU利用量がトップのプロセス グラフも表示されます。
  3. メモリ利用のTopプロセス(直近5分平均も併記):メモリ利用量がトップのプロセスをグラフで表示します。別途、直近5分においてメモリ利用量がトップのプロセス グラフも表示されます。
  4. ディスク情報:すべてのディスクをリストアップし、それぞれ、総容量と空き容量も示します。
  5. ハードディスクのステータス:ハードディスクのサイズ、直前のステータス、エラーがあればそのステータスを表示します。
  6. traceroute:traceroute分析をRCAに組み込むには、plus.site24x7.comへの接続をファイアウォールで許可してください。接続エラーの背後にある本当の問題を掘り下げて分析し、是正措置をとることが可能となります。
  7. イベントログ:イベントログのタイプ(警告、エラー、監査失敗、重大)、その説明、書き込み時間、書き込み元が記載されます。
  8. CPUファンのステータス:CPUファンの最新ステータスです。
  9. ログイン ユーザー:当該サーバーでのアクティブ ユーザー数です。
  10. 過去30日のソフトウェア インストール:該当するソフトウェアを表形式で提示します。

LinuxサーバーむけRCA:

Linuxサーバーの障害時にRCAレポートに含まれる基礎項目は、次の通りです。

  1. 監視情報:監視名、IPアドレス、ホスト名、障害の理由、障害継続時間など、ベーシック監視の情報が、表示されます。
  2. CPU利用のTopプロセス(直近5分平均も併記): CPU利用がトップのプロセスをグラフ表示します。別途、直近5分においてCPU利用量がトップのプロセス グラフも表示されます。
  3. メモリ利用のTopプロセス(直近5分平均も併記):メモリ利用量がトップのプロセスをグラフで表示します。別途、直近5分においてメモリ利用量がトップのプロセス グラフも表示されます。
  4. CPU利用状況:読み込みデータ比率(%)、コンテキスト スイッチのペース(件数/秒)、割り込みのペース(件数/秒)が表示されます。
  5. ディスク利用状況:すべてのディスクをリストアップし、それぞれ、総容量と空き容量も示します。
  6. メモリ統計:メモリ メトリックを提示します。総メモリ、使用済みメモリ、空きメモリ、空きバッファー、使用済みバッファ、空き仮想メモリ、使用済み仮想メモリなどが表示の対象です。
  7. ネットワーク情報:送受信パケット、ネット接続のステータス、送受信トラフィック量が表示されます。
  8. traceroute::traceroute分析をRCAに組み込むには、plus.site24x7.comへの接続をファイアウォールで許可してください。接続エラーの背後にある本当の問題を掘り下げて分析し、是正措置をとることが可能となります
  9. ユーザー セッション:サーバーでのアクティブ ユーザー数です。
  10. ディスク エラー:カーネルからのディスク エラーです。I/Oとファイルシステムのエラーの双方を含みます。
  11. ドライバー メッセージ:カーネルからのエラー メッセージが表示されます。
  12. syslog:syslogのプロセスID、エラー メッセージ、時刻(成形済み)、重要度を示します。

関連記事: