ヘルプ イントロダクション サーバー監視(エージェント ベース)

Site24x7サーバー監視(エージェント ベース)

本サービスは、クラウドからの、エージェント ベースのサーバー監視です。それぞれのサーバーに、軽量でインストールも容易なエージェントを、ダウンロード・設定してください。エージェントは、パフォーマンスメトリックを、Site24x7のデータコレクターに送信します。ユーザーは、ブラウザーでレポートを表示できます。

しくみ

Site24x7では、プライマリ データセンター(PDC)と、ディザスターリカバリデータセンター(DRDC)2つが別の地点に設定され、データセンターの障害の時も、監視サービスを継続サポートできるようにしています。

  • プライマリ データセンター: plus.site24x7.com
  • ディザスター リカバリ データセンター
    • プライマリ:plus2.site24x7.com
    • セカンダリ:plus3.site24x7.com  

PDCに問題があれば、まず、ハートビートチェックによる情報が、自動的にプライマリDRDCに送られます。これにより、断続的なネットワーク障害による誤報アラームを回避します。プライマリDRDCでの問題発生時は、セカンダリDRDCは監視の継続のため、ハートビート チェックの受信を続けます。サーバーが正常停止すると、エージェントはSite24x7に、サーバー停止を通知します。

エージェントをユーザー マシンにインストールすると、プライマリ データセンターへの通信が、一方向HTTPS接続で始まります。その際、ファイアウォールで開放すべきポートやドメインをご確認ください。 エージェントは通信に、おもに次の3つの手段を利用します。

  • 毎分のハートビート チェック
  • 5分ごとのデータ収集
  • 装置メッセージング システム(DMS) による30秒ごとの通信
ハートビート チェックとは

エージェントの「ハートビート チェック」は、エージェントはそのステータス情報をプライマリ データセンターに送信します。サーバー稼働時間は、Site24x7が、サーバー内のエージェントより、ハートビートを受信してからの期間で算出します。ハートビート チェックが3分連続で実行されない場合、「可用性ウォッチャー」はユーザーに、ネットワーク通信エラーやシステム クラッシュの可能性をアラートします。

デフォルトでは、エージェントは、ユーザーに通信エラーをアラートする前に、7分の待ち時間を設けます。待ち時間は、設定ページより 管理 > サーバー監視 > 設定 と移動して、変更できます。詳細はこちら

その他のデータセンター(AU、IN、CN、EU)の場合、エージェントがPDCに接続を行い、その接続に失敗すると、プライマリーDRDCに接続を行います。その他DCのドメインリストはこちら
1分間間隔のポーリングによるデータ収集:

サーバー監視エージェントは1分間隔でデータを収集し、5分間隔でSite24x7データセンターに統合します。しきい値違反が発生すると、即座にデータセンターに通信を行い、ユーザーにアラートを行います。さらにこのポーリング間隔は1分、5分、10分、15分、30分、1時間、3時間、6時間、12時間、1日から選択できます。

ネットワーク障害が発生すると、データはサーバにzipファイルで保存されます。接続が回復すると、エージェントがSite24x7データセンターにバックログを送信し、通信障害中のロスデータを回復させます。

装置メッセージング システム

Site24x7は装置メッセージング システムで、監視するサーバーへのリアルタイムな通信を行います。DMS(dms.zoho.com)への通信は、30秒ごとに行われます。エージェントはユーザー起動アクションを実行します。これには、プロセスの開始と停止、サービスやプロセスの検出、エージェントのアップグレード、根本原因分析のほか、ポート、URL、ファイル、ディレクトリ、イベントログ・syslogチェックなどの設定が該当します。 

サーバー監視のアーキテクチャ

障害レポートの前に、Site24x7は、「ネットワークサニティチェック(基礎動作確認)」をおこない、自分が属する内部ネットワークの可用性を調べます。これにより、ダウンしているのは監視対象そのものであり、自身の環境のネットワークではないことを確認します。詳細は、障害のシナリオとトラブルシュート手順を、参照ください。

サーバー監視エージェント:

それぞれのサーバーに、軽量でインストールも容易なエージェントを、ダウンロード・設定してください。それに伴い、エージェントのセキュリティ対策や、データ収集のしくみ、インストールの要件を一度ご確認ください。詳細は、 サーバー監視エージェントのしくみと、監視するサーバーへのリアルタイム通信の確保を参照ください。

サポートするOSと機能

OSと機能

サポートプラットフォームについてはこちらを参照してください。また、一括に100のサーバーにエージェントをインストールできる一括デプロイ機能も利用可能です。各プラットフォームで取得できるパフォーマンスメトリクスについてはこちらを参照してください。

Site24x7プラグイン

Site24x7プラグインは、DB、アプリケーション、Webサーバー、キャッシュ、メッセージ ブローカーを監視し、データの追跡を行う、優れた手段です。 MySQL、Redis、MongoDB、nginx、HAProxy、ZooKeeper、WordPress、Apache、ゾンビ プロセスなど、60以上の標準プラグインに対応しています。さらに、あらゆるNagiosプラグインがSite24x7で実行可能であるため、オープンソース コミュニティ(英語)でその詳細を確認できます。Linuxの場合は、 PythonかShell、Windowsの場合は、VBScript、PowerShell、バッチDLLによって、カスタム監視を自身で記載することも可能です。

レポート、ダッシュボード、IT自動化

全サーバーのダウンタイムのために詳細な根本原因分析レポートを受信し、単一ダッシュボードでサーバー環境全体を表示して、IT自動化ツールを用いて復旧措置を自動化します。