オートメーションプロファイルを事前に作成しておけば、考えられる問題に先んじて対応できます。インフラからの既知の反応や、アプリケーションのロジックが起こしうる現象に、備えることが可能です。
インフラや負荷の監視と、ITオートメーションの併用で、手作業での連絡なしに、事象への対応・解決が可能となります。
フェールセーフの実現には、複数のオートメーションプロファイルを、別のきっかけで起動するようマッピングのうえ、Site24x7のアラート作戦へとつなぎこんでください。たとえば、スクリプト実行か、サービス再起動のどちらかに失敗すると、システム全体をリブートするよう、ワークフローを定義できます。
サーバー負荷を監視し、自動アクションを編成することで、アラート、インシデント、事象のへの自動対応が可能となります。
Site24x7の利用で、繰り返しの多いタスクを自動化し、しきい値違反の対応を、中央制御できるようになります。Site24x7のアラームエンジンは、しきい値設やアラート作戦を設定したシステムイベントとメトリックを動的に吟味し、違反の発生時は指定アクションを自動実行します。また、通知は複数の手段で行います。
障害を減らし、自動的にトラブルシュート、MTTR(障害修復時間)の短縮が可能です。
利用率の低いEC2やRDSのインスタンスを特定し、停止すれば、コストの削減になります。EC2の不具合アラートには、リブート、Lamnda関数の実行、カスタムメッセージのSNSトピックへの送出などで、対応できます。
Site24x7のカスタムサーバースクリプト機能では、条件判断のロジックを加え、一連のアクションをワークフローにできます。これにより、複雑なシステムプロセスを、条件判断しながら、次々と自動実行することが可能です。
ディスク容量の開放、暴走プロセスの停止、ログローテーションの自動化、クラッシュ時のプロセス再起動などを、サーバーコマンドで実行。ファイル名などのデータを、引数として渡すことも可能です。
Windowsサービスの停止や失敗があれば、自動的にサービスの回復がかかります。応答のないサービスは、停止・起動・リブートができるほか、バックアップ機を用意してサービスの完全停止をすることも可能です。
それぞれのサイトやアプリケーションプールの起動・停止で、障害のあるIISサイトを復旧させたり、仮想リソースの買いすぎを防いだり、サーバーインスタンスをリブートしたりできます。
Webhookを利用すれば、Site24x7とユーザー利用アプリ間で、ワークフローを自動化できます。HTTP post要求メッセージで、URLへデフォルトのインシデントパラメーターを送ることも、ペイロードをカスタマイズすることも可能です。
オートメーションを実行し、Site24x7コンソールで、進捗を確認できます。
複数のサーバーインスタンスで、多数のアクションを同時実行可能です。
オートメーション実行に成功すれば、メールが届きます。
監視対象や特徴 | サポート |
---|---|
Windows、Linux、FreeBSD、OS X Server | |
AWS、Hyper-V、VMware | |
50以上のオープンソースのアプリケーションサービス | |
WindowsサービスとLinuxプロセス | |
AD、IIS, SQL、Exchange、フェールオーバークラスター | |
1000を超えるネットワーク装置テンプレート | |
SMS、メール、音声アラート | |
Slack、HipChat、PagerDutyなどと連携 |