AWS Health監視連携

AWS Health、AWSリソース、サービス、アカウントのステータスについての情報をリアルタイムで取得します。AWSリソースに影響のあるリソースパフォーマンスや可用性を通知し、修正に関するアドバイスを提供します。AWS Health監視で、AWSリソースの正常性の変化、スケジュールメンテナンスイベント、障害が発生した際ににアラートします。これにより、よりサービス状況の可視化とトラブルシュートのガイダンスを行います。

目次

ユースケース

  • AWS Healthは他のAWSサービスに代わってイベントを作成します。このイベントでアカウントに影響を及ぼす変更について通知します。例として、AWS HealthはIdentity and Access Management (IAM)で管理ポリシーの非推奨や、AWS設定で管理ルールの非推奨を計画している場合にイベントを作成します。この場合、Site24x7とアカウントが連携していると、その特定のイベントのアラートを受信します。イベントに応じて必要なアクションを行えます。
  • AWS HealthはAWSリージョン内のサービス可用性問題があった際にもイベントを作成します。Site24x7と連携されている場合、そのイベントのアラート通知を受信します。イベントについて確認し問題を把握でき、影響のあったリソースを特定することで、必要なアクションに移ることができます。

Site24x7とAWS Healthの連携の利点

Site24x7とAWS Healthを連携して、単一のプラットフォームで表示を行い、AWSリソースに影響を与えているイベントと問題を特定します。

この連携により次のことを行えます。

  • AWSサービスとアカウントをクリアに分析します。
  • 可用性の監視と、リージョン、サービス、イベントタイプといったカテゴリごとの正常性イベント数を把握します。
  • 正常性イベントがどのようにAWSリソースに影響しているかを分析し、それらを管理します。
  • アドバンス設定で、正常性イベントの通知を行います。
  • しきい値を設定して、影響の合ったリソースのアラートを受信します。

設定

  1. AWSとSite24x7アカウント間のクロスアカウントIAMロールを作成して、AWSリソースへのアクセスを有効にしてください。詳細はこちら
  2. AWSアカウント連携ページで、ディスカバリーサービス項目のAWS Healthが有効になっていることを確認してください。詳細はこちら

ポリシーと権限

AWSリソースの正常性監視にSite24x7で必要な次の権限が付与されているかを確認してください。

  • "health:DescribeAffectedEntities"
  • "health:DescribeEventAggregates"
  • "health:DescribeEventDetails"
  • "health:DescribeEvents"
  • AWS Account with Business, Enterprise On-Ramp, or Enterprise Support plan

ポーリング間隔

AWS Health監視のメトリックデータはデフォルトで5分ごとに収集されます。

サポートしているAWS Healthメトリック

リージョン、サービス、イベントタイプレベルで、次のメトリックが収集されます。メトリックの可用性はイベントカテゴリごとでも同様です。例として、問題イベント監視では今後のイベントメトリックは対応していません。

メトリック名 説明 単位
オープンイベント オープンステータスの正常性イベント数です。
今後のイベント 今後ステータスの正常性イベント数
クローズイベント クローズステータスの正常性イベント数です。
イベント合計 取得されたイベントの合計数です。

しきい値設定

管理 > 設定プロファイル > しきい値と可用性 (+)の順に移動し、監視タイプにAWS Healthを選択します。表示されている全てのメトリックにしきい値を設定でき、パブリックイベントの通知およびアカウントイベントの通知オプションを切り換えて、通知を受け取るよう設定します。

AWS Healthの表示

AWSリソースの正常性を表示するには、Site24x7にログインして、Cloud > AWS > AWS Healthの順に移動します。

Site24x7との連携で、次の3監視を提供しており、AWSリソースに影響があるイベントや問題を表示し特定します。

  • アカウント通知:証明書ローテーション、請求通知、セキュリティ脆弱性といったアカウント通知の正常性イベントを監視します。
  • 問題:問題により監視された問題カテゴリーの正常性イベントです。このカテゴリーの共通のイベントにはサービス機能低下を引き起こす操作問題についての通信や、ローカライズされたリソースレベルので問題が含まれます。
  • スケジュール変更:スケジュール変更カテゴリーの全正常性イベントを監視します。このイベントでサービスやリソースへの今後の変更についての情報を把握します。

AWS Healthデータ

次のタブでAWSリソースの正常性データを表示できます。

サマリー

サマリータブで、イベントのイベントチャートの概要をステータスごとに表示します。ここで、イベントタイプ、オープンイベント、今後のイベント、発生イベントの合計を表示できます。例として、1つのAWSリソースで、正常性イベントが発生したとします。この変更により問題上のオープンイベント数が、更新されます。

実行中のイベント

実行中のイベントタブで、現在のイベントについて表示します。AWSリソースに影響を与えているオープンイベントと今後のイベントが記載されます。

監視している影響リソース

このタブでは、影響のある監視リソースをすべて表示します。例として、正常性イベントで影響があるEC2インスタンス監視が、Site24x7でも監視されている場合、このタブにそのEC2インスタンス監視が表示されます。

リージョン

このタブで、イベントが発生したAWSリソースのリージョン情報を表示します。

サービス

このタブで、イベントで影響のあったAWSサービス情報を表示します。

イベント履歴

このタブで過去に発生したイベントの履歴を表示します。

Top