Amazon EC2監視連携

Amazon Elastic Compute Cloud(EC2)は、サイズ変更可能なコンピューティングキャパシティーを提供するサービスであり、クラウド内でビジネスアプリケーションの実行およびスケールアップを可能にします。
Site24x7の監視機能では、ハイパーバイザーレベル(CloudWatch)とシステムレベル(エージェント)の両方でEC2サーバーインスタンスの監視ができます。


概要

Site24x7の、Elastic Compute Cloud(EC2)インスタンスでは、以下の2つの監視モードをサポートしています:


CloudWatch EC2連携

設定手順

  • Site24x7をIAMユーザーとして作成するか、AWSアカウントとSite24x7のAWSアカウント間にクロスIAMロールを作成し、AWSリソースへのアクセスを有効にします。
    詳細はこちらのページをご確認ください。
  • AWSアカウント連携ページのディスカバリーサービス項目で、[EC2インスタンス]のチェックボックスが選択されていることを確認します。
    詳細はこちらのページをご確認ください。
起動状態のインスタンスのみディスカバリーされます。

ポリシーと権限

Site24x7 IAMエンティティに割り当てられたポリシーに、以下の読み取りレベルアクションが存在することを確認します。
詳細はこちらのページをご確認ください。

  • "ec2:DescribeAddresses",
  • "ec2:DescribeInstances",
  • "ec2:DescribeSnapshotAttribute",
  • "ec2:DescribeInstanceAttribute",
  • "ec2:DescribeSnapshots",
  • "ec2:DescribeInstanceCreditSpecifications",
  • "ec2:GetConsoleOutput",
  • "ec2:DescribeImages",
  • "ec2:DescribeVolumeStatus",
  • "ec2:DescribeAvailabilityZones",
  • "ec2:DescribeVolumes",
  • "ec2:DescribeAccountAttributes",
  • "ec2:DescribeElasticGpus",
  • "ec2:DescribeInstanceStatus",
  • "ec2:DescribeVpcs",
  • "ec2:DescribeFlowLogs",
  • "ec2:DescribeNatGateways",
  • "ec2:DescribeSubnets",
  • "ec2:DescribeVpcEndpoints",
  • "ec2:DescribeVpnConnections",
  • "ec2:DescribeVpcPeeringConnections",
  • "ec2:DescribeRouteTables",
  • "ec2:DescribeNetworkAcls",
  • "autoscaling:DescribeAutoScalingInstances",
  • "autoscaling:DescribeAutoScalingGroups"

予約容量監視ポリシー

  • "ec2:DescribeAddresses",
  • "ec2:DescribeCapacityReservations",
  • "ec2:DescribeInstances",
  • "ec2:GetCapacityReservationUsage"

ポーリング間隔

  • EC2メトリックデータは設定されているポーリング頻度に応じて収集されます。
    詳細はこちらのページをご確認ください。

IT自動化

AWS監視ではIT自動化機能を追加できます。
Site24x7にログインし、[管理]→[IT自動化テンプレート]→[自動化テンプレートの追加]の順にアクセスします。自動化が追加されると、それらをスケジュールして実行することができます。

そうすることでhibernateを用いた停止や、EC2インスタンスの起動、停止、再起動をAmazon EC2自動化を用いて行うことができます。


Security Findings

Amazon InspectorとEC2を単一コンソールで連携することで、サイバー攻撃に対してEC2インスタンスを強化できます。Inspector findingsは重要度によってグループ化されています。
group by機能を使用すると、重大度のカテゴリを並べ替えて、対応するルールパッケージ名とコメント(存在する場合)を一覧表示できます。

さらにしきい値設定を追加することで、次のようにしきい値を設定して通知を行うことができます。

  • Security findingsの重要度のhigh、low、medium、informationalや、Inspectorの合計数
  • GPUメモリ使用率、acceleratorメモリ使用率、accelerator使用率

CloudWatch EC2連携

サポートしているパフォーマンスメトリック

CPUクレジットメトリック

属性 詳細 統計 データタイプ
CPUクレジット使用率 インスタンスで消費したCPUクレジット数です。 平均
CPUクレジットバランス インスタンスで発生した獲得CPUクレジット数です。 平均
CPU余剰クレジットバランス T2 Unlimitedインスタンスで消費した余剰クレジット数です。 平均
請求余剰CPUクレジット 獲得CPUクレジットによる支払いがない、消費された余剰クレジットの数です。 平均

リソース使用量メトリック

属性 詳細 統計 データタイプ
CPU使用率 インスタンスで現在使用している、割り当て済みCPUユニットの割合です。 平均 パーセント
ディスク読み取りOPS すべてのインスタンスボリュームで完了した読み込み操作の数です。 平均
ディスク書き込みOPS すべてのインスタンスボリュームで完了した書き込み操作の数です。 平均
ディスク読み取りバイト すべてのインスタンスストアボリュームから読み込まれたバイト数です。 平均 バイト
ディスク書き込みバイト すべてのインスタンスストアボリュームに書き込まれたバイト数です。 平均 バイト
入力ネットワーク すべてのネットワークインターフェイスで受信したバイト数です。 平均
出力ネットワーク すべてのネットワークインターフェイスから送信されたバイト数です。 平均
入力ネットワークパケット すべてのネットワークインターフェイスで受信したパケット数です。 平均
出力ネットワークパケット すべてのネットワークインターフェイスから送信されたパケット数です。 平均
トークンなしメタデータ インスタンスメタデータサービスがトークンを使用しないメソッドでアクセスされた回数です。 合計

NitroベースインスタンスのEBSメトリック

属性 説明 統計 データタイプ
EBS読み取りOPS インスタンスにアタッチされている全EBSボリュームで完了した読み取り操作です。 平均
EBS書き込みOPS インスタンスにアタッチされている全EBSボリュームで完了した書き込み操作です。 平均
EBS読み取りバイト インスタンスにアタッチされているRBSボリュームから読み取られたバイトです。 平均 MB
EBS書き込みバイト インスタンスにアタッチされているRBSボリュームから読み取られたバイトです。 平均 MB
EBS IOバランスパーセント バーストバケットで保持されているI/Oクレジットのパーセンテージについての情報が表示されます。 平均 パーセンテージ
EBSバイトバランスパーセント バーストバケットで保持されているスループットクレジットのパーセンテージについての情報が表示されます。 平均 パーセンテージ

Acceleratorメトリック

Elastic Inferenceメトリック

Amazon Elastic Inference(EI)は、Amazon EC2インスタンスにアタッチすることで、ディープラーニング(DL)推論ワークロードの加速を可能にするリソースです。EC2インスタンスに接続されているElastic Inferenceの、接続性とパフォーマンスを監視します。

属性 詳細 統計 データタイプ
Accelerator正常性チェック Elastic Inference Acceleratorがステータスチェックに成功したかどうかを報告します。値が0の場合は、ステータスチェックの失敗を示します。値が1の場合は、ステータスチェックに成功したことを示します。 最小
Accelerator接続チェック Elastic Inference Acceleratorへの接続がアクティブか失敗かを報告します。値が0の場合は、接続の失敗を示します。値が1の場合は、接続が正常に完了したことを示します。 最小
Acceleratorメモリ使用率 Amazon Elastic Inference Acceleratorのメモリ容量です。 合計 バイト

Elastic Graphicメトリック

Amazon Elastic Graphicsは、低コストで高性能のグラフィックアクセラレーションをWindowsインスタンスへ提供します。EC2インスタンスに接続されているElastic Graphicsアクセラレーターの、接続性とパフォーマンスを監視します。

属性 詳細 統計 データタイプ
GPU接続チェック Elastic Graphics Acceleratorへの接続がアクティブか失敗かを報告します。値が0の場合は、接続の失敗を示します。値が1の場合は、接続が正常に完了したことを示します。 最小
GPU正常性チェック Elastic Inference Acceleratorがステータスチェックに成功したかどうかを報告します。値が0の場合は、ステータスチェックの失敗を示します。値が1の場合は、ステータスチェックに成功したことを示します。 最小
GPUメモリ使用率 使用されているGPUメモリ容量です。 合計 MiB

インスタンスのステータスチェック

属性 詳細
失敗したステータスチェック 過去1分間にインスタンスが、インスタンスおよびシステムの到達可能性の両方のチェックに成功したかどうかを報告します。
失敗したインスタンスステータスチェック 過去1分間にインスタンスが、インスタンス到達チェックに成功したかを確認します。
失敗したシステムステータスチェック 過去1分間にインスタンスが、システム到達チェックに成功したかを確認します。
アタッチEBS失敗ステータスチェック I/O操作を完了できないインスタンスにアタッチされているEBSボリュームが存在するかを確認します。

設定詳細

パラメーター 詳細
パブリックホスト名 インスタンスのホスト名です。
パブリックIPアドレス インスタンスのIPアドレスです。
インスタンスタイプ EC2インスタンスのタイプです。
インスタンス起動時刻 EC2インスタンスの起動時刻です。
リージョン インスタンスが実行されているリージョンの名前です。
インスタンスステータス インスタンスの機能ステータスです。
イメージID インスタンスの起動で使用したAMIのイメージIDをリスト化します。
AMI起動インデックス 起動グループ内のインスタンス検索で使用します。
プライベートDNS名 インスタンスに割り当てられたプライベートDNS名です。
プライベートIPアドレス インスタンスのプライベートIPアドレスです。
アベイラビリティーゾーン インスタンスのアベイラビリティーゾーンです。
アーキテクチャー 画像のアーキテクチャーです。
RAMディスクID インスタンスに関するRAMディスクです。
カーネルID インスタンスに関するカーネルです。
Root機器タイプ AMIで使用するRoot機器タイプです。
Root機器名 AMIで使用するRoot機器の名前です。
EC2インスタンス監視にしきい値プロファイルを追加します。
詳細はこちらのページをご確認ください。

EC2監視の強化(EC2 CloudWatchとエージェントの連携)

エージェントをEC2インスタンスにデプロイすると、そのパフォーマンスをさらに詳細に監視できます。
デプロイすると、システム属性(メモリ/スワップ使用量)、プロセス属性(スレッド/ハンドル数)、ディスク属性(空き/使用済みディスク容量)、ネットワーク属性(エラー/ドロップされたパケット)をベーシックインスタンスレベルで、CloudWatchから取得したEC2属性とともに並べて表示できます。

EC2インスタンスと、EC2 CloudWatchとエージェントの連携を有効にする手順については、製品ドキュメントをご覧ください。このドキュメントに前提条件、追加機能、UI機能、およびエージェントのデプロイ手順について記載されています。

連携したサーバーのアラートグループに通知を行えます。
詳細はこちらをご確認ください。

この連携により、次の追加属性を取得できます。

ポーリング間隔

システムレベルのメトリックは毎分単位で収集されます。

システムレベルの属性

パラメーター 詳細
物理的CPU使用率 全体のCPU使用率です。(単位:パーセント)
メモリ使用率 全体のメモリ使用率です。(単位:パーセント)
1分間の平均ロード 直前の1分間に、CPU時間を待っているタスクまたはプロセスの平均数です。
5分間の平均ロード 直前の5分間に、CPU時間を待っているタスクまたはプロセスの平均数です。
15分間の平均ロード 直前の15分間に、CPU時間を待っているタスクまたはプロセスの平均数です。
メモリ合計 利用可能なメモリの合計です。(単位:バイト)
空きメモリ 空きメモリの合計です。
使用中メモリ 使用中メモリの合計です。
スワップ合計 利用可能なスワップ領域の合計です。
空きスワップ 空きスワップ領域です。
使用中スワップ 使用中のスワップ領域です。
使用中ディスク 使用中のディスク容量です。(単位:パーセント)
空きディスク 空きディスク容量です。(単位:パーセント)
システムビジー時間 CPUがユーザーまたはカーネル空間で費やした時間です。
システムアイドル時間 CPUがアイドル状態にある時間です。

プロセスレベル属性

パラメーター 詳細
プロセスID 固有のプロセス識別番号(ID)です。
CPU使用率 プロセスで使用したCPU使用量です。
メモリの使用率 プロセスで消費した物理メモリの量です。
スレッド数 プロセスのアクティブスレッド数です。
ハンドル数 オブジェクトハンドルの数です。

ネットワーク属性

パラメーター 詳細
Network interfaceカード名 Elastic network interfaceカードのインターフェース名です。
エラーパケット ドロップしたネットワークパケット数です。
送信バイト Elastic Network Interfaceで1秒間に送信されたバイト数です。
受信バイト Elastic Network Interfaceで1秒間に受信されたバイト数です。
送信パケット Elastic Network Interfaceで1秒間に送信されたパケット数です。
受信パケット Elastic Network Interfaceで1秒間に受信されたパケット数です。

追加の設定詳細

パラメーター 詳細
ホスト名/IP EC2ホストのホスト名/IPです。
IPアドレス EC2ホストのIPアドレスです。
Operating System EC2ホストで現在実行されているオペレーティングシステムのタイプです。
OSアーキテクチャー プロセッサーアーキテクチャーです(32ビットまたは64ビット)。
インストールされたメモリ (MB) EC2ホストに取り付けられているメモリ。
CPUコア数 EC2ホスト上の論理CPUコアの数です。
プロセッサー 使用中プロセッサーの詳細です。
  • EC2インスタンス監視連携のしきい値プロファイルを追加します。
    詳細はこちらのページをご確認ください。
  • 連携サーバーアラートグループを有効にすると、それぞれの連携サーバーのアラートを受信し、設定しているサーバーのユーザーアラートグループに通知します。詳細設定ページで、連携後にサーバー監視を表示設定を有効にする必要があります。
    その後、[サーバー]→[サーバー監視]に連携した各EC2インスタンスが表示されます。

予約容量監視

特定の可用性ゾーンのAWS EC2インスタンスの予約容量使用率の監視をし、しきい値違反があった際の使用および未使用の容量を特定できます。

予約容量のパフォーマンスメトリック

属性 説明 統計 データタイプ
使用インスタンス数 現在使用しているインスタンス数です。
メモ:子のメトリックはリソースが共有されている場合にもア数レベルで使用できます。
最大
利用可能なインスタンス数 利用可能なインスタンス数です。 最小
インスタンス数の合計 予約されているインスタンス数の合計です。 最大
インスタンス使用率 現在使用されているインスタンスの予約容量パーセントです。 平均

ユースケース

  • 特定の時間にバッチワークロードを実行しているときに、未使用の容量を監視すると、追加料金が発生しないようにすることができます。
  • 使用インスタンスのしきい値を監視し、使用容量を特定します。

予測

次のパフォーマンスメトリックの未来の値を見積り、AWSインフラの容量追加やスケーリングに役立てます。

  • CPU使用率
  • 入力ネットワーク
  • 出力ネットワーク
  • CPUクレジット使用率
  • CPUクレジット残高
  • CPUサープラスクレジット残高

同様に、EC2監視の容量予約の次のメトリックを予測できます。

  • インスタンス使用率

CloudWatchエージェントとAmazon EC2サーバー連携

CloudWatchエージェントとEC2サーバーを連携し、より詳細なパフォーマンスメトリックを取得します。