ヘルプ AWS Amazon EKS

Amazon Elastic Kubernetes Service監視連携

Amazon Elastic Kubernetes Service (Amazon EKS)はAWSのKubernetesを用いて、コンテナー化したアプリケーションをデプロイ、管理、スケーリングします。Kubernetesによって、コンテナー化されたアプリケーションの大規模な展開、スケーリング、管理を自動化できます。

目次

ユースケース

Amazon EKSは、EC2とAWS Fargateの両方でアプリケーション稼働させるKubernetesサービスです。EKS監視にアタッチされているクラスターで実行されるアプリケーションがあるとします。Amazon EKSとSite24x7を連携すると、EKSクラスター、EKSネームスペース、EKSノードの監視が作成されます。クラスターやノードがダウンや問題に直面した際に、クラスターとノードの両方の監視で設定されているアラートで、問題の特定と追跡を行えます。

Site24x7とAmazon EKS連携の利点

Site24x7とEKSを連携して、クラスター、ノード、ネームスペースレベルで、Amazon EKSを監視できます。

この連携でできることは次のとおりです。

  • 監視リソースをフルスタックに可視化できます。
  • しきい値を設定して、クラスターやノードがダウンした際にアラートを通知します。
  • コンテナー分析として、グラフ形式でノードとポッドのパフォーマンスの概要を取得します。

設定

  1. AWSアカウントとSite24x7 AWSアカウント間で、AWSリソースへのアクセスを有効にしてください。
    • Site24x7をIAMユーザーとして作成する。
    • クロスアカウントIAMロールを作成する。詳細はこちら
  2. AWSアカウント連携ページで、Amazon EKSの隣のボックスにチェックを入れます。詳細はこちら

要件

  • Amazon EKS上にコンテナー分析をインストールしている必要があります。
    詳細はこちらのページをご確認ください。

ポリシーと権限

Site24x7はAmazon EKS APIを用いてクラスターに関する情報を収集しています。AWS管理ポリシーのReadOnlyAccessをSite24x7のエンティティ―(IAMユーザーまたはIAMロール)に割り当てることで、Site24x7がメトリックやメタデータを収集します。カスタムポリシーを設定する場合は、JSONポリシーにある次の読み込みレベルのアクションを確認してください。詳細はこちら

  • "eks:DescribeCluster",
  • "eks:ListClusters",
  • "cloudwatch:ListMetrics"

ポーリング間隔

Site24x7は設定したポーリング間隔ごとにクラスター、ノード、ネームスペースのメトリックデータを収集します。ポーリング間隔の範囲は、1分から1日です。詳細はこちら

クラスターレベルのメトリック

CloudWatchメトリック 説明 統計 データタイプ
クラスターの失敗ノード数 クラスター内の失敗したノード数です。 最大 ノード
クラスターのノード数 クラスター内のノード総数です。 最大 ノード
ネームスペースの稼働ポッド数 ネームスペース内で稼働しているポッド数です。 最大 ポッド
サービスの稼働ポッド数 サービス内で稼働しているポッド数です。 最大 ポッド
ノードの稼働ポッド数 ノード内で稼働しているポッド数です。 最大 ポッド
ノードの稼働コンテナー数 ノード内で稼働しているコンテナー数です。 最大 コンテナー
ノードの総CPU使用率 全てのノードで使用されているCPUです。 最大 ユニット
ノードのCPU制限 ノードに割り当てられているCPUです。 最大 ユニット
ノードの予約されているCPUの容量 ノードの予約されているCPUです。 平均 パーセンテージ
ノードのCPU利用率 ノードで使用されているCPUです。 平均 パーセンテージ
ノードのファイルシステム利用率 ノードのファイルシステム容量です。 平均 パーセンテージ
ノードのメモリ制限 ノードに割り当てられているメモリです。 最大 メガバイト
ノードのワーキングセットのメモリ ノードのワーキングセットで使用されているメモリです。 平均 メガバイト
ノードの予約されているメモリ容量 ノードで予約されているメモリです。 平均 パーセンテージ
ノードのメモリ利用率 ノードで利用されているメモリです。 平均 パーセンテージ
ノードの総ネットワークバイト ノードの総ネットワークトラフィックです。 合計 メガバイト/秒
ポッドの予約CPU容量 ポッドで予約されているCPUです。 平均 パーセンテージ
ポッドのCPU利用率 ポッドで使用されているCPUです。 平均 パーセンテージ
ポッド制限を超えたCPU利用率 ポッドの制限を超えて利用されているCPUです。 平均 パーセンテージ
ポッドの予約されているメモリ容量 ポッドで予約されているメモリです。 平均 パーセンテージ
ポッドのメモリ利用率 ポッドで利用されているメモリです。 平均 パーセンテージ
ポッド制限を超えたメモリ利用率 ポッドの制限を超えて利用されているメモリです。 平均 パーセンテージ
ポッドネットワークの受信バイト ポッドで受信された総バイトです。 合計 メガバイト/秒
ポッドネットワークの送信バイト ポットで送信された総バイトです。 合計 メガバイト/秒

ノードレベルのメトリック

CloudWatchメトリック 説明 統計 データタイプ
稼働ポッドのノード数 ノード内で稼働しているポッド数です。 最大 ポッド
稼働コンテナーのノード数 ノード内で稼働しているコンテナー数です。 最大 コンテナー
ノードの予約CPU容量 ノードで予約されているCPUです。 平均 パーセンテージ
ノードのCPU利用率 ノードで使用されているCPUです。 平均 パーセンテージ
ノードのファイルシステム利用率 ノードのファイルシステム容量です。 平均 パーセンテージ
ノードの予約メモリ容量 ノードで予約されているメモリです。 平均 パーセンテージ
ノードのメモリ利用率 ノードで利用されているメモリです。 平均 パーセンテージ
ノードネットワークの総バイト ノードの総ネットワークトラフィックです。 合計 メガバイト/秒

ネームスペースレベルのメトリック

CloudWatchメトリック 説明 統計 データタイプ
ネームスペースの稼働ポッド数 ネームスペース内で稼働しているポッド数です。 最大 ポッド
ポッドのCPU利用率 ポッドで利用されているCPUです。 平均 パーセンテージ
ポッド制限を超えたCPU利用率 ポッド制限を超えて利用されているCPUです。 平均 パーセンテージ
ポッドのメモリ利用率 ポッドで利用されているメモリです。 平均 パーセンテージ
ポッド制限を超えたメモリ利用率 ポッドの制限を超えて利用されているメモリです。 平均 パーセンテージ
ポッドネットワークの受信バイト ポッドの受信した総バイトです。 合計 メガバイト/秒
ポッドネットワークの送信バイト ポッドの送信した総バイトです。 合計 メガバイト/秒

サービスレベルのメトリック

CloudWatchメトリック 説明 統計 データタイプ
サービスの稼働ポッド数 サービス内で稼働しているポッドの数です。 最大 ポッド
ポッドのCPU利用率 ポッドで利用されているCPUです。 平均 パーセンテージ
ポッド制限を超えたCPU利用率 ポッドの制限を超えて利用されているCPUです。 平均 パーセンテージ
ポッドのメモリ利用率 ポッドで利用されているメモリです。 平均 パーセンテージ
ポッド制限を超えたメモリ利用率 ポッドの制限を超えて利用されているメモリです。 平均 パーセンテージ
ポッドネットワークの受信バイト ポッドの受信した総バイトです。 合計 メガバイト/秒
ポッドネットワークの送信バイト ポッドの送信した総バイトです。 合計 メガバイト/秒

ポッドレベルのメトリック

CloudWatchメトリック 説明 統計 データタイプ
ポッドの予約CPU容量 ポッドで予約されているCPUです。 平均 パーセンテージ
ポッドのCPU利用率 ポッドで利用されているCPUです。 平均 パーセンテージ
ポッド制限を超えたCPU利用率 ポッド制限を超えて利用されているCPUです。 平均 パーセンテージ
ポッドの予約メモリ容量 ポッドで予約されているメモリです。 平均 パーセンテージ
ポッドのメモリ利用率 ポッドで利用されているメモリです。 平均 パーセンテージ
ポッド制限を超えたメモリ利用率 ポッドの制限を超えて利用されているメモリです。 平均 パーセンテージ
ポッドネットワークの受信バイト ポッドが受信した総バイトです。 合計 メガバイト/秒
ポッドネットワークの送信バイト ポッドが送信した総バイトです。 合計 メガバイト/秒
ポッドのコンテナー再起動数 コンテナーの再起動数です。 最大 コンテナー
ポッドのCPUリクエスト ポッドのCPUリクエストです。 最大 ミリコア
ポッドのメモリリクエスト ポッドのメモリリクエストです。 最大 バイト
ポッドのCPU制限 ポッド内のコンテナーに定義されているCPU制限です。 最大 ミリコア
ポッドのメモリ制限 ポッド内のコンテナーに定義されているメモリ制限です。 最大 バイト
ポッドの失敗ステータス ポッド内のすべてのコンテナーが停止したことを示します。 最大
ポッドの待機ステータス ポッド内のすべてのコンテナーが待機していることを示します。 最大
ポッドのステータス実行中 ポッド内のすべてのコンテナーが実行していることを示します。 最大
ポッドのスケジュール済みステータス ポッドがノードにスケジュールされていることを示します。 最大
ポッドの未知のステータス ポッドのステータスが取得できないことを示します。 最大
ポッドの保留中ステータス クラスターで受容されているが、複数コンテナーがまだ準備完了状態になっていない状態を示します。 最大
ポッドの成功ステータス ポッド内のすべてのコンテナーが停止していて再起動していない状態を示します。 最大
ポッドのコンテナー数 ポッド仕様で定義されているコンテナーの数です。 最大
ポッドの実行中コンテナー数 現在実行状態であるポッドのコンテナー数です。 最大
ポッドの停止状態コンテナー ポッド内の停止状態のコンテナー数です。 最大
ポッドの実行状態コンテナー ポッド内の実行状態のコンテナー数です。 最大
ポッドの待機状態のコンテナー ポッド内の待機状態のコンテナー数です。 最大
ポッドのインターフェース受信ネットワークドロップ ポッドの受信時にドロップしたネットワークインターフェースのパケット数です。 合計 MB/秒
ポッドのインターフェース送信ネットワークドロップ ポッドの送信時にドロップしたネットワークインターフェースのパケット数です。 合計 MB/秒

コンテナーレベルのメトリック

メトリック名 説明 統計 単位
コンテナーのCPU使用率 コンテナーで使用されたCPUのパーセンテージです。 平均 パーセンテージ
コンテナーのコンテナー制限を超過したCPU使用率 コンテナー制限に関連するコンテナーで使用されたCPUパーセンテージです。 平均 パーセンテージ
コンテナーメモリ使用率 コンテナーで使用されたメモリパーセンテージです。 平均 パーセンテージ
コンテナー制限を超過したメモリ使用率 コンテナー制限に関連するコンテナーで使用されたメモリパーセンテージです。 平均 バイト/秒
コンテナーメモリ失敗の合計 コンテナーで発生したメモリ割り当て失敗回数です。 平均 MB/秒
コンテナーファイルシステム使用量 コンテナーファイルシステムで使用されている現在のディスク容量です。 平均 バイト
コンテナー空きファイルシステム コンテナーファイルシステム内の空きディスク容量です。 平均 バイト
コンテナーファイルシステム使用率 コンテナーファイルシステム内の空きディスク容量と使用ディスク容量の割合です。 平均 MB/秒

しきい値設定

[管理]→[設定プロファイル]→[しきい値と可用性 (+)]の順にアクセスし、監視タイプで[EKSクラスター]、[EKSノード]、[EKSネームスペース]のいずれかを選択します。この手順により上記で選択したメトリックのしきい値を設定できます。さらに、EKSネームスペースEKSノード監視では、しきい値フォームで非アクティブなネームスペースとノードをメンテナンスとして設定することができます。

予測

次のAmazon EKSクラスターメトリックの未来の値を見積ることで、AWSインフラのキャパシティ追加やスケーリングの計画に役立てられます。

  • ノードCPU使用量
  • ノードCPU使用率
  • ノードメモリ使用率
  • ポッドCPU使用率
  • ポッドメモリ使用率

ネームスペースレベルメトリックでは、次の予測値を表示できます。

  • ポッドCPU使用率
  • ポッドメモリ使用率
  • サービスCPU使用率
  • サービスメモリ使用率
  • CPU使用率
  • メモリ使用率

ノードレベルメトリックでは次の予測値を表示できます。

  • ノードごとのCPU使用率
  • ノードごとのメモリ使用率
  • ノードごとのネットワーク

Site24x7 EKS監視の画面

サマリー

時系列チャートで各リソース内で発生したイベントの概要を取得します。これらチャートは、ポッドやノードレベルでのCPU利用率やメモリ利用率のイベントタイムラインをパーセンテージで表示することができます。そのほかには総送信・受信バイト、ファイルシステム容量、稼働中のコンテナーやポッド数も把握できます。全ての時系列チャートで平均、最小、最大値が表示されます。

ノードグループ

ノードグループはAmazon EKS Kubernetesクラスターのノード(EC2インスタンス)のプロビジョニングとライフサイクル管理を自動化します。ノードグループタブで、EKS監視に関連付いているノードグループを表示します。このタブは、EKSクラスターにノードグループが作成されている場合にのみ表示されます。

Fargateプロファイル

FargateプロファイルはAmazon EKSクラスターの一部で、Fargate上で、ポッドの起動とどのように実行されているかを管理できます。Fargateプロファイルタブで、EKS監視に関連付いているFargateプロファイルを表示します。このタブは、EKS蔵鵜s多―にFargateプロファイルが作成されている場合にのみ表示されます。

ノードとネームスペース詳細

こちらから、EKS環境に関連付いているノードとネームスペースのリストを表示します。それぞれのリストをクリックして、リソースに関連付いているパフォーマンスとリソース使用量統計を表示します。アクション配下の鉛筆アイコンをクリックして、しきい値を設定し、サービスに失敗が発生した際に通知を受け取れます。

監視リソース

監視リソースタブでは、EKSクラスターに関連付いているEC2インスタンスとEC2オートスケーリンググループを表示します。

OIDC

OIDCは、クラスターのOpenID Connect (OIDC) IDプロバイダー情報表現するオブジェクトです。OIDCタブでEKSクラスターに関連付いているOIDCを表示します。

アドオン

アドオンは、Kubernetes の運用機能を拡張する、Amazon VPC CNI、CoreDNS、kube-proxy などの一般的な運用ソフトウェアです。アドオンタブでは、EKSクラスターアドオンと更新イベント関連のアドオンが表示されます。

更新履歴

更新履歴タブで、EKSクラスターとノードグループの設定更新情報を取得します。

ログ

選択したログタイプのEKSコントロールログを収集します。このログはCloudWatchから収集され、ログストリーム名で分類されます。

設定

このタブでEKSの設定詳細が表示されます。その表示内容は、リソース名、エンドポイントURL、リソースの領域、リソースのステータス、セキュリティーグループ、サブネット、VPC ID、パブリックおよびプライベートアクセスのステータス、などがあります。