AWS Step Functions 監視 連携

AWS Step functionsは、タスクとステートマシンに基づいてワークフローを表現し、分配されたコンポーネント間の作業を調整します。Site24x7とAWSの連携により、ステートマシンの動作を理解し、実行時間などに関するメトリクスの監視とアラートが可能になります。

設定手順

  • まだ設定がお済みでない場合は、Site24x7をIAMユーザーとして作成するか、アカウントとSite24x7のAWSアカウント間にクロスアカウントのIAMロールを作成し、AWSリソースへのアクセスを有効にします。詳細はこちら
  • AWSアカウント連携ページのサービス検索セクションで、step functionsのチェックボックスが選択されていることを確認します。詳細はこちら

ポリシーと権限

AWS管理ポリシーである読み込み専用アクセス権をSite24x7エンティティ(IAMユーザーまたはIAMロール)に割り当てることで、ステートマシンに関する情報へのアクセスと、収集ができるようになります。カスタムポリシーを割り当てる場合は、JSONポリシーに、以下の読み込みレベルのアクションが存在することを確認します。詳細はこちら

  • states:List* リスト
  • states:Describe* 詳細
  • states:GetExecutionHistory 実行履歴を取得

ポーリング間隔

Site24x7は、step functionの実行に関するメトリックデータのポイントを5分毎に収集します。詳細はこちら

ライセンス

各Step Functionは、ベーシック監視となります。 詳細はこちら

サポートしているメトリクス

属性 詳細 データタイプ 統計
実行時間 実行が開始されてから終了するまでの時間です。 平均
調整した実行回数 ステータスの入力イベントおよび再試行が調整された回数です。 カウント 合計
中止した実行回数 中止もしくは終了した実行回数です。 カウント 合計
失敗した実行回数 失敗した実行回数です。 カウント 合計
開始した実行回数 開始した実行回数です。 カウント 合計
成功した実行回数 正常に完了した実行回数です。 カウント 合計
タイムアウトした実行回数 何らかの理由でタイムアウトした実行回数です。 カウント 合計

データの表示手順

  • Site24x7のwebコンソールにサインインします。左側のナビゲーションウィンドウで、[AWS]と[監視しているAWSアカウント]を選択します。
  • ドロップダウンメニューで、[Step Functions]を選択します。
  • 監視しているステートマシンのリストから、メトリクスを表示したいステートマシンを選択します。

AWS Step Functionsの監視UIページ

概要

概要タブでは、Step functionの実行における洞察を得ることができます。デフォルトでは、すべてのステートマシンのメトリクスが時系列チャートで表示されます。

ワークフローのグラフ

視覚的かつ色分けされた、ステートマシンのワークフローを表示します。各ステータスにカーソルを合わせると、詳細情報が表示されます。例えば、[失敗したステータス]にマウスを合わせると、どの実行時間でのエラーが失敗を引き起こしたか、リソースのサービス名、活動とともに表示されます。

詳細

ステートマシンの、Amazonステートメント言語(JSONベースで構造した言語)の定義が表示されます。

実行

ステートマシンの実行履歴は、新しい順に表示されます。特定の実行を選択すると、その実行で発生したイベントリストが、タイムスタンプ、JSONデータ入力、タイプ、ステータスなどの情報とともに表示されます。

リソース

ステートマシン活動で参照されているDynamoDB表、SNSトピック、SQSキューなどのAWSリソースの、各ステータスが表示されます。(注記:Site24x7で監視している場合のみ、リソースステータスが表示されます。)

トップ