Amazon EC2 サービス アクション
EC2インスタンスの起動、停止、ハイバネートによる停止、EC2インスタンス再起動
Site24x7のITオートメーションを利用して、開始と停止、ハイバネートを用いた停止、EC2インスタンスの再起動を行うアクションファイルを作成できます。しきい値またはアラートイベントタイプ(アップ、ダウン、トラブル)をマッピングしてオートメーションを自動的にトリガーする設定にするか、Site24x7コンソールから手動でアクションを呼び出して直接APIを呼ぶこともできます。
必要な権限
Site24x7によって引き受けられたIAMロールまたはSite24x7用に作成されたIAMユーザーが、アクションを実行するために添付されたポリシードキュメントが以下の部分的な書き込みアクションがあることを確認してください。
- "ec2:StartInstances"
- "ec2:StopInstances"
- "ec2:RebootInstances"
制限事項
- EC2インスタンスが実行中のステータスであり、正常に実行するにはSite24x7によって監視されている必要があります。
- ステータスが保留中のときはアクションを実行できません。
アクションプロファイルの作成
- Site24x7のWebコンソールにログインし、[管理]>[ITオートメーション]
の順で選択します。
- [オートメーションの追加]をクリックし、ドロップダウンをクリックして,タイプとして[開始/停止/停止-ハイバネート/EC2リブート/AWS EC2 AMI作成]を選択します。
- ユニーク名を[表示名]フィールドに入力します。
- ドロップダウンをクリックし、実行されるアクションを選択します。
- 次に、アクションを実行したいES2インスタンスを選択します。(追加のオプション [$LOCALHOST])を選択すると、オートメーションプロファイルがマッピングされる全てのEC2インスタンスで操作が実行されます。
- [アクションの最大許容範囲時間]:Site24x7の最大待機秒数はリクエストがタイムアウトする前でなければなりません。実行時間はデフォルトによって[15秒]に設定されています。実行時間は[1~90秒]の範囲内で限定します。
- [オートメーションの結果をメールで送信]:オートメーション結果関連のメールを受信するには、ここを[はい]に切り替えます。
- プロファイルを保存します。
オートメーションのシミュレーション
アクションプロファイルをマッピングする前に、Site24x7のコンソールで手動でアクションを呼び出すかREST APIを使用することにより機能をテストできます。
プロファイル作成後、ITオートメーションサマリーページ([管理]>[ITオートメーション])に移動し、をクリックしてテストを実行します。
アクションプロファイルの関連付け
オートメーションを実行するには、アクションプロファイルを目的のアラートイベントにマッピングします。プロファイルを定義済みの監視レベルイベントタイプ(アップ/ダウン/トラブル)または、カスタム属性イベントタイプ(CPU使用率> 90%)でマッピングできます。
監視レベルのマッピング
監視対象のEC2インスタンスの監視編集ページへ移行([EC2インスタンス監視ページ]> >[編集])し、以下のいずれかの監視ステータスの変更にアクションプロファイルをマッピングします。
- ダウンのときに実行
- アップのときに実行
- トラブルのときに実行
- ステータス変更のときに実行
属性レベルのマッピング
また、CPU利用率やメモリ使用率、ロードバランサー、メトリックリテラシーに関連したHTTP 4xxなどを、関係したメトリックデータポイントに関連付けることもできます。監視対象のEC2インスタンスのしきい値プロファイル編集([リソースの監視編集ページへ移行]>[しきい値と可用性]フィールドの横にある鉛筆のアイコンをクリック)に移動し、[実行するオートメーションの選択]フィールドをクリックすることによって、プロファイルを任意の属性へマッピングします。
ユースケース
- ステータス確認に失敗したインスタンスのトラブルシューティング: 監視対象のAmazon EC2インスタンスがシステムまたはインスタンスの到達可能確認に失敗した場合、マッピングを作成し、上記インスタンスの再起動、停止または、開始アクションが自動的にトリガーされるようになります。
- メモリ不足の防止:EC2再起動アクションプロファイルをメトリックデータポイントのメモリ使用率にマッピングし、メモリの使用量がしきい値の限界に危険なほど到達し始めてきたらトリガーされるように設定します。
- インスタンスの消費時間の短縮:EC2停止アクションプロファイルをCPU使用率やネットワーク使用率などのメトリックデータポイントにマッピングして、使用率の低いインスタンスを特定し、それらを停止します。