スレッドダンプとヒープダンプ実行アクションの自動化

スレッドダンプとヒープダンプ実行を自動化して、手動作業を最小化してアプリケーションとサーバーのパフォーマンスを向上します。

ユースケース

アプリケーションの一般的な応答時間が超過は、潜在的なデッドロックやメモリリークにより引き起こされる可能性があります。このような場合にスレッドダンプやヒープダンプを作成して根本原因を検知します。

スレッドダンプはデッドロック条件があるかどうかの確認に使用され、ヒープダンプはメモリリークを検知します。

問題

アプリケーションにバックグラウンドタスクを追加すると、アプリケーション全体の応答時間が増加します。その場合、この増加の要因となるオブジェクトのステータスを確認する必要があります。

解決策

スレッドダンプとヒープダンプの自動化を追加して監視に関連付けることで、しきい値違反が起こった際にダンプを作成します。

自動化の追加

サポートしているエージェントバージョン:Linux 16.6.0以上

  1. Site24x7にログインし、管理 > IT自動化テンプレート (+)の順にクリックします。また、サーバー > IT自動化テンプレート (+)でもアクセス可能です。
  2. IT自動化のタイプにスレッドダンプヒープダンプを選択します。
  3. 目的特定のために表示名を入力します。
    例:上記例の場合は、表示名を「メモリリークダンプファイル」などに設定します。
  4. 完全なファイルパスを指定してダンプファイルを保存します。
    • サーバーエージェントフォルダ/opt/site24x7/monagentにダンプファイルを保存する場合、エージェントが削除されるとダンプファイルも消去されます。ダンプファイルをサーバーエージェントフォルダ外に保存している場合は、消去されません。
    • ヒープダンプファイルはHPROF形式で保存され、スレッドダンプファイルはTXT形式で保存されます。
  5. 実行するホストを選択します。平行して実行するために複数ホストで選択可能です。
      $LOCALHOSTと指定して、しきい値違反やステータス変更があったすべてのホストで実行するよう設定できます。APMアプリケーションレベルで自動化が有効化された場合、しきい値違反やステータス変更があったアプリケーションのすべての違反サーバーで実行されます。
  6. コマンド実行完了までエージェントが待機するタイムアウト期間(秒)を指定します。この期間を超過するとタイムアウトエラーが発生します。監視がダウンした際に根本原因レポートを送信をはいに設定すると、メールレポートが送信されます。
      デフォルトでタイムアウトは15秒に設定されています。1から90秒まで指定可能です。
  7. 自動化結果をメールで送信を指定すると、通知プロファイルで設定されているユーザーグループに自動化結果が送信されます。デフォルトでこれはいいえに設定されています。このメールには自動化名、インシデント理由、宛先ホストなどの情報が記載されています。
      1度のデータ収集で複数の自動化が実行された場合、それらをまとめたメールが送信されます。
  8. 保存をクリックします。
    自動化が追加すると、自動化のスケジュールを設定でき、これにより設定頻度に基づいて実行されます。

通知プロファイル設定

Configure the following settings in the 通知プロファイルで次の項目を設定します。

  • IT自動化の実行の後にダウン/トラブルを通知:はいに設定されている際、指定したアクションの実行後でも障害が継続している場合にアラートが通知されます。
  • 依存監視のIT自動化の抑制:依存リソースのステータスがダウンであっても、IT自動化は実行されません。

自動化のテスト

自動化を追加したら、IT自動化サマリーページ(サーバー > IT自動化テンプレート)にアクセスし、play-buttonアイコンを使用してテスト実行を行います。詳細はこちら

テスト実行はコマンド実行を選択しているすべてのホストに適用されます。$LOCALHOSTで1つのホストを指定している際はそのホストにのみ実行されます。
IT自動化ログをクリックして、日にちごとに実行された自動化リストを表示します。

自動化の関連付け

自動化は監視または属性に関連付けられます。関連付けには2つの方法があります。

関連ガイド