OpenAIオブザーバビリティにより、自身のアプリケーションのOpenAI APIアクセス状況などを監視します。
OpenAI使用量を可視化することで、モデルごとのコスト、ログ、応答の分析を行い、エラーを特定します。
OpenAIモジュールをインストールして追加を行います。
次の各フレームワークの手順を参照してください。
Node.js | Python
次のキーで、設定値を指定できます。
サンプリングファクターとOpenAIテキストキャプチャを環境変数として設定するには、次のキーを使用します。
設定 | デフォルト値 | 説明 |
$ export SITE24X7_SAMPLING_FACTOR=<set sampling factor> | 10 | デフォルトのサンプリングファクターは10です。監視間隔中のリクエスト10件の内の1プロンプトとメッセージのみをキャプチャします。 この値は変更することができます。 |
$ export SITE24X7_CAPTURE_OPENAI_TEXT=<set value> | True |
|
表示方法:
画面上部に平均応答時間、リクエスト数、平均トークン、コストが表示されます。
パラメーター | 説明 |
平均応答時間 | OpenAIがユーザーリクエストの応答にかかった平均時間です。 |
リクエスト数 | OpenAIに送信されたリクエスト数の合計です。 |
平均トークン | リクエストごとの平均トークン数です。 トークンは文字列です。
|
コスト | かかったコストの合計です(USD単位)。 |
選択した期間でのリクエストの平均応答時間を表示します。
[最小]は最小の応答時間、[最大]は最大の応答時間です。
受信した各HTTP応答のサマリーです。
グラフにポインタを合わせるとその数を表示します。
各モデルから送信されたリクエストパーセンテージを各ブロックで表示します。
ブロックは色分けされており、容易に特定が可能です。ブロックにポインタを合わせるとリクエスト数の合計を表示します。
全モデルとそのコストのサマリーを表示します。
指定した期間で送信されたリクエストの合計を可視化します。
ポインタを合わせると、そのモデルのリクエスト数を表示します。
応答コード、エラーメッセージ、発生したエラー数のサマリーを表示します。
パラメーター | 説明 |
応答コード | エラーのHTTP応答コードです。 |
エラーメッセージ | 完全なエラーメッセージです。 |
数 | 発生したエラー数の合計です。 |