翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock の使用状況とコストを追跡する
Amazon Bedrock は、モデル推論の使用状況とコストを特定のユーザー、チーム、アプリケーション、環境、または実験に関連付ける複数の方法を提供します。1 つのメカニズムを使用するか、複数のメカニズムを組み合わせることができます。たとえば、ユーザーごとの可視性には IAM プリンシパル属性を、アプリケーションごとのタグ付けにはプロジェクトとともに使用し、コールごとの実験追跡にはメタデータをリクエストします。
ヒント
ユースケースに合ったメカニズムがわからない場合は、この章の最後によくある質問ある から始めてください。「ユーザーごと、プロンプトごとの属性が必要」、「自分の選択肢は何ですか?」などの一般的な決定の質問に回答します。および「クラシック CUR と CUR 2.0 の違いは何ですか?」。
アプローチの選択
選択したコスト配分方法は、追跡するディメンション、使用する Amazon Bedrock APIs、必要な粒度レベルによって異なります。次の 2 つの表は、補完的なビューを示しています。1 つ目は目標別にメカニズムを検索し、2 つ目はメカニズムを並べて比較するために使用します。
目標で選択する
コスト追跡に必要なものがわかっている場合は、ここから始めてください。
| 目標が の場合 | 使用アイテム |
|---|---|
| ユーザー単位またはチーム単位の請求額 | IAM プリンシパル属性 |
| アプリケーション単位またはワークロード単位のドル | アプリケーション推論プロファイル (bedrock-runtime)、または プロジェクト WorkSpaces (bedrock-mantle) |
| 任意のディメンションでスライスされたプロンプトごとのトークンの使用量とコスト | リクエストごとのメタデータのタグ付け、モデル呼び出しログ付き |
| ユーザーごとおよびプロンプトごとの詳細 | ARN identity または request-metadata タグから取得したユーザーを含むモデル呼び出しログ |
| 請求書正確なドルとプロンプトごとの詳細の両方 | ネイティブメソッド ( などIAM プリンシパル属性) を と組み合わせる リクエストごとのメタデータのタグ付け |
メカニズムを比較する
次の表は、使用可能なメカニズムを、属性、出力内容、出力の詳細度、データの配信先、サポートするエンドポイント別に比較したものです。
| メカニズム | による属性 | Output | 詳細度 | データ送信先 | サポートされている API | bedrock-runtime |
bedrock-mantle |
|---|---|---|---|---|---|---|---|
| IAM プリンシパル属性 | IAM ID | 請求額 | 1 日あたりの使用タイプごとに集計 | AWS Cost Explorer/CUR 2.0 | InvokeModel、Converse、チャットの完了 | ||
| アプリケーション推論プロファイル | リソースタグをプロファイルする | 請求額 | 1 日あたりの使用タイプごとに集計 | AWS Cost Explorer/CUR 2.0 | InvokeModel、Converse、チャットの完了 | ||
| プロジェクト | プロジェクトリソースタグ | 請求額 | 1 日あたりの使用タイプごとに集計 | AWS Cost Explorer/CUR 2.0 | レスポンス、チャット完了 | ||
| WorkSpaces | ワークスペースヘッダーを介したプロジェクトリソースタグ | 請求額 | 1 日あたりの使用タイプごとに集計 | AWS Cost Explorer/CUR 2.0 | Anthropic メッセージ | ||
| リクエストごとのメタデータのタグ付け | リクエストごとのキーと値のタグ | トークン数 (コストに変換) | リクエストあたり | 呼び出しログのみ | InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream |
注記
ネイティブメソッド (IAM プリンシパル属性、アプリケーション推論プロファイル、プロジェクト、および WorkSpaces) は、 AWS Cost Explorer と CUR 2.0 に合計請求額を提供します。最も細かい粒度は 1 日あたりの使用タイプごとに、アイデンティティまたはタグによって属性付けられます。リクエストごとの行は生成されません。プロンプトごとの詳細については、モデル呼び出しログを使用します。各呼び出しは、独自のトークン数を格納する個別のレコードです。
LLM ゲートウェイの背後にある属性
ゲートウェイまたはプロキシが多くのユーザーに代わって Amazon Bedrock を呼び出すと、Amazon Bedrock はゲートウェイの IAM ロールを発信者の ID として記録します。ユーザーレベルの属性を保持するには、必要な出力に基づいて を選択します。
-
請求ツールのユーザー単位のドルについては、ユーザー単位またはセッションタグを使用して、ゲートウェイがユーザー
RoleSessionNameまたはテナントごとに Amazon Bedrock ロールを引き受けるようにします。セッションライフタイムの結果の認証情報をキャッシュして、すべてのリクエストでの AWS STS 呼び出しを回避します。詳細については、「IAM プリンシパル属性」を参照してください。 -
プロンプトごとの詳細については、各呼び出しのリクエストメタデータでユーザーを設定します。リクエストメタデータは、追加の AWS STS 呼び出しなしでリクエストごとに異なり、セッションタグは共有セッションで実行できません。