Amazon Bedrock の使用状況とコストを追跡する

Amazon Bedrock は、モデル推論の使用状況とコストを特定のユーザー、チーム、アプリケーション、環境、または実験に関連付ける複数の方法を提供します。1 つのメカニズムを使用するか、複数のメカニズムを組み合わせることができます。たとえば、ユーザーごとの可視性には IAM プリンシパル属性を、アプリケーションごとのタグ付けにはプロジェクトとともに使用し、コールごとの実験追跡にはメタデータをリクエストします。

ヒント

ユースケースに合ったメカニズムがわからない場合は、この章の最後によくある質問あるから始めてください。「ユーザーごと、プロンプトごとの属性が必要」、「自分の選択肢は何ですか？」などの一般的な決定の質問に回答します。および「クラシック CUR と CUR 2.0 の違いは何ですか？」。

アプローチの選択

選択したコスト配分方法は、追跡するディメンション、使用する Amazon Bedrock APIs、必要な粒度レベルによって異なります。次の 2 つの表は、補完的なビューを示しています。1 つ目は目標別にメカニズムを検索し、2 つ目はメカニズムを並べて比較するために使用します。

目標で選択する

コスト追跡に必要なものがわかっている場合は、ここから始めてください。

目標がの場合	使用アイテム
ユーザー単位またはチーム単位の請求額	IAM プリンシパル属性
アプリケーション単位またはワークロード単位のドル	アプリケーション推論プロファイル (`bedrock-runtime`)、またはプロジェクト WorkSpaces (`bedrock-mantle`)
任意のディメンションでスライスされたプロンプトごとのトークンの使用量とコスト	リクエストごとのメタデータのタグ付け、モデル呼び出しログ付き
ユーザーごとおよびプロンプトごとの詳細	ARN `identity` または request-metadata タグから取得したユーザーを含むモデル呼び出しログ
請求書正確なドルとプロンプトごとの詳細の両方	ネイティブメソッド ( などIAM プリンシパル属性) をと組み合わせるリクエストごとのメタデータのタグ付け

メカニズムを比較する

次の表は、使用可能なメカニズムを、属性、出力内容、出力の詳細度、データの配信先、サポートするエンドポイント別に比較したものです。

メカニズム	による属性	Output	詳細度	データ送信先	サポートされている API
IAM プリンシパル属性	IAM ID	請求額	1 日あたりの使用タイプごとに集計	AWS Cost Explorer/CUR 2.0	InvokeModel、Converse、チャットの完了
アプリケーション推論プロファイル	リソースタグをプロファイルする	請求額	1 日あたりの使用タイプごとに集計	AWS Cost Explorer/CUR 2.0	InvokeModel、Converse、チャットの完了
プロジェクト	プロジェクトリソースタグ	請求額	1 日あたりの使用タイプごとに集計	AWS Cost Explorer/CUR 2.0	レスポンス、チャット完了
WorkSpaces	ワークスペースヘッダーを介したプロジェクトリソースタグ	請求額	1 日あたりの使用タイプごとに集計	AWS Cost Explorer/CUR 2.0	Anthropic メッセージ
リクエストごとのメタデータのタグ付け	リクエストごとのキーと値のタグ	トークン数 (コストに変換)	リクエストあたり	呼び出しログのみ	InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream

注記

ネイティブメソッド (IAM プリンシパル属性、アプリケーション推論プロファイル、プロジェクト、および WorkSpaces) は、 AWS Cost Explorer と CUR 2.0 に合計請求額を提供します。最も細かい粒度は 1 日あたりの使用タイプごとに、アイデンティティまたはタグによって属性付けられます。リクエストごとの行は生成されません。プロンプトごとの詳細については、モデル呼び出しログを使用します。各呼び出しは、独自のトークン数を格納する個別のレコードです。

LLM ゲートウェイの背後にある属性

ゲートウェイまたはプロキシが多くのユーザーに代わって Amazon Bedrock を呼び出すと、Amazon Bedrock はゲートウェイの IAM ロールを発信者の ID として記録します。ユーザーレベルの属性を保持するには、必要な出力に基づいてを選択します。

請求ツールのユーザー単位のドルについては、ユーザー単位またはセッションタグを使用して、ゲートウェイがユーザーRoleSessionNameまたはテナントごとに Amazon Bedrock ロールを引き受けるようにします。セッションライフタイムの結果の認証情報をキャッシュして、すべてのリクエストでの AWS STS 呼び出しを回避します。詳細については、「IAM プリンシパル属性」を参照してください。
プロンプトごとの詳細については、各呼び出しのリクエストメタデータでユーザーを設定します。リクエストメタデータは、追加の AWS STS 呼び出しなしでリクエストごとに異なり、セッションタグは共有セッションで実行できません。

ドキュメントの表記規則

ベストプラクティス

IAM プリンシパル属性