View a markdown version of this page

Amazon Bedrock の使用状況とコストを追跡する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock の使用状況とコストを追跡する

Amazon Bedrock は、モデル推論の使用状況とコストを特定のユーザー、チーム、アプリケーション、環境、または実験に関連付ける複数の方法を提供します。1 つのメカニズムを使用するか、複数のメカニズムを組み合わせることができます。たとえば、ユーザーごとの可視性には IAM プリンシパル属性を、アプリケーションごとのタグ付けにはプロジェクトとともに使用し、コールごとの実験追跡にはメタデータをリクエストします。

ヒント

ユースケースに合ったメカニズムがわからない場合は、この章の最後によくある質問ある から始めてください。「ユーザーごと、プロンプトごとの属性が必要」、「自分の選択肢は何ですか?」などの一般的な決定の質問に回答します。および「クラシック CUR と CUR 2.0 の違いは何ですか?」。

アプローチの選択

選択したコスト配分方法は、追跡するディメンション、使用する Amazon Bedrock APIs、必要な粒度レベルによって異なります。次の 2 つの表は、補完的なビューを示しています。1 つ目は目標別にメカニズムを検索し、2 つ目はメカニズムを並べて比較するために使用します。

目標で選択する

コスト追跡に必要なものがわかっている場合は、ここから始めてください。

目標が の場合 使用アイテム
ユーザー単位またはチーム単位の請求額 IAM プリンシパル属性
アプリケーション単位またはワークロード単位のドル アプリケーション推論プロファイル (bedrock-runtime)、または プロジェクト WorkSpaces (bedrock-mantle)
任意のディメンションでスライスされたプロンプトごとのトークンの使用量とコスト リクエストごとのメタデータのタグ付けモデル呼び出しログ付き
ユーザーごとおよびプロンプトごとの詳細 ARN identity または request-metadata タグから取得したユーザーを含むモデル呼び出しログ
請求書正確なドルとプロンプトごとの詳細の両方 ネイティブメソッド ( などIAM プリンシパル属性) を と組み合わせる リクエストごとのメタデータのタグ付け
メカニズムを比較する

次の表は、使用可能なメカニズムを、属性、出力内容、出力の詳細度、データの配信先、サポートするエンドポイント別に比較したものです。

メカニズム による属性 Output 詳細度 データ送信先 サポートされている API bedrock-runtime bedrock-mantle
IAM プリンシパル属性 IAM ID 請求額 1 日あたりの使用タイプごとに集計 AWS Cost Explorer/CUR 2.0 InvokeModel、Converse、チャットの完了 Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
アプリケーション推論プロファイル リソースタグをプロファイルする 請求額 1 日あたりの使用タイプごとに集計 AWS Cost Explorer/CUR 2.0 InvokeModel、Converse、チャットの完了 Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
プロジェクト プロジェクトリソースタグ 請求額 1 日あたりの使用タイプごとに集計 AWS Cost Explorer/CUR 2.0 レスポンス、チャット完了 Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
WorkSpaces ワークスペースヘッダーを介したプロジェクトリソースタグ 請求額 1 日あたりの使用タイプごとに集計 AWS Cost Explorer/CUR 2.0 Anthropic メッセージ Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
リクエストごとのメタデータのタグ付け リクエストごとのキーと値のタグ トークン数 (コストに変換) リクエストあたり 呼び出しログのみ InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
注記

ネイティブメソッド (IAM プリンシパル属性アプリケーション推論プロファイルプロジェクト、および WorkSpaces) は、 AWS Cost Explorer と CUR 2.0 に合計請求額を提供します。最も細かい粒度は 1 日あたりの使用タイプごとに、アイデンティティまたはタグによって属性付けられます。リクエストごとの行は生成されません。プロンプトごとの詳細については、モデル呼び出しログを使用します。各呼び出しは、独自のトークン数を格納する個別のレコードです。

LLM ゲートウェイの背後にある属性

ゲートウェイまたはプロキシが多くのユーザーに代わって Amazon Bedrock を呼び出すと、Amazon Bedrock はゲートウェイの IAM ロールを発信者の ID として記録します。ユーザーレベルの属性を保持するには、必要な出力に基づいて を選択します。

  • 請求ツールのユーザー単位のドルについては、ユーザー単位またはセッションタグを使用して、ゲートウェイがユーザーRoleSessionNameまたはテナントごとに Amazon Bedrock ロールを引き受けるようにします。セッションライフタイムの結果の認証情報をキャッシュして、すべてのリクエストでの AWS STS 呼び出しを回避します。詳細については、「IAM プリンシパル属性」を参照してください。

  • プロンプトごとの詳細については、各呼び出しのリクエストメタデータでユーザーを設定します。リクエストメタデータは、追加の AWS STS 呼び出しなしでリクエストごとに異なり、セッションタグは共有セッションで実行できません。