Icon showing the xAI logo. xAI — Grok 4.3 モデルの詳細機能と機能料金プログラムによるアクセスサービス階層リージョン別の利用可能性クォータと制限サンプルコード使用上の考慮事項と制限事項

Grok 4.3

xAI — Grok 4.3

モデルの詳細

Grok 4.3 は、常時オンで設定可能な推論作業 (なし、低、中、高) を提供する推論ファーストモデルです。推論は常にオプションではなくアクティブであるため、思考をスキップできるモデルよりも複数ステップのエージェントループでより一貫して動作します。また、マルチステップエージェントを構築するための強力なツールの使用と指示に従う機能、および大量の推論をコスト効率良く維持するためのトークン効率も提供します。Grok 4.3 は、契約レビュー、判例調査、クレジットアグリーメント分析、財務文書 Q&A などのエンタープライズワークロードに特に適していますが、会話型 AI、検索、チャット、マルチターンワークフロー全体で一貫した高品質の結果を提供します。Grok 4.3 は、価格パフォーマンスのために設計された Amazon Bedrock の新しい推論エンジンである Mantle で実行され、ツール呼び出し、構造化出力、およびレスポンスストリーミングをサポートしています。

モデル開始日: 2026 年 6 月 15 日
モデル終了日: 該当なし
エンドユーザーライセンス契約と利用規約: 表示
モデルライフサイクル: アクティブ
コンテキストウィンドウ: 1Mトークン
推論: サポート (設定可能: low、medium、high)

入力モダリティ	出力モダリティ	サポートされている APIs	サポートされているエンドポイント
オーディオ	埋め込み	`Chat Completions`	`bedrock-runtime`
イメージ	イメージ	`Responses`	`bedrock-mantle`
音声	音声	`Invoke`
テキスト	テキスト	`Converse`
のビデオ	のビデオ

注記

このモデルは、bedrock-mantleエンドポイントのopenai/v1/responsesパスで使用できます。これは、レスポンスエンドポイントの他のモデルで使用されるv1/responsesパスとは異なります。

機能と機能

Bedrock の機能

bedrock-mantleエンドポイントを使用してサポートされる機能

サポート	サポートされていない
クライアント側のツール呼び出し推論プロジェクト不正検出レスポンスストリーミング構造化出力	—

料金

料金については、Amazon Bedrock の料金ページを参照してください。

プログラムによるアクセス

次のモデル IDs とエンドポイント URLsを使用して、このモデルにプログラムでアクセスします。使用可能な APIs「サポートされている APIs」と「サポートされているエンドポイント」を参照してください。

Endpoint	モデル ID	リージョン内エンドポイント URL	地理推論 ID	グローバル推論 ID
`bedrock-mantle`	`xai.grok-4.3`	`https://bedrock-mantle.{region}.api.aws/openai/v1`	サポートされません	サポートされません

たとえば、リージョンが us-west-2 (オレゴン) の場合、bedrock-mantle エンドポイント URL は「https://bedrock-mantle.us-west-2.api.aws/openai/v1」になります。

サービス階層

Amazon Bedrock は、ワークロードの要件に合わせて複数のサービス層を提供します。Standard はpay-per-tokenアクセスを提供します。Priority は、時間ベースのコミットメントでより高いスループットを提供します。Flex は、柔軟でnon-time-sensitiveワークロードに対して低コストのアクセスを提供します。リザーブドは、予測可能なワークロードに対するコミットメントという用語で、専用のスループットを提供します。詳細については、「サービス層」を参照してください。

スタンダード	優先度	Flex	予約済み

リージョン別の利用可能性

リージョンの可用性の概要

Bedrock には 3 つの推論オプションがあります。In-Region は厳格なコンプライアンスのために 1 つのリージョン内にリクエストを保持し、Geo Cross-Region ルートは 1 つのリージョン (米国、欧州など) 内にまたがり、データレジデンシーを尊重しながらスループットを向上させます。Global Cross-Region ルートは、レジデンシーの制約がない場合に、世界中のどこでも最大スループットを実現します。詳細については、リージョン別の可用性「」ページを参照してください。

リージョン	リージョン内	地域	グローバル
`us-west-2` (オレゴン)
`us-east-1` (バージニア北部)
`us-east-2` (オハイオ)

クォータと制限

AWS アカウントには、サービスのパフォーマンスを維持し、Amazon Bedrock の適切な使用を確保するためのデフォルトのクォータがあります。アカウントに割り当てられたデフォルトのクォータは、リージョンの要因、支払い履歴、不正使用、および/またはクォータ引き上げリクエストの承認に応じて更新される場合があります。詳細については、「 Amazon Bedrock のクォータドキュメント」および「モデルの制限」を参照してください。

bedrock-mantle エンドポイントでオンデマンドスループットを消費すると、使用可能なスループットは時間の経過とともにスケールされます。クォータ内のすべてのリクエストが需要の高い期間に成功することが保証されるわけではないため、徐々に増やすことが重要です。このモデルでは、デフォルトの制限は Service Quotas から直接表示されないため、ガイドとしてランプに従うことをお勧めします。

サンプルコード

ステップ 1 - AWS アカウント: AWS アカウントがすでにある場合は、このステップをスキップします。AWS を初めて使用する場合は、AWS アカウントにサインアップします。

ステップ 2 - API キー: Amazon Bedrock コンソールに移動し、長期 API キーを生成します。

ステップ 3 - SDK を取得する: この入門ガイドを使用するには、Python がすでにインストールされている必要があります。次に、使用している APIs に応じて、関連するソフトウェアをインストールします。

ステップ 4 - 環境変数を設定する: API キーを認証に使用するように環境を設定します。

ステップ 5 - 最初の推論リクエストを実行する: ファイルをとして保存する bedrock-first-request.py

使用上の考慮事項と制限事項

推論の労力 — 推論は常にデフォルトでアクティブです。エフォートは、 {"effort": "none"} (推論を無効にします）、 "low" (デフォルト）、"medium"、または reasoningパラメータを使用して設定できます"high"。推論コンテンツは暗号化され、Responsions API リクエストinclude: ["reasoning.encrypted_content"]を渡すことで返すことができます。暗号化されたコンテンツを後続のターンで送り返して、マルチターン会話の推論コンテキストを提供できます。Chat Completions API は推論トークンを返しません。
```
response = client.responses.create(
    model="xai.grok-4.3",
    reasoning={"effort": "high"},
    include=["reasoning.encrypted_content"],
    input="Explain quantum entanglement simply."
)
print(response.output_text)
```
デフォルトパラメータ — Grok 4.3 は、標準の OpenAI API 仕様とは異なるデフォルトを使用します。temperatureデフォルトは 0.7 ( ではなく1)、top_pデフォルトは 0.95 ( ではなく1)、max_completion_tokensデフォルトはです131072。アプリケーションで異なる動作が必要な場合は、これらの値を明示的に調整します。

ドキュメントの表記規則

xAI

Z.AI