Regioni supportate Prerequisiti Richiesta di base Risposte in streaming Funzionalità supportate Conta i token

Inferenza utilizzando l'API Anthropic Messages

L'API Anthropic Messages fornisce l'accesso nativo ai modelli di Claude utilizzando il formato di richiesta e risposta Anthropic. Puoi utilizzare l'API Messages sia sugli endpoint che sugli bedrock-runtime endpoint, offrendoti la bedrock-mantle flessibilità di scegliere lo stile di autenticazione e integrazione più adatto alla tua applicazione.

Endpoint	URL di base	Caso d'uso
`bedrock-mantle`	`https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages`	Consigliato per nuove applicazioni. Supporta l'autenticazione delle chiavi API eSpazi di lavoro () Anthropic-compatible.
`bedrock-runtime`	`https://bedrock-runtime.{region}.amazonaws.com`	Utilizzalo con le integrazioni AWS SDK esistenti e la registrazione delle chiamate.

Regioni supportate

L'API Messages è disponibile sull'bedrock-mantleendpoint in tutte le regioni che supportano (vedi). bedrock-mantle Regioni ed endpoint supportati Sull'bedrock-runtimeendpoint, è disponibile in tutte le regioni in cui sono disponibili i modelli Claude. Per informazioni dettagliate, vedi Disponibilità regionale.

Prerequisiti

Prima di utilizzare l'API Messages, assicurati di disporre di quanto segue:

Accesso ai modelli: richiedi l'accesso ai modelli Claude nella console Amazon Bedrock. Per informazioni, consulta Richiedi l'accesso ai modelli.
Autenticazione: dipende dall'endpoint:
- bedrock-mantle— Utilizza una chiave API Amazon Bedrock (vediChiavi API) o credenziali AWS SigV4.
- bedrock-runtime— Usa le credenziali AWS SigV4 tramite l' AWS SDK (boto3, ecc.).
Intestazione della versione antropica: tutte le richieste richiedono una versione API:
- bedrock-mantle: Imposta anthropic-version: 2023-06-01 come intestazione HTTP.
- bedrock-runtime: impostato "anthropic_version": "bedrock-2023-05-31" nel corpo della richiesta.

Richiesta di base

Per inviare un messaggio di base a un modello Claude, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

bedrock-mantle (curl)


curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

bedrock-runtime (Python)


import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])

bedrock-runtime (AWS CLI)

Usa la AWS CLI per richiamare il modello:


aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json

bedrock-runtime (curl)

Puoi chiamare bedrock-runtime direttamente con curl firmando la richiesta con SigV4. AWS L'esempio seguente utilizza il --aws-sigv4 flag integrato di curl (disponibile in curl 7.75.0 e versioni successive):


curl -X POST \
  "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-sonnet-4-6-v1/invoke" \
  -H "Content-Type: application/json" \
  --aws-sigv4 "aws:amz:us-east-1:bedrock" \
  --user "$AWS_ACCESS_KEY_ID:$AWS_SECRET_ACCESS_KEY" \
  -d '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'

Nota

Se utilizzi credenziali temporanee di AWS STS (ad esempio, un ruolo assunto), passa anche il token di sessione aggiungendolo alla richiesta. -H "X-Amz-Security-Token: $AWS_SESSION_TOKEN" Per la maggior parte dei casi d'uso consigliamo gli AWS SDK o la CLI, che gestiscono automaticamente la firma delle richieste e l'aggiornamento delle credenziali.

Risposte in streaming

Per ricevere i token di risposta in modo incrementale man mano che vengono generati, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

Funzionalità supportate

Oltre alle precedenti sezioni Extended thinking, Adaptive thinking, Structured Output, Compaction, Fallback credit for Reflused Requests (beta) e Mid-conversation System messages, l'API Messages supporta le seguenti funzionalità con i modelli Claude:

Istruzioni di sistema: imposta il comportamento del modello con un parametro. system
Multi-turn conversazioni — Passa messaggi alternati. user assistant
Uso dell'utensile: definisce gli strumenti che il modello può chiamare. Per informazioni, consulta Utilizzo di uno strumento per completare una risposta al modello Amazon Bedrock.
Visione: invia immagini nell'contentarray insieme al testo.
Memorizzazione rapida nella cache: memorizza nella cache il contesto utilizzato di frequente per ridurre latenza e costi.

Per il riferimento completo al campo di richiesta e risposta dell'API Messages, consulta. Richiesta e risposta

Conta i token

Per contare il numero di token di input che una richiesta consumerebbe prima di inviarla per l'inferenza, usa il count_tokens percorso Anthropic sull'endpoint. bedrock-mantle Questo è l'unico percorso di conteggio dei token supportato per i modelli Claude che non sono disponibili su un Region-specific endpoint, inclusi i modelli Claude che vengono avviati solo bedrock-runtime con l'inferenza tra regioni (CRIS). Per informazioni dettagliate e un esempio, consulta Conta i token usando l'endpoint bedrock-mantle.

Convenzioni dei documenti

API di completamento della chat

Pensiero esteso