View a markdown version of this page

Inferenza utilizzando l'API Anthropic Messages - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Inferenza utilizzando l'API Anthropic Messages

L'API Anthropic Messages fornisce l'accesso nativo ai modelli di Claude utilizzando il formato di richiesta e risposta Anthropic. Puoi utilizzare l'API Messages sia sugli endpoint che sugli bedrock-runtime endpoint, offrendoti la bedrock-mantle flessibilità di scegliere lo stile di autenticazione e integrazione più adatto alla tua applicazione.

Endpoint URL di base Caso d'uso
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Consigliato per nuove applicazioni. Supporta l'autenticazione delle chiavi API eSpazi di lavoro () Anthropic-compatible.
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Utilizzalo con le integrazioni AWS SDK esistenti e la registrazione delle chiamate.

Regioni supportate

L'API Messages è disponibile sull'bedrock-mantleendpoint in tutte le regioni che supportano (vedi). bedrock-mantle Regioni ed endpoint supportati Sull'bedrock-runtimeendpoint, è disponibile in tutte le regioni in cui sono disponibili i modelli Claude. Per informazioni dettagliate, vedi Disponibilità regionale.

Prerequisiti

Prima di utilizzare l'API Messages, assicurati di disporre di quanto segue:

  • Accesso ai modelli: richiedi l'accesso ai modelli Claude nella console Amazon Bedrock. Per informazioni, consulta Richiedi l'accesso ai modelli.

  • Autenticazione: dipende dall'endpoint:

    • bedrock-mantle— Utilizza una chiave API Amazon Bedrock (vediChiavi API) o credenziali AWS SigV4.

    • bedrock-runtime— Usa le credenziali AWS SigV4 tramite l' AWS SDK (boto3, ecc.).

  • Intestazione della versione antropica: tutte le richieste richiedono una versione API:

    • bedrock-mantle: Imposta anthropic-version: 2023-06-01 come intestazione HTTP.

    • bedrock-runtime: impostato "anthropic_version": "bedrock-2023-05-31" nel corpo della richiesta.

Richiesta di base

Per inviare un messaggio di base a un modello Claude, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (AWS CLI)

Usa la AWS CLI per richiamare il modello:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json
bedrock-runtime (curl)

Puoi chiamare bedrock-runtime direttamente con curl firmando la richiesta con SigV4. AWS L'esempio seguente utilizza il --aws-sigv4 flag integrato di curl (disponibile in curl 7.75.0 e versioni successive):

curl -X POST \ "https://bedrock-runtime.us-east-1.amazonaws.com/model/anthropic.claude-sonnet-4-6-v1/invoke" \ -H "Content-Type: application/json" \ --aws-sigv4 "aws:amz:us-east-1:bedrock" \ --user "$AWS_ACCESS_KEY_ID:$AWS_SECRET_ACCESS_KEY" \ -d '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
Nota

Se utilizzi credenziali temporanee di AWS STS (ad esempio, un ruolo assunto), passa anche il token di sessione aggiungendolo alla richiesta. -H "X-Amz-Security-Token: $AWS_SESSION_TOKEN" Per la maggior parte dei casi d'uso consigliamo gli AWS SDK o la CLI, che gestiscono automaticamente la firma delle richieste e l'aggiornamento delle credenziali.

Risposte in streaming

Per ricevere i token di risposta in modo incrementale man mano che vengono generati, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Funzionalità supportate

Oltre alle precedenti sezioni Extended thinking, Adaptive thinking, Structured Output, Compaction, Fallback credit for Reflused Requests (beta) e Mid-conversation System messages, l'API Messages supporta le seguenti funzionalità con i modelli Claude:

  • Istruzioni di sistema: imposta il comportamento del modello con un parametro. system

  • Multi-turn conversazioni — Passa messaggi alternati. user assistant

  • Uso dell'utensile: definisce gli strumenti che il modello può chiamare. Per informazioni, consulta Utilizzo di uno strumento per completare una risposta al modello Amazon Bedrock.

  • Visione: invia immagini nell'contentarray insieme al testo.

  • Memorizzazione rapida nella cache: memorizza nella cache il contesto utilizzato di frequente per ridurre latenza e costi.

Per il riferimento completo al campo di richiesta e risposta dell'API Messages, consulta. Richiesta e risposta

Conta i token

Per contare il numero di token di input che una richiesta consumerebbe prima di inviarla per l'inferenza, usa il count_tokens percorso Anthropic sull'endpoint. bedrock-mantle Questo è l'unico percorso di conteggio dei token supportato per i modelli Claude che non sono disponibili su un Region-specific endpoint, inclusi i modelli Claude che vengono avviati solo bedrock-runtime con l'inferenza tra regioni (CRIS). Per informazioni dettagliate e un esempio, consulta Conta i token usando l'endpoint bedrock-mantle.