Icono que muestra el logo de xAi. xAI — Grok 4.3 Detalles del modelo Capacidades y características Precios Acceso programático Niveles de servicio Disponibilidad regional Cuotas y límites Código de muestra Consideraciones y limitaciones de uso

Grok 4.3

xAI — Grok 4.3

Detalles del modelo

Grok 4.3 es un modelo que prioriza el razonamiento y ofrece un esfuerzo de razonamiento siempre activo y configurable (ninguno, bajo, medio, alto). Como el razonamiento es siempre activo y no opcional, se comporta de forma más coherente en ciclos de agentes de varios pasos que los modelos que permiten prescindir del pensamiento. También ofrece una gran capacidad de uso de herramientas y de seguimiento de instrucciones para crear agentes de varios pasos, así como una eficiencia simbólica que ayuda a mantener la rentabilidad de las inferencias de gran volumen. Grok 4.3 es especialmente adecuado para cargas de trabajo empresariales, como la revisión de contratos, la investigación de jurisprudencia, el análisis de contratos de crédito y las preguntas y respuestas de documentos financieros, al tiempo que ofrece resultados consistentes y de alta calidad en flujos de trabajo de IA conversacional, búsqueda, chat y múltiples turnos. Grok 4.3 se ejecuta en Mantle, un nuevo motor de inferencias de Amazon Bedrock diseñado pensando en la relación precio-rendimiento, con soporte para llamadas a herramientas, resultados estructurados y transmisión de respuestas.

Fecha de lanzamiento del modelo: 15 de junio de 2026
Fecha de caducidad del modelo: N/A
Acuerdos de licencia de usuario final y condiciones de uso: Ver
Ciclo de vida del modelo: activo
Ventana de contexto: 1 millón de fichas
Razonamiento: compatible (configurable: bajo, medio, alto)

Modalidades de entrada	Modalidades de salida	APIs compatibles	Puntos finales compatibles
Audio	Incrustación	`Chat Completions`	`bedrock-runtime`
Imagen	Imagen	`Responses`	`bedrock-mantle`
Discurso	Discurso	`Invoke`
Texto	Texto	`Converse`
Vídeo	Vídeo

nota

Este modelo está disponible en la openai/v1/responses ruta del bedrock-mantle punto final. Es diferente de la v1/responses ruta utilizada por otros modelos en el punto final de las respuestas.

Capacidades y características

Características de Bedrock

Funciones compatibles con el terminal bedrock-mantle

Soportado	No compatible
Client-side llamada de herramientas Razonamiento Proyectos Detección de abusos Transmisión de respuestas Salidas estructuradas	—

Precios

Para conocer los precios, consulta la página de precios de Amazon Bedrock.

Acceso programático

Utilice los siguientes ID de modelo y URL de punto final para acceder a este modelo mediante programación. Para obtener más información sobre las API y los puntos de enlace disponibles, consulte API compatibles y puntos de enlace compatibles.

Punto de conexión	ID del modelo	In-Region URL del punto final	ID de geoinferencia	ID de inferencia global
`bedrock-mantle`	`xai.grok-4.3`	`https://bedrock-mantle.{region}.api.aws/openai/v1`	No admitido	No admitido

Por ejemplo, si la región es us-west-2 (Oregón), la URL del punto final de bedrock-mantle será "». https://bedrock-mantle.us-west-2.api.aws/openai/v1

Niveles de servicio

Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. El estándar proporciona acceso de pago por token sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles y no urgentes. Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.

Estándar	Priority (Prioridad)	Flexible	Reservado

Disponibilidad regional

La disponibilidad regional de un vistazo

Bedrock ofrece tres opciones de inferencia: In-Regionmantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las Cross-Region rutas geográficas entre regiones de una misma geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y Cross-Region las rutas globales a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la Disponibilidad regional página para obtener más información.

Region	In-Region	Geo	Global
`us-west-2`(Oregón)
`us-east-1`(Virginia del Norte)
`us-east-2`(Ohio)

Cuotas y límites

Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar el uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.

Cuando se consume el rendimiento bajo demanda en el bedrock-mantle punto final, el rendimiento disponible aumenta con el tiempo. No se garantiza que todas las solicitudes que se ajusten a su cuota se ejecuten correctamente durante los períodos de alta demanda, por lo que es importante aumentarlas gradualmente. Para este modelo, los límites predeterminados no se muestran directamente a través de Service Quotas, por lo que te recomendamos seguir la pauta como guía.

Código de muestra

Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS.

Paso 2: Clave de API: vaya a la consola de Amazon Bedrock y genere una clave de API a largo plazo.

Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función de las API que utilice.

Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave de API para la autenticación.

Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py

Consideraciones y limitaciones de uso

Esfuerzo de razonamiento: el razonamiento siempre está activo de forma predeterminada. Puede configurar el esfuerzo mediante el reasoning parámetro: {"effort": "none"} (desactiva el razonamiento), "low" (predeterminado) o"high". "medium" El contenido de Reasoning está cifrado y se puede devolver enviando la include: ["reasoning.encrypted_content"] solicitud a la API de respuestas. Puedes volver a enviar el contenido cifrado en turnos posteriores para proporcionar un contexto de razonamiento para las conversaciones que tengan lugar en varios turnos. La API Chat Completions no devuelve símbolos de razonamiento.
```
response = client.responses.create(
    model="xai.grok-4.3",
    reasoning={"effort": "high"},
    include=["reasoning.encrypted_content"],
    input="Explain quantum entanglement simply."
)
print(response.output_text)
```
Parámetros predeterminados: Grok 4.3 usa valores predeterminados que difieren de la especificación estándar de la API OpenAI: temperature los valores predeterminados son 0.7 (no1), los valores predeterminados son (no) top_p y los valores predeterminados son1. 0.95 max_completion_tokens 131072 Ajusta estos valores de forma explícita si tu aplicación requiere un comportamiento diferente.

Convenciones del documento

eje I

Z.AI