Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Grok 4.3
xAI — Grok 4.3
Detalles del modelo
Grok 4.3 es un modelo que prioriza el razonamiento y ofrece un esfuerzo de razonamiento siempre activo y configurable (ninguno, bajo, medio, alto). Como el razonamiento es siempre activo y no opcional, se comporta de forma más coherente en ciclos de agentes de varios pasos que los modelos que permiten prescindir del pensamiento. También ofrece una gran capacidad de uso de herramientas y de seguimiento de instrucciones para crear agentes de varios pasos, así como una eficiencia simbólica que ayuda a mantener la rentabilidad de las inferencias de gran volumen. Grok 4.3 es especialmente adecuado para cargas de trabajo empresariales, como la revisión de contratos, la investigación de jurisprudencia, el análisis de contratos de crédito y las preguntas y respuestas de documentos financieros, al tiempo que ofrece resultados consistentes y de alta calidad en flujos de trabajo de IA conversacional, búsqueda, chat y múltiples turnos. Grok 4.3 se ejecuta en Mantle, un nuevo motor de inferencias de Amazon Bedrock diseñado pensando en la relación precio-rendimiento, con soporte para llamadas a herramientas, resultados estructurados y transmisión de respuestas.
Fecha de lanzamiento del modelo: 15 de junio de 2026
Fecha de caducidad del modelo: N/A
Acuerdos de licencia de usuario final y condiciones de uso: Ver
Ciclo de vida del modelo: activo
Ventana de contexto: 1 millón de fichas
Razonamiento: compatible (configurable: bajo, medio, alto)
| Modalidades de entrada | Modalidades de salida | APIs compatibles | Puntos finales compatibles |
|---|---|---|---|
Chat Completions | bedrock-runtime | ||
Responses | bedrock-mantle | ||
Invoke | |||
Converse | |||
nota
Este modelo está disponible en la openai/v1/responses ruta del bedrock-mantle punto final. Es diferente de la v1/responses ruta utilizada por otros modelos en el punto final de las respuestas.
Capacidades y características
Características de Bedrock
Funciones compatibles con el terminal bedrock-mantle
| Soportado | No compatible |
|---|---|
|
— |
Precios
Para conocer los precios, consulta la página de precios de Amazon Bedrock
Acceso programático
Utilice los siguientes ID de modelo y URL de punto final para acceder a este modelo mediante programación. Para obtener más información sobre las API y los puntos de enlace disponibles, consulte API compatibles y puntos de enlace compatibles.
| Punto de conexión | ID del modelo | In-Region URL del punto final | ID de geoinferencia | ID de inferencia global |
|---|---|---|---|---|
bedrock-mantle |
xai.grok-4.3 |
https://bedrock-mantle.{region}.api.aws/openai/v1 |
No admitido | No admitido |
Por ejemplo, si la región es us-west-2 (Oregón), la URL del punto final de bedrock-mantle será "». https://bedrock-mantle.us-west-2.api.aws/openai/v1
Niveles de servicio
Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. El estándar proporciona acceso de pago por token sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles y no urgentes. Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.
| Estándar | Priority (Prioridad) | Flexible | Reservado |
|---|---|---|---|
Disponibilidad regional
La disponibilidad regional de un vistazo
Bedrock ofrece tres opciones de inferencia: In-Regionmantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las Cross-Region rutas geográficas entre regiones de una misma geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y Cross-Region las rutas globales a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la Disponibilidad regional página para obtener más información.
| Region | In-Region | Geo | Global |
|---|---|---|---|
us-west-2(Oregón) | |||
us-east-1(Virginia del Norte) | |||
us-east-2(Ohio) |
Cuotas y límites
Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar el uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.
Cuando se consume el rendimiento bajo demanda en el bedrock-mantle punto final, el rendimiento disponible aumenta con el tiempo. No se garantiza que todas las solicitudes que se ajusten a su cuota se ejecuten correctamente durante los períodos de alta demanda, por lo que es importante aumentarlas gradualmente. Para este modelo, los límites predeterminados no se muestran directamente a través de Service Quotas, por lo que te recomendamos seguir la pauta como guía.
Código de muestra
Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS
Paso 2: Clave de API: vaya a la consola de Amazon Bedrock
Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función de las API que utilice.
Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave de API para la autenticación.
Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py
Consideraciones y limitaciones de uso
Esfuerzo de razonamiento: el razonamiento siempre está activo de forma predeterminada. Puede configurar el esfuerzo mediante el
reasoningparámetro:{"effort": "none"}(desactiva el razonamiento),"low"(predeterminado) o"high"."medium"El contenido de Reasoning está cifrado y se puede devolver enviando lainclude: ["reasoning.encrypted_content"]solicitud a la API de respuestas. Puedes volver a enviar el contenido cifrado en turnos posteriores para proporcionar un contexto de razonamiento para las conversaciones que tengan lugar en varios turnos. La API Chat Completions no devuelve símbolos de razonamiento.response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)Parámetros predeterminados: Grok 4.3 usa valores predeterminados que difieren de la especificación estándar de la API OpenAI:
temperaturelos valores predeterminados son0.7(no1), los valores predeterminados son (no)top_py los valores predeterminados son1.0.95max_completion_tokens131072Ajusta estos valores de forma explícita si tu aplicación requiere un comportamiento diferente.