Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
WorkSpaces Aplicaciones: servidor MCP
El servidor MCP de WorkSpaces Applications es un servicio totalmente gestionado que proporciona a los agentes de IA herramientas del Model Context Protocol (MCP) para interactuar con las aplicaciones de escritorio durante las sesiones de streaming. Los agentes pueden hacer clic en los botones, introducir texto, desplazarse y tomar capturas de pantalla del escritorio.
Descripción general de
Al habilitar el acceso de los agentes en una pila, los agentes pueden conectarse al servidor MCP administrado para interactuar con las aplicaciones de escritorio. El servidor MCP gestiona la comunicación entre el agente y la sesión de streaming. Su agente envía las solicitudes de herramientas MCP y el servidor las ejecuta en el escritorio.
El servidor MCP está alojado en la nube. AWS No necesita instalar ni mantener ningún componente del servidor. El servidor utiliza Streamable HTTP como protocolo de transporte.
Conexión al servidor MCP
Los agentes se conectan al servidor MCP en el siguiente punto final:
https://agentaccess-mcp.region.api.aws/mcp
Cada solicitud debe incluir lo siguiente:
-
Firma SigV4: todas las solicitudes deben firmarse con las credenciales de IAM y el nombre del servicio.
agentaccess-mcp -
Encabezado de la URL de transmisión: la URL de transmisión de la
CreateStreamingURLAPI debe pasarse comoX-Amzn-AgentAccess-Streaming-Session-Urlencabezado en todas las solicitudes.
El siguiente ejemplo de Python muestra cómo conectarse mediantemcp-proxy-for-aws:
aws_iam_streamablehttp_client( endpoint="https://agentaccess-mcp.region.api.aws/mcp", aws_service="agentaccess-mcp", aws_region="region", headers={ "X-Amzn-AgentAccess-Streaming-Session-Url": streaming_url, }, )
Para otros lenguajes, debe escribir su propia lógica de firma para las solicitudes MCP salientes o buscar una biblioteca disponible que admita la firma SigV4.
Para obtener más información al respectomcp-proxy-for-aws, consulte mcp-proxy-for-aws
Herramientas disponibles
El servidor MCP proporciona las siguientes herramientas para que los agentes interactúen con el escritorio durante una sesión de streaming. Todos los nombres de las herramientas utilizan el agentaccess___ prefijo.
Herramientas de ratón
left_click-
Haga clic con el botón izquierdo en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional, por ejemploctrloctrl+shift). double_click-
Haga doble clic en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). triple_click-
Haga un triple clic en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). right_click-
Haga clic con el botón derecho en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). middle_click-
Haga clic con el botón central en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). left_click_drag-
Arrastre con el botón izquierdo del ratón desde las coordenadas iniciales hasta las coordenadas finales.
Parámetros:
start_x(obligatorio),start_y(obligatorio),end_x(obligatorio),end_y(obligatorio). left_mouse_down-
Mantenga pulsado el botón izquierdo del ratón en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). left_mouse_up-
Suelte el botón izquierdo del ratón en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),modifiers(opcional). move_pointer-
Mueva el puntero a las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio). scroll-
Mueva la rueda del ratón en las coordenadas indicadas.
Parámetros:
x(obligatorio),y(obligatorio),scroll_direction(obligatorio —Up,Down, oRight)Left,scroll_amount(obligatorio: con marcas, donde 120 puntos equivalen a una muesca de rueda),modifiers(opcional).
Herramientas de teclado
type_text-
Escriba texto simulando los eventos del teclado para cada carácter.
Parámetros:
text(obligatorio, hasta 10 000 caracteres). key-
Pulse una tecla o una combinación de teclas.
Parámetros:
keys(obligatorio: una sola tecla o una combinación unida por+, por ejemploactrl+c, octrl+shift+s). hold_key-
Mantenga pulsada una tecla o combinación de teclas durante un tiempo especificado.
Parámetros:
keys(obligatorio),duration(obligatorio: de 1 a 30 segundos).
Herramientas de pantalla
screenshot-
Haz una captura de pantalla del escritorio. Las dimensiones de la imagen devuelta definen el espacio de coordenadas de todas las herramientas del ratón.
Parámetros:
include_cursor(opcional; el valor predeterminado esfalse).
Marcos compatibles
Puede conectarse al servidor MCP de WorkSpaces aplicaciones desde cualquier marco de MCP-compatible agente que admita la firma HTTP y SigV4 de Streamable. Se han probado los siguientes marcos:
-
SDK de Strands Agents
: proporciona soporte nativo para clientes MCP. -
mcp-proxy-for-aws
: un transporte ligero que gestiona la firma SiGv4 para las solicitudes de MCP en Python.
Supervisión
Puede supervisar la actividad de los agentes mediante los siguientes servicios:
-
AWS CloudTrail— Los eventos de la sesión del agente están registrados CloudTrail. Puede ver cuándo se conectan los agentes, qué herramientas utilizan y cuándo finalizan las sesiones. Las llamadas a herramientas son eventos de datos y requieren que configure un registro para registrar los eventos de datos. Para obtener más información, consulte Registro de eventos de datos en la Guía del usuario de CloudTrail .
-
CloudWatch— Las métricas operativas de las sesiones de los agentes están disponibles en CloudWatch.
-
Amazon S3: si configura el almacenamiento de capturas de pantalla, las capturas de pantalla capturadas durante las sesiones de los agentes estarán disponibles en el bucket de Amazon S3 que especifique. Las capturas de pantalla se almacenan con el siguiente formato clave:
agentaccess/screenshots/year=YYYY/month=MM/day=DD/session-id/timestamp.pngEl UUID de la ruta es el ID de la sesión de streaming de WorkSpaces las aplicaciones.
Introducción
Para empezar a utilizar el servidor MCP de WorkSpaces aplicaciones, consulte. Comience a proporcionar a los agentes acceso a las aplicaciones WorkSpaces