View a markdown version of this page

WorkSpaces Aplicaciones: servidor MCP - WorkSpaces Aplicaciones de Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

WorkSpaces Aplicaciones: servidor MCP

El servidor MCP de WorkSpaces Applications es un servicio totalmente gestionado que proporciona a los agentes de IA herramientas del Model Context Protocol (MCP) para interactuar con las aplicaciones de escritorio durante las sesiones de streaming. Los agentes pueden hacer clic en los botones, introducir texto, desplazarse y tomar capturas de pantalla del escritorio.

Descripción general de

Al habilitar el acceso de los agentes en una pila, los agentes pueden conectarse al servidor MCP administrado para interactuar con las aplicaciones de escritorio. El servidor MCP gestiona la comunicación entre el agente y la sesión de streaming. Su agente envía las solicitudes de herramientas MCP y el servidor las ejecuta en el escritorio.

El servidor MCP está alojado en la nube. AWS No necesita instalar ni mantener ningún componente del servidor. El servidor utiliza Streamable HTTP como protocolo de transporte.

Conexión al servidor MCP

Los agentes se conectan al servidor MCP en el siguiente punto final:

https://agentaccess-mcp.region.api.aws/mcp

Cada solicitud debe incluir lo siguiente:

  • Firma SigV4: todas las solicitudes deben firmarse con las credenciales de IAM y el nombre del servicio. agentaccess-mcp

  • Encabezado de la URL de transmisión: la URL de transmisión de la CreateStreamingURL API debe pasarse como X-Amzn-AgentAccess-Streaming-Session-Url encabezado en todas las solicitudes.

El siguiente ejemplo de Python muestra cómo conectarse mediantemcp-proxy-for-aws:

aws_iam_streamablehttp_client( endpoint="https://agentaccess-mcp.region.api.aws/mcp", aws_service="agentaccess-mcp", aws_region="region", headers={ "X-Amzn-AgentAccess-Streaming-Session-Url": streaming_url, }, )

Para otros lenguajes, debe escribir su propia lógica de firma para las solicitudes MCP salientes o buscar una biblioteca disponible que admita la firma SigV4.

Para obtener más información al respectomcp-proxy-for-aws, consulte mcp-proxy-for-aws en. GitHub

Herramientas disponibles

El servidor MCP proporciona las siguientes herramientas para que los agentes interactúen con el escritorio durante una sesión de streaming. Todos los nombres de las herramientas utilizan el agentaccess___ prefijo.

Herramientas de ratón

left_click

Haga clic con el botón izquierdo en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional, por ejemplo ctrl octrl+shift).

double_click

Haga doble clic en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

triple_click

Haga un triple clic en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

right_click

Haga clic con el botón derecho en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

middle_click

Haga clic con el botón central en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

left_click_drag

Arrastre con el botón izquierdo del ratón desde las coordenadas iniciales hasta las coordenadas finales.

Parámetros: start_x (obligatorio), start_y (obligatorio), end_x (obligatorio), end_y (obligatorio).

left_mouse_down

Mantenga pulsado el botón izquierdo del ratón en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

left_mouse_up

Suelte el botón izquierdo del ratón en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), modifiers (opcional).

move_pointer

Mueva el puntero a las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio).

scroll

Mueva la rueda del ratón en las coordenadas indicadas.

Parámetros: x (obligatorio), y (obligatorio), scroll_direction (obligatorio —Up,Down, oRight)Left, scroll_amount (obligatorio: con marcas, donde 120 puntos equivalen a una muesca de rueda), modifiers (opcional).

Herramientas de teclado

type_text

Escriba texto simulando los eventos del teclado para cada carácter.

Parámetros: text (obligatorio, hasta 10 000 caracteres).

key

Pulse una tecla o una combinación de teclas.

Parámetros: keys (obligatorio: una sola tecla o una combinación unida por+, por ejemplo actrl+c, octrl+shift+s).

hold_key

Mantenga pulsada una tecla o combinación de teclas durante un tiempo especificado.

Parámetros: keys (obligatorio), duration (obligatorio: de 1 a 30 segundos).

Herramientas de pantalla

screenshot

Haz una captura de pantalla del escritorio. Las dimensiones de la imagen devuelta definen el espacio de coordenadas de todas las herramientas del ratón.

Parámetros: include_cursor (opcional; el valor predeterminado esfalse).

Marcos compatibles

Puede conectarse al servidor MCP de WorkSpaces aplicaciones desde cualquier marco de MCP-compatible agente que admita la firma HTTP y SigV4 de Streamable. Se han probado los siguientes marcos:

Supervisión

Puede supervisar la actividad de los agentes mediante los siguientes servicios:

  • AWS CloudTrail— Los eventos de la sesión del agente están registrados CloudTrail. Puede ver cuándo se conectan los agentes, qué herramientas utilizan y cuándo finalizan las sesiones. Las llamadas a herramientas son eventos de datos y requieren que configure un registro para registrar los eventos de datos. Para obtener más información, consulte Registro de eventos de datos en la Guía del usuario de CloudTrail .

  • CloudWatch— Las métricas operativas de las sesiones de los agentes están disponibles en CloudWatch.

  • Amazon S3: si configura el almacenamiento de capturas de pantalla, las capturas de pantalla capturadas durante las sesiones de los agentes estarán disponibles en el bucket de Amazon S3 que especifique. Las capturas de pantalla se almacenan con el siguiente formato clave:

    agentaccess/screenshots/year=YYYY/month=MM/day=DD/session-id/timestamp.png

    El UUID de la ruta es el ID de la sesión de streaming de WorkSpaces las aplicaciones.

Introducción

Para empezar a utilizar el servidor MCP de WorkSpaces aplicaciones, consulte. Comience a proporcionar a los agentes acceso a las aplicaciones WorkSpaces