View a markdown version of this page

WorkSpaces Servidor MCP de aplicativos - WorkSpaces Aplicativos da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

WorkSpaces Servidor MCP de aplicativos

O servidor WorkSpaces Applications MCP é um serviço totalmente gerenciado que fornece aos agentes de IA ferramentas do Model Context Protocol (MCP) para interagir com aplicativos de desktop durante as sessões de streaming. Os agentes podem clicar em botões, inserir texto, rolar e fazer capturas de tela da área de trabalho.

Visão geral do

Quando você ativa o acesso do agente em uma pilha, os agentes podem se conectar ao servidor MCP gerenciado para interagir com os aplicativos de desktop. O servidor MCP gerencia a comunicação entre seu agente e a sessão de streaming. Seu agente envia solicitações de ferramentas MCP e o servidor as executa no desktop.

O servidor MCP está hospedado na AWS nuvem. Você não precisa instalar nem manter nenhum componente do servidor. O servidor usa HTTP Streamable como protocolo de transporte.

Conectando-se ao servidor MCP

Os agentes se conectam ao servidor MCP no seguinte endpoint:

https://agentaccess-mcp.region.api.aws/mcp

Cada solicitação deve incluir o seguinte:

  • Assinatura SigV4 — Todas as solicitações devem ser assinadas usando credenciais do IAM com o nome do serviço. agentaccess-mcp

  • Cabeçalho do URL de streaming — O URL de streaming da CreateStreamingURL API deve ser passado como X-Amzn-AgentAccess-Streaming-Session-Url cabeçalho em cada solicitação.

O exemplo de Python a seguir mostra como se conectar usando: mcp-proxy-for-aws

aws_iam_streamablehttp_client( endpoint="https://agentaccess-mcp.region.api.aws/mcp", aws_service="agentaccess-mcp", aws_region="region", headers={ "X-Amzn-AgentAccess-Streaming-Session-Url": streaming_url, }, )

Para outras linguagens, você precisa escrever sua própria lógica de assinatura para solicitações MCP enviadas ou encontrar uma biblioteca disponível que suporte a assinatura SigV4.

Para obter mais informações sobremcp-proxy-for-aws, consulte mcp-proxy-for-aws on. GitHub

Ferramentas disponíveis

O servidor MCP fornece as seguintes ferramentas para os agentes interagirem com o desktop durante uma sessão de streaming. Todos os nomes de ferramentas usam o agentaccess___ prefixo.

Ferramentas de mouse

left_click

Clique com o botão esquerdo nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional, por exemplo ctrl ouctrl+shift).

double_click

Clique duas vezes nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

triple_click

Faça um clique triplo nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

right_click

Clique com o botão direito do mouse nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

middle_click

Clique com o botão do meio nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

left_click_drag

Clique com o botão esquerdo e arraste das coordenadas iniciais para as coordenadas finais.

Parâmetros: start_x (obrigatório), start_y (obrigatório), end_x (obrigatório), end_y (obrigatório).

left_mouse_down

Pressione e segure o botão esquerdo do mouse nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

left_mouse_up

Solte o botão esquerdo do mouse nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), modifiers (opcional).

move_pointer

Mova o ponteiro para as coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório).

scroll

Role a roda do mouse nas coordenadas fornecidas.

Parâmetros: x (obrigatório), y (obrigatório), scroll_direction (obrigatório —Up,,Down, ouRight)Left, scroll_amount (obrigatório — em tiques, onde 120 tiques é igual ao entalhe de uma roda), (opcional). modifiers

Ferramentas de teclado

type_text

Digite texto simulando eventos de teclado para cada caractere.

Parâmetros: text (obrigatório — até 10.000 caracteres).

key

Pressione uma tecla ou uma combinação de teclas.

Parâmetros: keys (obrigatório — uma única tecla ou combinação unida por +a, por exemploctrl+c, ouctrl+shift+s).

hold_key

Mantenha pressionada uma tecla ou uma combinação de teclas por um período especificado.

Parâmetros: keys (obrigatório), duration (obrigatório — 1 a 30 segundos).

Ferramentas de tela

screenshot

Faça uma captura de tela da área de trabalho. As dimensões da imagem retornada definem o espaço de coordenadas para todas as ferramentas do mouse.

Parâmetros: include_cursor (opcional — o padrão é). false

Estruturas compatíveis

Você pode se conectar ao servidor WorkSpaces Applications MCP a partir de qualquer estrutura de MCP-compatible agente que ofereça suporte à assinatura Streamable HTTP e SigV4. As seguintes estruturas foram testadas:

Monitoramento

Você pode monitorar a atividade do agente por meio dos seguintes serviços:

  • AWS CloudTrail— Os eventos da sessão do agente são registrados. CloudTrail Você pode ver quando os agentes se conectam, quais ferramentas eles usam e quando as sessões terminam. As chamadas de ferramentas são eventos de dados e exigem que você configure uma trilha para registrar eventos de dados. Para obter mais informações, consulte Registrar eventos de dados, no Guia do usuário do CloudTrail .

  • CloudWatch— As métricas operacionais para sessões de agentes estão disponíveis em CloudWatch.

  • Amazon S3 — Se você configurar o armazenamento de capturas de tela, as capturas de tela capturadas durante as sessões do agente estarão disponíveis no bucket do Amazon S3 que você especificar. As capturas de tela são armazenadas com o seguinte formato de chave:

    agentaccess/screenshots/year=YYYY/month=MM/day=DD/session-id/timestamp.png

    O UUID no caminho é o ID da sessão de streaming de WorkSpaces aplicativos.

Conceitos básicos

Para começar a usar o servidor WorkSpaces Applications MCP, consulteComece a fornecer aos agentes acesso aos WorkSpaces aplicativos.