Avaliação com o Inspect AI
É possível avaliar modelos personalizados do Amazon Nova usando o Inspect AI
Escolha a abordagem de avaliação que melhor se adapta ao seu fluxo de trabalho:
-
SDK do Inspect AI: execute avaliações de forma interativa de um caderno ou ambiente local para o endpoint de inferência do SageMaker. É a abordagem ideal para desenvolvimento, iteração e testes rápidos.
-
Contêiner do Inspect AI: execute avaliações em grande escala, como Tarefas de Treinamento do SageMaker. É a abordagem ideal para pipelines de avaliação de produção, encadeamento de diversas avaliações comparativas e fluxos de trabalho automatizados.
Fluxo de trabalho recomendado: comece com o SDK do Inspect AI para criar e testar as avaliações comparativas de avaliação personalizadas usando o prompt de integração do assistente de IA