As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Tutoriais de caderno de avaliação de modelos
Esta seção fornece os seguintes tutoriais do caderno, incluindo exemplos de código e explicações:
-
Como avaliar um JumpStart modelo para estereotipagem imediata.
-
Como avaliar um modelo do Amazon Bedrock para precisão de resumo de texto.
Tópicos
Cadernos adicionais
O GitHub diretório fmeval
-
bedrock-claude-factual-knowledge.ipnyb
: Avalia um modelo Claude 2 da Anthropic hospedado no Amazon Bedrock para conhecimento fatual. -
byo-model-outputs.ipynb — Avalia um modelo Falcon 7b
hospedado para conhecimento factual, onde você traz suas próprias saídas de modelo em vez de enviar solicitações de inferência JumpStart para seu modelo. -
custom_model_runner_chat_gpt.ipnyb
: Avalia um modelo personalizado do ChatGPT 3.5hospedado emHugging Facepara conhecimento fatual.