Tutoriais de caderno de avaliação de modelos

Esta seção fornece os seguintes tutoriais do caderno, incluindo exemplos de código e explicações:

Cadernos adicionais

O GitHub diretório fmeval contém os seguintes exemplos adicionais de notebooks:

bedrock-claude-factual-knowledge.ipnyb: Avalia um modelo Claude 2 da Anthropic hospedado no Amazon Bedrock para conhecimento fatual.
byo-model-outputs.ipynb — Avalia um modelo Falcon 7b hospedado para conhecimento factual, onde você traz suas próprias saídas de modelo em vez de enviar solicitações de inferência JumpStart para seu modelo.
custom_model_runner_chat_gpt.ipnyb: Avalia um modelo personalizado do ChatGPT 3.5 hospedado em Hugging Face para conhecimento fatual.

Como usar a biblioteca fmeval

Avalie um JumpStart modelo para estereotipagem imediata