使用 Inspect AI 评测模型
您可以借助开源评测框架 Inspect AI
选择适配工作流程的评测方案:
-
Inspect AI SDK – 在笔记本或本地环境中,针对 SageMaker 推理端点,以交互方式运行模型评测。适合开发调试、迭代优化与快速验证。
-
Inspect AI 容器 – 以 SageMaker 训练作业形式大规模批量执行评测。适合生产级评测管道、多基准串联测试及自动化工作流程。
推荐工作流程:先使用 Inspect AI SDK,依据人工智能助手引导提示