Inspect AI による評価
オープンソースの評価フレームワークである Inspect AI
ワークフローに最適な評価アプローチを選択します:
-
Inspect AI SDK – ノートブックまたはローカル環境から SageMaker 推論エンドポイントに対してインタラクティブに評価を実行します。開発、イテレーション、クイックテストに最適です。
-
Inspect AI コンテナ – SageMaker トレーニングジョブとして大規模に評価を実行します。本番稼働用評価パイプライン、複数のベンチマークの連鎖、自動化されたワークフローに最適です。
推奨されるワークフロー: Inspect AI SDK から始めて、AI アシスタントのオンボーディングプロンプト