

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Bereitstellen öffentlich verfügbarer Basismodelle mit der `JumpStartModel`-Klasse
<a name="jumpstart-foundation-models-use-python-sdk-model-class"></a>

Mithilfe des SageMaker Python SDK können Sie in nur wenigen Codezeilen einen integrierten Algorithmus oder ein vortrainiertes Modell auf einem SageMaker KI-Endpunkt bereitstellen.

1. Suchen Sie zunächst in der Tabelle [Built-in Algorithmen mit vortrainiertem Modell nach der Modell-ID für das Modell](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html) Ihrer Wahl.

1. Definieren Sie Ihr Modell anhand der Modell-ID als JumpStart Modell.

   ```
   from sagemaker.jumpstart.model import JumpStartModel
   
   model_id = {{"huggingface-text2text-flan-t5-xl"}}
   my_model = JumpStartModel(model_id=model_id)
   ```

1. Verwenden Sie die `deploy`-Methode, um Ihr Modell automatisch für die Inferenz bereitzustellen. In diesem Beispiel verwenden wir das FLAN-T5 XL-Modell vonHugging Face.

   ```
   predictor = my_model.deploy()
   ```

1. Anschließend können Sie mit der `predict`-Methode eine Inferenz mit dem bereitgestellten Modell ausführen.

   ```
   question = {{"What is Southern California often abbreviated as?"}}
   response = predictor.predict(question)
   print(response)
   ```

**Anmerkung**  
In diesem Beispiel wird das Foundation-Modell FLAN-T5 XL verwendet, das für eine Vielzahl von Anwendungsfällen zur Textgenerierung geeignet ist, darunter die Beantwortung von Fragen, die Zusammenfassung, die Erstellung von Chatbots und mehr. Weitere Informationen zu Anwendungsfällen für Modelle finden Sie unter [Verfügbare Basismodelle](jumpstart-foundation-models-latest.md).

Weitere Informationen zur `JumpStartModel ` Klasse und ihren Parametern finden Sie unter. [JumpStartModel](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.jumpstart.model.JumpStartModel)

## Standard-Instance-Typen überprüfen
<a name="jumpstart-foundation-models-use-python-sdk-model-class-instance-types"></a>

Sie können bei der Bereitstellung eines vortrainierten Modells mithilfe der `JumpStartModel`-Klasse optional bestimmte Modellversionen oder Instance-Typen einbeziehen. Alle JumpStart Modelle haben einen Standard-Instanztyp. Rufen Sie den standardmäßigen Bereitstellungs-Instance-Typ mit dem folgenden Code ab:

```
from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope={{"inference"}})
print(instance_type)
```

Mit der `instance_types.retrieve()` Methode werden alle unterstützten Instanztypen für ein bestimmtes JumpStart Modell angezeigt.

## Verwenden von Inferenzkomponenten, um mehrere Modelle auf einem gemeinsamen Endpunkt bereitzustellen
<a name="jumpstart-foundation-models-use-python-sdk-model-class-endpoint-types"></a>

Eine Inferenzkomponente ist ein SageMaker KI-Hosting-Objekt, mit dem Sie ein oder mehrere Modelle auf einem Endpunkt bereitstellen können, um die Flexibilität und Skalierbarkeit zu erhöhen. Sie müssen das `endpoint_type` ändern, damit Ihr JumpStart Modell auf Inferenzkomponenten und nicht auf dem standardmäßigen modellbasierten Endpunkt basiert. 

```
predictor = my_model.deploy(
    endpoint_name = {{'jumpstart-model-id-123456789012'}}, 
    endpoint_type = {{EndpointType.INFERENCE_COMPONENT_BASED}}
)
```

Weitere Informationen zum Erstellen von Endpunkten mit Inferenzkomponenten und zum Bereitstellen von KI-Modellen finden Sie unter. SageMaker [Gemeinsame Ressourcennutzung mit mehreren Modellen](realtime-endpoints-deploy-models.md#deployed-shared-utilization)

## Überprüfen gültiger Eingabe- und Ausgabeinferenzformate
<a name="jumpstart-foundation-models-use-python-sdk-model-class-input-output"></a>

Um gültige Dateneingabe- und -ausgabeformate auf Inferenz zu überprüfen, können Sie die `retrieve_options()`-Methode aus den Klassen `Serializers` und `Deserializers` verwenden.

```
print(sagemaker.serializers.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.deserializers.retrieve_options(model_id=model_id, model_version=model_version))
```

## Überprüfen unterstützter Inhalts- und Annahmetypen
<a name="jumpstart-foundation-models-use-python-sdk-model-class-content-types"></a>

Sie können die `retrieve_options()`-Methode ebenfalls verwenden, um die unterstützten Inhalts- und Annahmetypen zu überprüfen.

```
print(sagemaker.content_types.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.accept_types.retrieve_options(model_id=model_id, model_version=model_version))
```

Weitere Informationen zu Dienstprogrammen finden Sie unter [APIs für Dienstprogramme](https://sagemaker.readthedocs.io/en/stable/api/utility/index.html).