

 **Aidez à améliorer cette page** 

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour contribuer à ce guide de l'utilisateur, cliquez sur le GitHub lien **Modifier cette page sur** qui se trouve dans le volet droit de chaque page.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Utiliser des AMI EKS-optimized accélérées pour les instances GPU
<a name="ml-eks-optimized-ami"></a>

Amazon EKS prend en charge les AMI EKS-optimized Amazon Linux et Bottlerocket pour les instances GPU. Les AMI EKS-optimized accélérées simplifient l'exécution des charges de travail d'intelligence artificielle et de machine learning dans les clusters EKS en fournissant des images de système d'exploitation prédéfinies et validées pour la pile Kubernetes accélérée. Outre les composants principaux de Kubernetes inclus dans les EKS-optimized AMI standard, les AMI EKS-optimized accélérées incluent les modules de noyau et les pilotes nécessaires pour exécuter le GPU NVIDIA et les instances EC2, `G` ainsi que les instances AWS GPU [Inferentia](https://aws.amazon.com/machine-learning/inferentia/) et [Trainium `P`](https://aws.amazon.com/machine-learning/trainium/) EC2 dans les clusters EKS.

Le tableau ci-dessous indique les types d'instances de GPU pris en charge pour chaque variante d'AMI EKS-optimized accélérée. Consultez les [versions EKS-optimized AL2023](https://github.com/awslabs/amazon-eks-ami/releases) et [Bottlerocket](https://github.com/bottlerocket-os/bottlerocket/blob/develop/CHANGELOG.md) pour connaître les dernières mises à jour GitHub des variantes de l'AMI.


| Variante EKS AMI | Types d'instances EC2 | 
| --- | --- | 
| AL2023 x86\_64 NVIDIA | p6-b300, p6-b200, p5, p5e, p5en, p4d, p4de, p3, p3dn, g7e, gr6, g6, g6e, g6f, gr6f, g5, g4dn | 
| BRAS NVIDIA AL2023 | p6e-gb200, p6e-gb300, 5g | 
| Neurone AL2023 x86\_64 | inf1, inf2, trn1, trn2 | 
| Bottlerocket x86\_64 aws-k8s-nvidia | p6-b300, p6-b200, p5, p5e, p5en, p4d, p4de, p3, p3dn, g7e, gr6, g6, g6e, g6f, gr6f, g5, g4dn | 
| Bottlerocket AWS-K8S-NVIDIA aarch64/arm64  | g/5g | 
| Bottlerocket x86\_64 aws-k8s | inf1, inf2, trn1, trn2 | 

## EKS-optimized AMI NVIDIA
<a name="eks-amis-nvidia"></a>

En utilisant les AMI EKS-optimized NVIDIA, vous acceptez le [contrat de licence utilisateur final (EULA) du cloud de NVIDIA](https://s3.amazonaws.com/EULA/NVidiaEULAforAWS.pdf).

Pour trouver les dernières AMI EKS-optimized NVIDIA, consultez [Récupérez l'AMI Amazon Linux recommandée IDs](retrieve-ami-id.md) et[Récupérer les ID d’AMI Bottlerocket recommandés](retrieve-ami-id-bottlerocket.md).

Lorsque vous utilisez Amazon Elastic Fabric Adapter (EFA) avec les AMI NVIDIA EKS-optimized AL2023 ou Bottlerocket, vous devez installer le plug-in de l'appareil EFA séparément. Pour de plus amples informations, veuillez consulter [Exécuter un entraînement de machine learning sur Amazon EKS avec Elastic Fabric Adapter](node-efa.md).

## AMI NVIDIA EKS AL2023
<a name="eks-amis-nvidia-al2023"></a>

Lorsque vous utilisez l'[opérateur GPU NVIDIA](https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/overview.html) avec les AMI NVIDIA EKS-optimized AL2023, vous devez désactiver l'installation du pilote et du kit d'outils par l'opérateur, car ceux-ci sont déjà inclus dans les AMI EKS. Les AMI NVIDIA EKS-optimized AL2023 n'incluent pas le plug-in de périphérique NVIDIA Kubernetes ni le pilote NVIDIA DRA, et ceux-ci doivent être installés séparément. Pour de plus amples informations, veuillez consulter [Gérez les appareils GPU NVIDIA sur Amazon EKS](device-management-nvidia.md).

Outre les composants standard de l'AMI EKS, les AMI NVIDIA EKS-optimized AL2023 incluent les composants suivants.
+ Pilote NVIDIA
+ Pilote en mode utilisateur NVIDIA CUDA
+ Boîte à outils pour conteneurs NVIDIA
+ Gestionnaire de tissus NVIDIA
+ NVIDIA a persisté
+ pilote NVIDIA IMEX
+ Gestionnaire de sous-réseau NVIDIA NVLink
+ EFA minimal (module noyau et rdma-core)

Pour plus de détails sur le pilote de mode utilisateur NVIDIA CUDA et le CUDA runtime/libraries utilisés dans les conteneurs d'applications, consultez la documentation [NVIDIA](https://docs.nvidia.com/deploy/cuda-compatibility/why-cuda-compatibility.html#why-cuda-compatibility). La version CUDA présentée ici `nvidia-smi` est la version du pilote de mode utilisateur NVIDIA CUDA installé sur l'hôte, qui doit être compatible avec le CUDA runtime/libraries utilisé dans les conteneurs d'applications.

Les AMI NVIDIA EKS-optimized AL2023 prennent en charge le noyau 6.12 pour les versions 1.33 et supérieures de Kubernetes, et la version 580 du pilote NVIDIA pour toutes les versions de Kubernetes. Le pilote NVIDIA 580 est requis pour utiliser CUDA 13\+.

Consultez les [versions de l' EKS-optimized AL2023 ci-dessous](https://github.com/awslabs/amazon-eks-ami/releases) GitHub pour plus de détails sur les versions des composants incluses dans les AMI. Consultez le script d'[installation de l'AMI NVIDIA EKS AL2023 et le script](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-nvidia-driver.sh) de [chargement du noyau](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/runtime/gpu/nvidia-kmod-load.sh) pour plus de détails sur la façon dont les AMI EKS configurent les dépendances NVIDIA. Vous pouvez trouver la liste des packages installés et de leurs versions sur une instance EC2 en cours d'exécution à l'aide de la `dnf list installed` commande.

Lors de la création d'AMI personnalisées avec les EKS-optimized AMI comme base, il n'est pas recommandé ou pris en charge d'exécuter une mise à niveau du système d'exploitation (c'est-à-dire`dnf upgrade`) ou de mettre à niveau l'un des packages Kubernetes ou GPU inclus dans les EKS-optimized AMI, car cela risque de compromettre la compatibilité des composants. Si vous mettez à niveau le système d'exploitation ou les packages inclus dans les EKS-optimized AMI, il est recommandé de procéder à des tests approfondis dans un environnement de développement ou de préparation avant le déploiement en production.

Lorsque vous créez des AMI personnalisées pour les instances de GPU, il est recommandé de créer des AMI personnalisées distinctes pour chaque génération et famille d'instances que vous allez exécuter. Les AMI EKS-optimized accélérées installent les pilotes et les packages de manière sélective au moment de l'exécution en fonction de la génération et de la famille du type d'instance sous-jacent. Pour plus d'informations, consultez les scripts EKS AMI pour [l'installation et l'](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-nvidia-driver.sh)[exécution](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/runtime/gpu/nvidia-kmod-load.sh).

## AMI NVIDIA EKS Bottlerocket
<a name="eks-amis-nvidia-bottlerocket"></a>

Lorsque vous utilisez l'[opérateur GPU NVIDIA](https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/overview.html) avec les AMI NVIDIA EKS-optimized Bottlerocket, vous devez désactiver l'installation par l'opérateur du pilote, du kit d'outils et du plug-in du périphérique, car ceux-ci sont déjà inclus dans les AMI EKS.

Outre les composants standard de l'AMI EKS, les AMI NVIDIA EKS-optimized Bottlerocket incluent les composants suivants. Les dépendances minimales pour EFA (module noyau et rdma-core) sont installées dans toutes les variantes de Bottlerocket.
+ Plug-in pour appareil NVIDIA Kubernetes
+ Pilote NVIDIA
+ Pilote en mode utilisateur NVIDIA CUDA
+ Boîte à outils pour conteneurs NVIDIA
+ Gestionnaire de tissus NVIDIA
+ NVIDIA a persisté
+ pilote NVIDIA IMEX
+ Gestionnaire de sous-réseau NVIDIA NVLink
+ Gestionnaire NVIDIA MIG

Pour plus de détails sur le pilote de mode utilisateur NVIDIA CUDA et le CUDA runtime/libraries utilisés dans les conteneurs d'applications, consultez la documentation [NVIDIA](https://docs.nvidia.com/deploy/cuda-compatibility/why-cuda-compatibility.html#why-cuda-compatibility). La version CUDA présentée ici `nvidia-smi` est la version du pilote de mode utilisateur NVIDIA CUDA installé sur l'hôte, qui doit être compatible avec le CUDA runtime/libraries utilisé dans les conteneurs d'applications.

Consultez les informations de version de Bottlerocket dans la [documentation de Bottlerocket](https://bottlerocket.dev/en/) pour plus de détails sur les packages installés et leurs versions. Les AMI NVIDIA EKS-optimized Bottlerocket prennent en charge le noyau 6.12 pour les versions 1.33 et supérieures de Kubernetes, et la version 580 du pilote NVIDIA pour les versions 1.34 et supérieures de Kubernetes. Le pilote NVIDIA 580 est requis pour utiliser CUDA 13\+.

## EKS-optimized AMI neuronales
<a name="eks-amis-neuron"></a>

Pour en savoir plus sur la façon d'exécuter des charges de travail d'entraînement et d'inférence à l'aide de Neuron avec Amazon EKS, consultez les références suivantes :
+  [Conteneurs - Kubernetes - Commencer](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) à utiliser la documentation Neuron AWS 
+  [Exemple de formation](https://github.com/aws-neuron/aws-neuron-eks-samples/blob/master/README.md#training) dans AWS Neuron EKS Samples on GitHub
+  [Déployez des charges de travail d'inférence ML avec Inferentia sur Amazon EKS](inferentia-support.md) 

Pour trouver les dernières AMI EKS-optimized Neuron, consultez [Récupérez l'AMI Amazon Linux recommandée IDs](retrieve-ami-id.md) et[Récupérer les ID d’AMI Bottlerocket recommandés](retrieve-ami-id-bottlerocket.md).

Lorsque vous utilisez Amazon Elastic Fabric Adapter (EFA) avec les AMI EKS-optimized AL2023 ou Bottlerocket Neuron, vous devez installer le plug-in de l'appareil EFA séparément. Pour de plus amples informations, veuillez consulter [Exécuter un entraînement de machine learning sur Amazon EKS avec Elastic Fabric Adapter](node-efa.md).

## AMI neuronales EKS AL2023
<a name="eks-amis-neuron-al2023"></a>

Les AMI Neuron EKS-optimized AL2023 n'incluent pas le pilote Neuron DRA, le plug-in du périphérique Neuron Kubernetes ou l'extension du planificateur [Neuron Kubernetes, et ceux-ci doivent être installés](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/tutorials/k8s-neuron-scheduler.html) séparément. Pour de plus amples informations, veuillez consulter [Gérez les appareils Neuron sur Amazon EKS](device-management-neuron.md).

Outre les composants standard de l'AMI EKS, les AMI Neuron EKS-optimized AL2023 incluent les composants suivants.
+ Pilote neuronal (aws-neuronx-dkms)
+ Outils Neuron (aws-neuronx-tools)
+ EFA minimal (module noyau et rdma-core)

Consultez le script d'[installation de l'AMI](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-neuron-driver.sh) Neuron EKS AL2023 pour plus de détails sur la façon dont les AMI EKS configurent les dépendances des neurones. Consultez les versions de l' EKS-optimized [AL2023 ci-dessous](https://github.com/awslabs/amazon-eks-ami/releases) GitHub pour voir les versions des composants incluses dans les AMI. Vous pouvez trouver la liste des packages installés et de leurs versions sur une instance EC2 en cours d'exécution à l'aide de la `dnf list installed` commande.

## AMI EKS Bottlerocket Neuron
<a name="eks-amis-neuron-bottlerocket"></a>

Les variantes standard de Bottlerocket (aws-k8s) incluent les dépendances Neuron qui sont automatiquement détectées et chargées lors de l'exécution sur des instances Inferentia ou Trainium EC2. AWS 

Les AMI EKS-optimized Bottlerocket n'incluent pas le pilote Neuron DRA, le plug-in du périphérique Neuron Kubernetes ou l'extension du planificateur [Neuron Kubernetes](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/tutorials/k8s-neuron-scheduler.html), et ceux-ci doivent être installés séparément. Pour de plus amples informations, veuillez consulter [Gérez les appareils Neuron sur Amazon EKS](device-management-neuron.md).

Outre les composants standard de l'AMI EKS, les AMI EKS-optimized Bottlerocket Neuron incluent les composants suivants.
+ Pilote neuronal (aws-neuronx-dkms)
+ EFA minimal (module noyau et rdma-core)

Lorsque vous utilisez les AMI EKS-optimized Bottlerocket avec des instances Neuron, les éléments suivants doivent être configurés dans les données utilisateur de Bottlerocket. Ce paramètre permet au conteneur de s'approprier le dispositif Neuron monté en fonction des `runAsGroup` valeurs `runAsUser` et fournies dans la spécification de charge de travail. Pour plus d'informations sur le support des neurones dans Bottlerocket, consultez le fichier [Quickstart](https://github.com/bottlerocket-os/bottlerocket/blob/develop/QUICKSTART-EKS.md#neuron-support) on EKS readme on. GitHub

```
[settings]
[settings.kubernetes]
device-ownership-from-security-context = true
```

Consultez le journal des [modifications du kit de noyau Bottlerocket pour plus d'informations sur la version du](https://github.com/bottlerocket-os/bottlerocket-kernel-kit/blob/develop/CHANGELOG.md) pilote Neuron incluse dans les AMI Bottlerocket. EKS-optimized 