

 **Bantu tingkatkan halaman ini** 

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Untuk berkontribusi pada panduan pengguna ini, pilih **Edit halaman ini pada GitHub** tautan yang terletak di panel kanan setiap halaman.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Gunakan AMI yang EKS-optimized dipercepat untuk instans GPU
<a name="ml-eks-optimized-ami"></a>

Amazon EKS mendukung EKS-optimized Amazon Linux dan AMI Bottlerocket untuk instans GPU. AMI yang EKS-optimized dipercepat menyederhanakan menjalankan beban kerja AI dan ML di klaster EKS dengan menyediakan image sistem operasi yang telah dibuat sebelumnya dan tervalidasi untuk tumpukan Kubernetes yang dipercepat. [Selain komponen inti Kubernetes yang disertakan dalam EKS-optimized AMI standar, AMI yang EKS-optimized dipercepat mencakup modul kernel dan driver yang diperlukan untuk menjalankan instans GPU dan EC2 NVIDIA, `G` serta instans GPU [Inferentia](https://aws.amazon.com/machine-learning/inferentia/) dan Trainium `P` EC2 di AWS cluster EKS.](https://aws.amazon.com/machine-learning/trainium/)

Tabel di bawah ini menunjukkan tipe instans GPU yang didukung untuk setiap varian AMI yang EKS-optimized dipercepat. Lihat rilis EKS-optimized [AL2023](https://github.com/awslabs/amazon-eks-ami/releases) [dan rilis Bottlerocket](https://github.com/bottlerocket-os/bottlerocket/blob/develop/CHANGELOG.md) GitHub untuk pembaruan terbaru pada varian AMI.


| Varian EKS AMI | Jenis instans EC2 | 
| --- | --- | 
| AL2023 x86\_64 NVIDIA | p6-b300, p6-b200, p5, p5e, p5en, p4d, p4de, p3, p3dn, g7e, gr6, g6, g6e, g6f, gr6f, g5, g4dn | 
| AL2023 LENGAN NVIDIA | p6e-gb200, p6e-gb300, g5g | 
| AL2023 x86\_64 Neuron | inf1, inf2, trn1, trn2 | 
| Botol oket x86\_64 aws-k8s-nvidia | p6-b300, p6-b200, p5, p5e, p5en, p4d, p4de, p3, p3dn, g7e, gr6, g6, g6e, g6f, gr6f, g5, g4dn | 
| Bottlerocket aws-k8s-nvidia aarch64/arm64  | g5g | 
| Bottlerocket x86\_64 aws-k8s | inf1, inf2, trn1, trn2 | 

## EKS-optimized AMI NVIDIA
<a name="eks-amis-nvidia"></a>

Dengan menggunakan AMI EKS-optimized NVIDIA, Anda menyetujui [Perjanjian Lisensi Pengguna Akhir Cloud (EULA) NVIDIA](https://s3.amazonaws.com/EULA/NVidiaEULAforAWS.pdf).

Untuk menemukan AMI EKS-optimized NVIDIA terbaru, lihat [Ambil AMI Amazon Linux yang direkomendasikan IDs](retrieve-ami-id.md) dan[Ambil Bottlerocket AMI yang direkomendasikan IDs](retrieve-ami-id-bottlerocket.md).

Saat menggunakan Amazon Elastic Fabric Adapter (EFA) Fabric Adapter dengan EKS-optimized AL2023 atau Bottlerocket NVIDIA AMI, Anda harus menginstal plugin perangkat EFA secara terpisah. Untuk informasi selengkapnya, lihat [Jalankan pelatihan pembelajaran mesin di Amazon EKS dengan Adaptor Kain Elastis](node-efa.md).

## EKS AL2023 NVIDIA AMI
<a name="eks-amis-nvidia-al2023"></a>

Saat menggunakan [operator GPU NVIDIA](https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/overview.html) dengan AMI NVIDIA AL2023, Anda harus menonaktifkan instalasi operator driver dan toolkit, karena ini sudah termasuk dalam AMI EKS. EKS-optimized EKS-optimized AMI NVIDIA AL2023 tidak menyertakan plugin perangkat NVIDIA Kubernetes atau driver NVIDIA DRA, dan ini harus diinstal secara terpisah. Untuk informasi selengkapnya, lihat [Kelola perangkat GPU NVIDIA di Amazon EKS](device-management-nvidia.md).

Selain komponen EKS AMI standar, AMI NVIDIA EKS-optimized AL2023 menyertakan komponen-komponen berikut.
+ Pengemudi NVIDIA
+ Driver mode pengguna NVIDIA CUDA
+ Toolkit kontainer NVIDIA
+ Manajer kain NVIDIA
+ NVIDIA bertahan
+ Pengemudi NVIDIA IMEX
+ Manajer Subnet NVIDIA NVLink
+ EFA minimal (modul kernel dan rdma-core)

Untuk detail tentang driver mode pengguna NVIDIA CUDA dan CUDA yang runtime/libraries digunakan dalam wadah aplikasi, lihat dokumentasi [NVIDIA](https://docs.nvidia.com/deploy/cuda-compatibility/why-cuda-compatibility.html#why-cuda-compatibility). Versi CUDA yang ditampilkan `nvidia-smi` adalah versi driver mode pengguna NVIDIA CUDA yang diinstal pada host, yang harus kompatibel dengan CUDA yang runtime/libraries digunakan dalam wadah aplikasi.

 EKS-optimized AMI NVIDIA AL2023 mendukung kernel 6.12 untuk Kubernetes versi 1.33 ke atas, dan driver NVIDIA versi 580 untuk semua versi Kubernetes. Driver NVIDIA 580 diperlukan untuk menggunakan CUDA 13\+.

Lihat rilis EKS-optimized [ GitHub AL2023](https://github.com/awslabs/amazon-eks-ami/releases) untuk detail versi komponen yang disertakan dalam AMI. Lihat [skrip instalasi EKS AL2023 NVIDIA [AMI](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-nvidia-driver.sh) dan skrip pemuatan kernel](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/runtime/gpu/nvidia-kmod-load.sh) untuk detail tentang bagaimana AMI EKS mengonfigurasi dependensi NVIDIA. Anda dapat menemukan daftar paket yang diinstal dan versinya pada instance EC2 yang sedang berjalan dengan `dnf list installed` perintah.

Saat membuat AMI kustom dengan EKS-optimized AMI sebagai basisnya, tidak disarankan atau didukung untuk menjalankan upgrade sistem operasi (yaitu`dnf upgrade`) atau meng-upgrade paket Kubernetes atau GPU mana pun yang disertakan dalam EKS-optimized AMI, karena ini berisiko merusak kompatibilitas komponen. Jika Anda memutakhirkan sistem operasi atau paket yang disertakan dalam EKS-optimized AMI, disarankan untuk menguji secara menyeluruh dalam lingkungan pengembangan atau pementasan sebelum menerapkan ke produksi.

Saat membuat AMI kustom untuk instance GPU, disarankan untuk membuat AMI kustom terpisah untuk setiap pembuatan tipe instans dan keluarga yang akan Anda jalankan. AMI yang EKS-optimized dipercepat secara selektif menginstal driver dan paket saat runtime berdasarkan generasi dan keluarga tipe instance yang mendasarinya. Untuk informasi selengkapnya, lihat skrip EKS AMI untuk [instalasi](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-nvidia-driver.sh) dan [runtime](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/runtime/gpu/nvidia-kmod-load.sh).

## EKS Bottlerocket NVIDIA AMI
<a name="eks-amis-nvidia-bottlerocket"></a>

Saat menggunakan [operator GPU NVIDIA](https://docs.nvidia.com/datacenter/cloud-native/gpu-operator/latest/overview.html) dengan EKS-optimized Bottlerocket NVIDIA AMI, Anda harus menonaktifkan instalasi operator driver, toolkit, dan plugin perangkat karena ini sudah termasuk dalam AMI EKS.

Selain komponen EKS AMI standar, EKS-optimized Bottlerocket NVIDIA AMI menyertakan komponen-komponen berikut. Ketergantungan minimal untuk EFA (modul kernel dan rdma-core) dipasang di semua varian Bottlerocket.
+ Plugin perangkat NVIDIA Kubernetes
+ Pengemudi NVIDIA
+ Driver mode pengguna NVIDIA CUDA
+ Toolkit kontainer NVIDIA
+ Manajer kain NVIDIA
+ NVIDIA bertahan
+ Pengemudi NVIDIA IMEX
+ Manajer Subnet NVIDIA NVLink
+ Manajer NVIDIA MIG

Untuk detail tentang driver mode pengguna NVIDIA CUDA dan CUDA yang runtime/libraries digunakan dalam wadah aplikasi, lihat dokumentasi [NVIDIA](https://docs.nvidia.com/deploy/cuda-compatibility/why-cuda-compatibility.html#why-cuda-compatibility). Versi CUDA yang ditampilkan `nvidia-smi` adalah versi driver mode pengguna NVIDIA CUDA yang diinstal pada host, yang harus kompatibel dengan CUDA yang runtime/libraries digunakan dalam wadah aplikasi.

Lihat Informasi Versi Bottlerocket di [dokumentasi Bottlerocket](https://bottlerocket.dev/en/) untuk detail tentang paket yang diinstal dan versinya. EKS-optimized Bottlerocket NVIDIA AMI mendukung kernel 6.12 untuk Kubernetes versi 1.33 ke atas, dan driver NVIDIA versi 580 untuk Kubernetes versi 1.34 dan di atasnya. Driver NVIDIA 580 diperlukan untuk menggunakan CUDA 13\+.

## EKS-optimized AMI Neuron
<a name="eks-amis-neuron"></a>

Untuk detail tentang cara menjalankan beban kerja pelatihan dan inferensi menggunakan Neuron dengan Amazon EKS, lihat referensi berikut:
+  [Container - Kubernetes - Memulai](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) Dokumentasi Neuron AWS 
+  [Contoh pelatihan](https://github.com/aws-neuron/aws-neuron-eks-samples/blob/master/README.md#training) dalam Sampel AWS Neuron EKS pada GitHub
+  [Terapkan beban kerja inferensi ML dengan Inferentia di Amazon EKS](inferentia-support.md) 

Untuk menemukan AMI EKS-optimized Neuron terbaru, lihat [Ambil AMI Amazon Linux yang direkomendasikan IDs](retrieve-ami-id.md) dan[Ambil Bottlerocket AMI yang direkomendasikan IDs](retrieve-ami-id-bottlerocket.md).

Saat menggunakan Amazon Elastic Fabric Adapter (EFA) Fabric Adapter dengan EKS-optimized AL2023 atau Bottlerocket Neuron AMI, Anda harus menginstal plugin perangkat EFA secara terpisah. Untuk informasi selengkapnya, lihat [Jalankan pelatihan pembelajaran mesin di Amazon EKS dengan Adaptor Kain Elastis](node-efa.md).

## EKS AL2023 AMI Neuron
<a name="eks-amis-neuron-al2023"></a>

 EKS-optimized AMI Neuron AL2023 tidak menyertakan driver Neuron DRA, plugin perangkat Neuron Kubernetes, atau ekstensi penjadwal [Neuron Kubernetes, dan ini](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/tutorials/k8s-neuron-scheduler.html) harus diinstal secara terpisah. Untuk informasi selengkapnya, lihat [Kelola perangkat Neuron di Amazon EKS](device-management-neuron.md).

Selain komponen EKS AMI standar, AMI Neuron EKS-optimized AL2023 mencakup komponen-komponen berikut.
+ Pengemudi neuron (aws-neuronx-dkms)
+ Alat neuron (aws-neuronx-tools)
+ EFA minimal (modul kernel dan rdma-core)

Lihat skrip instalasi EKS AL2023 Neuron [AMI](https://github.com/awslabs/amazon-eks-ami/blob/main/templates/al2023/provisioners/install-neuron-driver.sh) untuk detail tentang bagaimana AMI EKS mengonfigurasi dependensi Neuron. Lihat rilis EKS-optimized [ GitHub AL2023](https://github.com/awslabs/amazon-eks-ami/releases) untuk melihat versi komponen yang disertakan dalam AMI. Anda dapat menemukan daftar paket yang diinstal dan versinya pada instance EC2 yang sedang berjalan dengan `dnf list installed` perintah.

## EKS Bottlerocket Neuron AMI
<a name="eks-amis-neuron-bottlerocket"></a>

Varian Bottlerocket standar (aws-k8s) mencakup dependensi Neuron yang secara otomatis terdeteksi dan dimuat saat berjalan pada instans Inferentia atau Trainium EC2. AWS 

AMI EKS-optimized Bottlerocket tidak menyertakan driver Neuron DRA, plugin perangkat Neuron Kubernetes, atau ekstensi penjadwal [Neuron Kubernetes](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/tutorials/k8s-neuron-scheduler.html), dan ini harus diinstal secara terpisah. Untuk informasi selengkapnya, lihat [Kelola perangkat Neuron di Amazon EKS](device-management-neuron.md).

Selain komponen EKS AMI standar, AMI Neuron EKS-optimized Bottlerocket mencakup komponen-komponen berikut.
+ Pengemudi neuron (aws-neuronx-dkms)
+ EFA minimal (modul kernel dan rdma-core)

Saat menggunakan AMI EKS-optimized Bottlerocket dengan instance Neuron, berikut ini harus dikonfigurasi dalam data pengguna Bottlerocket. Pengaturan ini memungkinkan wadah untuk mengambil kepemilikan perangkat Neuron yang dipasang berdasarkan `runAsGroup` nilai `runAsUser` dan yang disediakan dalam spesifikasi beban kerja. Untuk informasi lebih lanjut tentang dukungan Neuron di Bottlerocket, lihat [Quickstart](https://github.com/bottlerocket-os/bottlerocket/blob/develop/QUICKSTART-EKS.md#neuron-support) on EKS readme on. GitHub

```
[settings]
[settings.kubernetes]
device-ownership-from-security-context = true
```

Lihat [changelog kit kernel Bottlerocket](https://github.com/bottlerocket-os/bottlerocket-kernel-kit/blob/develop/CHANGELOG.md) untuk informasi tentang versi driver Neuron yang disertakan dalam AMI Bottlerocket. EKS-optimized 