Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mulai cepat: OTel Container Insights di Amazon EKS
Panduan ini memandu Anda untuk mengaktifkan OTel Container Insights pada kluster Amazon EKS yang ada. Pada akhir prosedur ini, klaster Anda mengirimkan metrik infrastruktur dan log kontainer ke Amazon CloudWatch dengan Enhanced Observability diaktifkan.
Anda dapat mengaktifkan OTel Container Insights dalam dua cara: dengan menggunakan Konsol Manajemen AWS (tercepat) atau dengan menggunakan. AWS CLI Kedua pendekatan menginstal add-on amazon-cloudwatch-observability EKS yang sama dengan konfigurasi OTel Container Insights. Anda tidak memerlukan penerapan agen manual, bagan Helm, atau pipeline kolektor khusus. Seluruh proses memakan waktu kurang dari 5 menit.
Prasyarat
Sebelum Anda mengaktifkan OTel Container Insights, verifikasi bahwa Anda memenuhi persyaratan berikut.
-
Cluster Amazon EKS yang sudah ada yang menjalankan Kubernetes versi 1.28 atau yang lebih baru
-
Versi platform
eks.1atau yang lebih baru -
Versi 6.2.0 atau yang lebih baru dari add-on
amazon-cloudwatch-observability -
AWS CLI versi 2.15.0 atau yang lebih baru (untuk CLI-based pengaturan)
-
kubectldikonfigurasi untuk berkomunikasi dengan cluster target Anda -
Izin IAM:
eks:CreateAddon,, daneks:DescribeAddoniam:CreateServiceLinkedRole -
Add-on EKS Pod Identity Agent yang diinstal pada klaster Anda, atau IAM Roles for Service Accounts (IRSA) yang dikonfigurasi
-
Akses internet keluar dari cluster ke titik akhir CloudWatch
Aktifkan Wawasan Kontainer OTel (konsol)
Konsol Manajemen AWS Ini menyediakan jalur tercepat untuk mengaktifkan OTel Container Insights.
Untuk mengaktifkan OTel Container Insights dengan menggunakan konsol
-
Buka konsol Amazon EKS di https://console.aws.amazon.com/eks/
. -
Pilih Cluster, lalu pilih nama cluster Anda.
-
Pilih tab Observability.
-
Pilih Aktifkan Wawasan Kontainer dan ikuti petunjuk di layar.
Untuk panduan konsol yang mendetail, lihat. Aktifkan Insights Kontainer OTel dari konsol
Aktifkan Wawasan Kontainer OTel (AWS CLI)
Gunakan langkah-langkah berikut untuk mengaktifkan OTel Container Insights dengan menggunakan. AWS CLI
Langkah 1: Buat peran IAM
Buat peran IAM yang memungkinkan add-on CloudWatch Observability untuk mengirim data ke. CloudWatch
Untuk membuat peran IAM add-on CloudWatch Observability
-
Jalankan perintah berikut untuk membuat peran dengan kebijakan kepercayaan untuk EKS Pod Identity.
aws iam create-role \ --role-name EKS-CloudWatch-Observability-Role \ --assume-role-policy-document '{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Principal": { "Service": "pods.eks.amazonaws.com" }, "Action": ["sts:AssumeRole", "sts:TagSession"] }] }' -
Lampirkan kebijakan yang
CloudWatchAgentServerPolicydikelola ke peran.aws iam attach-role-policy \ --role-name EKS-CloudWatch-Observability-Role \ --policy-arn arn:aws:iam::aws:policy/CloudWatchAgentServerPolicy
Langkah 2: Buat asosiasi Pod Identity
Kaitkan peran IAM dengan akun layanan CloudWatch agen di klaster Anda.
Untuk membuat asosiasi Pod Identity
-
Jalankan perintah berikut. Ganti
cluster-namedengan nama cluster Amazon EKS Anda danaccount-iddengan ID AWS akun Anda.aws eks create-pod-identity-association \ --cluster-namecluster-name\ --namespace amazon-cloudwatch \ --service-account cloudwatch-agent \ --role-arn arn:aws:iam::account-id:role/EKS-CloudWatch-Observability-Role
Langkah 3: Instal add-on Amazon CloudWatch Observability
Instal amazon-cloudwatch-observability add-on dengan OTel Container Insights diaktifkan.
Untuk menginstal add-on
-
Jalankan perintah berikut. Ganti
cluster-namedengan nama cluster Amazon EKS Anda.aws eks create-addon \ --cluster-namecluster-name\ --addon-name amazon-cloudwatch-observability \ --configuration-values '{"otelContainerInsights":{"enabled":true}}'penting
otelContainerInsights.enabledKonfigurasi diperlukan. OTel Container Insights tidak diaktifkan secara default.
Langkah 4: Verifikasi status add-on
Konfirmasikan bahwa add-on berhasil diinstal.
Untuk memverifikasi status add-on
-
Jalankan perintah berikut. Ganti
cluster-namedengan nama cluster Amazon EKS Anda.aws eks describe-addon \ --cluster-namecluster-name\ --addon-name amazon-cloudwatch-observability \ --query "addon.status" \ --output textOutput yang diharapkan adalah
ACTIVE.
Langkah 5: Konfirmasikan pod agen sedang berjalan
Verifikasi bahwa pod CloudWatch agen berjalan di amazon-cloudwatch namespace.
Untuk mengonfirmasi pod agen sedang berjalan
-
Jalankan perintah berikut.
kubectl get pods -n amazon-cloudwatch -l app.kubernetes.io/name=cloudwatch-agentSemua pod agen harus menunjukkan
Runningstatus.
Verifikasi data di CloudWatch
Setelah Anda menyelesaikan penyiapan, data Wawasan Kontainer muncul CloudWatch dalam waktu 3 hingga 5 menit.
Periksa metrik
Untuk memeriksa metrik di CloudWatch
-
Buka CloudWatch konsol di https://console.aws.amazon.com/cloudwatch/
. -
Di panel navigasi, pilih Query Studio.
-
Cari metrik seperti menggunakan
container_cpu_usage_seconds_totalPromQL.
Periksa log
Untuk memverifikasi bahwa grup log ada untuk klaster Anda, jalankan perintah berikut. Ganti cluster-name dengan nama cluster Amazon EKS Anda.
aws logs describe-log-groups \ --log-group-name-prefix "/aws/containerinsights/cluster-name" \ --query "logGroups[].logGroupName" \ --output table
Waktu yang diharapkan untuk data
Tabel berikut menunjukkan latensi yang diharapkan untuk setiap jenis sinyal setelah Anda mengaktifkan OTel Container Insights.
| Sinyal | Latensi yang diharapkan |
|---|---|
| Metrik infrastruktur | 2—3 menit |
| Log Kontainer | 2—3 menit |
| Peristiwa log kinerja | 3—5 menit |
Pemecahan masalah
Gunakan panduan berikut untuk mengatasi masalah umum saat Anda mengaktifkan OTel Container Insights di Amazon EKS.
Add-on status menunjukkan CREATE_FAILED atau DEGRADED
Gejala: Saat Anda berlariaws eks
describe-addon, status menunjukkan CREATE_FAILED atauDEGRADED.
Penyebab: Instalasi add-on gagal, biasanya karena izin IAM yang tidak mencukupi atau asosiasi Identitas Pod yang hilang.
Solusi: Selesaikan langkah-langkah berikut untuk mengatasi masalah ini.
-
Jalankan perintah berikut untuk memeriksa informasi kesalahan terperinci. Ganti
cluster-namedengan nama klaster Anda.aws eks describe-addon \ --cluster-namecluster-name\ --addon-name amazon-cloudwatch-observability \ --query "addon.health" -
Verifikasi bahwa peran IAM ada dan memiliki
CloudWatchAgentServerPolicyterlampir. -
Verifikasi bahwa asosiasi Pod Identity menargetkan namespace (
amazon-cloudwatch) dan service account (cloudwatch-agent) yang benar. -
Hapus add-on yang gagal dan instal ulang setelah Anda menyelesaikan masalah.
aws eks delete-addon \ --cluster-namecluster-name\ --addon-name amazon-cloudwatch-observability
Pod agen dalam CrashLoopBackOff atau status Tertunda
Gejala: Saat Anda menjalankankubectl get pods -n
amazon-cloudwatch, satu atau beberapa pod akan ditampilkan CrashLoopBackOff atau Pending berstatus.
Penyebab: Pod agen tidak dapat memulai karena sumber daya node yang tidak mencukupi, izin yang hilang, atau masalah konektivitas jaringan.
Solusi: Selesaikan langkah-langkah berikut untuk mengatasi masalah ini.
-
Periksa peristiwa pod untuk mengetahui pesan kesalahan yang mendetail.
kubectl describe pod -n amazon-cloudwatch -l app.kubernetes.io/name=cloudwatch-agent -
Periksa log kontainer agen untuk kesalahan startup.
kubectl logs -n amazon-cloudwatch -l app.kubernetes.io/name=cloudwatch-agent --tail=50 -
Verifikasi bahwa node Anda memiliki CPU dan memori yang cukup untuk pod agen.
-
Verifikasi bahwa add-on EKS Pod Identity Agent telah diinstal dan dijalankan.
kubectl get pods -n kube-system -l app.kubernetes.io/name=eks-pod-identity-agent
Metrik tidak muncul CloudWatch setelah 5 menit
Gejala: Pod agen menunjukkan Running status, tetapi tidak ada metrik yang muncul CloudWatch setelah 5 menit.
Penyebab: Agen tidak dapat mengirim data ke CloudWatch, biasanya karena pembatasan jaringan atau izin IAM yang salah.
Solusi: Selesaikan langkah-langkah berikut untuk mengatasi masalah ini.
-
Verifikasi bahwa pod agen dapat mencapai CloudWatch titik akhir. Periksa apakah grup keamanan VPC dan ACL jaringan Anda mengizinkan lalu lintas HTTPS keluar (port 443) ke titik akhir. CloudWatch
-
Periksa log agen untuk kesalahan izin atau batas waktu koneksi.
kubectl logs -n amazon-cloudwatch -l app.kubernetes.io/name=cloudwatch-agent --tail=100 | grep -i "error\|timeout\|denied" -
Verifikasi bahwa peran IAM memiliki
CloudWatchAgentServerPolicykebijakan yang dilampirkan dan bahwa kebijakan kepercayaan memungkinkanpods.eks.amazonaws.com. -
Jika Anda menggunakan titik akhir VPC untuk CloudWatch, konfirmasikan bahwa kebijakan titik akhir mengizinkan tindakan yang diperlukan.