

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Kembangkan runbook dan rencana respons untuk menanggapi insiden di Deteksi dan Respons Insiden
<a name="idr-workloads-dev-runbook"></a>

AWS Incident Detection and Response menggunakan informasi yang diambil dari orientasi IDR CLI Anda untuk mengembangkan runbook untuk pengelolaan insiden yang memengaruhi beban kerja Anda. Runbook mendokumentasikan langkah-langkah yang diambil Manajer Insiden saat menanggapi suatu insiden. Rencana respons dipetakan ke setidaknya satu dari beban kerja Anda. Tim manajemen insiden membuat template ini dari informasi yang Anda berikan selama [orientasi beban kerja](getting-started-idr.md#workload-onboarding).

**Output kunci:**
+ Penyelesaian definisi beban kerja Anda pada Deteksi dan Respons Insiden AWS.
+ Penyelesaian alarm dan runbook di AWS Incident Detection and Response.

Anda juga dapat mengunduh contoh AWS Incident Detection and Response Runbook: [aws-idr-runbook-example.zip](samples/aws-idr-runbook-example.zip).

## Contoh runbook
<a name="idr-workloads-runbook-example"></a>

**Example Contoh runbook**  
**Deskripsi**  
Dokumen ini ditujukan untuk [CustomerName] - [WorkloadName].
**Langkah: Prioritas**  
**Tindakan prioritas**

1. Kirim korespondensi pertama tentang Dukungan kasus ini kepada pelanggan seperti di bawah ini.

```
Hello,

This is <<Engineer's name>> from AWS Incident Detection and Response. An alarm has triggered for your workload <<Application_Name>>. I am currently investigating and will update you in a few minutes once I have finished initial investigation.

Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
```
**Langkah: Informasi**  
**Rencana keterlibatan**
Bagian ini menjelaskan rencana keterlibatan yang berlaku untuk buku runbook ini dan hanya berisi detail kontak. Rencana keterlibatan akan direferensikan dalam **Rencana Komunikasi** langkah demi langkah.  
+ **Keterlibatan awal**

  AWS Incident Detection and Response Team menambahkan alamat pemangku kepentingan pelanggan di bawah ini ke kasus ini. Dukungan AWS Pemangku kepentingan adalah untuk pemangku kepentingan tambahan yang mungkin perlu disadarkan akan masalah apa pun.
  + *Pemangku Kepentingan Pelanggan: customeremail1; customeremail2; mobile1*
  + *AWS Pemangku kepentingan*: aws-idr-oncall@amazon.com; tam-tim-email; dll.
  + *One Time Only Contacts*: [Ini adalah kontak email yang disertakan hanya pada komunikasi pertama. Hapus kontak ini setelah komunikasi pertama padam. Ini bisa berupa alamat email paging pelanggan seperti pager-duty yang tidak boleh dipaged untuk setiap korespondensi. Secara eksplisit menambahkan instruksi di bagian “Prioritas”, “Rencana komunikasi” tentang cara menggunakannya hanya jika *Kontak Satu Kali Saja* tersedia.]
+ **Pengaturan panggilan insiden**

  Tunjukkan jika pelanggan memerlukan Deteksi dan Respons Insiden AWS untuk membuat jembatan, jika pelanggan menggunakan jembatan statis atau jika pelanggan akan menyediakan jembatan saat insiden dibuka.

  (Pilih satu opsi berdasarkan preferensi pelanggan)
  + Deteksi dan Respons Insiden AWS membuat Chime/Zoom Jembatan Amazon
  + Jembatan statis yang disediakan pelanggan
    + Nomor Konferensi: < Insert Conference number >
  + Pelanggan memberikan rincian jembatan untuk setiap insiden dengan menanggapi komunikasi yang dikirim oleh AWS Incident Detection and Response Team.
  + Lainnya - Tentukan detail.
+ **Eskalasi Keterlibatan**

  Deteksi dan Respons Insiden AWS akan menghubungi kontak berikut jika kontak dari paket **keterlibatan Awal** tidak merespons insiden.

  Untuk setiap Kontak Eskalasi menunjukkan apakah mereka harus ditambahkan ke Dukungan kasing, menelepon atau keduanya.
  + Pastikan bahwa Anda telah menelepon kontak Keterlibatan Awal, jika ada, sebelum meningkatkan.
  + *Kontak Eskalasi Pertama*: [eskalasi EmailAddress \#1]/[PhoneNumber] - Tunggu XX Menit sebelum eskalasi ke kontak ini.
    + [Tambahkan kontak ke Kasus/Telepon] kontak ini.
  + *Kontak Eskalasi Kedua*: [eskalasi EmailAddress \#2]/[PhoneNumber] - Tunggu XX Menit sebelum eskalasi ke kontak ini.
    + [Tambahkan Kontak ke Kasus/Telepon] kontak ini.
  + dll.
**Rencana komunikasi**  
Bagian ini menjelaskan bagaimana Insinyur Manajemen Insiden berkomunikasi dengan pemangku kepentingan yang ditunjuk di luar panggilan insiden dan saluran komunikasi.  
+ **Rencana Komunikasi Dampak**

  Rencana ini dimulai ketika AWS Incident Detection and Response telah menentukan dari langkah **Triage** bahwa peringatan menunjukkan potensi dampak bagi pelanggan.

  Deteksi dan Respons Insiden AWS akan meminta pelanggan untuk bergabung dengan jembatan yang telah ditentukan seperti yang ditunjukkan dalam **paket Keterlibatan - Penyiapan panggilan insiden**.

  (Pilih satu tergantung pada apakah *One Time Only Contacts* tersedia atau tidak.)

  1. Pastikan *Pemangku Kepentingan Pelanggan* dari **rencana Keterlibatan - Keterlibatan awal** ditambahkan ke kasus CC.

  ATAU

  1. Pastikan *Pemangku Kepentingan Pelanggan* dan *Kontak Satu Kali Saja* dari **rencana Keterlibatan - Keterlibatan awal** ditambahkan ke CC kasus.

  1. Kirim notifikasi keterlibatan ke pelanggan berdasarkan template berikut:

     (Pilih salah satu)

     *Templat Dampak - Jembatan Amazon Chime*

     ```
     The following alarm has engaged AWS Incident Detection and Response to an Incident bridge:
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
     Please join the Amazon Chime Bridge below so we can start the steps outlined in your Runbook:
         Amazon Chime Meeting ID: <insert_Meeting_ID_here>
         Link to Amazon Chime Bridge: <insert_Link_here>
         International dial-in numbers: https://chime.aws/dialinnumbers/
     ```

     *Template Dampak - Jembatan yang Disediakan Pelanggan*

     ```
     The following alarm has engaged AWS Incident Detection and Response:
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025 3:30 PM UTC>
     Please respond with your internal bridge details so we can join and start the steps outlined in your Runbook.
     ```

     *Templat Dampak - Jembatan Statis Pelanggan*

     ```
     The following alarm has engaged AWS Incident Detection and Response to an Incident bridge:
         Alarm Identifier - <insert CloudWatch Alarm ARN or APM Response Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
     Please join the Bridge below so we can start the steps outlined in your Runbook:
         Conference Number: <insert_conference_number>
         Conference URL: <insert_bridge_URL>
     ```

  1. Atur Kasus ke Tindakan Pelanggan yang Tertunda.

  1. HAPUS *Satu Kali Saja Kontak* dari kasing setelah mengirim Komunikasi Dampak di atas. (Jika *Kontak Satu Kali Saja* tersedia.)

  1. Ikuti rencana **Eskalasi Keterlibatan** seperti yang disebutkan di atas.

  1. Jika pelanggan tidak merespons dalam waktu 30 menit, lepaskan dan terus pantau hingga alarm pulih.
+ **Rencana Komunikasi Tanpa Dampak**

  **Rencana ini dimulai ketika alarm pulih sebelum Deteksi dan Respons Insiden menyelesaikan Triase awal.**

  1. Sebelum mengirim notifikasi tanpa dampak, verifikasi, lalu hapus and/or tambahkan kontak pelanggan dari CC Dukungan Kasus berdasarkan kontak yang tercantum dalam Rencana Keterlibatan **- Rencana Keterlibatan Awal**.

     ["JANGAN tambahkan *Kontak Satu Kali Saja*."] (Berlaku jika *Kontak Satu Kali Saja* tersedia.)

  1. Kirim pemberitahuan tanpa keterlibatan kepada pelanggan berdasarkan templat di bawah ini:

     *Template Tanpa Dampak*

     ```
     AWS Incident Detection and Response received an alarm that has recovered for your workload.
         Alarm Identifier - <insert_CloudWatch_Alarm_ARN_or_APM_Response_Identifier>
         Alarm State Change Reason - <insert_state_change_reason>
         Alarm Start Time - <Example: 1 January 2025, 3:30 PM UTC>
         Alarm End Time - <Example: 1 January 2025, 3:35 PM UTC>
     This may indicate a brief customer impact that is currently not ongoing.
     If there is an ongoing impact to your workload, please let us know and we will engage to assist.
     ```

  1. Masukkan kasing ke dalam **Tindakan Pelanggan yang Tertunda**.

  1. Jika pelanggan tidak merespons dalam waktu 30 menit, selesaikan kasusnya.
**Ikhtisar arsitektur aplikasi**  
Bagian ini memberikan ikhtisar application/workload arsitektur untuk kesadaran Insinyur Manajemen Insiden dan Insinyur Operasi.  
+ **AWS Akun dan Wilayah dengan layanan utama** - daftar AWS akun dengan Wilayah yang mendukung aplikasi ini. Membantu Insinyur dalam menilai infrastruktur dasar yang mendukung aplikasi.
  + 123456789012
    + US-EAST-1 - desc singkat yang sesuai
      + Amazon EC2 - desc singkat yang sesuai
      + DynamoDB - desc singkat yang sesuai
      + dll.
    + US-WEST-1 - desc singkat yang sesuai
      + dll.
  + akun lain
    + dll.