アラームの定義
アラームを AWS Incident Detection and Response にオンボードするときは、アプリケーションのパフォーマンスを可視化するメトリクスとアラーム設定を定義する必要があります。このプロセスの一環として、これらのアラームへの対応を担当する組織内のチームも特定する必要があります。
アラームを準備する際に推奨されるベストプラクティスを以下に示します。
アラームが「アラーム」状態になるのは、モニタリング対象のワークロードに継続的かつ重大な影響があり、チームと AWS からの早急な対応が必要なときのみです。トリガーされて自動的に復旧しないアラームが発生した場合は、チームがインシデントブリッジを AWS Incident Detection and Response に結合する必要があります。
指定した連絡先情報により、AWS Incident Detection and Response が組織内の適切なチームを 24 時間 365 日インシデントブリッジに確実にエンゲージすることができます。
重要なアウトプット
IDR CLI
を使用して AWS Incident Detection and Response に提供するアラームと連絡先の詳細のリスト。
Amazon CloudWatch アラームの定義と取り込みの詳細については、「CloudWatch アラームの取り込み」を参照してください。
サードパーティーのアプリケーションパフォーマンスモニタリングアラームの取り込みの詳細については、「サードパーティーのアプリケーションパフォーマンスモニタリングアラームの取り込み」を参照してください。