

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Alarmes et journaux pour le suivi des métriques provenant des points de terminaison sans serveur
<a name="serverless-endpoints-monitoring"></a>

Pour surveiller votre point de terminaison sans serveur, vous pouvez utiliser les CloudWatch alarmes Amazon. CloudWatch est un service qui collecte des métriques en temps réel à partir de vos AWS applications et de vos ressources. Une alarme contrôle les métriques au fur et à mesure qu’elles sont collectées et vous donne la possibilité de préspécifier un seuil et les actions à entreprendre si ce seuil est dépassé. Par exemple, votre CloudWatch alarme peut vous envoyer une notification si votre terminal dépasse un seuil d'erreur. En configurant des CloudWatch alarmes, vous bénéficiez d'une meilleure visibilité sur les performances et les fonctionnalités de votre terminal. Pour plus d'informations sur les CloudWatch alarmes, consultez la section [Utilisation des CloudWatch alarmes Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) dans le *guide de CloudWatch l'utilisateur Amazon*.

## Surveillance avec CloudWatch
<a name="serverless-endpoints-monitoring-metrics"></a>

Voici une liste exhaustive des métriques pour les points de terminaison sans serveur. Toute métrique non répertoriée ci-dessous n’est pas publiée pour les points de terminaison sans serveur. Pour plus d'informations sur les métriques suivantes, consultez [Surveiller Amazon SageMaker AI avec Amazon CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).

### Métriques de point de terminaison courantes
<a name="serverless-endpoints-monitoring-metrics-common"></a>

Ces CloudWatch mesures sont identiques à celles publiées pour les points de terminaison en temps réel.

La `OverheadLatency` métrique suit toutes les latences supplémentaires ajoutées par l' SageMaker IA, y compris le temps de démarrage à froid pour lancer de nouvelles ressources de calcul pour votre point de terminaison sans serveur. Comparé aux points de terminaison sans serveur à la demande, la `OverheadLatency` des points de terminaison sans serveur dotés de la simultanéité provisionnée est généralement nettement inférieure.

Les points de terminaison sans serveur peuvent également utiliser les métriques `Invocations4XXErrors`, `Invocations5XXErrors`, `Invocations`, `ModelLatency`, `ModelSetupTime` et `MemoryUtilization`. Pour en savoir plus sur ces mesures, consultez [SageMaker Métriques d'invocation des terminaux AI](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation).

### Métriques de point de terminaison sans serveur courantes
<a name="serverless-endpoints-monitoring-metrics-serverless"></a>

Ces CloudWatch mesures sont publiées à la fois pour les points de terminaison sans serveur à la demande et pour les points de terminaison sans serveur dotés d'une simultanéité provisionnée.


| Nom de la métrique | Description | Unit/Stats | 
| --- | --- | --- | 
| ServerlessConcurrentExecutionsUtilization | Le nombre d’exécutions simultanées divisé par la simultanéité maximum. | Unités : aucune<br />Statistiques valides : moyenne, maximum, minimum | 

### Métriques d’un point de terminaison sans serveur avec la simultanéité provisionnée
<a name="serverless-endpoints-monitoring-metrics-serverless-pc"></a>

Ces CloudWatch métriques sont publiées pour les points de terminaison sans serveur dotés d'une simultanéité provisionnée.


| Nom de la métrique | Description | Unit/Stats | 
| --- | --- | --- | 
| ServerlessProvisionedConcurrencyExecutions | Le nombre d’exécutions simultanées gérées par le point de terminaison. | Unités : nombre<br />Statistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencyUtilization | Le nombre d’exécutions simultanées divisé par la simultanéité provisionnée allouée. | Unités : aucune<br />Statistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencyInvocations | Le nombre de demandes InvokeEndpoint traitées par la simultanéité provisionnée. | Unités : nombre<br />Statistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencySpilloverInvocations | Le nombre de demandes InvokeEndpoint non traitées par la simultanéité provisionnée, qui sont gérées par u à la demande. | Unités : nombre<br />Statistiques valides : moyenne, maximum, minimum | 

## Journaux
<a name="serverless-endpoints-monitoring-logs"></a>

Si vous souhaitez surveiller les journaux de votre terminal à des fins de débogage ou d'analyse de progression, vous pouvez utiliser Amazon CloudWatch Logs. Le groupe de SageMaker AI-provided journaux que vous pouvez utiliser pour les points de terminaison sans serveur est. `/aws/sagemaker/Endpoints/[EndpointName]` Pour plus d'informations sur l'utilisation de CloudWatch Logs in SageMaker AI, consultez[CloudWatch Journaux pour Amazon SageMaker AI](logging-cloudwatch.md). Pour en savoir plus sur CloudWatch les journaux, consultez [Qu'est-ce qu'Amazon CloudWatch Logs ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) dans le *guide de l'utilisateur d'Amazon CloudWatch Logs*.