

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Synchronisation d’une source de données
<a name="kb-managed-sync"></a>

Après avoir créé votre base de connaissances, vous devez ingérer ou synchroniser vos données afin qu’elles puissent être interrogées. L'ingestion convertit les données brutes de votre source de données en intégrations vectorielles.

Avant de commencer l’ingestion, vérifiez que votre source de données remplit les conditions suivantes :
+ Vous avez configuré les informations de connexion pour votre source de données. Voir [Connecter une source de données](kb-managed-connect-ds.md). Vous configurez votre source de données dans le cadre de la création de votre base de connaissances.
+ Vous avez configuré le modèle d'intégration vectorielle que vous avez choisi. Voir les [modèles d'intégration vectorielle pris en charge.](kb-managed-create.md#kb-managed-embedding-models) Vous configurez vos vectorisations dans le cadre de la création de votre base de connaissances.
+ Le format des fichiers est pris en charge. Pour plus d'informations, consultez la section [Formats de document pris en charge](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ Les fichiers ne dépassent pas la **taille du fichier de tâche d'ingestion** spécifiée dans la section Quotas de [service et quotas](kb-managed-quotas.md) de la référence AWS générale.

Chaque fois que vous ajoutez, modifiez ou supprimez des fichiers de votre source de données, vous devez synchroniser cette dernière afin qu’elle soit réindexée dans la base de connaissances. La synchronisation étant incrémentielle, Amazon Bedrock ne traite que les documents ajoutés, modifiés ou supprimés depuis la dernière synchronisation.

Pour découvrir comment intégrer vos données dans votre base de connaissances et les synchroniser avec vos données les plus récentes, choisissez l’onglet correspondant à votre méthode préférée, puis suivez les étapes :

------
#### [ Console ]

**Pour intégrer vos données dans votre base de connaissances et les synchroniser avec vos données les plus récentes**

1. Connectez-vous au AWS Management Console et accédez à Amazon Bedrock AgentCore > **Built-in outils** > **Base de connaissances**.

1. Choisissez votre base de connaissances.

1. Dans la section **Source de données**, sélectionnez **Synchroniser** pour commencer l’ingestion de données ou la synchronisation avec vos données les plus récentes. Pour arrêter une source de données en cours de synchronisation, sélectionnez **Arrêter**. Une source de données doit être en cours de synchronisation pour arrêter la synchronisation de la source de données. Vous pouvez sélectionner à nouveau **Synchroniser** pour ingérer le reste de vos données.

1. Lorsque l’ingestion de données est terminée, une bannière verte apparaît en cas de réussite.

1. Vous pouvez choisir une source de données pour afficher son **historique de synchronisation**. Sélectionnez **Afficher les avertissements** pour savoir pourquoi une tâche d’ingestion de données a échoué.

------
#### [ API ]

Pour intégrer vos données dans votre base de connaissances et les synchroniser avec vos données les plus récentes, envoyez une [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)demande à un point de terminaison [Agents for Amazon Bedrock Build-time](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Spécifiez `knowledgeBaseId` et `dataSourceId`. Vous pouvez également arrêter une tâche d'ingestion de données en cours d'exécution en envoyant une [StopIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html)demande. Spécifiez `dataSourceId`, `ingestionJobId` et `knowledgeBaseId`. Une tâche d’ingestion de données doit être en cours d’exécution pour arrêter l’ingestion de données. Vous pouvez envoyer à nouveau une demande `StartIngestionJob` pour ingérer le reste de vos données lorsque vous serez prêt.

Utilisez le résultat `ingestionJobId` renvoyé dans la réponse à une [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html)demande adressée à un point de [terminaison Agents for Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) pour suivre l'état de la tâche d'ingestion. Spécifiez également `knowledgeBaseId` et `dataSourceId`.
+ Lorsque la tâche d’ingestion est terminée, l’élément `status` de la réponse indique `COMPLETE`.
+ L’objet `statistics` de la réponse renvoie des informations indiquant si l’ingestion a réussi ou non pour les documents dans la source de données.

Vous pouvez également consulter les informations relatives à toutes les tâches d'ingestion d'une source de données en envoyant une [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html)demande à un point de terminaison [Agents for Amazon Bedrock au moment de la création.](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) Spécifiez le `dataSourceId` et le `knowledgeBaseId` de la base de connaissances dans laquelle les données sont ingérées.
+ Filtrez les résultats en spécifiant le statut à rechercher dans l’objet `filters`.
+ Pour effectuer un tri en fonction de l’heure à laquelle la tâche a été lancée ou du statut d’une tâche, spécifiez l’objet `sortBy`. Vous pouvez spécifier un ordre de tri croissant ou décroissant.
+ Spécifiez le nombre maximum de résultats à renvoyer en réponse dans le champ `maxResults`. Si le nombre de résultats est supérieur à ce que vous avez défini, la réponse renvoie un `nextToken` que vous pouvez envoyer dans une autre demande [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html) afin de voir le lot suivant de tâches.

------