翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データソースを同期する
ナレッジベースを作成したら、データを取り込むか同期して、クエリできるようにします。取り込みは、データソースの raw データをベクトル埋め込みに変換します。
取り込みの開始前に、データソースが次の条件を満たしていることを確認してください。
データソースからファイルを追加、変更、または削除するたびに、ナレッジベースでファイルのインデックスが再作成されるように、データソースを同期する必要があります。同期は増分処理であるため、前回の同期以降に追加、変更、または削除されたドキュメントだけが処理されます。
データをナレッジベースに取り込み、最新のデータと同期する方法を確認するには、任意の方法のタブを選択してステップを実行してください。
- Console
-
データをナレッジベースに取り込み、最新のデータと同期するには
-
にサインイン AWS マネジメントコンソール し、Amazon Bedrock AgentCore > 組み込みツール > ナレッジベースに移動します。
-
ナレッジベースを選択します。
-
[データソース] セクションで [同期] を選択して、データの取り込み (データインジェスト) または最新データの同期を開始します。同期中のデータソースを停止するには、[停止] を選択します。停止できるのは、同期中のデータソースだけです。[同期] をもう一度選択すると、残りのデータを取り込むことができます。
-
データインジェストが正常に完了すると、緑色の成功バナーが表示されます。
-
データソースを選択して、そのデータソースの [同期履歴] を表示することができます。[警告を表示] を選択すると、データインジェストジョブが失敗した理由を確認できます。
- API
-
ナレッジベースにデータを取り込み、最新のデータと同期するには、Amazon Bedrock エージェントのビルドタイムエンドポイントで StartIngestionJob リクエストを送信します。knowledgeBaseId と dataSourceId を指定してください。StopIngestionJob リクエストを送信することで、実行中のデータインジェストジョブを停止することもできます。dataSourceId、ingestionJobId、および knowledgeBaseId を指定します。停止できるのは、実行中のデータインジェストジョブのみです。準備ができたら、StartIngestionJob リクエストを再送信して、残りのデータを取り込むことができます。
レスポンスで返された ingestionJobId を使用して、Amazon Bedrock エージェントのビルドタイムエンドポイントで GetIngestionJob リクエストを送信し、取り込みジョブのステータスを追跡します。また、knowledgeBaseId と dataSourceId も指定します。
また、Amazon Bedrock エージェントのビルドタイムエンドポイントで ListIngestionJobs リクエストを送信することで、データソースのすべての取り込みジョブに関する情報を確認することもできます。dataSourceId と、データの取り込み先のナレッジベースの knowledgeBaseId を指定してください。
-
検索するステータスを filters オブジェクトで指定して、結果をフィルタリングします。
-
sortBy オブジェクトを指定して、ジョブの開始時間またはジョブのステータスでソートします。昇順または降順で並べ替えることができます。
-
レスポンスで返す結果の最大数を maxResults フィールドで設定します。設定した数よりも結果の件数が多い場合は、nextToken が返されます。これを別の ListIngestionJobs リクエストで送信して、ジョブの次のバッチを確認できます。