View a markdown version of this page

Sinkronkan sumber data - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sinkronkan sumber data

Setelah Anda membuat basis pengetahuan Anda, Anda menelan atau menyinkronkan data Anda sehingga data dapat ditanyakan. Ingestion mengubah data mentah di sumber data Anda menjadi embeddings vektor.

Sebelum Anda mulai menelan, periksa apakah sumber data Anda memenuhi ketentuan berikut:

  • Anda telah mengonfigurasi informasi koneksi untuk sumber data Anda. Lihat Connect sumber data. Anda mengonfigurasi sumber data Anda sebagai bagian dari pembuatan basis pengetahuan Anda.

  • Anda telah mengonfigurasi model penyematan vektor pilihan Anda. Lihat model penyematan vektor yang didukung. Anda mengonfigurasi penyematan vektor Anda sebagai bagian dari pembuatan basis pengetahuan Anda.

  • File dalam format yang didukung. Untuk informasi selengkapnya, lihat Format dokumen yang didukung.

  • File tidak melebihi ukuran file pekerjaan Ingestion yang ditentukan dalam kuota Layanan dan kuota di Referensi Umum. AWS

Setiap kali Anda menambahkan, memodifikasi, atau menghapus file dari sumber data Anda, Anda harus menyinkronkan sumber data sehingga diindeks ulang ke basis pengetahuan. Sinkronisasi bersifat bertahap, jadi Amazon Bedrock hanya memproses dokumen yang ditambahkan, dimodifikasi, atau dihapus sejak sinkronisasi terakhir.

Untuk mempelajari cara memasukkan data Anda ke dalam basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

Console
Untuk menyerap data Anda ke basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda
  1. Masuk ke Konsol Manajemen AWS dan navigasikan ke Amazon Bedrock AgentCore > Built-in tools > Knowledge Base.

  2. Pilih basis pengetahuan Anda.

  3. Di bagian Sumber data, pilih Sinkronkan untuk memulai konsumsi data atau menyinkronkan data terbaru Anda. Untuk menghentikan sinkronisasi sumber data saat ini, pilih Berhenti. Sumber data saat ini harus disinkronkan untuk menghentikan sinkronisasi sumber data. Anda dapat memilih Sinkronkan lagi untuk menyerap sisa data Anda.

  4. Ketika konsumsi data selesai, spanduk sukses hijau muncul jika berhasil.

  5. Anda dapat memilih sumber data untuk melihat riwayat Sinkronisasi. Pilih Lihat peringatan untuk melihat mengapa pekerjaan penyerapan data gagal.

API

Untuk memasukkan data Anda ke basis pengetahuan Anda dan menyinkronkan dengan data terbaru Anda, kirim StartIngestionJobpermintaan dengan titik akhir waktu build Agen untuk Amazon Bedrock. Tentukan knowledgeBaseId dandataSourceId. Anda juga dapat menghentikan pekerjaan penyerapan data yang sedang berjalan dengan mengirimkan permintaan. StopIngestionJob TentukandataSourceId,ingestionJobId, danknowledgeBaseId. Pekerjaan penyerapan data harus sedang berjalan untuk menghentikan konsumsi data. Anda dapat mengirim StartIngestionJob permintaan lagi untuk menelan sisa data Anda saat Anda siap.

Gunakan yang ingestionJobId dikembalikan dalam respons dalam GetIngestionJobpermintaan dengan titik akhir waktu build Agen untuk Amazon Bedrock untuk melacak status pekerjaan konsumsi. Selain itu, tentukan knowledgeBaseId dandataSourceId.

  • Ketika pekerjaan konsumsi selesai, responsnya adalahstatus. COMPLETE

  • statisticsObjek dalam respons mengembalikan informasi tentang apakah konsumsi berhasil atau tidak untuk dokumen dalam sumber data.

Anda juga dapat melihat informasi untuk semua pekerjaan konsumsi untuk sumber data dengan mengirimkan ListIngestionJobspermintaan dengan titik akhir waktu pembuatan Agen untuk Amazon Bedrock. Tentukan dataSourceId knowledgeBaseId dan basis pengetahuan tempat data dicerna.

  • Filter untuk hasil dengan menentukan status untuk mencari di filters objek.

  • Urutkan berdasarkan waktu pekerjaan dimulai atau status pekerjaan dengan menentukan sortBy objek. Anda dapat mengurutkan dalam urutan naik atau turun.

  • Mengatur jumlah maksimum hasil untuk kembali dalam respon di maxResults lapangan. Jika ada lebih banyak hasil daripada nomor yang Anda tetapkan, respons akan mengembalikan permintaan nextToken yang dapat Anda kirim dalam ListIngestionJobspermintaan lain untuk melihat kumpulan pekerjaan berikutnya.