

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Buat basis pengetahuan yang dikelola
<a name="kb-managed-create"></a>

Saat Anda membuat basis pengetahuan terkelola, Amazon Bedrock AgentCore mengelola infrastruktur penyimpanan, pengindeksan, dan pengambilan untuk Anda. Secara default, model penyematan yang dikelola layanan digunakan dan tidak diperlukan pemilihan atau konfigurasi model. Anda dapat secara opsional menyediakan model embedding Bedrock Anda sendiri. Anda juga dapat secara opsional memberikan kunci KMS untuk enkripsi penyimpanan vektor terkelola.

Setelah Anda membuat basis pengetahuan, hubungkan ke sumber data dan mulai konsumsi. Untuk detail tentang menghubungkan sumber data, lihat [Connect a data source](kb-managed-connect-ds.md). Untuk menyinkronkan sumber data, gunakan `StartIngestionJob` API. Lihat perinciannya di [Sinkronkan data Anda dengan basis pengetahuan Amazon Bedrock](kb-data-source-sync-ingest.md).

Untuk mempelajari cara membuat basis pengetahuan terkelola, pilih tab untuk metode pilihan Anda:

------
#### [ Console ]

**Untuk membuat basis pengetahuan yang dikelola**

1. Masuk ke Konsol Manajemen AWS dan navigasikan ke Amazon Bedrock AgentCore > **Built-in tools** > **Knowledge Base**.

1. Pilih **Buat Basis Pengetahuan Terkelola**.

1. (Opsional) Perluas **konfigurasi tambahan** bagian **detail Basis Pengetahuan** untuk mengonfigurasi hal berikut:
   + Tambahkan deskripsi.
   + Pilih jenis model penyematan:
     + **Dikelola** (default): Model penyematan yang dikelola layanan digunakan. Tidak diperlukan pemilihan model atau konfigurasi.
     + **Kustom**: Pilih model embedding Bedrock. Pilih model untuk membuka pemilih model, yang menunjukkan penyedia yang tersedia (Amazon, Cohere) dan model.
   + Konfigurasikan izin IAM: pilih **Buat dan gunakan peran layanan baru** (disarankan) atau pilih peran yang ada.
   + Konfigurasikan AWS KMS enkripsi untuk penyimpanan vektor AWS terkelola (kunci terkelola secara default, atau pilih kunci KMS khusus).

1. Di bawah **Sumber data**, berikan nama sumber data.

1. Pilih jenis sumber data Anda dari menu tarik-turun: Amazon S3, Confluence, Custom, Google Drive OneDrive,,, atau Web Crawler. SharePoint

1. Konfigurasikan pengaturan koneksi sumber data untuk jenis sumber data yang Anda pilih.

1. (Opsional) Perluas **parsing dan chunking Konten** untuk mengonfigurasi hal berikut:
   + Strategi parsing diatur ke **Managed parser** secara default.
   + Pilih strategi chunking teks dari dropdown:
     + **Pembagian default (disarankan): Membagi teks menjadi potongan** ukuran tetap.
     + **Fixed-size chunking: Membagi** teks menjadi perkiraan ukuran token yang Anda tetapkan.
     + **Tidak ada chunking**: Untuk dokumen pra-proses atau pra-split.

1. (Opsional) Perluas **konfigurasi lanjutan untuk mengonfigurasi pengindeksan** lanjutan. Di bawah **Pengindeksan konten**, default mengindeks konten berbasis teks dari dokumen umum. Aktifkan pengindeksan lanjutan untuk modalitas tambahan:
   + **Konten visual dalam dokumen**: Memproses visual yang disematkan dalam file.pdf, .docx, .ppt, .pptx.
   + **File audio: Memproses** file.mp3, .wav, .m4a, .flac, .ogg.
   + **File video: Memproses** file.mp4, .mov, .m4v.

   Secara opsional atur ukuran file maksimum (MB) dan konfigurasikan perlindungan penghapusan dokumen.

1. (Opsional) Konfigurasikan pengiriman log untuk mengirim log konsumsi basis pengetahuan ke tujuan seperti CloudWatch Log, Amazon S3, atau Firehose.

1. Pilih **Buat Basis Pengetahuan**.

1. Tunggu basis pengetahuan dan sumber data dibuat (2—5 menit). Jika Anda membuat basis pengetahuan terkelola dengan kunci yang dikelola pelanggan, pembuatannya mungkin membutuhkan waktu lebih lama.

------
#### [ API ]

Berikut ini adalah contoh membuat basis pengetahuan terkelola dan mengonfigurasi sumber data Anda menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-managed-customize-ingestion.md)

**AWS Command Line Interface**

**Langkah 1: Buat basis pengetahuan**

Dengan model penyematan terkelola (default):

```
aws bedrock-agent create-knowledge-base \
 --name "{{my-managed-kb}}" \
 --role-arn "{{arn:aws:iam::123456789012:role/BedrockKBRole}}" \
 --description "{{My managed knowledge base}}" \
 --knowledge-base-configuration file://kb-config.json

kb-config.json
{
    "type": "MANAGED",
    "managedKnowledgeBaseConfiguration": {
        "embeddingModelType": "MANAGED"
    }
}
```

Dengan model penyematan khusus (model Bedrock yang disediakan pelanggan):

```
aws bedrock-agent create-knowledge-base \
 --name "{{my-custom-embed-kb}}" \
 --role-arn "{{arn:aws:iam::123456789012:role/BedrockKBRole}}" \
 --description "{{My managed knowledge base with custom embedding}}" \
 --knowledge-base-configuration file://kb-config.json

kb-config.json
{
    "type": "MANAGED",
    "managedKnowledgeBaseConfiguration": {
        "embeddingModelType": "CUSTOM",
        "embeddingModelArn": "{{arn:aws:bedrock:us-west-2::foundation-model/amazon.titan-embed-text-v2:0}}",
        "embeddingModelConfiguration": {
            "bedrockEmbeddingModelConfiguration": {
                "dimensions": 1024
            }
        }
    }
}
```

**catatan**  
Ketika `embeddingModelType` dihilangkan, defaultnya. `MANAGED` Saat menggunakan`MANAGED`, Anda tidak boleh menentukan `embeddingModelArn` atau`embeddingModelConfiguration`. Saat menggunakan`CUSTOM`, kedua bidang diperlukan.

**Langkah 2: Buat sumber data**

```
aws bedrock-agent create-data-source \
 --name "{{S3-connector}}" \
 --description "{{S3 data source connector for Amazon Bedrock to use content in S3}}" \
 --knowledge-base-id "{{your-knowledge-base-id}}" \
 --data-source-configuration file://bedrock-s3-managed-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"parsingConfiguration":{"parsingStrategy":"SMART_PARSING"}}'

bedrock-s3-managed-connector-configuration.json
{
    "type": "MANAGED_KNOWLEDGE_BASE_CONNECTOR",
    "managedKnowledgeBaseConnectorConfiguration": {
        "mediaExtractionConfiguration": {
            "imageExtractionConfiguration": {
                "imageExtractionStatus": "ENABLED"
            }
        },
        "connectorParameters": {
            "type": "S3",
            "version": "1",
            "connectionConfiguration": {
                "bucketName": "{{your-test-s3-bucket}}",
                "bucketOwnerAccountId": "{{123456789012}}"
            },
            "deletionProtectionConfiguration": {
                "enableDeletionProtection": false
            }
        }
    }
}
```

------

## Opsi model penyematan
<a name="kb-managed-embedding-models"></a>

Basis pengetahuan terkelola mendukung dua jenis model penyematan:
+ **Penyematan terkelola** (default) - Model penyematan yang dikelola layanan digunakan secara otomatis. Anda tidak perlu memilih model, mengonfigurasi dimensi, atau mengelola batas layanan Bedrock untuk penyematan. Layanan ini menangani pemilihan model, hosting, dan penskalaan secara transparan.
+ **Penyematan khusus - Anda menyediakan model penyematan** Batuan Dasar Anda sendiri ARN. Saat menggunakan model penyematan khusus, Anda harus menentukan dimensi model (1024) dan tipe data penyematan float32. Model penyematan Bedrock berikut didukung:
  + Embeddings Teks Amazon Titan V2
  + Cohere Sematkan Bahasa Inggris v3
  + Cohere Sematkan Multilingual v3
  + Cohere Sematkan v4
  + Embeddings Multimodal Amazon Nova

**catatan**  
Anda tidak dapat mengubah jenis model penyematan setelah membuat basis pengetahuan. Untuk beralih antara penyematan terkelola dan kustom, Anda harus membuat basis pengetahuan baru.

**penting**  
Jika Anda membuat basis pengetahuan dengan model penyematan kustom, reranker terkelola tidak tersedia untuk basis pengetahuan tersebut. Untuk menggunakan reranker terkelola, buat basis pengetahuan Anda dengan model penyematan terkelola default.

## Konektor sumber data yang didukung
<a name="kb-managed-connectors"></a>

Basis pengetahuan terkelola mendukung konektor sumber data berikut:
+ Amazon S3
+ Confluence
+ Microsoft SharePoint
+ Google Drive
+ Microsoft OneDrive
+ Perayap Web
+ Konektor kustom

Untuk informasi tentang mengonfigurasi konektor sumber data, lihat [Connect sumber data](kb-managed-connect-ds.md).