

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 소스에 대한 수집 사용자 지정
<a name="kb-managed-customize-ingestion"></a>

에서 데이터 소스를 연결할 때 벡터 수집을 사용자 지정AWS Management Console하거나 [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html) 요청을 보낼 때 `vectorIngestionConfiguration` 필드 값을 수정하여 벡터 수집을 사용자 지정할 수 있습니다.

주제를 선택하여 데이터 소스에 연결할 때 수집을 사용자 지정하기 위한 구성을 포함하는 방법을 알아봅니다.

**Topics**
+ [스마트 구문 분석 사용](#kb-managed-customize-parsing)
+ [청킹 전략 선택](#kb-managed-customize-chunking)

## 스마트 구문 분석 사용
<a name="kb-managed-customize-parsing"></a>

관리형 지식 기반은 기본적으로 스마트 구문 분석을 사용합니다. 스마트 구문 분석은 콘텐츠에 가장 적합한 구문 분석 접근 방식을 자동으로 선택하는 서비스 관리형 구문 분석 전략입니다. 구문 분석 모델을 구성하거나 추가 설정을 제공할 필요가 없습니다.

스마트 구문 분석을 사용하려면에서 `parsingConfiguration` 필드를 생략`vectorIngestionConfiguration`하거나 다음과 같이 명시적으로 지정할 수 있습니다.

```
{
    "parsingConfiguration": {
        "parsingStrategy": "SMART_PARSING"
    }
}
```

**참고**  
관리형 지식 기반은 `SMART_PARSING` 전략만 지원합니다. `BEDROCK_FOUNDATION_MODEL` 및와 같은 다른 구문 분석 전략`BEDROCK_DATA_AUTOMATION`은 지원되지 않습니다.

## 청킹 전략 선택
<a name="kb-managed-customize-chunking"></a>

데이터의 문서가 저장 및 검색을 위해 청크되는 방식을 사용자 지정할 수 있습니다. Amazon Bedrock Knowledge Bases에서 데이터를 청킹하는 옵션에 대한 자세한 내용은 [지식 기반에서 콘텐츠 청킹 작동 방식](kb-chunking.md) 섹션을 참조하세요.

**주의**  
데이터 소스로 연결한 후에는 청킹 전략을 변경할 수 없습니다.

에서 데이터 소스에 연결할 때 청킹 전략을 AWS Management Console선택합니다. Amazon Bedrock API를 사용하면 [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)의 `chunkingConfiguration` 필드에 [ChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ChunkingConfiguration.html)을 포함합니다.

이 구성을 생략하거나 기본 청킹 전략을 지정하면 서비스는 토큰 300개와 중복 20%가 포함된 고정 크기 청킹을 사용합니다.

```
{
    "chunkingConfiguration": {
        "chunkingStrategy": "DEFAULT"
    }
}
```

사용하려는 청킹 전략에 해당하는 섹션을 확장합니다.

### 청킹 없음
<a name="w2aac32c12c25c13c17c11c15b1"></a>

데이터 소스의 각 문서를 단일 소스 청크로 처리하려면 다음 형식으로 `ChunkingConfiguration`의 `chunkingStrategy` 필드에 `NONE`를 지정합니다.

```
{
    "chunkingStrategy": "NONE"
}
```

### 고정 크기 청킹
<a name="w2aac32c12c25c13c17c11c15b3"></a>

데이터 소스의 각 문서를 거의 동일한 크기의 청크로 나누려면 `ChunkingConfiguration`의 `chunkingStrategy` 필드에 `FIXED_SIZE`를 지정하고 다음 형식과 같이 `fixedSizeChunkingConfiguration` 필드에 [FixedSizeChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_FixedSizeChunkingConfiguration.html)을 포함합니다.

```
{
    "chunkingStrategy": "FIXED_SIZE",
    "fixedSizeChunkingConfiguration": {
        "maxTokens": number,
        "overlapPercentage": number
    }
}
```

**참고**  
관리형 지식 기반에는 의미 체계 청킹이 지원되지 않습니다.