

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Personalización de la ingesta de un origen de datos
<a name="kb-managed-customize-ingestion"></a>

Puede personalizar la ingesta vectorial al conectar una fuente de datos Consola de administración de AWS o al modificar el valor del `vectorIngestionConfiguration` campo al enviar una solicitud. [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)

Seleccione un tema para obtener información acerca de cómo incluir configuraciones para personalizar la ingesta al conectarse a un origen de datos:

**Topics**
+ [Utilice el análisis inteligente](#kb-managed-customize-parsing)
+ [Selección de una estrategia de fragmentación](#kb-managed-customize-chunking)

## Utilice el análisis inteligente
<a name="kb-managed-customize-parsing"></a>

Las bases de conocimiento gestionadas utilizan el análisis inteligente de forma predeterminada. El análisis inteligente es una estrategia de análisis gestionada por un servicio que selecciona automáticamente el mejor enfoque de análisis para su contenido. No es necesario configurar un modelo de análisis ni proporcionar ajustes adicionales.

Para utilizar el análisis inteligente, puede omitir el `parsingConfiguration` campo o especificarlo explícitamente de la `vectorIngestionConfiguration` siguiente manera:

```
{
    "parsingConfiguration": {
        "parsingStrategy": "SMART_PARSING"
    }
}
```

**nota**  
Las bases de conocimiento gestionadas solo respaldan la `SMART_PARSING` estrategia. Otras estrategias de análisis, como `BEDROCK_FOUNDATION_MODEL` y no `BEDROCK_DATA_AUTOMATION` son compatibles.

## Selección de una estrategia de fragmentación
<a name="kb-managed-customize-chunking"></a>

Puede personalizar la forma en que se fragmentan los documentos de sus datos para su almacenamiento y recuperación. Para obtener más información sobre las opciones de fragmentación de datos en Bases de conocimiento de Amazon Bedrock, consulte [Funcionamiento de la fragmentación de contenido para las bases de conocimiento](kb-chunking.md).

**aviso**  
No puede cambiar la configuración de fragmentación después de conectarse al origen de datos.

En elConsola de administración de AWS, usted elige la estrategia de fragmentación al conectarse a una fuente de datos. Con la API de Amazon Bedrock, incluye un [ChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ChunkingConfiguration.html)en el `chunkingConfiguration` campo de. [VectorIngestionConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_VectorIngestionConfiguration.html)

Si omite esta configuración o especifica la estrategia de fragmentación predeterminada, el servicio utiliza una fragmentación de tamaño fijo con 300 tokens y un 20% de superposición.

```
{
    "chunkingConfiguration": {
        "chunkingStrategy": "DEFAULT"
    }
}
```

Amplía la sección correspondiente a la estrategia de fragmentación que quieres usar:

### Sin fragmentación
<a name="w2aac32c12c25c13c17c11c15b1"></a>

Para tratar cada documento del origen de datos como un fragmento de origen único, especifique `NONE` en el campo `chunkingStrategy` de `ChunkingConfiguration`, como en el siguiente formato:

```
{
    "chunkingStrategy": "NONE"
}
```

### Fixed-size fragmentación
<a name="w2aac32c12c25c13c17c11c15b3"></a>

Para dividir cada documento de la fuente de datos en fragmentos de aproximadamente el mismo tamaño, especifique `FIXED_SIZE` en el `chunkingStrategy` campo `ChunkingConfiguration` e incluya una [FixedSizeChunkingConfiguration](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_FixedSizeChunkingConfiguration.html)en el `fixedSizeChunkingConfiguration` campo, como en el siguiente formato:

```
{
    "chunkingStrategy": "FIXED_SIZE",
    "fixedSizeChunkingConfiguration": {
        "maxTokens": number,
        "overlapPercentage": number
    }
}
```

**nota**  
Las bases de conocimiento gestionadas no admiten la fragmentación semántica.