

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 清单文件的验证规则
<a name="md-create-manifest-file-validation-rules"></a>

 当您导入清单文件时，Amazon Rekognition Custom Labels 会应用关于限制、语法和语义的验证规则。 SageMaker AI Ground Truth 架构强制执行语法验证。有关更多信息，请参阅[输出](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-data-output.html)。以下是限制和语义的验证规则。

**注意**  
所有验证规则累计遵循 20% 的无效规则。如果由于任意组合（例如 15% 的无效 JSON 和 15% 的无效图像）导致导入超过 20% 的限制，则导入将失败。
每个数据集对象都对应于清单中的一行。空行/无效行也算作数据集对象。
重叠度为（测试和训练之间的共用标签数）/（训练标签数）。

**Topics**
+ [限制](#md-validation-rules-limits)
+ [语义](#md-validation-rules-semantics)

## 限制
<a name="md-validation-rules-limits"></a>


| 验证 | 限制 | 出现错误 | 
| --- | --- | --- | 
| 清单文件大小 | 最大 1 GB | 错误 | 
| 清单文件的最大行数 | 一个清单中最多可以包含 250,000 个数据集对象行。 | 错误 | 
| 每个标签的有效数据集对象总数的下限  | >=1 | 错误 | 
| 标签数下限 | >=2 | 错误 | 
| 标签数上限 | <=250 | 错误 | 
| 每张图像的最小边界框数 | 0 | 无 | 
| 每张图像的最大边界框数 | 50 | 无 | 

## 语义
<a name="md-validation-rules-semantics"></a>




| 验证 | 限制 | 出现错误 | 
| --- | --- | --- | 
| 空清单 |  | 错误 | 
| source-ref 对象丢失/无法访问 | 对象数量小于 20% | 警告 | 
| source-ref 对象丢失/无法访问 | 对象数量 > 20% | 错误 | 
| 训练数据集中不存在测试标签  | 标签中至少有 50% 的重叠 | 错误 | 
| 在数据集中混合标签与同一标签的对象示例。针对同一类别在数据集对象中进行分类和检测。 |  | 没有错误或警告 | 
| 测试与训练之间的重叠资产  | 测试数据集与训练数据集之间不应有重叠。 |  | 
| 数据集中的图像必须来自同一个存储桶  | 如果对象位于不同的存储桶中，则会出错 | 错误 | 