

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# SageMaker 模型并行度库 v2
<a name="model-parallel-v2"></a>

**注意**  
自 SageMaker 模型并行度 (SMP) 库 v2.0.0 于 2023 年 12 月 19 日发布以来，SMP 库 v2 的本文档已更新。有关先前版本的 SMP 库，请参阅 [（已存档） SageMaker 模型并行度库 v1.x](model-parallel.md)。

Amazon SageMaker AI 模型并行度库是 SageMaker AI 的一项功能，可实现高性能，并在 SageMaker AI 加速计算实例上优化大规模训练。[SageMaker 模型并行库 v2 的核心功能](model-parallel-core-features-v2.md) 包括加速和简化大型模型训练的技术和优化，例如混合分片数据并行性、张量并行、激活检查点和激活卸载。您可以使用 SMP 库加速具有数千亿个参数的大型语言模型（LLM）、大型视觉模型（LVM）和基础模型（FM）的训练和微调。

 SageMaker 模型并行度库 v2 (SMP v2) 将该库的 API 和方法与开源的 PyTorch 完全分片数据并行性 (FSDP) 保持一致，这使您只需最少的代码更改即可获得 SMP 性能优化的好处。借助 SMP v2，您可以将 PyTorch FSDP 训练脚本引入 AI，从而提高在 SageMaker AI 上训练最先进的大型模型的计算性能。 SageMaker 

您可以将 SMP v2 用于集群上的[Amazon SageMaker HyperPod](sagemaker-hyperpod.md)常规[SageMaker 训练](train-model.md)作业和分布式训练工作负载。

**Topics**
+ [模型并行性概念](model-parallel-intro-v2.md)
+ [支持的框架和 AWS 区域](distributed-model-parallel-support-v2.md)
+ [使用 SageMaker 模型并行度库 v2](model-parallel-use-api-v2.md)
+ [SageMaker 模型并行库 v2 的核心功能](model-parallel-core-features-v2.md)
+ [亚马逊 SageMaker AI 模型并行度库 v2 示例](distributed-model-parallel-v2-examples.md)
+ [SageMaker 分布式模型并行性最佳实践](model-parallel-best-practices-v2.md)
+ [SageMaker 模型并行库 v2 参考](distributed-model-parallel-v2-reference.md)
+ [SageMaker 模型并行度库的发行说明](model-parallel-release-notes.md)
+ [（已存档） SageMaker 模型并行度库 v1.x](model-parallel.md)