本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
管理 Lustre 版本
FSx for Lustre 目前支持 Lustre 社区发布的多个长期支持(LTS)Lustre 版本。较新的 LTS 版本提供诸多优势,例如性能提升、新增功能以及对客户端实例最新 Linux 内核版本的支持。您可以使用 AWS 管理控制台、 AWS CLI或 AWS SDK 在几分钟内将文件系统升级到较新的 Lustre 版本。
FSx for Lustre 当前支持 Lustre LTS 版本 2.10、2.12 和 2.15。您可以使用或使用 AWS 管理控制台 describe-file-systems 命令确定 FSx for Lustre 文件系统的 LTS 版本。 AWS CLI
在执行 Lustre 版本升级之前,建议您按照 Lustre 版本升级的最佳实践 中所述的步骤操作。
Lustre 版本升级的最佳实践
在升级 FSx for Lustre 文件系统的 Lustre 版本之前,我们建议遵循以下最佳实践:
在非生产环境中测试:在升级生产文件系统之前,先在生产文件系统的副本上测试 Lustre 版本升级。这可确保生产工作负载的升级过程顺利进行。
确保客户端兼容性:确认客户端实例上运行的 Linux 内核版本与计划升级到的 Lustre 版本兼容。有关详细信息,请参阅Lustre 文件系统和客户机内核兼容性。
备份您的数据:
对于未与 S3 关联的文件系统:我们建议您在升级 Lustre 版本前创建 FSx 备份,以便为文件系统建立已知的还原点。如果您的文件系统已启用每日自动备份,Amazon FSx 将在升级前自动创建文件系统的备份。
对于已与 S3 关联的文件系统,我们建议升级前确保所有更改都已导出至 S3。如果您启用了自动导出,请检查AgeOfOldestQueuedMessage AutoExport指标是否为零,以确认所有更改均已成功导出到 S3。如果您尚未启用自动导出,可在升级前手动运行数据存储库任务(DRT)导出操作,将文件系统与 S3 存储桶进行同步。
计划文件系统停机时间:要成功升级,必须在升级开始之前断开所有客户端的连接,并在升级完成之前保持断开连接。总停机时间取决于识别和卸载所有客户机的时间、升级过程本身(对于绝大多数文件系统,通常不超过 30 分钟),以及升级完成后重新安装客户机和恢复工作负载的时间。客户端的卸载和重新装载持续时间因您的环境和客户机数量而异。
执行升级
要将 FSx for Lustre 文件系统升级到新版本,请按照下列步骤操作:
卸载所有客户端:在开始升级之前,必须从所有访问文件系统的客户机实例中卸载该文件系统。您可以使用 Amazon 上的
ClientConnections指标验证是否已成功卸载所有客户端,该 CloudWatch 指标应显示零连接。如果有任何客户机保持与文件系统的连接,则升级过程将无法成功。您可以在文件系统根目录存储的
.fsx/clientConnections文件中查看连接到该文件系统的客户端网络标识符(NID)列表。此文件每 5 分钟更新一次。您可以使用cat命令以显示文件内容,如以下示例所示:cat /test/.fsx/clientConnections升级 Lustre 版本:您可以使用亚马逊 FSx 控制台、或亚马逊 FSx API 升级 FSx for Lustre 文件系统的 Lustre 版本。 AWS CLI我们建议将文件系统升级到 FSx for Lustre 支持的最新 Lustre 版本。
更新文件系统的 Lustre 版本(控制台)
打开 Amazon FSx 控制台,网址为。https://console.aws.amazon.com/fsx/
在左侧导航窗格中,选择文件系统。在文件系统列表中,选择要更新其 Lustre 版本的 FSx for Lustre 文件系统。
在操作中,选择更新文件系统 Lustre 版本。或者,在摘要面板中,选择文件系统的 Lustre 版本字段旁边的更新。将出现更新文件系统 Lustre 版本对话框。将出现更新文件系统 Lustre 版本对话框。
在选择新的 Lustre 版本字段中,选择一个 Lustre 版本。您选择的版本必须比当前的 Lustre 版本更新。
选择更新。
更新文件系统的 Lustre 版本(CLI)
要更新 FSx for Lustre 文件系统的 Lustre 版本,请使用 update-file-system 命令。 AWS CLI(等效的 API 操作是UpdateFileSystem。) 设置以下参数:
将
--file-system-id设置为要更新的文件系统的 ID。将
--file-system-type-version设置为要更新的文件系统的 Lustre 版本。
以下示例将文件系统的 Lustre 版本从 2.12 更新至 2.15:
aws fsx update-file-system \ --file-system-idfs-0123456789abcdef0\ --file-system-type-version "2.15"如果升级工作流程失败(例如,如果客户端仍连接到文件系统),则文件系统会自动回滚到其原始的 Lustre 版本和状态。在这种情况下,管理操作事件将包含一条失败消息,其中包含有关在重试升级之前如何解决问题的指导。
挂载所有客户端:您可以使用 Amazon FSx 控制台中的更新选项卡或 AWS CLI中的
describe-file-systems,监控 Lustre 版本更新的进度。Lustre 版本升级状态显示为Completed后,即可安全地在客户端实例上重新挂载文件系统并恢复工作负载。