

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 文件系统性能问题排查
<a name="performance-troubleshooting"></a>

FSx for Windows File Server 文件系统的性能取决于多个因素，包括推送到文件系统的流量、文件系统的配置方式以及由启用的功能消耗的资源，例如重复数据删除或影子副本。有关了解文件系统性能的更多信息，请参阅 [FSx for Windows File Server 性能性能](performance.md)。

**Topics**
+ [如何确定我的文件系统的吞吐量和 IOPS 限制？](#perf-throughput-IOPS-limits)
+ [网络 I/O 和磁盘有什么区别 I/O？ 为什么我的网络 I/O 与我的磁盘不同 I/O？](#perf-whatis-networkio-diskio)
+ [为什么即使我的网络很低，我的 CPU 或内存使用率也 I/O 很高？](#why-cpu-mem-high)
+ [什么是突增？ 我的文件系统使用了多少突增？ 突增点数用完时会发生什么？](#what-is-bursting)
+ [我在上面看到了警告 **监控&amp;性能** 页面 — 我需要更改文件系统的配置吗？](#warnings)
+ [我的指标暂时丢失，我应该担心吗？](#missing-metrics)

## 如何确定我的文件系统的吞吐量和 IOPS 限制？
<a name="perf-throughput-IOPS-limits"></a>

要查看文件系统的吞吐量和 IOPS 限制，请根据预置吞吐能力参阅[性能水平表](performance.md#performance-table)。

## 网络 I/O 和磁盘有什么区别 I/O？ 为什么我的网络 I/O 与我的磁盘不同 I/O？
<a name="perf-whatis-networkio-diskio"></a>

Amazon FSx 文件系统包括一个或多个文件服务器，这些服务器通过网络向访问文件系统的客户端提供数据。这就是网络 I/O。文件服务器具有快速的内存缓存，可增强处理最常访问的数据的性能。文件服务器还会将流量推送到托管文件系统数据的存储卷。这是磁盘 I/O。下图说明了 Amazon FSx 文件系统的网络和磁盘 I/O 。

![FSx for Windows File Server 架构，显示了文件服务器和存储卷性能指标的关系及其对文件系统性能的影响。](http://docs.aws.amazon.com/zh_cn/fsx/latest/WindowsGuide/images/metrics-overview-FSxW.png)


有关更多信息，请参阅 [使用 Amazon 进行监控 CloudWatch](monitoring-cloudwatch.md)。

## 为什么即使我的网络很低，我的 CPU 或内存使用率也 I/O 很高？
<a name="why-cpu-mem-high"></a>

文件服务器 CPU 和内存利用率不仅取决于您推送的网络流量，还取决于您在文件系统上启用的功能。如何配置和计划这些功能可能会影响 CPU 和内存利用率。

正在进行的重复数据删除作业可能会消耗内存。您可以修改重复数据删除作业的配置，以降低内存需求。例如，您可以将优化限制为针对特定文件类型或文件夹运行，或者设置优化的最小文件大小和期限。我们还建议将重复数据删除作业配置为在文件系统负载最小的空闲期间运行。有关更多信息，请参阅 [通过重复数据删除来降低存储成本](managing-storage-configuration.md#using-data-dedup)。

如果您启用了基于访问权限的枚举，则可能会在最终用户查看或列出文件共享时，或者在存储扩展作业的优化阶段，看到 CPU 利用率很高。有关更多信息，请参阅《Microsoft 存储文档》**中的[对命名空间启用基于访问的枚举](https://docs.microsoft.com/en-us/windows-server/storage/dfs-namespaces/enable-access-based-enumeration-on-a-namespace)。

## 什么是突增？ 我的文件系统使用了多少突增？ 突增点数用完时会发生什么？
<a name="what-is-bursting"></a>

File-based 工作负载通常处于尖峰状态，其特点是短而密集的高峰期，两次突发之间 I/O 有空闲时间。为了支持这些类型的工作负载，除了文件系统可以维持的基准速度外，Amazon FSx 还提供了在一段时间内以更高的速度进行网络 I/O 和磁盘操作 I/O 的功能。

Amazon FSx 使用积分机制根据平均利用率分配吞吐量和 IOPS — 当文件系统的吞吐量和 IOPS 使用量低于其基准限制时，文件系统会累积积积分，并且可以在需要时使用这些积分突破基准限制（不超过突发限制）。 I/O 有关文件系统的突增限制和持续时间的更多信息，请参阅 [FSx for Windows File Server 性能性能](performance.md)。

## 我在上面看到了警告 **监控&amp;性能** 页面 — 我需要更改文件系统的配置吗？
<a name="warnings"></a>

**监控和性能**页面出现警告，指明最近的工作负载需求何时接近或超过资源限制，具体取决于您的文件系统配置方式。这并不一定意味着您需要更改配置，但如果不采取建议的措施，您的文件系统可能无法满足您的工作负载需求。

如果导致警告的工作负载并不典型，并且您预计它不会持续，那么不采取任何措施但同时密切监控未来的利用率可能是安全的。但是，如果导致警告的工作负载是典型工作负载，并且您预计它会持续甚至加剧，我们建议您按照建议的操作来提高文件服务器性能（通过增加吞吐能力）或提高存储卷性能（通过增加存储容量或从 HDD 切换到 SSD 存储）。

**注意**  
某些文件系统事件可能会消耗磁盘 I/O 性能资源，并可能触发性能警告。例如：  
存储容量扩展的优化阶段会增加磁盘吞吐量，如 [增加存储容量并提升文件系统性能](managing-storage-configuration.md#storage-capacity-increase-and-performance) 中所述
对于 Multi-AZ 文件系统，诸如吞吐量容量扩展、硬件更换或可用区中断之类的事件会导致自动故障转移和故障恢复事件。在此期间发生的任何数据更改都需要在主文件服务器和辅助文件服务器之间同步，Windows Server 运行的数据同步作业可能会消耗磁盘 I/O 资源。有关更多信息，请参阅 [管理吞吐能力](managing-throughput-capacity.md)。

## 我的指标暂时丢失，我应该担心吗？
<a name="missing-metrics"></a>

Single-AZ 在文件系统维护、更换基础架构组件以及可用区不可用时，文件系统将出现不可用情况。在这段时间内，指标将不可用。

在 Multi-AZ 部署中，Amazon FSx 会自动在不同的可用区预配置和维护备用文件服务器。如果文件系统维护或计划外服务中断，Amazon FSx 通常会自动失效转移到备用文件服务器，让您无需人工干预即可继续访问数据。在您的文件系统进行失效转移和失效自动恢复的短时间内，指标可能暂时不可用。