本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS PCS 運算節點群組
AWS PCS 運算節點群組是節點 (Amazon EC2 執行個體) 的邏輯集合。這些節點可用於執行運算任務,以及提供 HPC 系統的互動式殼層型存取。運算節點群組包含建立節點的規則,包括要使用的 Amazon EC2 執行個體類型、要執行的執行個體數量、是否使用 Spot 執行個體或隨需執行個體、要使用的子網路和安全群組,以及如何在啟動時設定每個執行個體。當這些規則更新時, AWS PCS 會更新與運算節點群組相關聯的資源以符合。
運算節點上已停用 SMT
AWS PCS 會在引導時停用所有運算節點執行個體上的同時多執行緒 (SMT),也稱為 Intel 處理器上的超執行緒。這無法設定。在具備 SMT 功能的執行個體類型上,每個 vCPU 都會映射到專用實體核心,而不是硬體執行緒。這表示 vCPU 總數是執行個體類型的預設值的一半,但每個 vCPU 都有完整核心的專屬存取權。例如,公告 96 個 vCPUs執行個體類型在 AWS PCS 運算節點上有 48 個可用的核心。不支援 SMT 的執行個體類型,例如 Graviton (Arm),不受影響。
大多數運算限制的 HPC 工作負載在停用 SMT 的情況下,會看到同等或更好的效能。停用超執行緒可消除同級執行緒之間的資源爭用,並為每個實體核心提供其快取和執行單位的獨佔存取權。這是 HPC 環境的常見實務。