本課程專注於在國網中心的GPU主機平台上使用Slurm進行跨節點運算。課程內容涵蓋國網GPU HPC主機的介紹與使用,並通過實作跨節點訓練大型專案(Yolov9),讓用戶逐步熟悉跨節點GPU運算的相關技術,包括Slurm、Singularity和Torchrun等工具。 * 課前條件:
- 需理解 Pytorch 的運作原理
- 熟悉 Linux 指令
* 使用環境:
- T2 (TWCC)
課程投影片:https://ppt.cc/fWW9Ex
線上會議連結:https://teams.microsoft.com/meet/285104362322?p=dBNPVZqfwbCeJnEEV5