Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Ãœberarbeitung
Nächste Überarbeitung
Vorhergehende Ãœberarbeitung
Nächste Überarbeitung Beide Seiten der Revision
hlr:phoenix:nutzeranleitung [2020/06/04 10:45]
raskrato [Ansys Job starten]
hlr:phoenix:nutzeranleitung [2021/12/16 11:00]
matfranz [Jobfile]
Zeile 68: Zeile 68:
 --begin=now+60 (seconds by default) ​ --begin=now+60 (seconds by default) ​
 --begin=2010-01-20T12:​34:​00 --begin=2010-01-20T12:​34:​00
 +</​code>​
 +
 +Es gibt insgesamt acht GPU-Konten mit jeweils vier Grafikkarten. Für diese gibt es drei verschiedene GPU queues mit verschiedenen Workloads:
 +
 +<​code>​
 +gpu01_queue:​ 2 GPU-Knoten, hohe Priorität; nur für Jobs, die alle vier GPUs eines Knotens allozieren; maximal ein Job pro User; Walltime: 3 Tage
 +gpu02_queue:​ 6 GPU-Knoten, hohe Priorität; auch für Jobs, die nur einzelne GPUs allozieren; maximal zwei Jobs pro User; Walltime: 7 Tage
 +gpu03_queue:​ 8 GPU-Knoten, niedrige Priorität; auch für Jobs, die nur einzelne GPUs allozieren; Anzahl der Jobs pro User unbegrenzt; Walltime: 7 Tage; Jobs können unterbrochen werden, daher Checkpoints im Code verwenden
 +</​code>​
 +
 +Ein Beispiel für ein Jobfile für einen der GPU-Knoten sieht wie folgt aus:
 +
 +<​code>​
 +#!/bin/bash -l
 +
 +#SBATCH --partition=gpu02_queue
 +#SBATCH --nodes=2
 +#SBATCH --time=2-00:​00:​00
 +#SBATCH --job-name=GPUExample
 +#SBATCH --ntasks-per-node=4
 +#SBATCH --gres=gpu:​4 ​
 +
 +~/​anaconda3/​bin/​python "/​path/​to/​file/​example.py"​
 </​code>​ </​code>​
  
Zeile 516: Zeile 539:
 --begin=now+60 (seconds by default) ​ --begin=now+60 (seconds by default) ​
 --begin=2010-01-20T12:​34:​00 --begin=2010-01-20T12:​34:​00
 +</​code>​
 +
 +In the following you can find an example for a jobfile for a GPU-node:
 +
 +<​code>​
 +#!/bin/bash -l
 +
 +#SBATCH --partition=gpu
 +#SBATCH --nodes=2
 +#SBATCH --time=2-00:​00:​00
 +#SBATCH --job-name=GPUExample
 +#SBATCH --ntasks-per-node=4
 +#SBATCH --gres=gpu:​4 ​
 +
 +~/​anaconda3/​bin/​python "/​path/​to/​file/​example.py"​
 </​code>​ </​code>​
  
hlr/phoenix/nutzeranleitung.txt · Zuletzt geändert: 2023/09/05 18:08 von matfranz
Gauß-IT-Zentrum