Hardware
Alles in allem stehen unseren Nutzerinnen und Nutzern mehr als 100 GPUs und mehrere hundert Terabyte an Storage zur Verfügung. Die GPUs verteilen sich dabei auf insgesamt 32 physikalische Rechenknoten, welche mittels schnellem Interconnect (InfiniBand) an das mit BeeGFS bereitgestellte verteilte Dateisystem angebunden sind. Zudem besitzt jeder Rechenknoten eine lokale SSD, auf die während der Joblaufzeit frei zugegriffen werden kann.
Momentan stehen zwei verschiedene Compute-Node-Typen zur Verfügung.
Typ |
Anzahl |
GPUs pro Knoten |
GPU Speicher |
CPU |
CPU-Kerne |
Hauptspeicher |
makaria |
16 |
2x NVIDIA GTX-1080ti |
11 GB |
AMD Threadripper 1920x |
24 |
64 GB |
cerberus |
16 |
4 x NVIDIA Titan V |
12 GB |
Intel Xeon 4108 |
32 |
192 GB |
erebos |
3 |
4x NVIDIA A100 |
40 GB |
AMD EPYC 7402 |
96 |
512 GB |
Dabei ist sowohl der Zugriff als die Nutzung dieser Ressourcen durch ein Batch-System und unterschiedliche Queues entweder projekt- oder accountspezifisch festgelegt und kann daher für die Nutzerinnen und Nutzer variieren.