HPC Optimisation and Scaling Workshop

Der HPC Optimisation and Scaling Workshop fand vom 18. bis 22. Februar am JSC statt. Er beinhaltete eine kombinierte Schulung von Intel und JSC über den Einsatz der parallelen Tools zur Anwendungsleistungsanalyse mit der Möglichkeit, groß angelegte Durchläufe und Messungen auf den Systemen JUWELS und JURECA durchzuführen. Über zwanzig Teilnehmer (oft in Teams von zwei bis vier Personen arbeitend) wurden von einer vergleichbaren Anzahl von JSC-Mitarbeitern aus den Simulationslabors und Querschnittsteams, drei Referenten von Intel und weiteren HPC-System-Supportmitarbeitern im Hintergrund unterstützt. JUWELS und JURECA (Cluster- und Booster-Teile) waren an allen Tagen während der Kurszeiten reserviert, um Jobs mit einer großen Anzahl von Rechenknoten durchzuführen. Diese wurden nach und nach freigegeben, wenn sie nicht mehr benötigt werden, um Serviceunterbrechungen zu minimieren.

Die Teilnehmer wurden ermutigt, ihre Codes mit Testfällen und/oder Ausführungsmaßnahmen zur Auditierung im Vorfeld des Workshops zur Verfügung zu stellen. Vorabanalysen mehrerer Codes wurden zu Beginn des Workshops kurz vorgestellt und in die während des Workshops entwickelten Pläne zur Optimierung integriert.

Drei Codes, die effektiv Multi-Threading in Kombination mit MPI verwendeten, wurden leicht skaliert, um erfolgreich mit bis zu 2048 Rechenknoten von JUWELS zu laufen, und zwei Codes, die nur MPI (und kein Threading) verwendeten, wurden auf die Verwendung von 1024 Rechenknoten abgestimmt. Außerdem wurde demonstriert, dass in Kombination der JURECA-Cluster- und Boosterknoten auch groß angelegte modulare Supercomputing-Anwendungen laufen können. Andere Code-Teams konzentrierten sich auf die Optimierung von Speicherzugriff und Vektorisierung. Die Teilnehmer des Workshops waren sehr dankbar für die Testmöglichkeiten und Unterstützung.

Im Zuge dieses intensiven Einsatzes von Systemhardware und -software sind eine Vielzahl von Problemen aufgetreten, die nicht alle während des Workshops gelöst werden konnten, aber weiterhin aktiv angegangen werden. Die Nutzung der Supercomputersysteme wird dadurch verbessert, was die Lösung größerer Rechenprobleme und eine effizientere Nutzung der Ressourcen ermöglicht.

Ansprechpartner: Dr. Brian Wylie, b.wylie@fz-juelich.de

aus JSC News No. 264, 27. März 2019

Letzte Änderung: 05.07.2022