Wir unterstützten die Forschungsgruppe des RIFS bei der Analyse und Behebung intermittierender Fehler nach dem Umzug komplexer Atmosphärenchemie-Modelle auf ein neues Hochleistungsrechner-Cluster. Dabei schlossen wir die Lücke zwischen wissenschaftlicher Anwendungslogik und systemnaher Fehlersuche.
Auftraggeber
Forschungsinstitut für Nachhaltigkeit (RIFS)
Dauer
2 Wochen
Produkt
Dienstleistung
Expertise
Softwareentwicklung
Ziel des Projekts war es, die Ursache intermittierender Fehler zu identifizieren und zu beheben, die nach der Migration auf einen neuen Hochleistungsrechner-Cluster auftraten. Dadurch sollte die zuverlässige Ausführung der Modellsimulationen auf der neuen Infrastruktur wieder ermöglicht werden.
Eine zentrale Herausforderung bestand darin, dass nach dem Wechsel auf ein neues Hochleistungsrechner-Cluster eine nicht korrekt passende MPI-Konfiguration zu Laufzeitproblemen führte. Die Ursache lag damit nicht im fachlichen Modell selbst, sondern im Zusammenspiel von wissenschaftlichem Code, Systembibliotheken und Cluster-Umgebung. Dadurch war eine tiefgehende Analyse der systemnahen Konfiguration erforderlich.
Programmiersprachen
Bash
Technologien
MPI
Schematische Darstellung eines Hochleistungsrechner-Clusters mit wissenschaftlicher Simulationssoftware.
Ähnliches Problem?
Im Projekt konnte die Ursache der Fehler identifiziert und behoben werden, sodass die Modellsimulationen auf dem Hochleistungsrechner-Cluster wieder ausführbar wurden. Das Projekt zeigte den Wert einer Brücke zwischen wissenschaftlicher Softwareentwicklung und systemnaher HPC-Analyse.
RIM2D ist ein bestehendes, hocheffizientes 2D-hydraulisches Simulationsmodell für fluviale, pluviale und urbane Hochwasser. Wir unterstützten im Rahmen einer strategischen Partnerschaft dabei, den Forschungscode um eine Webanwendung und eine cloudbasierte GPU-Simulationsumgebung zu erweitern und so den Transfer in ein marktfähiges Produkt zu ermöglichen.
Wir entwickelten eine S3-basierte Open-Source Datalake-Lösung zur zentralen Erfassung, Kategorisierung und Durchsuchbarkeit von Daten. Ziel war es, die manuelle Datenverwaltung durch eine integrierte Architektur mit Workflowsteuerung, Datenkatalog und Zugriffsschutz zu automatisieren und zu verbessern.