Institut

HAICON26: KI als Bindeglied für die Umweltforschung

Die HAICON26 "AI for Science" fand vom 8.-11. Juni im House of Communications in München statt.

Die sechste Helmholtz AI Conference 2026 (HAICON26) brachte vom 8. bis 11. Juni 2026 KI-Vertreter aus Wissenschaft und Industrie in München zusammen. Die von Helmholtz AI organisierte Konferenz stand unter dem Leitmotiv „AI for Science“ und widmete sich der Frage, wie moderne KI-Methoden wissenschaftliche Forschung beschleunigen und neue Erkenntnisse ermöglichen können. Der Workshop „AI in Environmental Research“, von Martin Schultz und Florentine Weber geleitet, fokussierte sich auf die Rolle von KI als verbindendes Element zwischen bislang getrennten Bereichen der Umwelt- und Erdsystemforschung. Im Mittelpunkt standen insbesondere agentische KI-Systeme, Foundation Models für Umweltanwendungen sowie die Herausforderungen und Chancen einer stärker integrierten Earth-System-Perspektive.

Die ESDE-Gruppe war mit Martin Schultz, Florentine Weber und Sebastian Buschow vertreten.

Von fragmentiertem Wissen zu einer integrierten Earth-System-Perspektive

Der Workshop brachte rund 25 Teilnehmer aus verschiedenen Helmholtz-Zentren sowie externen Einrichtungen zusammen, darunter Forscher vom KIT, DKRZ, AWI, der Universität Bonn, Fraunhofer sowie Vertreter aus der Industrie, unter anderem von NVIDIA.

Die vertretenen Forschungsgebiete reichten von Wetter- und Klimavorhersage über Luftqualitätsforschung, Hochwasserprognosen, Fernerkundung, Meereis-Klassifikation und Biodiversitätsanalysen über Akustik bis hin zu landwirtschaftlichen Anwendungen und technischen Fragestellungen. Diese Vielfalt verdeutlichte eindrucksvoll die zunehmende Fragmentierung der Umweltwissenschaften: Unterschiedliche Fachgebiete arbeiten mit eigenen Datenstrukturen, Modellen, Begrifflichkeiten und Annahmen, wodurch eine ganzheitliche Betrachtung des Erdsystems erschwert wird.

Die Leitfrage des Workshops lautete daher:

Kann KI zum verbindenden Gewebe („connective tissue“) der Earth-System-Forschung werden?

In der Einführung skizzierten Martin Schultz und Florentine Weber die aktuellen Herausforderungen:

stark fragmentierte wissenschaftliche Disziplinen,
getrennte Dateninfrastrukturen und Metadatenstandards,
inkompatible räumliche und zeitliche Skalen,
statische, manuell entwickelte Workflows,
begrenzte domänenspezifische Sichtweisen.

Dem gegenüber steht die Vision zukünftiger KI-Systeme, die unterschiedliche Wissensdomänen miteinander verbinden können. Diskutiert wurden insbesondere agentische KI-Systeme, die eigenständig Informationen sammeln, Werkzeuge orchestrieren, Unsicherheiten identifizieren, Hypothesen generieren und Simulationen gezielt anstoßen könnten. Solche Systeme könnten langfristig eine integrierte Betrachtung des Erdsystems ermöglichen und den Übergang von reiner Vorhersage hin zu wissensgestützter Entscheidungsunterstützung unterstützen.

Martin Schultz und Florentine Weber aus der Earth System Data Exploration (ESDE) Forschungsgruppe des Jülich Supercomputing Centre (JSC) riefen zu Wissenschaft & Philosophie auf: Sie leiteten den Workshop “KI in Umweltforschung” auf der HAICON26.

Als Beispiele aktueller Entwicklungen stellte Martin Schultz mehrere Initiativen aus dem ESDE-Umfeld vor, darunter die Foundation-Model-Projekte WeatherGenerator, RAINA und HClimRep für Wetter- und Klimaanwendungen sowie die offenen Dateninfrastrukturen MeteoCloud und TOAR. Darüber hinaus wurden die Aktivitäten der CESOC (Center for Earth System Observation and Computational analysis) Machine Learning Working Group und des geplante MLESM26-Workshop hervorgehoben.

World Café I: Cross-Domain Challenges and Opportunities

Als dominante Herausforderungen der stärkeren Vernetzung verschiedener Umweltforschungsdomänen aus naturwissenschaftlicher Sicht wurden die Heterogenität von Datentypen, räumlichen und zeitlichen Skalen sowie die Vielfalt physikalischer Größen identifiziert. Besonders problematisch ist dabei nicht nur die bloße Datenintegration, sondern die konsistente Kopplung von Prozessen über Systemgrenzen hinweg - etwa zwischen Atmosphäre, Landoberfläche, Ozean und Biosphäre -, insbesondere wenn unterschiedliche Modellannahmen und Unsicherheitsniveaus zusammengeführt werden müssen. Hinzu kommt das Fehlen gemeinsamer Ontologien und semantischer Standards, was eine automatisierte, domänenübergreifende Modellkopplung derzeit stark limitiert.

Ein zentrales wissenschaftliches Spannungsfeld betrifft die Unterscheidung von Korrelation und Kausalität. Diskutiert wurde, wie sich datengetriebene KI-Methoden stärker mit physikalischem Wissen verbinden lassen, um nicht nur statistische Zusammenhänge zu identifizieren, sondern robuste, übertragbare Ursache-Wirkungs-Beziehungen abzuleiten. Eng damit verbunden ist die Frage, wie sich Unsicherheiten und mögliche Halluzinationen von Modellen systematisch erkennen, quantifizieren und in Entscheidungs- oder Simulationsketten kontrollieren lassen - im Besonderen in Szenarien, in denen Modelle als aktive wissenschaftliche Akteure in iterativen Forschungsprozessen eingesetzt werden.

Rocco Sedona leitete die Diskussion zu Methoden in der KI.

Als besonders zukunftsweisend wurden agentische Forschungsarchitekturen diskutiert. Hierbei könnten KI-Systeme nicht nur Daten analysieren, sondern aktiv Hypothesenräume explorieren, potenzielle Datenabhängigkeiten vorschlagen und diese iterativ gegen physikalische Modelle testen. Dadurch entstünde ein geschlossener wissenschaftlicher Loop aus Hypothesengenerierung, Simulation, Validierung und Anpassung. In diesem Kontext wurde auch die Idee adressiert, dass Agenten eigenständig Forschungsfragen formulieren und experimentelle Designs ableiten könnten, etwa zur Identifikation bislang unbekannter Kopplungen zwischen Umwelt- und Erdsystemprozessen.

Ein weiterer innovativer Ansatz betrifft Multi-Agenten-Systeme mit domänenspezifischer Spezialisierung. Statt eines monolithischen Modells könnten unterschiedliche „Expert Agents“ für Atmosphärenphysik, Hydrologie, Fernerkundung oder Energiesysteme miteinander interagieren, um konkurrierende Hypothesen auszuhandeln und konsistente, domänenübergreifende Interpretationen zu erzeugen. Dadurch könnten auch Wissenslücken zwischen Fachdisziplinen explizit sichtbar und systematisch adressierbar werden.

Schließlich wurde die Entwicklung agentischer Benchmarks als wichtiger nächster Schritt diskutiert. Diese könnten über klassische Leistungsmetriken hinausgehen und bewerten, inwiefern KI-Systeme in der Lage sind, eigenständig Forschungswerkzeuge zu entwickeln, zu optimieren und gegen physikalische Referenzmodelle zu validieren. Damit würde nicht nur Modellqualität, sondern auch Autonomie in wissenschaftlichen Arbeitsprozessen messbar – einschließlich der Frage, wie stark menschliche Intervention weiterhin erforderlich ist.

World Café II: ML Methods for Earth System Science

Die zweite Diskussionsrunde widmete sich den methodischen Grundlagen zukünftiger KI-Systeme für die Umweltforschung.

Eine erste Diskussion entstand um die Rolle großer allgemeiner Foundation Models gegenüber spezialisierten Modellen. Beide Ansätze wurden als relevant angesehen, gleichzeitig wurde jedoch auf die Kosten dieser Parallelität hingewiesen. Konkret wurde die Frage diskutiert, ob geringe Leistungssteigerungen – etwa im Bereich von wenigen Prozentpunkten – den deutlich höheren Energiebedarf großer Modelle rechtfertigen.

Inspiriert vom Blick auf die Alpen auf der einen und die Allianz Arena auf der anderen Seite diskutierten die Teilnehmenden des Workshops über die Möglichkeiten des Einsatzes von KI bei der Vorhersage von Umweltfaktoren, angeleitet von Philipp Franke.

Datenknappheit wurde nicht als hauptsächliches Problem betrachtet. Stattdessen wurde betont, dass große Mengen an Erdbeobachtungsdaten bereits verfügbar sind, jedoch häufig nicht in einer Form vorliegen, die unmittelbar für KI-Anwendungen genutzt werden kann. Datenkurierung und die Bereitstellung AI-ready Datensätze wurden daher als wesentliche Herausforderungen identifiziert.

Weitere methodische Schwerpunkte waren:

erklärbare KI,
Unsicherheitsquantifizierung,
die Rolle standardisierter Benchmarks im Spannungsfeld zu fachspezifischen Aufgabenstellungen,
digitale Zwillinge und synthetische Daten,
sowie die Frage, wie sich KI-Modelle im operativen Einsatz verhalten.

Im Bereich agentischer KI wurden sowohl Zuverlässigkeitsfragen als auch mögliche Systemarchitekturen diskutiert. Offen blieb insbesondere, ob zukünftige Lösungen auf einzelnen leistungsfähigen Modellen oder auf Multi-Agenten-Systemen mit spezialisierten Komponenten basieren sollten.

Auf dem Weg zum Workshop: Rund 25 Teilnehmer fanden sich ein.

Darüber hinaus wurde die Rolle von Large Language Models als wissenschaftliche Werkzeuge thematisiert. Sie können Forschungsprozesse beschleunigen, den Zugang zu Methoden erleichtern und es Forschenden ohne ausgeprägten Machine-Learning-Hintergrund ermöglichen, komplexere Analysen durchzuführen. Gleichzeitig wurde darauf hingewiesen, dass eine niedrigere Einstiegshürde nicht automatisch zu besseren wissenschaftlichen Prozessen führt und die Gefahr besteht, dass Anwender den Fokus auf die eigentliche Forschungsfrage verlieren.

World Café III: Ethics & Equity – From Prediction to Decision Support

Wer kontrolliert und versteht KI-Systeme noch, wenn diese von Vorhersagewerkzeugen zu autonomen Entscheidungspartnern werden? - Die dritte Diskussionsrunde behandelte ethische, gesellschaftliche und organisatorische Aspekte zukünftiger KI-Anwendungen in der Umweltforschung und deren Übergang von reinen Vorhersagesystemen hin zu entscheidungsunterstützenden Werkzeugen.

Ein tiefes Thema war die Frage nach einer breiten und gerechten Teilhabe an modernen KI-Technologien. Während offene Daten, Open-Source-Modelle und zunehmend verfügbare Rechenressourcen den Zugang zur Umweltmodellierung erleichtern, bleibt die Entwicklung und das Training großer Umwelt-Foundation-Models bislang auf wenige Institutionen mit entsprechender Infrastruktur konzentriert. Gleichzeitig wurde die Erwartung geäußert, dass offene Software-Ökosysteme und frei verfügbare Modelle diese Konzentration langfristig aufbrechen könnten. Darüber hinaus wurde diskutiert, dass Large Language Models künftig fehlende Expertise kompensieren und kleineren Forschungsgruppen den Zugang zu Methoden ermöglichen könnten, die bislang nur spezialisierten Zentren vorbehalten waren.

Ein weiterer Schwerpunkt war die Frage, welche Formen von Kontrolle und Governance für zukünftige KI- und Agentensysteme erforderlich sind. Die Teilnehmer betonten die Notwendigkeit transparenter Informationen über Trainingsdaten, Modellannahmen, Einsatzgrenzen und potenzielle Verzerrungen. Gleichzeitig wurde darauf hingewiesen, dass moderne agentische Systeme immer leistungsfähiger werden, während ihre internen Entscheidungsprozesse zunehmend schwer nachvollziehbar sind. Dadurch entsteht die Gefahr, dass Nutzer Entscheidungen auf Basis von Ergebnissen treffen, deren Herleitung sie nur noch oberflächlich verstehen. Die Herausforderung wurde mit der Analogie beschrieben, ein Team zu führen, dessen Mitglieder zwar hochkompetent, aber in ihren Denk- und Arbeitsweisen weitgehend intransparent sind.

Besonders intensiv wurde die Frage nach Verzerrungen und versteckten Einflussfaktoren diskutiert. Neben bekannten Datenverzerrungen wurden mögliche implizite Vorgaben kommerzieller Anbieter thematisiert, die sich in Modellen, Trainingsdaten oder Entwicklungswerkzeugen niederschlagen könnten. Als Gegenmaßnahmen wurden offene Modelle, offene Datensätze und wissenschaftlicher Wettbewerb hervorgehoben, da erst unabhängige Reproduzierbarkeit einen systematischen Vergleich unterschiedlicher Ansätze ermöglicht. Darüber hinaus wurde darauf hingewiesen, dass viele Datensätze geografische und kulturelle Ungleichgewichte aufweisen und insbesondere Regionen außerhalb der stark beobachteten Industrieländer häufig unterrepräsentiert sind.

Martin Schultz war für den Vortrag "Rethinking Weather and Climate Modelling in the Age of AI" eingeladen.

Im Zusammenhang mit Verzerrungen (Biases) wurde auch die besondere Bedeutung seltener Ereignisse hervorgehoben. Extremereignisse liegen definitionsgemäß außerhalb der typischen Datenverteilungen und stellen daher eine besondere Herausforderung für datengetriebene Systeme dar. Die Diskussion machte deutlich, dass die Bewertung von KI-Systemen nicht allein anhand durchschnittlicher Leistungsmetriken erfolgen sollte, sondern insbesondere ihre Robustheit und Verlässlichkeit in seltenen, aber gesellschaftlich hochrelevanten Situationen berücksichtigen muss.

Eng damit verknüpft war die Frage nach dem Umgang mit Unsicherheiten. Die Teilnehmer plädierten für eine stärkere Fehler- und Unsicherheitskultur, in der nicht nur Vorhersagen, sondern auch deren Grenzen sichtbar gemacht werden. Diskutiert wurden sowohl technische Methoden zur Darstellung von Unsicherheiten als auch organisatorische Ansätze, beispielsweise die gezielte Einbindung von Personen, deren Aufgabe darin besteht, Schwächen, Fehlannahmen und Randfälle systematisch zu identifizieren. Unterstützende Nutzergemeinschaften und offene Austauschplattformen wurden dabei als mögliche Instrumente genannt, um wiederkehrende Probleme und Fehlverhalten von Modellen frühzeitig sichtbar zu machen.

Als übergreifende Schlussfolgerung zog sich die Forderung nach Offenheit durch die gesamte Diskussion. Offene Daten, offene Modelle und transparente Entwicklungsprozesse wurden nicht nur als technische Präferenz verstanden, sondern als zentrale Voraussetzung für Nachvollziehbarkeit, Vertrauen, Teilhabe und die langfristige gesellschaftliche Akzeptanz von KI-gestützten Umweltinformations- und Entscheidungssystemen.

Fazit

Der Workshop „AI in Environmental Research“ zeigte eindrucksvoll, dass die Umweltwissenschaften vor einer grundlegenden Transformation stehen. Während Umweltforschung heute häufig in voneinander getrennten Fachdisziplinen organisiert ist, eröffnet die rasante Entwicklung von Foundation Models und agentischen KI-Systemen neue Möglichkeiten für eine integrierte Betrachtung des Erdsystems.

Gleichzeitig wurde deutlich, dass die größten Herausforderungen weniger in den Modellen selbst liegen als vielmehr in Datenstandards, Interoperabilität, Unsicherheitsbewertung und wissenschaftlicher Validierung. Die Diskussionen machten klar, dass KI künftig nicht nur als Werkzeug zur Vorhersage verstanden werden sollte, sondern als potentieller Vermittler zwischen wissenschaftlichen Disziplinen.

Ein zusätzlicher Höhepunkt auf der HAICON26 war Martin Schultz’ eingeladener Vortrag „Rethinking Weather and Climate Modelling in the Age of AI“, der die Rolle moderner KI-Methoden für die nächste Generation der Wetter- und Klimamodellierung adressierte und die Themen des Workshops in den größeren Kontext der Earth-System-Forschung einordnete.

Letzte Änderung: 13.06.2026

AI #jsc-rg-esde