Daten, Modellierung & Künstliche Intelligenz – Forschung für die Bioökonomie von morgen

Täglich entstehen am Institut für Bio- und Geowissenschaften (IBG) hochaufgelöste Daten aus Sensorik, Sequenzierung, Bildgebung oder Fernerkundung – z. B. über Mikroorganismen in Böden, Stoffflüsse in Landschaften oder das Wachstum von Pflanzen unter Klimastress. Diese Daten bilden die Grundlage für innovative KI-Verfahren, simulationsbasierte Modelle und datengetriebene Entscheidungen – mit großem Nutzen für Wissenschaft, Gesellschaft und Bioökonomie. Denn sie spielen eine zentrale Rolle, um biologische Systeme, Umweltprozesse und biotechnologische Verfahren besser zu verstehen und nachhaltig zu gestalten.

Simulation und datengetriebene Modellierung

Im Rahmen des Centre for Advanced Simulation and Analytics (CASA) des Jülich Supercomputing Centre (JSC) arbeitet das IBG gemeinsam im Simulation and Data Lab Digital Bioeconomy (SDL-DBE) an neuen Ansätzen der simulations- und datengetriebenen Analyse biologischer und biotechnologischer Systeme. Ziel ist es, mithilfe von High-Performance Computing, multiskaligen Modellen, KI-gestützten Simulationen und digitalen Workflows neue Erkenntnisse in Bereichen wie Pflanzenforschung, mikrobiellen Systemen und zirkulärer Biotechnologie zu gewinnen. Zudem entstehen durch die Kombination von Experiment und Simulation Werkzeuge für resiliente Prozesse – etwa im Digital-Twin-Projekt ReGenFarm- das landwirtschaftliche Produktionssysteme dynamisch abbildet.

Datengewinnung und -infrastruktur

Im IBG werden pflanzliche, mikrobielle und umweltbezogene Daten mit modernen Methoden erhoben – z. B. im GrowScreen mit 3D-Bildgebung, per Sequenzanalyse, Umweltsensoren, Drohnen oder Satellitenfernerkundung. Das Helmholtz Sensor Management System (SMS) unterstützt dabei das verteilte und effiziente Management großer Sensorinfrastrukturen. Über Viewer wie beispielsweise dem Helmholtz Earth werden Daten über die Zeit visuell dargestellt. Angebunden an Nationale Forschungsdaten Infrastrukturen (NFDI ), wie DataPLANT, NFDI4bioimage, NFDI4microbiota oder FAIRagro fließen diese Daten nach dem FAIR Prinzip (findable, accessible, interoperable, reusable) in offene Infrastrukturen ein. Darüber hinaus werden am IBG die nationale Infrastruktur de.NBI (Deutsches Netzwerk für Bioinformatik-Infrastruktur) und ihr europäischer Zweig ELIXIR Germany koordiniert. Diese Netzwerke stellen leistungsfähige Werkzeuge und Services für die Analyse biologischer und biotechnologischer Daten bereit sowie eine leistungsfähige Cloud-Infrastruktur. Dadurch werden unsere Forschungsdaten nachhaltig nutzbar gemacht und international anschlussfähig vernetzt.

Künstliche Intelligenz

Auch die KI-gestützte Analyse dieser Daten, etwa zur Erkennung raumzeitlicher Muster in der Umweltmodellierung, ist ein zentrales Arbeitsfeld. Ob bei der Annotation von komplexen Genomen (Helixer), der Analyse regulatorischer Elemente (deepCRE), der Vorhersage von Proteinfunktionen (TopEC, OneProt) oder der Interpretation von Mikrobiomdaten: KI hilft, Muster zu erkennen, die für den Menschen kaum sichtbar wären. Auch in der Fernerkundung und Umweltmodellierung kommt KI zunehmend zum Einsatz (KI STrategie für Erdsystemdaten, KISTE).

Letzte Änderung: 09.10.2025