Cloud Computing

Die Analyse von Datensätzen, die durch Omics-Analysemethoden gewonnen werden, erfordert immer größere Rechen- und Speicherressourcen, welche den Forschenden lokal nicht zur Verfügung stehen. Hier eröffnet Cloud-Computing neue Möglichkeiten für eine schnellere und effizientere Verarbeitung dieser Datensätze.

Herausforderungen durch Hochdurchsatz-Sequenzierung

In der jüngeren Vergangenheit konnten enorme Fortschritte in der Entwicklung von Hochdurchsatz-Sequenzierungs-Technologien erzielt werden. Dies hat nicht nur auf die biologische und medizinische Forschung große Auswirkungen. Daraus resultieren exponentiell steigende Mengen an Sequenzdaten, welche in Kombination mit der wachsenden Komplexität der Experimente die Bioinformatik vor große Herausforderungen stellt.

Neue bioinformatische Ansätze für wachsende Datenmengen

Es gilt, neue bioinformatische Ansätze zu entwickeln, welche die Verarbeitung und Interpretation der immer größer werdenden Datenmengen ermöglichen. Am IBG-5 trifft die Forschungsarbeit im Bereich der Metagenomik durch die Forschungsgruppe Computational Metagenomics auf die Entwicklungen der Bielefelder Bioinformatik-Server-Gruppe, welche sich mit der Bereitstellung von Analyse-Pipelines in öffentlichen und privaten Cloud-Computing-Umgebungen beschäftigt.

Vernetzung und globale Ressourcennutzung

In der Bioinformatik-Forschungsgemeinschaft wurden früh die positiven Effekte der Vernetzung und Nutzung von global verteilten Ressourcen erkannt und umgesetzt. Relevante Werkzeuge und Datenbanken wurden online zur Verfügung gestellt und den Forschungsgruppen der Community somit zugänglich gemacht.

Bielefelder Bioinformatik-Server (BiBiServ)

So wurde der Bielefelder Bioinformatik-Server (BiBiServ) 1996 mit dem Ziel gegründet, die an der Universität entwickelten Bioinformatik-Tools langfristig anbieten zu können. Dafür wurde ein Framework entwickelt, welches es Entwicklern ermöglicht, ihre Tools und Dienste mit minimalem Aufwand zur Verfügung zu stellen und notwendige Webserver-Infrastrukturen auf dem neuesten Stand zu halten. Allein in den letzten 10 Jahren wurden mehr als 1,5 Millionen Aufträge von Nutzern aus mehr als 90 Ländern über BiBiServ abgewickelt.

Cloud-Computing-Framework für Bioinformatik-Tools

Ein in unserer Forschungsgruppe entwickeltes Cloud-Computing-Framework ermöglicht es, praktisch alle BiBiServ-Tools in privaten und öffentlichen Cloud-Umgebungen, wie etwa AWS, Google Cloud oder OpenStack zu betreiben. Dabei konfiguriert das BiBiGrid-Framework die verfügbaren Cloud-Computing-Ressourcen zu einem HPC-Cluster und ermöglicht einen einfachen Zugang zu Speicherlösungen in der Cloud, welche für die gewaltigen Datenmengen der Forschungsprojekte zunehmend an Bedeutung gewinnen.

Forschungsarbeit im Spannungsfeld von Cloud Computing und Bioinformatik

Die aktuellen Entwicklungen und der damit verbundene Bedarf an immensen Rechen- und Speicherressourcen für die Analyse gewaltiger, über mehrere Standorte verteilter Datensätze, gilt es durch effiziente und leistungsfähige Analysewerkzeuge und Infrastrukturen gerecht zu werden. Dynamisch skalierbare, „virtualisierte“ Ressourcen und zentralisiert zur Verfügung gestellte Datensätze spielen hier eine wichtige Rolle.

Die Forschungsarbeit unseres Institutsbereich findet sich in diesem aufregenden Spannungsfeld wieder.

Letzte Änderung: 25.03.2025