Ideen für Masterarbeiten
Metagenomik
Im Rahmen des “Metagenomics Toolkit”-Projekts sollen große Datenmengen mithilfe eines cloudbasierten Bioinformatik-Workflows automatisiert analysiert werden. Der Workflow ist auf Basis von Nextflow (https://www.nextflow.io) implementiert und kann mit verschiedenen Programmiersprachen erweitert werden (Python, Bash, R, etc.). Der Workflow soll durch verschiedene Analysetools aus dem Bereich der Metagenomik erweitert werden.
Mögliche Themen für Abschlussarbeiten:
- Evaluation verschiedener Strategien zu Metagenom-Assembly- und -Binning
- Vorhersage des Ressourcenverbrauchs mit Hilfe von KI-Methoden
- Automatische Evaluation verschiedener Konfigurationen des Workflows
- Entwicklung eines „Minimal-Workflows“ zur Hochdurchsatzanalyse von tausenden von Datensätzen
- Erweiterung des Toolkits um Analysetools für virale Sequenzdaten
- Weiterentwicklung des Tools TraceFlow zum Benchmarking von Nextflow Pipelines (Einblick in den Ressourcenverbrauch von Tools über deren gesamte Laufzeit)
Cloud Computing
Das Deutsche Netzwerk für Bioinformatik-Infrastruktur (de.NBI) stellt eine eigene föderierte Cloud für die Lebenswissenschaften zur Verfügung. Das de.NBI-CloudPortal (https://cloud.denbi.de) bietet mit SimpleVM einen möglichen Projekt-Modus, über den Virtuelle Maschinen (VMs) gestartet und verwaltet werden können. Um den Umgang mit der Cloud weiter zu vereinfachen, soll SimpleVM erweitert werden.
Mögliche Themen für Abschlussarbeiten:
- Bereitstellung und Austausch (großer) Datenmengen in virtuellen Umgebungen
- Monitoring des Resourcenverbrauchs der einzelnen Virtuellen Maschinen über das Portal, Erweiterung des SimpleVM-Systems durch entsprechende Visualisierungen
- Austausch von virtuellen Umgebungen zwischen verschiedenen de.NBI-Cloud-Standorten
- Austausch, Aktualisierung und Synchronisierung (großer) Bioinformatik-Datenbanken über mehrere de.NBI-Cloud-Standorte