Data Management, Mining and Analysis
Ansprechpartnerin:
- Institute for Advanced Simulation (IAS)
- Datenanalytik und Maschinenlernen (IAS-8)
Raum 2003
Datenmanagement, Mining and Analysis untersucht Methoden und Anwendungen, die große Datenmengen oder komplexe Datensammlungen in allen Informationssystemen betreffen. Dieser Bereich gewinnt zunehmend an Bedeutung, da immer mehr Datenquellen aus wissenschaftlichen Instrumenten, sozialen Netzwerken, offenen Daten, Überwachungssystemen, Sensornetzwerken usw. verfügbar werden.
Unsere Forschung im Bereich Datenmanagement betrifft die Indizierung, den effizienten Zugriff sowie die Anfrageverarbeitung und Ähnlichkeitssuche. Unsere Lösungen bestehen typischerweise aus algorithmischen Strategien, die einen effizienten Zugriff auf relevante Daten ermöglichen, oft mit beweisbarer Korrektheitsgarantie. Ein bemerkenswerter Schwerpunkt unserer Forschung ist die Verwendung moderner Hardware, d. h. Multi-Core-CPUs und Grafikkarten (GPUs) auf Standard-Desktop- oder Laptop-Computern.
In der Datenanalyse sind wir an Konzepten und Methoden zum Lernen aus Daten interessiert, wobei wir sowohl überwachte als auch unüberwachte Methoden einsetzen. Insbesondere tragen wir Clustering-Methoden für hochdimensionale und verrauschte Daten bei, sowie unüberwachte Lösungen zur Ausreißererkennung. Zu den überwachten Ansätzen gehören künstliche neuronale Netze, insbesondere für den Umgang mit Textdaten (Natural Language Processing, NLP) und Bilddaten (z.B. Fernerkundung), bei denen Transferlernen eine wichtige Rolle spielt.
Methodisch kombinieren wir formale Problemdefinitionen und analytische Diskussionen mit prototypischen Implementierungen und empirischen Studien. Wir nutzen Benchmarking-Daten sowie Kooperationen mit Domänenexperten, um die Qualität, Effizienz und Skalierbarkeit unserer Ansätze zu evaluieren.