Lernen und Kontrolle für die molekulare Nanofabrikation

Um das Feld der SPM-basierten Fabrikation molekularer Nanostrukturen voranzubringen, führen wir Methoden des Machine Learning und der Regelungstheorie in dieses Forschungsgebiet ein. So waren wir beispielsweise Vorreiter bei der autonomen Nanofabrikation mithilfe eines Reinforcement-Learning-Agenten und kombinierten Machine Learning mit regelungstheoretischen Ansätzen, um sowohl molekulare Konformationen während der Manipulation sichtbar zu machen als auch die Scanning-Quantum-Dot-Mikroskopie zu beschleunigen.

Unser Ziel ist es, molekulare Manipulationen [1] zu verstehen und nutzbar zu machen. Die Komplexität von Manipulationsexperimenten sowie der damit verbundene hohe Rechenaufwand realistischer Simulationen erfordern einen datengetriebenen Ansatz. Dabei verfolgen wir eine mehrdimensionale Strategie. Einerseits konzentrieren wir uns auf die molekulare Fabrikation durch einen selbstlernenden Agenten und verwandeln das SPM damit in einen autonomen Roboter, der in der Lage ist, bestimmte Manipulationsaufgaben auszuführen [2]. Der Agent ist darauf ausgelegt, sowohl mit der begrenzten Informationsverfügbarkeit des SPM als auch mit der intrinsischen Variabilität auf der Nanoskala umzugehen. Entscheidend ist dabei, dass der Agent die tatsächliche molekulare Konformation nicht kennen muss.

Andererseits nutzen wir Machine Learning und Konzepte der Regelungstheorie, wie etwa Particle Filter, um molekulare Konformationen im Experiment zu „beobachten“. Hierzu wird Machine Learning beispielsweise eingesetzt, um molekulare Simulationen zu beschleunigen [3]. In Kombination mit Virtual Reality [4], werden diese Konzepte es letztlich ermöglichen, Veränderungen der molekularen Konformation während eines Manipulationsexperiments in Echtzeit zu visualisieren.

Fortschritt eines Reinforcement-Learning-Agenten beim Versuch, eine molekulare Manipulationsaufgabe zu erfüllen. Während der Agent zunächst zufällige SPM-Tip-Trajektorien verwendet (siehe schwarzer Trial Counter), lernt er aus fehlgeschlagenen Versuchen (grüne Kreuze) und verbessert schrittweise seine Einschätzung einer erfolgreichen Tip-Trajektorie (Hintergrundfarbe), die er schließlich findet.

Letzte Änderung: 13.05.2026