Durch künstliche Intelligenz gesteuerte Erkennung von Drängelverhalten in Menschenmengen
In dieser Forschungsarbeit wurde ein neuartiges automatisches KI-basiertes Systementwickelt, um Drängln in Menschenmengen zu erkennen, insbesondere in Videoaufnahmen und Live-Kamerastreams von überfüllten Einlässen zu Veranstaltungen.
Ziel der Arbeit ist es, Veranstaltern und Sicherheitsdiensten das nötige Wissen zur Verfügung zu stellen, um Drängeln in Menschenmengen und die damit verbundenen Risiken zu verringern, den Komfort der Menschen zu erhöhen und potenziell lebensbedrohliche Situationen zu verhindern. Die Entwicklung des Framework bestand aus drei Phasen:
Erste Phase: Identifizierung von Regionen mit Gedränge in Videoaufnahmen
In der ersten Projektphase wurde ein neuer Ansatz entwickelt, der auf einem vortrainierten Deep-Learning-Modell für den optischen Fluss, einem angepassten und trainierten EfficientNetV1B0-basierten Convolutional Neural Network (CNN) und einem Algorithmus zur Fehlerreduktion basiert. Dieser Ansatz zielt darauf ab, Regionen zu identifizieren, die Personen enthalten, die in Videos von Menschenmengen drängeln. Jede Region umfasst ungefähr eine Fläche von 1 bis 2 Quadratmetern. Durch die Identifizierung dieser Regionen kann ein besseres Verständnis gewonnen werden, wann, wo und warum ein Drängeln in Menschenmengen auftritt. Dieses Wissen ist für die Entwicklung effektiver Crowd-Mangement - Strategien für Veranstaltungen und zur Verbesserung der Gestaltung öffentlicher Räume von Bedeutung.
Das Modell wurde anhand mehrerer Experimente trainiert, die eine geradlinige Warteschlange mit einer Einlasskontrolle darstellt. Die experimentellen Ergebnisse zeigen, dass der Ansatz eine Genauigkeit von 88 % und eine F1-Punktzahl erreicht.
Zweite Phase: Echtzeit-Erkennung von Gedränge in Live-Kamerastreams
In der zweiten Projektphase haben wir einen neuen Cloud-basierten Deep-Learning-Ansatz vorgeschlagen, um Drängler in dichten Menschenmengen in Echtzeit zu erkennen. Die Erkennung in Echtzeit ermöglicht Veranstaltern und Sicherheitskräften frühzeitig einzugreifen. Darüber hinaus kann eine solche frühzeitige Identifizierung bei der Bewertung der Maßnahmen des Crowd-Managements helfen und eine frühzeitige Erkennung von Schwachstellen und Maßnahmen zur Optimierung ermöglichen.
Der technische Ansatz zur Analyse des Videostreams zur Erkennung von Regionen in Echtzeit kombiniert ein robustes, schnelles und vorab trainiertes KI-Modell für den ‚Optischen Fluss‘ , ein angepasstes und trainiertes EficientNetV2B0-basiertes CNN-Modell und eine Farbradmethode. Für die Bereitstellung leistungsfähiger Ressourcen wird eine Live-Aufnahmetechnologie und eine Cloud-Umgebung verwendet.
Für das Training und die Evaluierung des Cloud-basierten Ansatzes wurden Daten aus Experimenten verwendet, in denen unterschiedliche Aufbauten von Warteschlangesystemen und Einlassschleusen untersucht wurden. In Testläufen konnten wir zeigen, dass es mit diesem Ansatz möglich ist Bereiche mit Gedränge aus dem Live-Kamera-Stream mit einer Genauigkeit von 87 % und innerhalb einer angemessenen Zeitverzögerung von 4 Sekunden zu erkennen.
Dritte Phase: Erkennung einzelner Personen, die in einer Menschenmengen drängeln
Während sich die ersten beiden Phasen auf die bereichsbezogene Erkennung konzentrieren, wurde in der dritten Phase ein innovativer Ansatz zur Identifizierung von drängelnden Personen in Menschenmengenvideos eingeführt, der auf Voronoi Diagrammen basiert. Die Analyse der Dynamik des Drängelverhaltens auf mikroskopischer Ebene kann genauere Einblicke in das Verhalten und die Interaktionen von Menschenmengen liefern. Dieses tiefe Verständnis hilft bei der Entwicklung effektiverer Crowd-Management-Strategien und zuverlässigerer, genauerer Simulationsmodelle.
Der vorgestellte Ansatz verwendet Fußgänger-Trajektorendaten als zusätzliche Eingabequelle. Ähnlich wie in der zweiten Phase, aber mit mehr realen Experimenten, wurde dieser Ansatz trainiert und bewertet. Die experimentellen Ergebnisse zeigen, dass der Ansatz eine Genauigkeit von 85 % erreicht.
Artikel
Ahmed Alia, Mohammed Maree, and Mohcine Chraibi. “A Hybrid Deep Learning and Visualization Framework for Pushing Behavior Detection in Pedestrian Dynamics.” Sensors 22, no. 11 (2022): 4040. https://doi.org/10.3390/s22114040. https://github.com/PedestrianDynamics/DL4PuDe
Ahmed Alia, Mohammed Maree, Mohcine Chraibi, Anas Toma, and Armin Seyfried. “A Cloud-based Deep Learning Framework for Early Detection of Pushing at Crowded Event Entrances.” IEEE Access (2023). https: //doi.org/10.1109/ACCESS.2023.3273770. https://github.com/PedestrianDynamics/CloudFast-DL4PuDe
Ahmed Alia, Mohammed Maree, Mohcine Chraibi, and Armin Seyfried. “A Novel Voronoi-based Convolutional Neural Network Framework for Pushing Person Detection in Crowd Videos.” Complex & Intelligent Systems (2024). https://doi.org/10.1007/s40747-024-01422-2. https://github.com/PedestrianDynamics/VCNN4PuDe