Abstract
In dieser Arbeit wird ein Computer Vision System mit kognitiven Fähigkeiten vorgeschlagen und evaluiert. Dieses System verfolgt mehrere Objekte über einen langen Zeitraum, sogar wenn diese Objekte vollkommen von anderen Objekten verdeckt sind. Zu jedem Zeitpunkt liefert das System plausible Positionen der relevanten Objekte, unabhängig von der aktuellen Sichtbarkeit der Objekte. Dies wird dadurch erreicht, dass das System mögliche Interpretationen auf Grundlage der beobachteten visuellen Eingangsdaten erzeugt. Der verwendete Ansatz kombiniert eine Bottom-up-Verarbeitung mit einer Top-down-Schlussfolgerung. Das System hat zusätzlich die Fähigkeit zu lernen. Diese Lernfähigkeit wird dazu verwendet, um Objekte besser verfolgen zu können, wenn diese ihr visuelles Aussehen über den Beobachtungszeitraum langsam verändern. Das modulare System ermöglicht es, verschiedene Algorithmen zur Objektverfolgung aus der Literatur zu verwenden, wenn diese die geforderte Minimalschnittstelle erfüllen können. In den Versuchen werden Template-Tracker, Mean-Shift-Tracker und Interest-Point basierende Tracker eingesetzt, um die Anpassungsfähigkeit des Systems zu zeigen. Im zweiten Teil der Arbeit wird die Kombination von verschiedenen visuellen Merkmalen untersucht. Die Intuition dahinter ist, dass ein System mit vielen visuellen Merkmalen stabiler funktionieren sollte als ein System welches nur ein visuelles Merkmal verwendet. Das Problem ist jedoch, dass die richtigen visuellen Merkmale für ein bestimmtes Objekt zuerst ermittelt werden müssen. Es wird ein Verfahren vorgeschlagen, welches die Ergebnisse von verschiedenen Detektoren mit unterschiedlichen visuellen Merkmalen kombiniert. Die Kombination der Detektoren wird mit der Hilfe einer Support-Vector-Maschine (SVM) erreicht und mit den Datensätzen der Visual Object Classes Challenge (VOC) getestet. Die Ergebnisse auf den VOC Datensätzen zeigen, dass die kombinierten Detektoren signifikant besser sind als jene die nur ein visuelles Merkmal verwenden.
Titel in Übersetzung | Automatische Szeneninterpretation mit vollständig verdeckten Objekten |
---|---|
Originalsprache | Englisch |
Qualifikation | Dr.mont. |
Betreuer/-in / Berater/-in |
|
Publikationsstatus | Veröffentlicht - 2017 |
Bibliographische Notiz
gesperrt bis nullSchlagwörter
- Szeneninterpretation
- Bildverstehen
- Videoverarbeitung
- Tracking
- Bildklassifikation
- Maschinelles Lernen