Loading...
 


Seminar Visuelle Modellierung

Masterseminar/Seminar im Diplomstudiengang

UnivIS-Eintrag


In diesem Seminar wird den Studierenden die Möglichkeit geboten, sich mit verschiedenen Gebieten aus den Bereichen Computer Graphik und Computer Vision zu beschäftigen. Die Teilnehmer sollen dabei eigenständig eine Präsentation über ein spezielles Thema vortragen. Typischerweise handelt es sich dabei um Artikel aus wissenschaftlichen Zeitschriften. Es wird empfohlen, bereits eine Vorlesung zu 3D-Szenenrekonstruktion, Computer Graphik oder Multimedialer Informationverarbeitung besucht zu haben.

Das Seminar findet in der Regel Donnerstags von 10:15 bis 11:45 Uhr im Institut für Informatik (Hermann-Rodewald-Str. 3), Raum 102 (Seminarraum Keller) nach Ankündigung statt.
Eine Vorbesprechung und Vergabe der Themen findet am folgenden Termin statt:

Vorbesprechung und Themenvergabe

Institut für Informatik (Hermann-Rodewald-Str. 3), Raum 308 (Seminarraum 1.OG.)
Donnerstag, d. 22.10.2009, 10:15 Uhr

Image
Im Mittelpunkt dieses Seminars steht der Anwendungsbereich Rekonstruktion von Stadtszenarien und autonome Navigation in Städten.
Methoden der Computer Vision und bildbasierten Rekonstruktion haben sich als sehr erfolgreich zum Beispiel für die Steuerung autonomer Roboterfahrzeuge in Stadtszenen erwiesen. Grundlegendes Probleme, die mit Hilfe der Bildverarbeitung gelöst werden können, sind dabei die Rekonstruktion und Repräsentation von Stadtszenen und das Interpretieren von Objekten im Straßenverkehr.
Ein prominentes Beispiel für die Anwendung solcher Verfahren ist die DARPA Urban Challenge, in der autonome Fahrzeuge gegeneinander antreten, um einen Straßenparcour mit verschiedenen Aufgaben zu bewältigen. Neben bildbasierten Verfahren kommen hier in der Regel auch andere Sensoren wie GPS oder 3D-Laserscanner zum Einsatz.

In den einzelnen Beiträgen für das Seminar sollen verschiedene Problemstellungen der Computer Vision und visuellen Modellierung behandelt werden, die für die autonome Navigation in Stadtszenen eine Rolle spielen,
unter anderem:

  • Bildbasierte Lokalisierung und Navigation von Fahrzeugen, zum Beispiel unter Verwendung von vorhandenen Städte-Modellen
  • Verschiedene Verfahren zur automatischen Rekonstruktion von Stadt- und Straßenmodellen aus Videosequenzen
  • Geeignete Repräsentation, Kodierung und Visualisierung solcher Modelle
  • Fusionierung von verschiedenen Sensordaten
  • Objekterkennung (z.B. Fußgänger, Fahrzeugkennzeichen, Straßenschilder) zur Vermeidung von Gefahrensituationen oder zur Orientierung


Es soll dabei auch die Möglichkeit geben, in Zweiergruppen einen umfangreicheren Artikel vorzustellen.
Die folgenden Themenvorschläge werden im Laufe der Zeit noch erweitert. Bei Interesse meldet euch am besten einfach per E-Mail dem Betreuer des jeweiligen Themas.


Seminarthemen:





Verschiedene Verfahren zur Modellierung von Stadtszenen


Verfahren zur automatischen bildbasierten Navigation in Städten setzen in der Regel
Vorwissen über die Umgebung voraus, das zum Beispiel in Form eines 3D-Modells der
Stadtszene vorliegen kann. In dieser Aufgabe soll ein Überblick über die verschiedenen
Verfahren gegeben werden, mit denen sich große Stadtszenen automatisch erfassen und
als 3D-Modell rekonstruieren lassen. Der Artikel, der hier bearbeitet werden soll,
stellt sowohl photogrammetrische Verfahren (Fahrzeuge mit Kamerasystemen, Luftbilder,
Panoramen) als auch auf aktiven Sensoren basierende Verfahren (Laserscanner, LIDAR)
und Hybridverfahren vor.

Dieses Thema soll möglichst zu Beginn des Seminars vorgetragen werden.

Literatur und Weblinks:


Betreuer: Sandro Esquivel

zurück nach oben



3D-Rekonstruktion von Stadtszenen in Echtzeit


In dieser Aufgabe geht es um ein Verfahren zur 3D-Rekonstruktion von großen Stadtszenen in Echtzeit.
Dabei wird ein Mehrkamerasystem verwendet, welches auf ein Fahrzeug montiert ist. Das System zeichnet
während der Fahrt Videoströme auf, die später von einem Rechner verarbeitet werden. Um die Kamerapositionen
drift-frei zu berechnen, werden GPS- und INS-Daten mit aufgezeichnet. Um die dabei anfallenden sehr großen
Datenmengen in Echtzeit zu verarbeiten werden Teile des Verfahrens (Plane-Sweep-Algorithmus zur Tiefenschätzung)
auf der Grafikkarte implementiert.

Literatur und Weblinks:


Betreuer: Anne Sedlazeck

Grundlagen: 3D-Szenenrekonstruktion

zurück nach oben



Verfahren zur bildbasierten Selbstlokalisierung (SLAM)


Ein zentrales Problem für autonome Fahrzeuge stellt die Selbstlokalisierung und Navigation in einer zunächst unbekannten Umgebung dar.
Eine Lösung dieses Problems liefern sogenannte SLAM-Verfahren (simultaneous localization and mapping, also: Simultane Lokalisierung
und Kartenerstellung), bei der ein System gleichzeitig eine Karte seiner Umgebung erstellt und seine Pose innerhalb dieser Karte schätzt.
Zur Veranschaulichung dieses Themas sollen in dieser Aufgabe verschiedene Verfahren zur Selbstlokalisierung anhand von Bilddaten
vorgestellt und verglichen werden. Der Artikel, der hier verwendet werden soll, beschreibt zwei SLAM-Verfahren, die jeweils auf
einer einzelnen (monokularen) Kamera und einem Stereokamerasystem beruhen. Ein zentraler Punkt sind dabei sogenannte Kalman-Filter,
die Rückschlüsse auf den Zustand eines Systems aufgrund fehlerbehafteter Messwerte erlauben.

Literatur und Weblinks:


Betreuer: Arne Petersen

Grundlagen: 3D-Szenenrekonstruktion

zurück nach oben



DARPA Urban Challenge 2007


Ein prominentes Beispiel für die autonome Navigation innerhalb von Städten ist die DARPA Urban Challenge, die 2007 in Victorville, Kalifornien stattfand. Aufgabe der Urban Challenge war ein Rennen zwischen Roboterfahrzeugen, die vollkommen autonom einen bebauten Parcours durch ein ehemaliges Kasernengelände absolvieren mussten.
Am Beispiel eines Teilnehmers der DARPA Urban Challenge, dem Roboter Junior des Stanford Racing Team um Sebastian Thrun von der Stanford University, soll die Urban Challenge vorgestellt werden und ein System zur Lösung der Aufgabe beschrieben werden. Junior erreichte bei dem Rennen den zweiten Platz (tatsächlich erreichte er zwar als erstes Fahrzeug das Ziel, erhielt allerdings wegen eines Verstoßes gegen die kalifornische Straßenverkehrsordnung eine Zeitstrafe).

Literatur und Weblinks:


Betreuer: Sandro Esquivel

Grundlagen: 3D-Szenenrekonstruktion

zurück nach oben



Robuste Wegmessung durch quadrifokales Tracking


Eine Möglichkeit zur autonomen Navigation ist, den zurückgelegten Weg eines Fahrzeugs zu messen (Odometrie) und zur Positionsbestimmung mit einer virtuellen Karte zu vergleichen.
Dieses Seminarthema beschäftigt sich mit einem neuen Verfahren zur visuellen Odometrie eines Fahrzeugs innerhalb einer Stadt mit Hilfe eines Stereokamerasystems.
Bekannte Verfahren nutzen meist die Stereogeometrie aus, um aus jeweils einem Bildpaar 3D-Punkte zu erzeugen, die über die Sequenz verfolgt werden.
Im Gegensatz zu solchen Verfahren wird hier die Geometrie aufeinanderfolgender Bildpaare (quadrifokale Geometrie) verwendet, um die Kameratrajektorie zu schätzen.
Dazu wird eine Warpingfunktion zwischen Bildpaaren definiert, welche auf dem trifokalen Tensor basiert, und darauf basierend ein robustes Verfahren zur Poseschätzung (Stichworte: M-Schätzer, Extended Kalman Filter) entworfen.

Literatur und Weblinks:


Betreuer: Sandro Esquivel

Grundlagen: 3D-Szenenrekonstruktion

zurück nach oben



Bildbasierte Modellierung von Gebäuden (Façade)


In diesem Seminarthema soll eines der bekanntesten nicht-automatischen Verfahren zur Modellierung von Stadtszenen vorgestellt werden.
Das Façade-Verfahren erstellt in Interaktion mit dem Benutzer aus wenigen Kamerabildern texturierte Modelle von Gebäuden. Dafür definiert der Benutzer einige einfache Grundobjekte, die das zu modellierende Objekt grob annähern. Anschließend wird das grobe Modell mit Hilfe der gegebenen Kamerabilder verfeinert und texturiert. Das so erhaltene Modell ist aufgrund seiner einfachen Geometrie sehr kompakt kodierbar und kann für fotorealistische Visualisierungen neuer Ansichten oder zur Erstellung von größeren Stadtmodellen genutzt werden.

Literatur und Weblinks:


Betreuer: Arne Petersen

Grundlagen: 3D-Szenenrekonstruktion

zurück nach oben



Prozedurale Erstellung virtueller Stadtszenen für Computerspiele und Film


Neben der Rekonstruktion und Modellierung echter Umgebungen spielt auch das prozedurale Erzeugen von künstlichen Stadtszenarien zum Beispiel für Computerspiele oder Filme in der Computer Graphik eine Rolle.
In dieser Aufgabe soll ein Überblick über den Einsatz solcher Techniken in der Praxis gegeben werden und verschiedene prozedurale Methoden vorgestellt werden, mit denen sich interaktiv bzw. automatisch Gebäude aus Bildern erstellen lassen und zu Stadtszenen erweitern lassen. Dabei kommen Grammatiken zum Einsatz, mit denen sich Gebäude in Stadtszenarien beschreiben lassen.

Literatur und Weblinks:


Betreuer: Bogumil Bartczak

Grundlagen: Computer Graphik

zurück nach oben



Detektion und Erkennung von Straßenschildern


Das automatische Erkennen und Klassifizieren von Straßenschildern ist eine wichtige Komponente
für autonomes Fahren, aber auch für Fahrerassistenz-Systeme. In dieser Aufgabe soll neben einem
Überblick über verschiedene Verfahren ein konkretes Verfahren vorgestellt und mit anderen Verfahren
verglichen werden.

Literatur und Weblinks:

  • M. S. Prieto, A. R. Allen: Using Self-Organising Maps in the Detection and Recognition of Road Signs , Image and Vision Computing 27, 2009.
  • A. de la Escalera, J. M. Armingol, M. Mata: Traffic Sign Recognition and Analysis For Intelligent Vehicles , Image and Vision Computing 21, 2003.
  • Y.-Y. Nguwi, A. Z. Kouzani: A Study on Automatic Recognition of Road Signs, Cybernetics and Intelligent Systems, 2006.


Betreuer: Ingo Schiller

zurück nach oben



Erkennung und Verfolgung von Fahrzeugkennzeichen


Im Zusammenhang mit der automatischen Koordination des Stadtverkehrs ist das Erkennen und Verfolgen von Fahrzeugkennzeichen in Videosequenzen interessant.
In dieser Aufgabe soll ein Verfahren vorgestellt werden, das sogenannte MSER-Features verwendet, um Bereiche in Bildern einer Straßensequenz zu finden,
die Kennzeichen enthalten könnten. Zur Unterscheidung der einzelnen Buchstaben und Ziffern wird eine SVN (Support Vector Machine) verwendet
- ein Standardverfahren aus dem Bereich der Klassifizierung - und mit dem älteren Verfahren AdaBoost verglichen.

Literatur und Weblinks:


Betreuer: Kristine Haase

zurück nach oben



Objekterkennung in der Beobachtung von Straßenverkehr


Um Videosequenzen von Verkehrsszenarien zu untersuchen, müssen verschiedene Objekte, z.B. Fahrzeuge, Fußgänger oder Straßenschilder, erkannt und unterschieden werden.
Um die Besonderheiten der Objekterkennung in solchen Szenarien zu verdeutlichen, soll hier ein Verfahren vorgestellt werden, Objekte, die im Straßenverkehrs vorkommen
geeignet darzustellen und zu klassifizieren. Dabei wird die besondere Beschaffenheit von Straßenszenen, z.B. das Vorhandensein einer gut detektierbaren Bodenebene,
ausgenutzt, um die Eingabebilder zu rektifizieren und so perspektivische Verzerrungen der Objekte im Bild zu vermindern, die eine template-basierte Objekterkennung
erschweren.

Literatur und Weblinks:


Betreuer: Kristine Haase

zurück nach oben



Semantische Beschreibung von Stadtszenen


Zur automatischen Navigation innerhalb eine Szene ist es hilfreich, verschiedene semantische Objektklassen unterscheiden zu können, zum Beispiel Fußgänger, Straße, Gebäude oder Hintergrund.
In dieser Aufgabe soll ein Artikel vorgestellt werden, der sich mit der semantischen Interpretation einer Szene auf der Basis von Sensordaten befasst. Die Aufgabe besteht darin, verschiedenen Teilen einer Szene semantische Label zuzuordnen, zum Beispiel "Wand", "Auto", "Fußgänger", usw. Für die Erfassung der Sensordaten werden ein Laserscanner und eine Farbkamera eingesetzt, wobei der Laserscanner geometrische Informationen (3D-Punkte) und die Kamera visuelle Informationen (Farbe) über die Szene liefern. Die erfasste Information dient dann als Grundlage für unterschiedliche Klassifizierer, um die Szene in semantisch zusammengehörende Teile zu zerlegen. Begriffe wie "Semantic Robot Maps", "Outdoor Mapping" und "Support Vector Machines" werden in dieser Ausarbeitung von Bedeutung sein.

Literatur und Weblinks:


Betreuer: Anatol Frick

zurück nach oben



Pixelklassifikation auf Satellitenbildern von Städten


Die Analyse von hochauflösenden Satellitenaufnahmen von Städten kann hilfreich für die Erstellung von Navigationskarten sein, ist aber darüberhinaus auch die Grundlage vieler statistischer Erhebungen und Prognosen, z.B. über den Rückgang der Vegetation oder über die Bebauungsdichte. Die Klassifizierung der Bildelemente in Grünflächen, Straßen, Wasserflächen und Gebäude ist hierbei die Grundlage vieler weiterführender Analysen. Da aufgrund der Größe der Bilder eine Klassifizierung der Pixel von Hand nicht möglich ist, übernehmen Klassifizierungsalgorithmen diese Aufgabe auf der Grundlage von wenigen, von Hand klassifizierten Pixeln. Im Rahmen dieser Seminararbeit soll ein Verfahren vorgestellt werden, das diese Klassifizierung mittels einer speziellen SVM (Support Vector Machine) erledigt. Im Vordergrund stehen hierbei die Einführung in das "Semi-Supervised Learning", sowie die Transformation der Ausgangsdaten in den höherdimensionalen Merkmalsraum der SVM.

Literatur und Weblinks:

  • D. Tuia, G. Camps-Valls: Cluster Kernels for Semi-Supervised Classification of VHR Urban Images, URBAN Remote Sensing Joint Event, 2009.


Betreuer: Andreas Jordt

zurück nach oben



Automatische Erzeugung von texturierten Stadtmodellen


Modelle von Städten werden für verschiedene Anwendungen benötigt, z. B. Städteplanung, Computerspiele, virtueller Tourismus oder Simulation. In diesem Seminar soll eine Methode zur automatischen Generierung von Stadtmodellen vorgestellt werden. Mit Hilfe von Grundrisskarten und LIDAR-Daten (optische Abstands-/Geschwindigkeitsmessung, dem Radar ähnlich) werden Modelle der Gebäude erstellt. Besondere Sorgfalt wird dem Gebäudedach gewidmet um der großen Vielfalt in städtischen Umgebungen Rechnung zu tragen. Die Gebäudemodelle werden anschließend texturiert, wodurch sie besser zu unterscheiden sind und ein realistisches Stadtbild erzeugt wird.

Literatur und Weblinks:


Betreuer: Daniel Jung?

zurück nach oben



Created by esquivel. Last Modification: Thursday 07 of July, 2011 09:41:09 CEST by sandro.