Loading...
 

Seminar Visuelle Modellierung

Masterseminar/Seminar im Diplomstudiengang

UnivIS-Eintrag


Dozent: Prof. Dr.-Ing. Reinhard Koch

Betreuer: Dipl.-Inf. Sandro Esquivel

Angaben: 2 SWS, ECTS-Credits: 4, Modul: MSS0601

Zeit und Ort: Do 10:15-11:45, HRS3 - R.101-103 (Institut für Informatik, Hermann-Rodewald-Str. 3, Seminarraum Keller)

erster Termin: Donnerstag, d. 14.04.2011


Inhalt

Im Seminar werden aktuelle Fragestellungen aus den Bereichen bildbasierte Szenenrepräsentationen, visuell-geometrische Rekonstruktionen und Computergrafik behandelt.
Die Seminarteilnehmer sollen dabei eigenständig eine Präsentation über ein bestimmtes Thema vortragen. Typischerweise handelt es sich dabei um Artikel aus wissenschaftlichen Zeitschriften. Die Artikel sind in der Regel auf Englisch verfasst, wobei die Möglichkeit besteht, auch den Seminarvortrag auf Englisch zu halten. Eigene Vorschläge können bei der Themenvergabe ebenfalls berücksichtigt werden.

Es wird empfohlen, bereits eine Vorlesung zu 3D-Szenenrekonstruktion, Computergrafik oder Multimedialer Informationsverarbeitung besucht zu haben.
Das Seminar richtet sich dabei an Studierende im Masterstudiengang, sowie Diplomstudenten mit Hauptfach Informatik im Hauptstudium.

Im Rahmen des Seminars werden neben den Seminarvorträgen auch Vorträge von Mitarbeitern sowie Bachelor-/Diplomabschlussvorträge gehalten. Der Termin ist dabei jeweils Donnerstag von 10:15 bis 11:45 Uhr. Die Vortragsthemen und schriftliche Ausarbeitungen werden jeweils eine Woche vor dem Termin per E-Mail an die Seminarteilnehmer verschickt über die Mailingliste mip_seminar[at]mip.informatik.uni-kiel.de.

Alle Teilnehmer müssen sich in der StudiDB zur Veranstaltung MSS0601: Seminar - Visuelle Modellierung (080193) anmelden, sowie in die Mailingliste mip_seminar[at]mip.informatik.uni-kiel.de eintragen!


Themen



Zeitplan

14.4. Wie schreibe ich eine Seminararbeit? (Sandro Esquivel)
21.4. Wie halte ich einen Seminarvortrag? (Sandro Esquivel)
28.4. Mitarbeitervortrag (Anatol Frick)  
5.5. A Best-Next-View-Selection Algorithm for Multi-View Rendering (Daniel Jung)  
12.5. Dynamic 3D Scene Analysis and Modeling with a Time-of-Flight Camera (Ingo Schiller)  
19.5. fällt aus  
26.5. Fast Tracking of Deformable Objects in Depth and Colour Video (Andreas Jordt)  
2.6. fällt aus  
3.6. Deadline für schriftliche Ausarbeitungen  
9.6. fällt aus  
16.6. Robuste Objektdetektion mit Wärmebildkameras (Stefan Junge) Image PDF herunterladen
23.6. Dynamic Refraction Stereo (Thomas Kiupel) Image PDF herunterladen
Bewegungsschätzung in der Ebene ohne Korrespondenzen (Jana Bork) Image PDF herunterladen
30.6. fällt aus  
7.7. High-Dynamic-Range Still-Image Encoding in JPEG 2000 (Steven Smyth) Image PDF herunterladen
Videobasierte Rekonstruktion animierbarer menschlicher Figuren (Stefano Spyropoulos) Image PDF herunterladen


Vorlagen und Hilfsmittel

Kontakt

Prof. Dr.-Ing Reinhard Koch
Dipl.-Inf. Sandro Esquivel




Bewegungsschätzung in der Ebene ohne Korrespondenzen


Zur Bestimmung der Eigenbewegung einer Kamera werden üblicherweise Verfahren verwendet, die Korrespondenzen zwischen den einzelnen Kamerabildern benötigen, z.B. korrespondierende Merkmalspunkte ("2D-Tracking").
In den letzten Jahren ist allerdings eine Reihe von Verfahren zur Bewegungsschätzung entwickelt worden, die ohne explizite Korrespondenzen auskommen.
Im Mittelpunkt dieser Klasse von Schätzverfahren steht in der Regel eine Bewertungsfunktion für Pose-Hypothesen, welches auf einer Korrelation zwischen allen möglichen Korrespondenzpaaren beruht. Diese Algorithmen sind damit an die Hough-Transformation angelehnt, die ursprünglich zum Erkennen von Geraden und anderen parametrisierten geometrischen Objekten entwickelt wurde.

In diesem Seminarthema soll ein solches Verfahren vorgestellt werden, das sich auf die Klasse der planaren Bewegungen, also Bewegungen innerhalb einer Ebene, beschränkt und mit sphärischen Kamerabildern arbeitet. Solche Kamera- und Bewegungsmodelle kommen oft im Zusammenhang mit autonom navigierenden Fahrzeugen vor. Das Verfahren basiert auf einer verallgemeinerten Hough-Transformation über dem Raum der planaren Bewegungen, die verwandt mit der Radon-Transformation ist. Diese Transformation kann in diesem Fall effizient auf Grundlage der sphärischen Fourier-Transformation berechnet werden.

Planar Ego-Motion Teasergrafik 1 Planar Ego-Motion Teasergrafik 2

Sphärische Kamerabilder während einer Bewegung in der Ebene und Hough-Transformation des Bildpaares (Abbildungen aus A. Makadia et al.: Planar Ego-Motion Without Correspondences)

Literatur und Links:


bearbeitet von: Jana Bork

Betreuer: Sandro Esquivel

zurück nach oben



Speicherbeschränkter Aufbau hierarchischer Raumaufteilung auf der GPU


Grundlage schnellen Ray-Tracings auf der Grafikhardware (GPU) ist die effiziente Implementierung hierarchischer Raumaufteilung, ohne die eine Parallelisierung nur von beschränktem Nutzen ist. Aufgrund der Architektur der Grafikhardware wird für die effiziente Berechnung hauptsächlich die Breitensuche verwendet, die jedoch den Nachteil eines hohen Speicherbedarfs hat.

Auf der Grafikhardware steht typischerweise weniger Speicher zur Verfügung als Hauptspeicher in einem Computer vorhanden ist und das Aufrüsten von Speicher ist, wenn überhaupt, nur eingeschränkt möglich. Zudem ist der Transfer von Daten zwischen dem Hauptspeicher des Computers und dem Texturspeicher der Grafikhardware ein Flaschenhals für die Berechnung auf der Grafikhardware, wodurch ein bedarfsgesteuertes Nachladen bei einfacher Breitensuche ineffizient wird.

Diese Ausarbeitung stellt ein Verfahren vor, das durch Aufteilung der Breitensuche den Speicherbeschränkungen auf der Grafikhardware Rechnung trägt und dadurch die effiziente Berechnung größerer Szenen auf der Grafikhardware ermöglicht.

Image

Anwendungsbeispiele für das Verfahren (Abbildungen aus Q. Hou et al.: Memory-Scalable GPU Spatial Hierarchy Construction)

Literatur und Links:


bearbeitet von: Jan Meyer

Betreuer: Daniel Jung?

zurück nach oben



Videobasierte Rekonstruktion animierter menschlicher Figuren


Dieses Thema beschäftigt sich mit der automatischen Bewegungserfassung von Menschen, dem sogenannten Human Motion Capture. Dabei wird eine Person durch mehrere Kameras aufgezeichnet und durch Chroma Keying segmentiert.
Aus der segmentierten Silhouette wird ein dreidimensionales Gitternetz berechnet, das die Person komplett beschreibt. Zusätzlich wird in diesem Ansatz die Bewegung von Kleidung mitgeschätzt und unterschiedliche Stoffe und die Bewegungen, die dadurch entstehen, können erfasst werden. Die erfassten Modelle können auf ganz neue Bewegungen übertragen werden und so Szenen dargestellt werden, die der Schauspieler so nie ausgeführt hat.

Das in dieser Arbeit vorgestellte Verfahren erreicht eine hervorragende Qualität und es wurde darüber bereits in Zeitschriften und im (deutschen) Fernsehen berichtet.

Image

Darstellung verschiedener Posen einer animierten menschlichen Figur (Abbildung von http://www.mpi-inf.mpg.de/resources/perfcap/index_vrhc.html)

Literatur und Links:


bearbeitet von: Stefano Spyropoulos

Betreuer: Anatol Frick

zurück nach oben



"Hough Forests" zur Objekterkennung, -verfolgung und Aktionserkennung


Die Arbeit, die in diesem Seminarthema vorgestellt werden soll, beschreibt die Verwendung sogenannter Hough Forests zum Zweck der Objekterkennung, der Verfolgung von Objekten und zum Erkennen von Handlungen.

Die allgemeine Hough-Transformation wurde ursprünglich zur Detektion von Linien entwickelt. Sie wurden weiterentwickelt um allgemeine Formen zu erkennen und schließlich, um verschiedene Objektklassen zu unterscheiden. Hough Forests sind im Prinzip Codebücher die schnell trainiert werden können und eine schnelle Auswertung erlauben. Sie bestehen aus mehreren Bäumen und jeder Baum bildet die Eigenschaften von Bildern oder Videos in seinen Blättern ab, wobei die Blätter den Einträgen im Hough-Raum entsprechen. Dies ist eine sehr interessante und vielversprechende Methode, um verschiedene Aufgaben der Computer Vision zu lösen.

Image

Online-Adaption des Hough Forests während der Objektverfolgung (Abbildung aus J. Gall et al.: Hough Forests for Object Detection, Tracking, and Action Recognition)

Literatur und Links:


bearbeitet von: Tobias Börding

Betreuer: Ingo Schiller

zurück nach oben



Robuste Objektdetektion mit Thermal-Kameras


Dieses Thema beschäftigt sich mit der Erkennung von Objekten in Bildern einer Thermalkamera, die an ein Flugzeug oder einen Helikopter montiert ist. Diese Kameras zeichnen Infrarotstrahlung auf und können somit Objekte anhand ihrer Wärmeabstrahlung erkennen. Deshalb sind hier Personen und andere Objekte beispielsweise auch bei Nacht erkennbar. Das hier vorzustellende Verfahren verwendet sogenannte forward-backward motion history images (MHI), in denen die Bewegung zwischen aufeinanderfolgenden Bildern gespeichert werden. Ein wichtiger Schritt in diesem Verfahren ist auch die Bildstabilisierung, da sich sowohl Objekte als auch die Kamera bewegen können.

Image

Anwendung des Verfahrens zur Detektion von Fahrzeugen (Abbildung aus Z. Jin, R. Collins: Moving Object Localization in Thermal Imagery by Forward-Backward MHI)

Literatur und Links:


bearbeitet von: Stefan Junge

Betreuer: Ingo Schiller

zurück nach oben



Robuste Personendetektion mit Thermal-Kameras


Dieses Thema beschäftigt sich mit der Erkennung von Personen in Bildern einer Thermalkamera. Diese Kameras zeichnen Infrarotstrahlung auf und können somit Wärmeaustrahlungen erkennen. Deshalb sind hier Personen beispielsweise auch bei Nacht erkennbar. Die vorzustellende Arbeit bezieht sich auf ein sehr aktuelle Verfahren, welches eine spezielle Wavelet-Transformation verwendet, um Fußgänger in vorher selektierten Regionen zu parametrisieren. Anschließend wird eine Support Vector Machine (SVM) eingesetzt, um diese in Regionen mit Fußgängern und ohne Fußgänger zu klassifizieren.

Image Image

Anwendung des Klassifizierers zum Erkennen von Regionen mit Fußgängern (Abbildung aus J. Lia et al.: Robust Pedestrian Detection in Thermal Infrared Imagery Using the Wavelet Transform)

Literatur und Links:

J. Lia, W. Gong, W. Lia, X. Liua: Robust Pedestrian Detection in Thermal Infrared Imagery Using the Wavelet Transform, in: Infrared Physics & Technology
53(4), S. 267-273, 2010

bearbeitet von: Jan Hoffmann

Betreuer: Arne Petersen

zurück nach oben



"Dynamic Refraction Stereo"


In diesem Seminarthema geht es um die Rekonstruktion von sich bewegenden Oberflächen von Flüssigkeiten. In dem vorzustellenden Artikel wird ein Verfahren beschrieben, mit dem die dynamische Oberfläche von Flüssigkeiten in einem Aquarium rekonstruiert wird. Dazu wird die Oberfläche zuerst mit einer Stereokamera aufgenommen, wobei das Kamerasystem von oben in das Aquarium schaut, auf dessen Boden ein Schachbrettmuster liegt. Mit Hilfe der Lichtbrechung, einem Stereoalgorithmus und dem bekannten Schachbrettmuster können dann die Oberflächennormalen zu jedem Zeitpunkt rekonstruiert werden.

Seminarthema Dynamic Refraction Stereo Seminarthema Dynamic Refraction Stereo

Kameraaufbau und Dreiecksnetz der rekonstruierten Oberfläche (Abbildungen von http://www.dgp.toronto.edu/~nmorris/Water)

Literatur und Links:


bearbeitet von: Thomas Kiupel

Betreuer: Anne Sedlazeck

zurück nach oben



Kodierung von HDR-Bildern im JPEG-2000 Format


HDR-Bilder ermöglichen die Speicherung von Bildern mit einem deutlich erhöhten Dynamikbereich (verbesserte Helligkeits-/Farbtiefe). Da diese mehr Informationen enthalten als normale Bilder, sind effiziente Kompressionsverfahren unverzichtbar. In dem hier behandelten Artikel wird ein Verfahren vorgestellt, mit dem HDR-Bilder mit dem JPEG-2000 Standard kodiert werden können. So kann die Kodierung mit der Wahl eines Qualitätsfaktors für optimale Qualität bzw. maximaler Kompression genutzt werden.

BSP-Bild fuer Codierung von HDR-Bildern in JPEG-2000

Kodierung von HDR-Bildern im JPEG-2000 Format (Abbildung aus R. Xu et al.: High-Dynamic-Range Still-Image Encoding in JPEG 2000)

Literatur und Links:


* Paper auf Anfrage beim Betreuer dieses Seminarthemas erhältlich

bearbeitet von: Steven Smyth

Betreuer: Arne Petersen

zurück nach oben




Created by sandro. Last Modification: Friday 07 of October, 2011 12:27:00 CEST by sandro.