Jag accepterar att kakor lagras på min dator

Läs mer

Adaptive reconstruction using multiple views - theory and algorithms.

Adaptive reconstruction using multiple views - theory and algorithms. Beställ tryckt exemplar Lägg i kundvagnen
Författare: Ulvklo Morgan, Uppsäll Magnus
Ort: Linköping
Sidor: 19
Utgivningsår: 1998
Publiceringsdatum: 1998-09-02
Rapportnummer: (FOA-R--98-00836-408)
Nyckelord image processing, depth estimation, structure from motion, spatiotemporal segmentation, bildbehandling, avståndsestimering, struktur från rörelse, spatiotemporal segmentering, I3303, 33
Sammanfattning Denna vetenskapliga rapport beskriver den teortiska delen i projektet. En tidigare användarrapport tar upp applikationer, " Adaptive reconstruction using multiple view - results and applications", FOA-R--97-00571-408--SE. I rapporten introduceras ett signalbehandlingskoncept för djupsegmentering och scenrekonstruktion som på ett naturligt sätt hanterar delvis skylda objekt i en videosekvens. Målsättningen med arbetet har varit att maximalt utnyttja en signals homogenitet i den temporala dimensionen under förutsättning att scenen är statisk och att kamerans rörelse är känd. Ett objekt bakom förgrunden rekonstrueras genom att utnyttja att delar av objektet har varit synligt i olika delar av sekvensen. En huvudpunkt i det rapporterade arbetet är att utnyttja en spatiotemporal säkerhetsvolym c(x) med samma dimension som den spatiotemporala insignalen s(x), och sedan använda c(x) som "black-board" för att utesluta redan segementerade bildstrukturer. Segmenteringen börjar med att söka efter förgrunden, eliminerar sedan deras skylande verkan och fortsätter på större avstånd. Normaliserad faltning används för all filtrering. Detta kan ses som en lokal viktad minstakvadratteknik för filtrering av data med varierande säkerhet. Hög upplösning nära objektkanter uppnås och endast närliggande strukturer på samma avstånd ger varandra stöd i segmenteringsalgoritmen.
Abstract This scientific report describes the theoretical part of the project. An earlier user report describes applications, "Adaptive reconstruction using multiple view - results and applications", FOA-R--97-00571-408--SE. This report introduces a signal processing strategy for depth segmentation and scene reconstruction from video sequences that incorporates occlosion as a natural component. The work aims to maximize the use of connectivity in the temporal domain as much as possible under the condition that the scene is static and that the camera motion is known. An object behind the foreground is reconstructed using the fact that different parts of the object have been seen in different images in the sequence. One of the main ideas in the reported work is the use of a spatiotemporal certainty volume c(x) with the same dimension as the input spatiotemporal volume s(x) and the use c(x) as a "blackboard" for rejecting already segmented image structures. The segmentation starts with searching for image structures in the foreground, eliminates their occluding influence, and then proceeds. Normalized convolution, which is a Weighted Least Square technique for filtering data with varying spatial reliability, is used for all filtering. High spatial resolution near object borders is achieved and only neighboring structures with similar depth support each other.

Kundvagn

Inga rapporter i kundvagnen

FOI, Totalförsvarets forskningsinstitut

FOI
Totalförsvarets forskningsinstitut
164 90 Stockholm

Tel: 08-555 030 00
Fax: 08-555 031 00

Orgnr: 202100-5182