Template-based versus Feature-based Template Matching

RAX Automation Suite
Nov 16, 2019 – 4 min read

De Rean Neil Luces

Corelarea modelelor este un subiect important în domeniul Inteligenței Artificiale (AI), deoarece este una dintre abordările la problema de bază a procesării imaginilor, care este localizarea regiunii de interes. Aceasta găsește unde se află un anumit obiect în imaginea dată. Ea are o gamă largă de aplicații, cum ar fi detectarea obiectelor, urmărirea, supravegherea, imagistica medicală și îmbinarea imaginilor.

Corelarea șablonului cuprinde, de asemenea, două componente principale: imaginea sursă și imaginea șablon sau plasturele. Imaginea sursă este imaginea în care ne așteptăm să găsim o potrivire cu imaginea șablon, în timp ce imaginea șablon este imaginea patch care va fi comparată cu subimaginea imaginii sursă.

Cele două clasificări generale ale potrivirii șablonului sau a imaginii sunt cele bazate pe șablon și cele bazate pe caracteristici. Abordarea bazată pe șablon, cunoscută și sub denumirea de abordare bazată pe suprafață, funcționează foarte bine atunci când șabloanele nu au caracteristici puternice cu o imagine, deoarece operează direct pe valorile pixelilor. Potrivirile sunt măsurate folosind valorile de intensitate atât ale imaginii, cât și ale șablonului. Pe de altă parte, abordarea bazată pe caracteristici este utilizată atunci când atât imaginea sursă, cât și imaginea șablon conțin mai multe corespondențe în ceea ce privește caracteristicile și punctele de control. În acest caz, caracteristicile includ puncte, curbe sau un model de suprafață pentru a realiza potrivirea șablonului.

Abordare bazată pe șablon

Abordarea bazată pe șablon este mai ușor de implementat decât cea bazată pe caracteristici. Potrivirea simplă a șabloanelor presupune compararea imaginii șablon cu imaginea sursă prin glisarea acesteia. Imaginea șablon este deplasată câte un pixel de la stânga la dreapta sau de sus în jos pentru a permite calcularea unei măsuri numerice de similaritate cu pata pe care o suprapune. Ambele imagini sunt convertite în imagini binare sau în alb-negru și apoi se aplică tehnici de potrivire a șabloanelor, cum ar fi corelația încrucișată normalizată, corelația încrucișată și suma diferenței pătratice.

Una dintre provocările abordării bazate pe șabloane este invarianța de scară. Modificările în dimensiunea imaginii sursă sau a imaginii șablon vor afecta performanța algoritmului. Un truc simplu pentru a rezolva această problemă este redimensionarea imaginii șablon la mai multe scări și apoi compararea acesteia cu imaginea sursă. După parcurgerea în buclă a tuturor mărimilor, luați regiunea cu cel mai mare coeficient de corelație și folosiți-o ca fiind regiunea „potrivită”. Cu toate acestea, invarianța la rotație este dificil de rezolvat prin această abordare. În acest sens, Kim, Hae & Araújo, Sidnei (2007) a dezvoltat algoritmul Ciratefi pentru a rezolva problema rotației prin îmbunătățirea algoritmului de forță brută care implică rotirea imaginii șablon la fiecare unghi. Algoritmul Ciratefi este de 400 de ori mai rapid decât algoritmul forței brute și obține aceleași rezultate.

Abordare bazată pe caracteristici

Caracteristicile imaginii, cum ar fi marginile și punctele de interes, oferă informații bogate despre conținutul imaginii. Caracteristicile locale și descriptorii acestora sunt elementele de bază ale multor algoritmi de viziune pe calculator. Aplicațiile lor includ înregistrarea imaginilor, detectarea și clasificarea obiectelor, urmărirea și estimarea mișcării. Aceste caracteristici sunt exclusive pentru fiecare imagine și, prin urmare, ajută la identificarea între imagini. Caracteristicile unei imagini vor rămâne chiar și în cazul în care există o modificare a dimensiunii și a orientării, astfel încât abordarea se poate dovedi în continuare utilă dacă potrivirea din imaginea de căutare este transformată într-un anumit mod. Această abordare este, de asemenea, mai eficientă în cazul în care imaginea are o rezoluție mare. Glisarea imaginii șablon într-o imagine sursă mare, pixel cu pixel, și repetarea acesteia la diferite scări va fi costisitoare din punct de vedere computațional.

Corelarea șablonului bazată pe caracteristici include patru etape principale. Primele două etape sunt detectarea caracteristicilor și extragerea caracteristicilor. SIFT (Scale Invariant Feature Transform) și SURF (Speeded Up Robust Feature) sunt cele mai utile pentru detectarea și potrivirea caracteristicilor, deoarece sunt invariante la scară, rotație, translație, iluminare și neclaritate. După detectarea și extragerea caracteristicilor, următorul pas este potrivirea caracteristicilor cu ajutorul Fast Library for Approximate Nearest Neighbors (FLANN). Aceasta conține o colecție de algoritmi optimizați pentru căutarea rapidă a celui mai apropiat vecin în seturi mari de date și caracteristici cu dimensiuni mari. Dintre caracteristicile de potrivire adunate de FLANN matcher, se selectează potrivirile bune pe baza testului raportului lui Lowe. După filtrarea punctelor caracteristice, următorul pas este calcularea omografiei prin intermediul algoritmului RANdom SAmple Consensus (RANSAC).

Această abordare, totuși, nu poate fi utilizată atunci când imaginile au mai puține caracteristici sau diferite obiecte au aceleași caracteristici, deoarece algoritmul nu va reuși să găsească șablonul în imaginea sursă.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.