Template-based versus Feature-based Template Matching

RAX Automation Suite
Nov 16, 2019 – 4 min read

By Rean Neil Luces

Mallien täsmäytys on tärkeä aihe tekoälyn (Artificial Intelligence, AI) alalla, sillä se on yksi lähestymistapa kuvankäsittelyn perusongelmaan, joka on kiinnostavan alueen paikantaminen. Se löytää, missä tietty kohde on annetussa kuvassa. Sillä on laaja valikoima sovelluksia, kuten kohteiden havaitseminen, seuranta, valvonta, lääketieteellinen kuvantaminen ja kuvien yhdistäminen.

Template matching koostuu myös kahdesta pääkomponentista: lähdekuvasta ja mallikuvasta tai patchista. Lähdekuva on kuva, josta odotetaan löytyvän vastaavuus mallikuvaan, kun taas mallikuva on paikkauskuva, jota verrataan lähdekuvan alakuvaan.

Mallien tai kuvien yhteensovittamisen kaksi yleistä luokittelua ovat mallipohjainen ja ominaisuuspohjainen. Mallipohjainen lähestymistapa, joka tunnetaan myös aluepohjaisena lähestymistapana, toimii erittäin hyvin silloin, kun malleilla ei ole vahvoja piirteitä kuvan kanssa, koska ne toimivat suoraan pikseliarvojen perusteella. Vastaavuus mitataan sekä kuvan että mallin intensiteettiarvojen avulla. Toisaalta ominaisuuksiin perustuvaa lähestymistapaa käytetään silloin, kun sekä lähde- että mallikuvissa on enemmän vastaavuutta ominaisuuksien ja ohjauspisteiden suhteen. Tällöin piirteitä ovat esimerkiksi pisteet, käyrät tai pintamalli, joiden avulla mallin täsmäytys suoritetaan.

Mallipohjainen lähestymistapa

Mallipohjainen lähestymistapa on helpompi toteuttaa kuin piirrepohjainen. Yksinkertaisessa mallien täsmäytyksessä verrataan mallikuvaa lähdekuvaan liu’uttamalla sitä. Mallikuvaa siirretään pikseli kerrallaan vasemmalta oikealle tai ylhäältä alas, jotta voidaan laskea jonkinlainen numeerinen samankaltaisuuden mitta päällekkäisen kuvan kanssa. Molemmat kuvat muunnetaan binäärikuviksi tai mustavalkoisiksi, minkä jälkeen sovelletaan mallien yhteensovittamistekniikoita, kuten normalisoitua ristiinkorrelaatiota, ristiinkorrelaatiota ja neliöeron summaa.

Yksi mallipohjaisen lähestymistavan haasteista on mittakaavainvarianssi. Lähdekuvan tai mallikuvan koon muutokset vaikuttavat algoritmin suorituskykyyn. Yksinkertainen temppu ongelman ratkaisemiseksi on muuttaa mallikuvan kokoa useisiin mittakaavoihin ja verrata sitä sitten lähdekuvaan. Kun kaikki koot on käyty läpi, otetaan alue, jolla on suurin korrelaatiokerroin, ja käytetään sitä ”sovitettuna” alueena. Kiertymättömyyttä on kuitenkin vaikea ratkaista tällä lähestymistavalla. Tämän vuoksi Kim, Hae & Araújo, Sidnei (2007) kehitti Ciratefi-algoritmin, joka ratkaisee rotaatio-ongelman parantamalla raa’an voiman algoritmia, johon kuuluu mallin kuvan kiertäminen jokaisessa kulmassa. Paikalliset piirteet ja niiden kuvaajat ovat monien tietokonenäköalgoritmien rakennuspalikoita. Niiden sovelluksia ovat muun muassa kuvien rekisteröinti, kohteiden havaitseminen ja luokittelu, seuranta ja liikkeen estimointi. Nämä piirteet koskevat vain kutakin kuvaa, ja siksi ne auttavat tunnistamaan kuvia toisistaan. Kuvan piirteet säilyvät, vaikka kuvan koko ja suuntaus muuttuisivat, joten lähestymistapa voi osoittautua hyödylliseksi, jos hakukuvan vastaavuutta muutetaan jollakin tavalla. Tätä lähestymistapaa on myös tehokkaampi käyttää, jos kuvan resoluutio on suuri. Mallin kuvan liu’uttaminen suuressa lähdekuvassa pikseli kerrallaan ja sen toistaminen eri mittakaavoissa on laskennallisesti kallista.

Ominaisuuksiin perustuva mallin täsmäytys sisältää neljä päävaihetta. Kaksi ensimmäistä vaihetta ovat ominaisuuksien havaitseminen ja ominaisuuksien louhinta. SIFT (Scale Invariant Feature Transform) ja SURF (Speeded Up Robust Feature) ovat käyttökelpoisimpia piirteiden havaitsemiseen ja yhteensovittamiseen, koska ne ovat muuttumattomia mittakaavalle, kiertymiselle, siirtymiselle, valaistukselle ja epätarkkuudelle. Piirteiden havaitsemisen ja erottamisen jälkeen seuraava vaihe on piirteiden yhteensovittaminen FLANN:n (Fast Library for Approximate Nearest Neighbors) avulla. Se sisältää kokoelman algoritmeja, jotka on optimoitu nopeaan lähimmän naapurin etsimiseen suurissa tietokokonaisuuksissa ja korkea-ulotteisissa piirteissä. FLANN-matcherin keräämistä vastaavista piirteistä valitaan hyvät vastaavuudet Lowen suhdetestin perusteella. Ominaisuuspisteiden suodattamisen jälkeen seuraava vaihe on homografian laskeminen RANdom SAmple Consensus (RANSAC) -algoritmin avulla.

Tätä lähestymistapaa ei kuitenkaan voida hyödyntää, kun kuvissa on vähemmän piirteitä tai eri objekteilla on samoja piirteitä, koska algoritmi ei löydä mallia lähdekuvasta.

Vastaa

Sähköpostiosoitettasi ei julkaista.