Template-based versus Feature-based Template Matching

RAX Automation Suite
Nov 16, 2019 – 4 min read

By Rean Neil Luces

A sablonillesztés fontos téma a mesterséges intelligencia (AI) területén, mivel ez az egyik megközelítése a képfeldolgozás alapvető problémájának, amely az érdekes régió megtalálása. Megkeresi, hogy az adott képen hol van egy adott objektum. Alkalmazásai széles skáláját öleli fel, mint például a tárgyak felismerése, követése, megfigyelés, orvosi képalkotás és képfűzés.

A sablonillesztés is két fő komponensből áll: a forrásképből és a sablonképből vagy a foltból. A forráskép az a kép, amelyben egyezést várunk a sablonképhez, míg a sablonkép a foltkép, amelyet a forráskép részképével hasonlítunk össze.

A sablon- vagy képillesztés két általános osztályozása a sablonalapú és a jellemzőalapú. A sablonalapú megközelítés, más néven területalapú megközelítés nagyon jól működik, ha a sablonok nem rendelkeznek erős jellemzőkkel a képpel, mivel közvetlenül a pixelértékekkel operálnak. Az egyezéseket a kép és a sablon intenzitásértékei alapján mérik. Másrészt a jellemző-alapú megközelítés akkor használható, ha mind a forrás-, mind a sablonképek több megfeleltetést tartalmaznak a jellemzők és a kontrollpontok tekintetében. Ebben az esetben a jellemzők közé tartoznak a pontok, görbék vagy egy felületmodell a sablonillesztés elvégzéséhez.

Sablonalapú megközelítés

A sablonalapú megközelítés könnyebben megvalósítható, mint a jellemzőalapú. Az egyszerű sablonillesztés során a sablonképet csúsztatással hasonlítjuk össze a forrásképpel. A sablonképet pixelenként mozgatjuk balról jobbra vagy felülről lefelé, hogy az átfedésben lévő folthoz való hasonlóság valamilyen numerikus mértékét kiszámíthassuk. Mindkét képet bináris képpé vagy fekete-fehér képpé alakítjuk, majd olyan sablonillesztési technikákat alkalmazunk, mint a normalizált keresztkorreláció, a keresztkorreláció és a négyzetes különbség összege.

A sablonalapú megközelítés egyik kihívása a méretarány-invariancia. A forráskép vagy a sablonkép méretének változása befolyásolja az algoritmus teljesítményét. Egy egyszerű trükk a probléma megoldására az, hogy a sablonképet több méretarányban átméretezzük, majd összehasonlítjuk a forrásképpel. Miután végighaladtunk az összes méreten, válasszuk ki a legnagyobb korrelációs együtthatóval rendelkező régiót, és ezt használjuk “illesztett” régiónak. A forgásinvariancia azonban nehezen oldható meg ezzel a megközelítéssel. Ezzel együtt Kim, Hae & Araújo, Sidnei (2007) kifejlesztette a Ciratefi algoritmust a forgatási probléma megoldására a nyers erő algoritmus továbbfejlesztésével, amely a sablonkép minden szögben történő elforgatását jelenti. A Ciratefi algoritmus 400-szor gyorsabb, mint a nyers erő algoritmus, és ugyanolyan eredményeket ér el.

Jellemző alapú megközelítés

A kép jellemzői, például az élek és az érdekpontok, gazdag információt nyújtanak a kép tartalmáról. A helyi jellemzők és leíróik számos számítógépes látási algoritmus építőkövei. Alkalmazásaik közé tartozik a képregisztráció, a tárgyak észlelése és osztályozása, a követés és a mozgásbecslés. Ezek a jellemzők kizárólag az egyes képekre vonatkoznak, és ezért segítenek a képek közötti azonosításban. A kép jellemzői akkor is megmaradnak, ha a kép mérete és tájolása megváltozik, így a megközelítés további hasznosnak bizonyulhat, ha a keresett képen lévő egyezést valamilyen módon átalakítják. Ez a megközelítés akkor is hatékonyabban használható, ha a kép nagy felbontású. A sablonkép egy nagyméretű forrásképben történő pixelenkénti csúsztatása és különböző méretarányokban történő megismétlése számításigényes lesz.

A tulajdonságalapú sablonillesztés négy fő lépést tartalmaz. Az első két lépés a jellemződetektálás és a jellemzőkivonatolás. A SIFT (Scale Invariant Feature Transform) és a SURF (Speeded Up Robust Feature) a leghasznosabbak a jellemzők detektálására és illesztésére, mivel ezek nem változnak méretarányra, forgatásra, transzlációra, megvilágításra és elmosódásra. A jellemzők felismerése és kinyerése után a következő lépés a jellemzők egyeztetése a Fast Library for Approximate Nearest Neighbors (FLANN) segítségével. Ez olyan algoritmusok gyűjteményét tartalmazza, amelyeket nagy adathalmazok és nagy dimenziójú jellemzők gyors legközelebbi szomszédjának keresésére optimalizáltak. A FLANN által összegyűjtött illeszkedő jellemzők közül a Lowe-féle arányteszt alapján választjuk ki a jó illeszkedéseket. A jellemzőpontok szűrése után a következő lépés a homográfia kiszámítása a RANdom SAmple Consensus (RANSAC) algoritmus segítségével.

Ez a megközelítés azonban nem használható, ha a képek kevesebb jellemzővel rendelkeznek, vagy különböző objektumok azonos jellemzőkkel rendelkeznek, mivel az algoritmus nem fogja megtalálni a sablont a forrásképben.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.