Shodování šablon na základě šablon versus shodování šablon na základě funkcí

RAX Automation Suite
16. listopadu, 2019 – 4 minuty čtení

Od Reana Neila Lucese

Shodování šablon je důležitým tématem v oblasti umělé inteligence (AI), protože je jedním z přístupů k základnímu problému zpracování obrazu, kterým je lokalizace oblasti zájmu. Zjišťuje, kde se na daném snímku nachází určitý objekt. Má širokou škálu aplikací, jako je detekce objektů, sledování, sledování, lékařské zobrazování a spojování obrazů.

Shodování šablon se také skládá ze dvou hlavních složek: zdrojového obrazu a šablonového obrazu nebo záplaty. Zdrojový obraz je obraz, u kterého očekáváme nalezení shody s obrazem šablony, zatímco obraz šablony je obraz záplaty, který bude porovnáván s dílčím obrazem zdrojového obrazu.

Dvě obecné klasifikace porovnávání šablon nebo obrazů jsou šablonové a příznakové. Přístup založený na šabloně, známý také jako přístup založený na ploše, funguje velmi dobře, pokud šablony nemají s obrazem žádné silné rysy, protože pracují přímo s hodnotami pixelů. Shody se měří pomocí hodnot intenzity obrazu i šablony. Naproti tomu přístup založený na příznacích se používá, když zdrojový obraz i obraz šablony obsahují větší shodu s ohledem na příznaky a kontrolní body. V tomto případě prvky zahrnují body, křivky nebo model povrchu pro provedení shody se šablonou.

Přístup založený na šabloně

Přístup založený na šabloně je jednodušší na implementaci než přístup založený na prvcích. Jednoduché porovnávání šablon spočívá v porovnání obrázku šablony se zdrojovým obrázkem jeho posunutím. Obraz šablony se posouvá po jednom pixelu zleva doprava nebo shora dolů, aby bylo možné vypočítat určitou číselnou míru podobnosti s políčkem, které překrývá. Oba obrazy se převedou na binární nebo černobílé obrazy a poté se použijí techniky porovnávání šablon, jako je normalizovaná křížová korelace, křížová korelace a součet čtvercových rozdílů.

Jedním z problémů přístupu založeného na šablonách je invariance měřítka. Změny velikosti zdrojového obrazu nebo obrazu šablony ovlivní výkonnost algoritmu. Jednoduchý trik, jak tento problém vyřešit, spočívá ve změně velikosti obrazu šablony v několika měřítkách a jeho následném porovnání se zdrojovým obrazem. Po projití všech velikostí vezmete oblast s největším korelačním koeficientem a použijete ji jako „porovnávanou“ oblast. Tímto přístupem se však obtížně řeší rotační invariance. S tím Kim, Hae & Araújo, Sidnei (2007) vyvinuli algoritmus Ciratefi, který řeší problém rotace vylepšením algoritmu hrubé síly, který zahrnuje otáčení vzorového obrazu v každém úhlu. Algoritmus Ciratefi je 400krát rychlejší než algoritmus hrubé síly a dosahuje stejných výsledků.

Přístup založený na prvcích

Prvky obrazu, jako jsou hrany a zajímavé body, poskytují bohaté informace o obsahu obrazu. Lokální rysy a jejich deskriptory jsou základními stavebními kameny mnoha algoritmů počítačového vidění. Jejich aplikace zahrnují registraci obrazu, detekci a klasifikaci objektů, sledování a odhad pohybu. Tyto rysy jsou exkluzivní pro každý obraz, a proto pomáhají při identifikaci mezi obrazy. Rysy obrazu zůstanou zachovány, i když dojde ke změně velikosti a orientace, takže tento přístup může být dále užitečný, pokud je shoda v hledaném obrazu nějakým způsobem transformována. Tento přístup je také efektivnější použít, pokud má obrázek velké rozlišení. Posouvání vzorového obrázku ve velkém zdrojovém obrázku po jednom pixelu a jeho opakování v různých měřítkách bude výpočetně nákladné.

Shoda šablony založená na příznacích zahrnuje čtyři hlavní kroky. První dva kroky jsou detekce prvků a extrakce prvků. K detekci a přiřazování rysů jsou nejužitečnější SIFT (Scale Invariant Feature Transform) a SURF (Speeded Up Robust Feature), protože jsou invariantní vůči měřítku, rotaci, translaci, osvětlení a rozmazání. Po detekci a extrakci prvků je dalším krokem přiřazování prvků pomocí rychlé knihovny pro přibližné nejbližší sousedy (FLANN). Obsahuje soubor algoritmů optimalizovaných pro rychlé vyhledávání nejbližších sousedů ve velkých souborech dat a vysokodimenzionálních prvcích. Ze shodných rysů shromážděných párovačem FLANN jsou vybrány dobré shody na základě Loweova poměrového testu. Po vyfiltrování bodů rysů je dalším krokem výpočet homografie pomocí algoritmu RANdom SAmple Consensus (RANSAC).

Tento přístup však nelze využít, pokud mají obrazy méně rysů nebo různé objekty sdílejí stejné rysy, protože algoritmus nenajde šablonu ve zdrojovém obraze.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.