Baseado em Template versus Baseado em Funcionalidades de Correspondência de Template

Suíte de Automatização do RAX
16 de Novembro, 2019 – 4 min read

Por Rean Neil Luces

A correspondência de modelos é um tópico importante no campo da Inteligência Artificial (IA) pois é uma das abordagens ao problema básico do processamento de imagens que é a localização da região de interesse. Ele encontra onde um determinado objeto está na imagem dada. Tem uma ampla gama de aplicações como detecção de objetos, rastreamento, vigilância, imagens médicas e costura de imagens.

Acoplamento de imagens também compreende dois componentes principais: a imagem de origem e a imagem modelo ou o patch. A imagem fonte é a imagem na qual esperamos encontrar uma correspondência com a imagem modelo, enquanto a imagem modelo é a imagem patch que será comparada com a subimagem da imagem fonte.

As duas classificações gerais de template ou de correspondência de imagem são baseadas em template e baseadas em características. A abordagem baseada em templates, também conhecida como abordagem por área, funciona muito bem quando os templates não têm características fortes com uma imagem, uma vez que operam directamente sobre os valores de pixel. As combinações são medidas usando os valores de intensidade tanto da imagem como do modelo. Por outro lado, a abordagem baseada em características é usada quando ambas as imagens de origem e modelo contêm mais correspondência em relação às características e pontos de controle. Neste caso, as características incluem pontos, curvas, ou um modelo de superfície para realizar a correspondência entre modelos.

Abordagem baseada em templates

>

A abordagem baseada em templates é mais fácil de implementar do que a baseada em características. A correspondência simples do template envolve a comparação da imagem do template com a imagem de origem, deslizando-a. A imagem do template é movida um pixel de cada vez da esquerda para a direita ou de cima para baixo para permitir calcular alguma medida numérica de similaridade com o patch que se sobrepõe. Ambas as imagens são convertidas em imagens binárias ou em preto e branco e, em seguida, são aplicadas técnicas de correspondência de modelos como a correlação cruzada normalizada, a correlação cruzada e a soma da diferença quadrática.

Um dos desafios da abordagem baseada em modelos é a invariância da escala. Mudanças no tamanho da imagem de origem ou da imagem do template afetarão a performance do algoritmo. Um truque simples para resolver o problema é redimensionar a imagem do template para várias escalas e depois compará-la com a imagem de origem. Depois de percorrer todos os tamanhos, pegue a região com o maior coeficiente de correlação e use-a como sua região “correspondida”. No entanto, a invariância da rotação é difícil de resolver por esta abordagem. Com isso, Kim, Hae & Araújo, Sidnei (2007) desenvolveu o algoritmo Ciratefi para resolver o problema da invariância de rotação melhorando o algoritmo de força bruta que envolve a rotação da imagem modelo em cada ângulo. O algoritmo Ciratefi é 400 vezes mais rápido do que o algoritmo de força bruta e obtém os mesmos resultados.

Agência baseada em características

>

>

As características de imagem, tais como bordas e pontos de interesse, fornecem informações ricas sobre o conteúdo da imagem. As características locais e seus descritores são os blocos de construção de muitos algoritmos de visão computacional. Suas aplicações incluem o registro de imagens, detecção e classificação de objetos, rastreamento e estimativa de movimento. Estes recursos são exclusivos para cada imagem e, portanto, ajudam na identificação entre imagens. As características de uma imagem permanecerão mesmo que haja uma mudança no tamanho e orientação, por isso a abordagem pode revelar-se mais útil se a correspondência na imagem de pesquisa for transformada de alguma forma. Esta abordagem também é mais eficiente de usar se a imagem tiver uma grande resolução. Deslizando sua imagem de template em uma imagem fonte grande, um pixel de cada vez e repetindo-a em diferentes escalas, será computacionalmente caro.

A correspondência de template baseada em características inclui quatro passos principais. Os dois primeiros passos são a detecção de características e a extracção de características. SIFT (Scale Invariant Feature Transform) e SURF (Speeded Up Robust Feature) são muito úteis para detectar e combinar características porque são invariantes à escala, rotação, tradução, iluminação e desfocagem. Após a detecção e extração dos recursos, o próximo passo é a correspondência de recursos usando a Biblioteca Rápida para Vizinhos Mais Próximos Aproximados (FLANN). Ela contém uma coleção de algoritmos otimizados para a busca rápida de vizinhos mais próximos em grandes conjuntos de dados e recursos de alta dimensão. A partir das características de correspondência recolhidas pelo combinador FLANN, as boas correspondências são seleccionadas com base no teste de proporção de Lowe. Depois de filtrar pontos de características, o próximo passo é computar a homografia através do algoritmo RANdom SAmple Consensus (RANSAC).

Esta abordagem, no entanto, não pode ser utilizada quando as imagens têm menos características ou objetos diferentes compartilham as mesmas características, pois o algoritmo falhará em encontrar o modelo na imagem de origem.

Deixe uma resposta

O seu endereço de email não será publicado.