Visão Estéreo
Júlio M. Otuyama
Curso de Visão Computacional
Prof. Aldo von Wangenheim
Pós graduação em Ciência da Computação
Universidade Federal de Santa Catarina
2.2. Algoritmos baseados em token (símbolo)
Enquanto os algoritmos baseados em intensidade luminosa supõem que um ponto de um objeto possui uma intensidade luminosa igual em ambas imagens do par estéreo, os algoritmos baseados em token não utilizam tal hipótese, evitando alguns dos problemas que ocorrem por causa de tal suposição. Os algoritmos baseados em token extraem determinadas características, tais como bordas, curvas ou vértices, para, em uma segunda etapa, buscar o casamento destes no par estéreo.
Tokens podem variar em diversos graus de complexidade, de acordo com as estruturas por eles representados na imagem. Dentre os tipos de tokens mais utilizados temos:
Para cada tipo de token, associamos atributos para serem utilizados no casamento destes tokens no par estéreo. Dentre os atributos mais comum, temos:
Método de tokens de ponto
O método de casamento de tokens de ponto consistem em duas etapas, extração e casamento, descritos a seguir.
Extração dos tokens de ponto
A extração de tokens de ponto podem ser baseadas em duas idéias similares: operadores de interesse e detetores de quinas. O primeiro é a noção de que de regiões texturizadas podemos extrair tokens estáveis (pontos a partir do qual em todas direções há uma variação de intensidade luminosa significante) que não são afetados por ruído ou deformação da forma objeto por um diferente ponto de observação. O segundo é a noção de que ao longo de contornos visíveis na imagem (por exemplo, contornos entre dois objetos sobrepostos) pontos de grande curvatura destes contornos são provavelmente tokens estáveis.
Operadores de interesse, como o próprio nome diz, tentam encontrar pontos na imagem que são "de interesse". Não há apenas uma definição para tal palavra, portanto para uma análise mais detalhada, restringimo-nos a um operador em particular e seu algoritmo. O operador de interesse mais popular é conhecido como operador de interesse de Moravec, que opera da seguinte forma:
Detetores de quinas tentam localizar o ponto na imagem correspondente a uma grande curvatura (ou quina) em contornos da imagem. Há duas formas principais de se obter isto:
pode ser descrito como uma convolução da imagem com uma máscara Gaussiana seguido pelo Laplaciano da imagem convolucionada. Este processo é equivalente a convolução da imagem com a máscara:
, onde
é um parâmetro de escala.
Casamento dos tokens de ponto
Uma vez extraídos os tokens de cada uma das imagens do par estéreo, passamos ao casamento destes tokens. A seguir descrevemos um exemplo de algoritmo de casamento de tokens.
O algoritmo de Barnard e Thompson é um algoritmo largamente utilizado para o casamento de tokens. Inicialmente, cada ponto na primeira imagem (chamado de nó) é pareado com cada ponto da segunda imagem (chamado de etiqueta) dentro de uma distância pré definida. Para cada nó, associamos em todas as etiquetas suas disparidades referentes a tal nó. Além disto, cada ponto também é associado a uma etiqueta de "sem casamento" para permitir a possibilidade que tal ponto não tenha casamento. Associado a cada etiqueta há a probabilidade de tal casamento. Estas probabilidades são computadas usando a correlação por variância normalizada de duas pequenas áreas ao redor dos dois pontos que são pareados. A probabilidade de sem casamento é calculada como o complemento da soma das probabilidades de todas outras etiquetas para um ponto.
Estas etiquetas proporcionam uma restrição parcial sobre os casamento locais. A restrição global é uma condição de consistência sobre as etiquetas dos pontos da vizinhança na primeira imagem, ou seja, os pontos vizinhos devem ter etiquetas com disparidades semelhantes.