Visão Computacional
1998
CONVOLUÇÃO
Autor: Cleiton
FUNDAMENTOS DE CONVOLUÇÃO
Convolução é uma das mais comuns operações no domínio do espaço realizada sobre imagens. Onde um núcleo (kernel) de números é multiplicado para cada pixel e seus vizinhos em uma pequena região, os resultados somados e a soma armazenada na posição equivalente da imagem resultante. Isto é aplicado para todos os pixels da imagem.
Este tipo de convolução é particularmente comum para suavização (smoothing) e operações derivadas. Um exemplo de núcleo seria:
1/16 2/16 1/16
2/16 4/16 2/16
1/16 2/16 1/16
Esta operação utilizando um núcleo pequeno (por exemplo 3x3) é rápida. Aplicar um núcleo maior torna a operação mais lenta. A partir de um certo tamanho de núcleo compensa transformar a imagem para o domínio de Fourier. O tempo necessário realizar uma transformação de Fourier (FFT ou FHT) do domínio do espaço para o domínio da freqüência mais o tempo da convolução no domínio da freqüência passa a ser menor que a convolução somente no domínio do espaço.
Sendo a imagem representada por f(x, y) e o núcleo representado por g(x, y). As transformadas de Fourier de f(x, y) e g(x, y) são respectivamente F(u, v) e G(u, v). O símbolo * representa a operação de convolução. Com base nessa notação pode-se tem-se a seguinte equivalência:
A convolução no domínio da freqüência resume-se a uma multiplicação de matrizes, que é feita da seguinte forma:
Existe apenas uma diferença, quando fazemos a convolução no domínio do espaço não realizamos a operação nos pixels próximos da borda da imagem pois não há pixels vizinhos ou as vezes criamos um núcleo especial para estes pixels. No domínio da freqüência não é necessário pois qualquer arranjo.
Note que a equivalência entre multiplicação no domínio da freqüência e convolução no domínio do espaço é restrita para filtros lineares ou multiplicativos.
TRANSFORMAÇÕES DE FOURIER
Para a imagem f(x, y) de tamanho (M, N) e sua transformada de Fourier F(u, v), calcula-se a transformação da seguinte forma:
1 M-1 N-1
F(u, v) = ¾ S S f(x, y) exp[-i 2 p (ux/M + vy/N)]
MN x=0 y=0
E a operação inversa:
1 M-1 N-1
f(u, v) = ¾ S S F(x, y) exp[i 2 p (ux/M + vy/N)]
MN x=0 y=0
REFERÊNCIAS BIBLIOGRÁFICAS
GOMES, Jonas & VELHO, Luiz. Computação Gráfica: Imagem. Rio de Janeiro, IMPA/SBM, 1994.
GONZALEZ, Rafael C. & WOODS, Richard E.. Digital Image Processing. Reading, Addison-Wesley ,1992.
RUSS, John C. . The image processing handbook. 2 ed., Boca Raton, CRC Press, 1995.