Visão Computacional
1998

CONVOLUÇÃO

Autor: Cleiton


Este Texto em formato Word 97

FUNDAMENTOS DE CONVOLUÇÃO

Convolução é uma das mais comuns operações no domínio do espaço realizada sobre imagens. Onde um núcleo (kernel) de números é multiplicado para cada pixel e seus vizinhos em uma pequena região, os resultados somados e a soma armazenada na posição equivalente da imagem resultante. Isto é aplicado para todos os pixels da imagem.

Este tipo de convolução é particularmente comum para suavização (smoothing) e operações derivadas. Um exemplo de núcleo seria:

1/16 2/16 1/16

2/16 4/16 2/16

1/16 2/16 1/16

Esta operação utilizando um núcleo pequeno (por exemplo 3x3) é rápida. Aplicar um núcleo maior torna a operação mais lenta. A partir de um certo tamanho de núcleo compensa transformar a imagem para o domínio de Fourier. O tempo necessário realizar uma transformação de Fourier (FFT ou FHT) do domínio do espaço para o domínio da freqüência mais o tempo da convolução no domínio da freqüência passa a ser menor que a convolução somente no domínio do espaço.

Sendo a imagem representada por f(x, y) e o núcleo representado por g(x, y). As transformadas de Fourier de f(x, y) e g(x, y) são respectivamente F(u, v) e G(u, v). O símbolo * representa a operação de convolução. Com base nessa notação pode-se tem-se a seguinte equivalência:

A convolução no domínio da freqüência resume-se a uma multiplicação de matrizes, que é feita da seguinte forma:

  1. Transforma-se a imagem para o domínio da freqüência.
  2. Transforma-se o núcleo para o domínio da freqüência também.

  3. Acrescenta-se zeros a direita e abaixo no núcleo transformado para que tenha o tamanho necessário para a multiplicação.
  4. Efetua-se a multiplicação de matrizes.
  5. Transforma-se a imagem para o domínio do espaço.

Existe apenas uma diferença, quando fazemos a convolução no domínio do espaço não realizamos a operação nos pixels próximos da borda da imagem pois não há pixels vizinhos ou as vezes criamos um núcleo especial para estes pixels. No domínio da freqüência não é necessário pois qualquer arranjo.

Note que a equivalência entre multiplicação no domínio da freqüência e convolução no domínio do espaço é restrita para filtros lineares ou multiplicativos.

TRANSFORMAÇÕES DE FOURIER

Para a imagem f(x, y) de tamanho (M, N) e sua transformada de Fourier F(u, v), calcula-se a transformação da seguinte forma:

1 M-1 N-1

F(u, v) = ¾ S S f(x, y) exp[-i 2 p (ux/M + vy/N)]

MN x=0 y=0

E a operação inversa:

f(u, v) = ¾ S S F(x, y) exp[i 2 p (ux/M + vy/N)]

MN x=0 y=0

REFERÊNCIAS BIBLIOGRÁFICAS

GOMES, Jonas & VELHO, Luiz. Computação Gráfica: Imagem. Rio de Janeiro, IMPA/SBM, 1994.

GONZALEZ, Rafael C. & WOODS, Richard E.. Digital Image Processing. Reading, Addison-Wesley ,1992.

RUSS, John C. . The image processing handbook. 2 ed., Boca Raton, CRC Press, 1995.