Visão Computacional
1.  Representação de 
     imagens
2.  Filtragem de imagens
3.  Detecção de Bordas
4.  Segmentação Simples
5.  Crescimento de Regiões
6.  Segmentação com
     Filtros
7.  Segmentação a Cores
8.  Análise de Texturas
9.  Análise de Texturas
     Multiescalar 
10. Redes Neurais
11. Morfologia Matemática
12. Convolução
13. Esqueletonização
14. Técnicas Estatísticas
15. Fractais
16. Reconhecimento de
      Formas
17. Representação de 
      Objetos
18. Quadtrees e Octrees
19. Visão Estereo
20. Inteligência Artificial
21. Controle de qualidade
22. Robótica
23. Medicina
24. Sensoriamento remoto

Material do
Prof. Aldo von Wangenheim

Currículo...
Publicações
Pesquisa
Projetos
Ensino de Graduação 

Você lê?

Seminário Introdução à Visão Computacional
The Cyclops Project
PPGCC - INE - UFSC

Docentes
Prof. Dr. rer.nat. Aldo von Wangenheim
Prof. Dr. rer.nat. Eros Comunello
Dr. Rogério Richa
(a partir de 2013)

(página antiga da disciplina - hoje usamos Moodle - usar aqui como referência adicional)

  1. Introdução
  2. Ementa da Discilina (antes de 2013)
  3. Temas a Serem Abordados
  4. Funcionamento da Disciplina
  5. Realização dos Trabalhos Escritos
  6. Realização dos Trabalhos Práticos
  7. Conceitos e Aprovação
  8. Bibliografia
  9. Banco de Imagens-Exemplo
  10. Banco de Imagens para Realização de Trabalhos
  11. Apresentação de Trabalhos:


Introdução


Nesta disciplina iremos abordar todos os aspectos básicos da Visão Computacional. Podemos definir Visão Computacional como o conjunto de métodos e técnicas através dos quais sistemas computacionais podem ser capazes de interpretar imagens. A interpretação de uma imagem pode ser definida em termos computacionais como a transformação de um conjunto de dados digitais representando uma imagem (um sinal mono-, bi-, tri- ou tetradimensional) em uma estrutura de dados descrevendo a semântica deste conjunto de dados em um contexto qualquer. A Visão Computacional é uma disciplina que se encontra ainda nos seus primórdios, sendo a grande maioria de suas soluções e abordagens objeto de pesquisas. Esta pesquisa envolve toda uma gama de enfoques, desde aplicações bastante orientadas à solução de problemas práticos restritos, como o controle de qualidade em linhas de produção através de inspeção automática até tentativas de modelagem de processos cognitivos visuais como eles ocorrem nos animais superiores, numa tentativa de elaborar modelos genéricos de percepção visual.

Uma das características mais marcantes do estado da arte em Visão Computacional é que ainda não existe nenhum modelo genérico de percepção visual passível de ser aplicado na prática. O nosso conhecimento de como funcionam os mecanismos de percepção visual nos animais tampouco é suficiente para que possamos aplicar algum mecanismo de "engenharia reversa" , utilizando por exemplo técnicas de redes neurais para modelar ou imitar a percepçaõ visual biológica. O que ocorre na prática, é que, para resolvermos uma determinada tarefa de interpretação de imagens utilizamos um conjunto de algoritmos bastante específicos, que são respectivamente responsáveis por realizar subtarefas bastante limitadas dentro do processo de interpretação dessa imagem. Esses algoritmos são divididos em grupos, como filtros de contraste, detectores de bordas de objetos, segmentadores de imagens em regiões, classificadores de texturas e assim por diante. Comumente resolvemos um problema encaixando um conjunto desses algoritmos um atrás do outro para chegarmos a um resultado que só funcionará para um conjunto de imagens com características muito específicas, deixando de funcionar para todas as outras. Para o leitor mais desavisado essa realidade pode parecer bastante desanimadora, pois isso realmente esta a mundos de distância do "computador que vê". Esta limitação nos algoritmos e nos paradigmas de análise de imagens realmente impõe grandes limitações ao que pode ser realizado na prática com as técnicas atualmente disponíveis. Compreender essas limitações e conhecer formas de tirar o máximo de proveito do que atualmente há disponível é um aspecto muito importante a ser considerado por quem deseja enveredar-se por problemas cuja solução possivelmente envolva o uso de Visão Computacional. A estrutura da nossa disciplina refletirá este estado da arte.

No correr da disciplina serão enfocados tanto aspectos teóricos quanto práticos. Nós vamos ver três principais grupos de temas:

  1. Aspectos introdutórios, percepção visual humana e armazenamento e representação de imagens.
  2. Os principais grupos de algoritmos de análise de imagens, desde filtros até técnicas de representação de objetos complexos em imagens.
  3. Áreas de aplicação prática de de Visão Computacional e suas respectivas técnicas, como controle de qualidade, visão estereo, análise de imagens na medicina, robótica.

Temas a Serem Abordados

1.  Representação de imagens
2.  Filtragem de imagens
3.  Detecção de Bordas
4.  Segmentação Simples
5.  Crescimento de Regiões
6.  Segmentação com Filtros
7.  Segmentação a Cores
8.  Análise de Texturas
9.  Análise de Texturas Multiescalar 
10. Redes Neurais
11. Morfologia Matemática
12. Convolução
13. Esqueletonização
14. Técnicas Estatísticas
15. Fractais
16. Reconhecimento de Formas
17. Representação de Objetos
18. Quadtrees e Octrees
19. Visão Estereo
20. Inteligência Artificial
21. Controle de qualidade
22. Robótica
23. Medicina
24. Sensoriamento remoto


Funcionamento da Disciplina

A disciplina funcionará basicamente como um seminário prático. O conteúdo é dividido em temas (acima relacionados) a serem trabalhados um por cada participante da disciplina. Haverá:
  1. Uma introdução pelo Professor de cada tema no início da disciplina, criando uma visão geral de toda a Visão Computacional antes do início das apresentações.
  2. Um tema que deverá ser desenvolvido como um trabalho escrito e será apresentado pelo aluno.
  3. Um trabalho experimental envolvendo o tema do seminário, sempre visando resolver um problema prático. Este também será apresentado ao final do trabalho teórico.
A parte prática da disciplina será realizada através da utilização do laboratório de análise de imagens Khoros. Khoros, hoje um produto comercial, foi desenvolvido originalmente pela University of New Mexico em colaboração com a UNICAMP e é o mais utilizado sistema para teste e experimentação de soluções de Visão Computacional. Ele provê um conjunto bastante extenso de implementações de algoritmos de Visão Computacional e um ambiente de programação visual onde conjuntos complexos de algoritmos podem rapidamente ser implementados como uma solução e testados. A disciplina incluirá, no seu início, aulas de laboratório para a aprendizagem da utilização do Khoros. Khoros é uma ferramenta para ambiente Unix e encontra-se instalado em todas as estações Sun e todos os PCs Linux do INE, além dos PCs Linux do Laboratório 3 do CTC. Um tutorial do Khoros estará também à disposição na rede.

Realização dos Trabalhos Escritos

Para cada tema será distribuído material bibliográfico. Serão sempre mais de um documento e estes serão capítulos de livros ou artigos. Com base neste material será desenvolvido um trabalho escrito que não será meramente uma tradução dos artigos e que será apresentado em data a ser marcada no último mês do trimestre. Será dado grande valor à elaboração detalhada dos aspectos matemáticos do tema. 

Instruções para este trabalho:

  • O trabalho será escrito em no padrão formatção de textos  LaTeX. A seguir será convertido em site através da utilização do conversor la2html e de um editor HTML qualquer. Ao final o aluno deverá ter desenvolvido um site sobre o tema que abordou no seminário e uma monografia .tex,. Os resultados dos experimentos práticos realizados pelo aluno deverão ter sido incluídos no site e na monografia.
  • O trabalho será apresentado através de slides desenvolvidos em Microsoft PowerPoint ou StarOffice com base em um template disponível nesta página.
  • Este site será incluído na página desta disciplina (em http://www.inf.ufsc.br/~awangenh/visao/2001/<nome do tema>) uma semana antes  da apresentação do seminário, para que esteja acessável na data da apresentação.
  • O formato do trabalho deverá obrigatoriamente ser o formato padrão das páginas do site da disciplina com base neste template. Toque: Para usar este site como template carregue-o no editor de páginas do Netscape (modo "Edit Page") e salve-o localmente em seu computador. Assim você terá uma cópia local desta página, inclusive todas as figuras de fundo,  e poderá utilizá-la para desenvolver seu trabalho.
  • Importante: O site desenvolvido, além de possuir o formato padrão da disciplina, deverá obrigatoriamente ser desenvolvido em HTML padrão. Evite utilizar editores HTML que podem produzir páginas fora de padrão, como Microsoft FrontPage. Tampouco será permitido gerar página HTML com texto em GIFs a partir da apresentação Microsoft PowerPoint. Sugerimos que se utilize o editor do Netscape ou um editor HTML para Linux disponível na Internet. 
  • Tanto o site HTML quanto a monografia (em .tex) e os slides PPT deverão ser entregues ao professor no mínimo uma semana antes da data prevista para a apresentação para  autorização para ser apresentado.  O seminário não será apresentado sem autorização prévia do profesor, não recebendo nota. Atrasos na apresentação prévia levarão a descontos no conceito final.



Realização dos Trabalhos Práticos

Para cada tema de seminário será distribuída uma tarefa prática envolvendo o tema. Esta tarefa consistira em um problema prático que deverá ser resolvido com as técnicas abordadas no tema do seminário. Para a solução dos problema serão utilizados os recursos disponíveis no Khoros.

A definição do problema, o caminho para a solução e os resultados obtidos serão apresentados ao fim do apresnetação do tema no seminário.

Uma ajuda voce pode ter atraves do Curso de Analise de Imagens usando Khoros que esta aqui. O software você pode pegar aqui. Observe o seguinte: Este arquivo para download possui 25 MB, espere portanto o momento adequado para buscá-lo se você vai fazê-lo de casa por conexão telefônica. Observe também que neste tarfile está a versão compilada para Linux e também os fontes, que você poderá compilar para Solaris, AIX, Irix ou HP-UX, caso deseje. Se você vai usar a versão précompilada Linux, rode o programa kconfigure antes de iniciar a primeira execução. Se você vai compilar em outro sistema operacional, leia atentamente toda a documentação antes de fazê-lo.


Conceitos e Aprovação

Estará aprovado somente aquele aluno inscrito que:
  • Desenvolver trabalho escrito acerca de seu tema no formato prescrito.
  • Apresentar uma versão draft do trabalho ao professor para revisão antes da apresentação no seminário até a data definida pelo professor.
  • Apresentar este trabalho sob forma de seminário de maneira satisfatória.
  • Desenvolver de forma satisfatória o trabalho prático, apresentando seus resultados.
  • Entregar cópia dos documentos supracitados e instalar o site desenvolvido na página da disciplina.
O conceito final do aluno dependerá: a) da qualidade do trabalho escrito, b) da qualidade do trabalho prático e c) da qualidade da apresentação. A participação no seminário implica no aceite das condições acima estabelecidas.

Bibliografia

  1. David Marr: Vision - A Computational Investigation into the Human Representation and Processing of Visual Information, W.H.Freeman & Co.,1982
  2. R. Gonzalez, R.Woods: Digital Image Processing, Addison Wesley, 1993
  3. John C. Russ: The Image Processing Handbook, CRC Press, 1995
  4. B.D.Ripley: Pattern Recognition and Neural Networks, Cambridge Univ. Press, 1996
  5. R.D.Boyle, R.C.Thomas: Computer Vision - A First Course, Blackwell Scientific, 1988
  6. Perker: Algorithms for Image Processing and Computer Vision
  7. Torras: Computer Vision: Theory and Industrial Application
  8. Haralick, Shapiro: Computer and Robot Vision, Volumes I & II,
  9. Buxton: Computer Vision - EECV 96: fourth European Conf.of Computer Vision
  10. Mundy: Geometry Invariance in Computer  Vision
  11. Brown: Real-time Computer Vision
  12. Young: Handbook of Pattern Recoginition and Image Processing, Academic Press
  13. Metaxas: Physics-Based Deformable Models
  14. Hanan Samet: The Design and Analysis of Spatil Data Structures, Addison Wesley, 1989

Material Extra:

  • Artigo de Mumford e Shah (segmentação)
  • Tese de Peter Klausmann (segmentação)
  • Tese de Gangolf Mittelhaeusser (segmentação)
  • Tese de Joachim Weickert (filtros de difusão anisotrópica)

 

Obs.: Todos estes livros se encontram disponíveis ou no Centro de Documentação do INE ou na coleção particular do Professor.

Contato:

Tel.: +55-48-331 7552/9498
FAX: +55-48-331-9770
awangenh@inf.ufsc.br

O que estou lendo ? "In the Beginning was the Command Line" por Neal Stephenson. Veja aqui o que é...