Visão
Computacional
1.
Representação
de
imagens
2. Filtragem
de imagens
3. Detecção
de Bordas
4. Segmentação
Simples
5. Crescimento
de Regiões
6. Segmentação
com
Filtros
7. Segmentação
a Cores
8. Análise
de Texturas
9. Análise
de Texturas
Multiescalar
10. Redes
Neurais
11. Morfologia
Matemática
12. Convolução
13. Esqueletonização
14. Técnicas
Estatísticas
15. Fractais
16. Reconhecimento
de
Formas
17. Representação
de
Objetos
18. Quadtrees
e Octrees
19. Visão
Estereo
20. Inteligência
Artificial
21. Controle
de qualidade
22. Robótica
23. Medicina
24. Sensoriamento
remoto
Material
do
Prof.
Aldo von Wangenheim
Currículo...
Publicações
Pesquisa
Projetos
Ensino
de Graduação
Você
lê?
|
 |
Seminário
Introdução à Visão Computacional
The
Cyclops Project
PPGCC - INE
- UFSC
Docentes
Prof. Dr.
rer.nat. Aldo
von Wangenheim
Prof. Dr.
rer.nat. Eros
Comunello
Dr. Rogério Richa (a partir de 2013)
(página antiga da disciplina - hoje
usamos Moodle - usar aqui como referência adicional)
|
-
Introdução
-
Ementa
da Discilina (antes de 2013)
-
Temas
a Serem Abordados
-
Funcionamento
da Disciplina
-
Realização
dos Trabalhos Escritos
-
Realização
dos Trabalhos Práticos
-
Conceitos
e Aprovação
-
Bibliografia
-
Banco
de Imagens-Exemplo
-
Banco
de
Imagens para Realização de Trabalhos
-
Apresentação
de Trabalhos:
Introdução
Nesta disciplina
iremos
abordar todos os aspectos básicos da Visão
Computacional.
Podemos definir Visão Computacional como o
conjunto
de métodos e técnicas através dos quais sistemas
computacionais
podem ser capazes de interpretar imagens. A
interpretação
de uma imagem pode ser definida em termos computacionais como a
transformação de um conjunto de dados digitais
representando
uma imagem (um sinal mono-, bi-, tri- ou tetradimensional) em uma
estrutura
de dados descrevendo a semântica deste conjunto de dados em um
contexto
qualquer. A Visão Computacional é uma
disciplina
que se encontra ainda nos seus primórdios, sendo a grande
maioria
de suas soluções e abordagens objeto de pesquisas. Esta
pesquisa
envolve toda uma gama de enfoques, desde aplicações
bastante
orientadas à solução de problemas práticos
restritos, como o controle de qualidade em linhas de
produção
através de inspeção automática até
tentativas
de modelagem de processos cognitivos visuais como eles ocorrem nos
animais
superiores, numa tentativa de elaborar modelos genéricos de
percepção
visual.
Uma das
características
mais marcantes do estado da arte em Visão Computacional é
que ainda não existe nenhum modelo genérico de
percepção
visual passível de ser aplicado na prática. O nosso
conhecimento
de como funcionam os mecanismos de percepção visual nos
animais
tampouco é suficiente para que possamos aplicar algum mecanismo
de "engenharia reversa" , utilizando por exemplo técnicas de
redes
neurais para modelar ou imitar a percepçaõ visual
biológica.
O que ocorre na prática, é que, para resolvermos uma
determinada
tarefa de interpretação de imagens utilizamos um conjunto
de algoritmos bastante específicos, que são
respectivamente
responsáveis por realizar subtarefas bastante limitadas dentro
do
processo de interpretação dessa imagem. Esses algoritmos
são divididos em grupos, como filtros de contraste, detectores
de
bordas de objetos, segmentadores de imagens em regiões,
classificadores
de texturas e assim por diante. Comumente resolvemos um problema
encaixando
um conjunto desses algoritmos um atrás do outro para chegarmos a
um resultado que só funcionará para um conjunto de
imagens
com características muito específicas, deixando de
funcionar
para todas as outras. Para o leitor mais desavisado essa realidade pode
parecer bastante desanimadora, pois isso realmente esta a mundos de
distância
do "computador que vê". Esta limitação nos
algoritmos
e nos paradigmas de análise de imagens realmente impõe
grandes
limitações ao que pode ser realizado na prática
com
as técnicas atualmente disponíveis. Compreender essas
limitações
e conhecer formas de tirar o máximo de proveito do que
atualmente
há disponível é um aspecto muito importante a ser
considerado por quem deseja enveredar-se por problemas cuja
solução
possivelmente envolva o uso de Visão Computacional. A estrutura
da nossa disciplina refletirá este estado da arte.
No correr da
disciplina serão
enfocados tanto aspectos teóricos quanto práticos.
Nós
vamos ver três principais grupos de temas:
-
Aspectos
introdutórios,
percepção visual humana e armazenamento e
representação
de imagens.
-
Os principais
grupos de algoritmos
de análise de imagens, desde filtros até técnicas
de representação de objetos complexos em imagens.
-
Áreas de
aplicação
prática de de Visão Computacional e suas respectivas
técnicas,
como controle de qualidade, visão estereo, análise de
imagens
na medicina, robótica.
Temas
a Serem Abordados
1. Representação
de imagens
2. Filtragem
de imagens
3. Detecção
de Bordas
4. Segmentação
Simples
5. Crescimento
de Regiões
6. Segmentação
com Filtros
7. Segmentação
a Cores
8. Análise
de Texturas
9. Análise
de Texturas Multiescalar
10. Redes
Neurais
11. Morfologia
Matemática
12. Convolução
13. Esqueletonização
14. Técnicas
Estatísticas
15. Fractais
16. Reconhecimento
de Formas
17. Representação
de Objetos
18. Quadtrees
e Octrees
19. Visão
Estereo
20. Inteligência
Artificial
21. Controle
de qualidade
22. Robótica
23. Medicina
24. Sensoriamento
remoto
Funcionamento
da Disciplina
A disciplina
funcionará
basicamente como um seminário prático. O conteúdo
é dividido em temas (acima relacionados) a serem trabalhados um
por cada participante da disciplina. Haverá:
-
Uma
introdução
pelo Professor de cada tema no início da disciplina, criando uma
visão geral de toda a Visão Computacional antes do
início
das apresentações.
-
Um tema que
deverá ser
desenvolvido como um trabalho escrito e será apresentado pelo
aluno.
-
Um trabalho
experimental envolvendo
o tema do seminário, sempre visando resolver um problema
prático.
Este também será apresentado ao final do trabalho
teórico.
A parte
prática da disciplina
será realizada através da utilização do
laboratório
de análise de imagens Khoros. Khoros, hoje um produto comercial,
foi desenvolvido originalmente pela University of New Mexico em
colaboração
com a UNICAMP e é o mais utilizado sistema para teste e
experimentação
de soluções de Visão Computacional. Ele
provê
um conjunto bastante extenso de implementações de
algoritmos
de Visão Computacional e um ambiente de
programação
visual onde conjuntos complexos de algoritmos podem rapidamente ser
implementados
como uma solução e testados. A disciplina
incluirá,
no seu início, aulas de laboratório para a aprendizagem
da
utilização do Khoros. Khoros é uma ferramenta para
ambiente Unix e encontra-se instalado em todas as
estações
Sun e todos os PCs Linux do INE, além dos PCs Linux do
Laboratório
3 do CTC. Um tutorial do Khoros estará também à
disposição
na rede.
Realização
dos Trabalhos Escritos
Para cada tema
será distribuído
material bibliográfico. Serão sempre mais de um documento
e estes serão capítulos de livros ou artigos. Com base
neste
material será desenvolvido um trabalho escrito que não
será
meramente uma tradução dos artigos e que será
apresentado
em data a ser marcada no último mês do trimestre.
Será
dado grande valor à elaboração detalhada
dos
aspectos matemáticos do tema.
Instruções
para este trabalho:
-
O trabalho
será escrito
em no padrão formatção de textos LaTeX.
A seguir será convertido em site através da
utilização
do conversor la2html e de um editor HTML qualquer. Ao
final
o aluno deverá ter desenvolvido um site sobre o tema que
abordou no seminário e uma monografia .tex,. Os resultados dos
experimentos
práticos realizados pelo aluno deverão ter sido
incluídos
no site e na monografia.
-
O trabalho
será apresentado
através de slides desenvolvidos em Microsoft PowerPoint
ou
StarOffice
com base em um template
disponível nesta página.
-
Este site
será incluído
na página desta disciplina (em
http://www.inf.ufsc.br/~awangenh/visao/2001/<nome
do tema>) uma semana antes da apresentação do
seminário,
para que esteja acessável na data da apresentação.
-
O formato do
trabalho deverá
obrigatoriamente
ser o formato padrão das páginas do site da disciplina
com
base neste
template.
Toque:
Para usar este site como template carregue-o no editor de
páginas
do Netscape (modo "Edit Page") e salve-o localmente em seu computador.
Assim você terá uma cópia local desta
página,
inclusive todas as figuras de fundo, e poderá
utilizá-la
para desenvolver seu trabalho.
-
Importante:
O site desenvolvido,
além de possuir o formato padrão da disciplina,
deverá
obrigatoriamente ser desenvolvido em HTML padrão. Evite
utilizar
editores HTML que podem produzir páginas fora de padrão,
como Microsoft FrontPage. Tampouco será permitido gerar
página
HTML com texto em GIFs a partir da apresentação Microsoft
PowerPoint. Sugerimos que se utilize o editor do Netscape ou um editor
HTML para Linux disponível na Internet.
-
Tanto
o site HTML quanto a monografia (em .tex) e os slides PPT
deverão
ser entregues ao professor no mínimo uma semana antes da
data prevista para a apresentação para
autorização
para ser apresentado. O seminário não será
apresentado
sem autorização prévia do profesor, não
recebendo
nota. Atrasos na apresentação prévia
levarão
a descontos no conceito final.
Realização
dos Trabalhos Práticos
Para cada tema de
seminário
será distribuída uma tarefa prática envolvendo o
tema.
Esta tarefa consistira em um problema prático que deverá
ser resolvido com as técnicas abordadas no tema do
seminário.
Para a solução dos problema serão utilizados os
recursos
disponíveis no Khoros.
A
definição
do problema, o caminho para a solução e os resultados
obtidos
serão apresentados ao fim do apresnetação do tema
no seminário.
Uma ajuda voce
pode ter atraves
do Curso de
Analise de
Imagens usando Khoros que esta aqui. O software você
pode
pegar aqui.
Observe o seguinte: Este arquivo para download possui 25 MB, espere
portanto
o momento adequado para buscá-lo se você vai fazê-lo
de casa por conexão telefônica. Observe também que
neste tarfile está a versão compilada para Linux e
também
os fontes, que você poderá compilar para Solaris, AIX,
Irix
ou HP-UX, caso deseje. Se você vai usar a versão
précompilada
Linux, rode o programa
kconfigure antes de iniciar a primeira
execução.
Se você vai compilar em outro sistema operacional, leia
atentamente
toda a documentação antes de fazê-lo.
Conceitos
e Aprovação
Estará
aprovado somente
aquele aluno inscrito que:
-
Desenvolver
trabalho escrito
acerca de seu tema no formato
prescrito.
-
Apresentar uma
versão
draft do trabalho ao professor para revisão
antes da apresentação no seminário até a
data
definida pelo professor.
-
Apresentar este
trabalho sob
forma de seminário de maneira satisfatória.
-
Desenvolver de
forma satisfatória
o trabalho prático, apresentando seus resultados.
-
Entregar
cópia dos documentos
supracitados e instalar o site desenvolvido na página da
disciplina.
O conceito final do
aluno dependerá:
a) da qualidade do trabalho escrito, b) da qualidade do trabalho
prático
e c) da qualidade da apresentação. A
participação
no seminário implica no aceite das condições acima
estabelecidas.
Bibliografia
-
David Marr: Vision
- A Computational Investigation into the Human Representation and
Processing
of Visual Information, W.H.Freeman & Co.,1982
-
R. Gonzalez,
R.Woods: Digital
Image Processing, Addison Wesley, 1993
-
John C. Russ:
The
Image Processing Handbook, CRC Press, 1995
-
B.D.Ripley: Pattern
Recognition and Neural Networks, Cambridge Univ. Press, 1996
-
R.D.Boyle,
R.C.Thomas: Computer
Vision - A First Course, Blackwell Scientific, 1988
-
Perker: Algorithms
for Image Processing and Computer Vision
-
Torras: Computer
Vision:
Theory and Industrial Application
-
Haralick,
Shapiro: Computer
and Robot Vision, Volumes I & II,
-
Buxton: Computer
Vision
- EECV 96: fourth European Conf.of Computer Vision
-
Mundy: Geometry
Invariance
in Computer Vision
-
Brown: Real-time
Computer
Vision
-
Young: Handbook
of
Pattern Recoginition and Image Processing, Academic Press
-
Metaxas: Physics-Based
Deformable Models
-
Hanan Samet:
The Design
and Analysis of Spatil Data Structures, Addison Wesley, 1989
Material Extra:
-
Artigo de
Mumford e Shah (segmentação)
-
Tese de Peter
Klausmann (segmentação)
-
Tese de Gangolf
Mittelhaeusser
(segmentação)
-
Tese de Joachim
Weickert (filtros
de difusão anisotrópica)
Obs.: Todos
estes livros
se encontram disponíveis ou no Centro de
Documentação
do INE ou na coleção particular do Professor.
Contato:
Tel.:
+55-48-331
7552/9498
FAX:
+55-48-331-9770
awangenh@inf.ufsc.br
O
que estou lendo ? "In
the Beginning was the Command Line" por Neal Stephenson. Veja aqui o
que
é...
|
|