![]() |
![]() |
|||
Visão Computacional 1. Representação de Prof. Aldo von Wangenheim |
Uma Rede Neural Para Reconhecimento Visual e Navegação Autonoma em Ambientes Desconhecidos <S. Taraglio, UM.
Zanela, M. Salerno, F. Sargeni, V. Bonaiuto>
1. Introdução A navegação autônoma requer informação tridimensional sobre o ambiente para evitar colisões com objetos em movimento ou com os obstáculos. Este trabalho apresenta um algoritmo de visão estéreo, pioneiro na área da robótica que usa uma arquitetura de redes neurais artificiais para recuperar as três informações dimensionais do ambiente, baseado no processo de relaxamento de energia espontânea de uma rede neural celular (CNN). A CNN são circuitos
analógicos capazes processar sinais em tempo real. O alto processamento
paralelo analógico processa a uma taxa e velocidade de convergência
que torna o paradigma de CNN realmente atrativo para problemas onde são
necessárias respostas em tempo real para estímulos externos.
2. Aproximação de CNN Para Visão Estéreo e Reconstrução de Volumes De um par de imagens estéreo é possível recuperar informações de profundidade, pois determinado ponto no espaço é visto de pontos de vista ligeiramente diferentes nas duas imagens. O processo de juntar os pontos conjugados pode ser classificado em dois tipos principais: baseado em características (contornos, extremidades, etc) ou baseado em área (correlação das vizinhaças). As Redes de Neurais Celulares caracterizam o duplo aspecto, das redes neurais e do automato celular. A estabilidade de uma CNN é garantida pela existência de uma função de Lyapunov. Esta função pode ser interpretada como a energia interna da CNN. Sendo que a distância seja conhecida, por uma simples geometria, é possível reconstruir todas as coordenadas dos pixels visíveis da imagem e navegar. O modo mais simples para representar esta informação sobre o ambiente é dividir as três representações dimensionais dos dados para obter um mapa dos ambientes, como visto pelas câmeras
Pode haver aproximações
diferentes para recuperar o mapa de imagens de video, neste trabalho, entretanto,
o foco primário é a demonstração da usabilidade
da CNN para a navegação autônoma, esta também
é a razão para a utilização da reconstrução
ambiente, enquanto sendo este a produção natural do algoritmo
de CNN Estéreo a nenhum custo computacional extra. Além
da possibilidade para utilizar uma reconstrução tri-dimensional
do ambiente, pode ser extremamente útil em outros assuntos de robótica,
como por exemplo a localização ou reconhecimento de forma.
3. Implementação de Hardware O projeto da placa é baseado no chip original, assim como o processamento da CNN analógica. Quatro deste neurochips são conectados juntos para implementar uma rede de 6x24 células. Além disso, foi usada uma interface PCI, conectada diretamente em um Pentium que é a placa do robô, reduzindo qualquer demora relacionada à transferência de dados. A placa foi equipada com um microcontrolador de 16 bits para controlar todas as operações on-board. Um controlador PCI assegura
uma manipulação notável da interface. Um SRAM de 512x16
Kbytes foi colocado na placa para armazenar as imagens. Além, algum
ADC administrará a própria conversão do análogo
de input/output voltagens estatais que permitem para a aquisição
da produção imagens de tons de cinza. O PC adquirirá
as imagens e os armazenará diretamente na SRAM pela interface PCI.
O controlador lê os dados no SRAM e alimenta a CNN que faz o processamento
analógico. Finalmente, pega os resultados da CNN analógica
e calcula a saída de disparidade do mapa.
4. O planejamento e O Subsistema de Navegação Um método seguro e conhecido para juntar leituras de múltiplos sensores em um mapa global do ambiente é por "Grades de Ocupação". Neste trabalho o único sensor usado é um sistema de visão estéreo que é executado durante o movimento do robô. Os dados são analisados e juntados para modelar mapas, obtendo uma representação mais segura do ambiente no qual o robô tem que se mover. O processo de fusão é feito por um parâmetro adicional do mapa de pixel, a confiança de ocupação. Este parâmetro possui na valor inicial de 0.5 e constantemente é atualizado. O mapa de chão é dividido em um conjunto de células quadradas C(i,j) das dimensões físicas da base de robô. Para cada célula é definido um estado que possui um valor dependente do seu estado de ocupação. Se a célula estiver ocupada, então ela será excluída do caminho-livre. 5. Resultados Experimentais Os resultados apresentados são relativos a experiências executadas em um ambiente fechado e ao ar livre. A organização global do software do robô é uma arquitetura cliente-servidor e o controle principal é composto de três passos. Captura do estéreograma e processamento neural. Reconstrução tri-dimensional do traçado do chão e planejamento. Movimentação.
Na experiência do corredor, é calculada a largura comum do corredor como 182 cm, enquanto a medida atual é 190 cm. O obstáculo estava a 363 cm com uma largura de 48 cm, a medida atual é 345 cm com uma largura de 45 cm. O erro de percentual é de cerca de 4%. Nas experiências de ao ar livre preliminares o erro foi maior, da ordem de 7%, isto é devido aos dados de entrada serem mais ruidosos. 6. Conclusões Foi apresentado um sensor complexo baseado no controle em que o sensor usado é um par de câmeras que provêem um stereogram para um sistema de visão estéreo baseado em uma rede de neural celular. As informações são usadas para criar uma representação do ambiente na qual o robô se movimenta. São detectados obstáculos e a estrutura arquitetônica do ambiente e um caminho livre para movimentar-se. Os resultados apresentados
foram obtidos com um simulador digital uma rede de neural, mas, uma customização
em hardware de sistemas de CNN permitirão uma versão do sistema
em tempo real. Foi demonstrada a usabilidade do paradigma de CNN em aplicações
de robótica.
|
|||
![]() |
![]() |
![]() |