fixação de objetos por garras de robôs: aplicações de ... · dias, real, bruno, belini,...

Leonardo Marquez Pedro

Fixação de objetos por garras de robôs: aplicações deredes neurais e proposta de auto-aprendizagem

para os casos 2D e 3D

Dissertação apresentada ao Departamento de

Engenharia Mecânica da Escola de Engenharia

de São Carlos para a obtenção do Título de

Mestre em Engenharia Mecânica

Orientador:

Prof. Dr. Glauco Augusto de Paula Caurin

SEM - DEPARTAMENTO DE ENGENHARIA MECÂNICA

EESC - ESCOLA DE ENGENHARIA DE SÃO CARLOS

USP - UNIVERSIDADE DE SÃO PAULO

São Carlos - SP

Janeiro de 2009

AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

Ficha catalográfica preparada pela Seção de Tratamento da Informação do Serviço de Biblioteca – EESC/USP

Pedro, Leonardo Marquez P372f Fixação de objetos por garras de robôs : aplicações

de redes neurais e proposta de auto-aprendizagem para os casos 2D e 3D / Leonardo Marquez Pedro ; orientador Glauco Augusto de Paula Caurin, 2008.

Dissertação (Mestrado-Programa de Pós-Graduação em Engenharia Mecânica e Área de Concentração em Dinâmica das Máquinas e Sistemas) -- Escola de Engenharia de São Carlos da Universidade de São Paulo, 2008.

1. Fixação de objetos 2D. 2. Fixação de objetos 3D. 3. Redes neurais artificiais. 4. Inteligência artificial. 5. Garras robóticas. I. Título.

v

Dedico esta dissertação aos meus pais

Manuel Augusto e Maria do Carmo,

exemplos de trabalho, fé e perseverança.

vii

Agradecimentos

Agradeço primeiramente a Deus pela vida, e por ter me dado iluminação, inspiração e saúde

durante a realização deste trabalho.

Agradeço aos meu pais, Manuel Augusto e Maria do Carmo, pelo amor, incentivo e apoio,

e à toda a minha família por terem compreendido a minha ausência durante a dedicação aos

trabalhos. Sem a ajuda e o opoio de vocês, nada seria possível.

Agradeço também à Marilia Pinheiro de Carvalho, minha companheira e principal incenti-

vadora, pelo apoio nos momentos difíceis, e principalmente por ter compartilhado comigo todos

os momentos vividos durante a realização do trabalho.

Ao Professor Glauco Caurin, meu orientador, pela oportunidade de desenvolvimento do

trabalho, pelos ensinamentos e pela excelente orientação.

Aos amigos de república, César e Vitor, pelo excelente convívio e pela compreensão durante

estes dois anos de trabalho.

Aos colegas do laboratório de mecatrônica, Dalton, Rafael Aroca, Jean, Jorge, Martins,

Paulo Marcos, Takao, Ronny, Akira, Ricardo, André Lins, Christoffer, Leandro Massaro, André

Dias, Real, Bruno, Belini, Marciel e Kelen, pelas idéias, sugestões e críticas ao trabalho, e

principalmente pela amizade e pelo ótimo convívio no ambiente de trabalho.

Ao amigo Rafael Vidal Aroca pelos trabalhos em parceria e pela valiosa correção do texto.

Ao Christoffer Tenório Emídio de Souza, aluno de iniciação científica, pela colaboração

referente ao tema "Simplificação de Superfícies", parte importante deste trabalho.

Aos Professores Aluizio Fausto Araújo e Roseli Franceli Romero pelas correções do texto

em relação a terminologia sobre redes neurais artificiais.

Ao colega de pesquisa Valdinei Luis Belini pela ajuda na compreensão da teoria da fixação.

Ao CNPq pelo apoio financeiro realizado com o oferecimento da bolsa de mestrado.

Por fim, gostaria de agradecer a todos os demais amigos e colegas, cujos nomes não caberiam

nesta folha, que de alguma forma contribuíram para a realização deste trabalho, e que ao lerem

estas palavras saberão que foram lembrados. Muito obrigado.

viii Agradecimentos

ix

“O único lugar onde o sucesso vem antes do trabalho

é no dicionário.”

Albert Einstein

xi

Resumo

PEDRO, L. M. Fixação de objetos por garras de robôs: aplicações de redes neurais eproposta de auto-aprendizagem para os casos 2D e 3D. Dissertação (Mestrado). Escola de

Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2008.

Este trabalho apresenta estudos da aplicação de redes neurais artificiais (RNAs) na deter-

minação de fixação de objetos 2D e 3D por garras de robôs, e também apresenta uma proposta

de algoritmo de auto-aprendizagem para fixação, também baseado em RNAs. A capacidade de

fixar objetos, principalmente aqueles desconhecidos pelo sistema, a partir de informações de

um sistema de visão, é um dos principais requisitos dos robôs, tanto para aplicações industriais,

quanto para aplicações em ambientes menos estruturados (tal como aqueles encontrados por

robôs de serviço). Uma das diferentes maneiras de se determinar fixações de objetos desconhe-

cidos a partir de sua forma geométrica é a utilização das RNAs. Para avaliar a capacidade das

redes nestas tarefas, três diferentes métodos são testados em simulações com objetos de exten-

sas bases de dados. Os métodos avaliados são: o proposto por Xu et al. (1990); o proposto por

Valente (1999); e uma nova proposta baseada nestes dois métodos. Também são propostas duas

redes de Hopfield para a simplificação de objetos, uma para o caso 2D e outra para o caso 3D,

cujo objetivo é reduzir os dados que representam os objetos, sem perdas significativas de infor-

mações, e cujo propósito é simplificar as etapas de cálculo das RNAs. Os resultados obtidos

nas simulações dos três métodos avaliados, com as bases de objetos, mostram as capacidades e

limitações das redes nesta aplicação, e pode-se afirmar que as redes são capazes de determinar

pontos de fixação desde que adequadamente configuradas e treinadas. Pode-se afirmar também

que a simplificação da forma do objeto melhora o desempenho das redes, principalmente em

relação aos tempos de processamento. A partir dos resultados obtidos com os métodos avali-

ados, um algoritmo de auto-aprendizagem para fixação de objetos desconhecidos é proposto.

Simulações com as bases de objetos 2D e 3D são realizadas a fim de verificar a capacidade

de auto-aprendizagem, e os resultados mostram a capacidade de auto-aprendizagem de novas

fixações, à medida que as redes são utilizadas.

Palavras-chave: fixação de objetos 2D, fixação de objetos 3D, redes neurais artificiais,

inteligência artificial, garras robóticas

xii Resumo

xiii

Abstract

PEDRO, L. M. Object grasping using robot grippers: applications of artificial neuralnetworks and proposal of a self-learning algorithm for 2D and 3D cases. Thesis (Master).

Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2008.

The present work presents studies of artificial neural networks (ANNs) to find 2D and

3D grasping points of unknown objects for robot grippers and hands, and also, a self-learning

grasping algorithm is proposed based on ANNs. Object grasping, mainly for those which are

unknown by the system, is one of the most important requirements of robots, either for those

designed for industrial applications, or for those that work in unstructured environments, like

service robots. Methods based on ANN, among several different methods, are interesting for

unknown object grasping due to the ANN capacity of classification and generalization. Aimed

to evaluate the ANN capacities to accomplish such tasks, and three different ANN methods are

simulated. The evaluated methods are: the methods proposed by Valente (1999) and the one

proposed by Lee et al. (2002) for the 2D and 3D case, respectively, and the proposed by Lee

et al. (2002) for the 3D case; the method proposed by Xu et al. (1990); and a new method is

proposed as a combination of the first methods. Simulations are done to evaluate the different

ANN behavior on determining grasping points for 2D and 3D objects of extensive data bases.

Two Hopfield networks are also presented to simplify the object shape, and it is aimed with such

approach to reduce the object representation without loss of information, and as a consequence,

reduce the demanded ANN processing time of training and execution. The results obtained

in the simulations confirm that the ANN is capable to determine grasping points for unknown

objects, since the network parameters are correctly tuned and the network is properly trained.

Results show that the object shape simplification improves the ANN performance concerning

processing time. Additionally, based on the behavior of the three methods evaluated on training

and on grasping determination, a self-learning algorithm is proposed. Several self-learning

simulations were done using the 2D and 3D object data bases, and the obtained results show the

capacity of learning new grasps.

Keywords: 2D object grasping, 3D object grasping, artificial neural networks, artificial

intelligence, robot grippers

xiv Abstract

xv

Sumário

Lista de Abreviaturas e Siglas xxi

Lista de Figuras xxiii

Lista de Tabelas xxxiii

I xxxvii

1 Introdução 1

1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Objetivos do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Metodologia adotada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4 Organização do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Revisão bibliográfica 9

2.1 Fixação de objetos desconhecidos por garras robóticas . . . . . . . . . . . . . 9

2.1.1 Fixação 2D de objetos desconhecidos . . . . . . . . . . . . . . . . . . 10

2.1.2 Fixação 3D de objetos desconhecidos . . . . . . . . . . . . . . . . . . 17

3 Teoria fundamental da fixação 27

3.1 Movimentação e carregamentos de corpos rígidos . . . . . . . . . . . . . . . . 27

3.1.1 Movimentação em R3 e transformações homogêneas . . . . . . . . . . 27

3.1.2 Velocidade em R6 de um corpo rígido . . . . . . . . . . . . . . . . . . 30

3.1.3 Carregamentos e carregamentos equivalentes . . . . . . . . . . . . . . 34

3.2 Estática da fixação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

xvi Sumário

3.2.1 Modelos de contato . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2.2 Base do contato e mapa da fixação G . . . . . . . . . . . . . . . . . . 40

3.3 Propriedades da fixação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.3.1 Estabilidade da fixação . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.3.2 Propriedade Force-closure de uma fixação . . . . . . . . . . . . . . . . 46

3.3.3 Propriedade Form-closure de uma fixação . . . . . . . . . . . . . . . . 49

3.3.4 Avaliação e Medida da qualidade da fixação . . . . . . . . . . . . . . . 50

3.4 Resumo do Capítulo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

II Fixação 2D utilizando redes neurais artificiais 57

4 Aproximação poligonal utilizando redes de Hopfield 59

4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2 Rede de Hopfield . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3 Algoritmo original . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.4 Algoritmo proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.5 Simulações e resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.5.1 Comparação com o algoritmo original . . . . . . . . . . . . . . . . . . 68

4.5.2 Comparação com demais algoritmos . . . . . . . . . . . . . . . . . . . 72

4.5.3 Simulação com imagens reais . . . . . . . . . . . . . . . . . . . . . . 76


5 Fixação 2D de objetos desconhecidos 79

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5.2 Teoria e equacionamento da fixação 2D . . . . . . . . . . . . . . . . . . . . . 81

5.2.1 Simplificações e hipóteses . . . . . . . . . . . . . . . . . . . . . . . . 82

5.2.2 Sistemas de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . 83

Sumário xvii

5.2.3 Equacionamento da fixação 2D por 2 pontos de contato . . . . . . . . . 86


5.3 Verificação da condição force-closure e avaliação da fixação . . . . . . . . . . 91

5.4 Métodos de determinação dos pontos de contato . . . . . . . . . . . . . . . . . 93

5.4.1 Fixação 2D por busca heurística . . . . . . . . . . . . . . . . . . . . . 94

5.4.2 Fixação 2D por otimização utilizando redes competitivas de Hopfield . 102

5.4.3 Fixação 2D por redes neurais feedforward tipo RBF . . . . . . . . . . 106

5.4.4 Fixação 2D por redes feedforward e de Hopfield combinadas . . . . . . 112


IIIFixação 3D utilizando redes neurais artificiais 119

6 Simplificação de superfícies utilizando redes de Hopfield 121

6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121


6.2.1 Descrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

6.2.2 Estratégias de simplificação . . . . . . . . . . . . . . . . . . . . . . . 130


6.3.1 A ferramenta de avaliação Metro . . . . . . . . . . . . . . . . . . . . . 131

6.3.2 Desempenho em função do limiar Umin . . . . . . . . . . . . . . . . . 132

6.3.3 Comparação com outros algoritmos . . . . . . . . . . . . . . . . . . . 135


6.5 Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

7 Fixação 3D de objetos desconhecidos 143

7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

7.2 Teoria e equacionamento da fixação 3D . . . . . . . . . . . . . . . . . . . . . 145

xviii Sumário


7.2.2 Sistemas de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . 146



7.3 Verificação da condição force-closure e avaliação da fixação 3D . . . . . . . . 154

7.4 Métodos de seleção de pontos de contato . . . . . . . . . . . . . . . . . . . . . 156


7.4.2 Fixação 3D por Busca Heurística . . . . . . . . . . . . . . . . . . . . 160

7.4.3 Fixação 3D por otimização utilizando redes competitivas de Hopfield . 168

7.4.4 Fixação 3D por redes feedforward tipo RBF . . . . . . . . . . . . . . . 174

7.4.5 Fixação 3D por redes feedforward e de Hopfield combinadas . . . . . . 181


7.6 Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

IV Proposta de um sistema de fixação de auto-aprendizagem 189

8 Fixação 2D e 3D com auto-aprendizagem 191

8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191


8.2.1 Descrição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193


8.3.1 O algoritmo proposto é capaz de aprender novas fixações? . . . . . . . 195

8.3.2 Simulações e resultados . . . . . . . . . . . . . . . . . . . . . . . . . 196


9 Conclusões Finais 207

9.1 Conclusões e propostas para a fixação 2D . . . . . . . . . . . . . . . . . . . . 209

Sumário xix

9.2 Conclusões e propostas para a fixação 3D . . . . . . . . . . . . . . . . . . . . 212

9.3 Conclusões e propostas para o algoritmo de

auto-aprendizagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

Referências Bibliográficas 219

Apêndice A -- Processamento de imagens 225

A.1 Justificativa e descrição do método . . . . . . . . . . . . . . . . . . . . . . . . 225

A.2 Resultados obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

A.3 Considerações sobre o método de processamento de imagens adotado . . . . . 230

Apêndice B -- Tabelas do Capítulo 4 231

Apêndice C -- Tabelas do Capítulo 6 235

Apêndice D -- Cálculo dos momentos principais de inércia 245

Apêndice E -- Cálculo do centro de um fixação realizada por três pontos de contato 247

E.1 Definição do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

E.1.1 Arco capaz de 120o . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

E.1.2 Cálculo do Cf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

E.1.3 Solução analítica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

E.1.4 Solução geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

Apêndice F -- Figuras das respostas das simulações do algoritmo de auto-aprendizagem do

Capítulo 8 253

F.1 Gráficos da segunda simulação . . . . . . . . . . . . . . . . . . . . . . . . . . 254

F.2 Gráficos da terceira simulação . . . . . . . . . . . . . . . . . . . . . . . . . . 256

F.3 Gráficos da quarta simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . 258

F.4 Gráficos da quinta simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

Anexo A -- Adição de Minkowski 263

xx Sumário

xxi

Lista de Abreviaturas e Siglas

τS torque space

2D bidimensional

3D tridimensional

FS force space

GτS grasp torque space

GDL grau de liberdade

GFS grasp force space

GWS grasp wrench space

MLP multilayer perceptron

RBF Radial bases function

RNA Rede Neural Artificial

WS wrench space

xxii Lista de Abreviaturas e Siglas

xxiii

Lista de Figuras

1.1 Robô Unimate. Desenvolvido por Joseph Engelberger, em 1961. Peso aproxi-

mado de 1800kg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Principais áreas de aplicação dos robôs industriais. Comparação entre as os

anos de 1985, 1995 e o período de 2004 a 2006. Dados extraídos de Craig

(2005) e IFR (2007). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.1 Esquemático da garra de Hanafusa e Asada (1977). A Figura 2.1(a) mostra

os dedos da garra dispostos sobre um anel a 120o entre si, e a Figura 2.1(b)

representa a garra fixando um objeto e as molas deformadas. . . . . . . . . . . 12

2.2 Resultado do sistema proposto por Backer et al. (1985) para duas formas ge-

ométricas. A Figura 2.2(a) mostra resultado satisfatório para uma forma qual-

quer, e Figura 2.2(b) mostra um exemplo de falha, em que não é possível atingir

o ponto vermelho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3 DLR Hand. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 Barret Hand. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.5 Robô ARMAR, utilizado por Morales et al. (2006b). . . . . . . . . . . . . . . 25

3.1 Possíveis carregamentos para os três tipos fundamentais de contato propostos

por Nguyen (1988). Figura 3.1(a) contato pontual sem atrito, Figura 3.1(b)

contato pontual com atrito e Figura 3.1(c) contato macio. . . . . . . . . . . . . 38

3.2 Exemplo de uma envolvente convexa para um conjunto de pontos no plano. À

esquerda o conjunto de pontos, e à direita a envolvente convexa em vermelho

gerada pelo algoritmo QuickHull (BARBER et al., 1996). . . . . . . . . . . . . 47

4.1 Exemplo de uma rede de Hopfield com seis neurônios e suas conexões. . . . . 61

4.2 Desvio entre curva e corda definido como o somatório das distâncias entre a

curva px py e a corda px py. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4.3 Esquemático do cálculo da função energia U para um elemento qualquer. Figura

modificada de Valente (1999). . . . . . . . . . . . . . . . . . . . . . . . . . . 64

xxiv Lista de Figuras

4.4 Função energia para uma etapa de iteração. . . . . . . . . . . . . . . . . . . . 65

4.5 Região de interesse para o cálculo da matriz H. . . . . . . . . . . . . . . . . . 66

4.6 As formas acima são freqüentemente utilizadas pelos autores da área para avali-

ação dos algoritmos de aproximação poligonal. Figura 4.6(a) Leaf shape, Figura

4.6(b) Chromosome shape e Figura 4.6(c) Semi-circle shape. . . . . . . . . . . 68

4.7 Gráficos de comparação entre o algoritmo proposto, em azul, e o algoritmo

original, em vermelho, para o Leaf shape (Figura 4.6(a)). Figura 4.7(a) mostra

o erro máximo por aproximação m, Figura 4.7(b) mostra o somatório do erro

quadrático por aproximação m e Figura 4.7(c) mostra o tempo de processamento

por aproximação m.A forma Leaf shape tem inicialmente 120 pontos. . . . . . 69

4.8 Gráficos de comparação entre o algoritmo proposto, em azul, e o algoritmo ori-

ginal, em vermelho, para o Chromosome shape (Figura 4.6(b)). Figura 4.8(a)

mostra o erro máximo por aproximação m, Figura 4.8(b) mostra o somatório do

erro quadrático por aproximação m e Figura 4.8(c) mostra o tempo de proces-

samento por aproximação m. A forma Chromosome shape tem inicialmente 60

pontos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.9 Gráficos de comparação entre algoritmo proposto, em azul, e o algoritmo origi-

nal, em vernelho, para o Semi-circle shape (Figura 4.6(c)). Figura 4.9(a) mostra

o erro máximo por aproximação m, Figura 4.9(b) mostra o somatório do erro

quadrático por aproximação m e Figura 4.9(c) mostra o tempo de processamento

por aproximação m. A forma Semi-circle shape tem inicialmente 100 pontos. . 71

4.10 Comparação do algoritmo proposto com outros algoritmos. Somatório do erro

quadrático por aproximação do Leaf Shape. . . . . . . . . . . . . . . . . . . . 73

4.11 Comparação do algoritmo proposto com outros algoritmos. Erro máximo por

aproximação do Leaf Shape. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73


quadrático por aproximação do Chromosome Shape. . . . . . . . . . . . . . . 74


aproximação do Chromosome Shape. . . . . . . . . . . . . . . . . . . . . . . 74


quadrádico por aproximação do Semi Circle Shape. . . . . . . . . . . . . . . . 75

Lista de Figuras xxv


aproximação do Semi Circle Shape. . . . . . . . . . . . . . . . . . . . . . . . 75

5.1 Definição do sistema de coordenadas do objeto. . . . . . . . . . . . . . . . . . 83

5.2 Definição do sistema de coordenadas da fixação. A Figura 5.2(a) mostra o

sistema de coordenadas da fixação por dois contato, e a Figura 5.2(b) mostra

o sistema para a fixação por trê contatos. . . . . . . . . . . . . . . . . . . . . . 84

5.3 Definição do sistema de coordenadas dos contatos para fixação por dois pontos

de contato (Figura 5.3(a)), e para fixação por três pontos de contato (Figura

5.3(b)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.4 Definição do sistema de coordenadas dos contatos c1 e c2. . . . . . . . . . . . 87

5.5 Definição do sistema de coordenadas da fixação, linha de ação e direção normal

aos pontos de fixação para uma garra de três dedos sem adução abdução. . . . . 90

5.6 Definição dos parâmetros para cálculo da função custo para fixação por dois

pontos de contato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5.7 Resultados do algoritmo de busca heurística para dois pontos de fixação para

objetos do cotidiano. As linhas vermelhas mostram a direção de aproximação

dos dedos da garra para o momento da fixação. . . . . . . . . . . . . . . . . . 97

5.8 Definição dos parâmetros para cálculo da função custo para fixação por três dedos. 99

5.9 Resultados do algoritmo de busca heurística para três pontos de fixação para


dos dedos da garra para o momento da fixação (parte 1 de 2). . . . . . . . . . . 100

5.10 Resultados do algoritmo de busca heurística para três pontos de fixação para


dos dedos da garra para o momento da fixação (parte 2 de 2). . . . . . . . . . . 101

5.11 Resultados do algoritmo de otimização com redes de Hopfield para determi-

nação de dois pontos de fixação para objetos do cotidiano. As linhas vermelhas

mostram a direção de aproximação dos dedos da garra para o momento da fixa-

ção (parte 1 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

xxvi Lista de Figuras


nação de dois pontos de fixação para objetos do cotidiano. As linhas vermelhas

mostram a direção de aproximação dos dedos da garra para o momento da fixa-

ção (parte 2 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104


nação de três pontos de fixação para objetos do cotidiano. . . . . . . . . . . . . 105

5.14 Padrões geométricos 2D utilizados no treinamento das redes neurais feedforward

tipo RBF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


nação de três pontos de fixação para objetos do cotidiano. . . . . . . . . . . . . 109

5.16 Resultados do algoritmo baseado em RNAs RBF na determinação de três pontos

de fixação para objetos do cotidiano. . . . . . . . . . . . . . . . . . . . . . . . 111

5.17 Resultados do algoritmo baseado em RNAs RBF e posterior otimização por

redes de Hopfield na determinação de dois pontos de fixação para objetos do

cotidiano (parte 1 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.18 Resultados do algoritmo baseado em RNAs RBF e posterior otimização por

redes de Hopfield na determinação de dois pontos de fixação para objetos do

cotidiano (parte 2 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.19 Resultados do algoritmo baseado em redes neurais RBF e posterior otimização

por redes de Hopfield na determinação de três pontos de fixação para objetos do

cotidiano. As linhas vermelhas mostram a direção de aproximação dos dedos

da garra para o momento da fixação (parte 1 de 2). . . . . . . . . . . . . . . . . 115

5.20 Resultados do algoritmo baseado em redes neurais RBF e posterior otimização

por redes de Hopfield na determinação de três pontos de fixação para objetos do

cotidiano. As linhas vermelhas mostram a direção de aproximação dos dedos

da garra para o momento da fixação (parte 2 de 2). . . . . . . . . . . . . . . . . 116

6.1 Elementos de malhas da superfície de um modelo reconstruído pela triangu-

lação de Delaunay. Figura 6.1(a) mostra o modelo reconstruído, Figura 6.1(b)

mostra a nuvem de pontos, e a Figura 6.1(c) mostra os elementos triangulares

da malha. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Lista de Figuras xxvii

6.2 Vizinhança de um ponto qualquer de uma malha. Em azul o ponto selecionado,

em vermelho os triângulos da vizinhança e em verde os pontos vizinhos do

ponto em azul. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

6.3 Efeito sobre a malha de superfície ao retirar um ponto. Figura 6.3(a) mostra a

malha antes de se retirar o ponto azul, Figura 6.3(b) mostra a malha reconstruída

após a retirada do ponto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6.4 Cálculo do erro de simplificação. . . . . . . . . . . . . . . . . . . . . . . . . . 128

6.5 Figura 6.5(a) mostra o modelo Bunny, que possui com 34834 vertices e malha

de 69451 triângulos, e a Figura 6.5(b) mostra o modelo Fandisk que possui com

6475 vertices e malha de 12946 triângulos. . . . . . . . . . . . . . . . . . . . . 131

6.6 Resultados para diferentes porcentagens de simplifcação do modelo Bunny em

função do limiar Umin. A Figura 6.6(a) mostra o erro médio quadrático de cada

porcentagem de simplificação em função do limiar, e a Figura 6.6(b) mostra o

tempo de simplificação em função do mesmo limiar. . . . . . . . . . . . . . . 133

6.7 Resultados para diferentes porcentagens de simplifcação do modelo Fandisk em

função do limiar Umin. A Figura 6.7(a) mostra o erro médio quadrático de cada

porcentagem de simplificação em função do limiar, e a Figura 6.7(b) mostra o

tempo de simplificação em função do mesmo limiar. . . . . . . . . . . . . . . . 134

6.8 Gráficos de comparação do método proposto com outros métodos da literatura

na simplificação do modelo Bunny. Os gráficos das Figuras 6.8(a) e 6.8(b)

mostram respectivamente o erro máximo Emax e o erro médio Emed medidos

para diferentes níveis de simplificação. . . . . . . . . . . . . . . . . . . . . . . 136

6.9 Gráficos de comparação do método proposto com outros métodos da literatura

na simplificação do modelo Fandisk. Os gráficos das Figuras 6.9(a) e 6.9(b)

mostram respectivamente o erro máximo e o erro médio medidos para diferentes

níveis de simplificação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

6.10 Representação dos modelos simplificados pelo método proposto (parte 1 de 3). 138



7.1 Definição do sistema de coordenadas do objeto para a Fixação 3D. . . . . . . . 146

7.2 Sistema de coordenadas de uma fixação 3D. . . . . . . . . . . . . . . . . . . . 147

xxviii Lista de Figuras

7.3 Sistemas de coordenadas dos contatos Ci para uma fixação 3D. . . . . . . . . . 148

7.4 Exemplos de envolventes convexas para uma fixação 3D por dois pontos de

contato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

7.5 Exemplos de envolventes convexas para uma fixação 3D por três pontos de

contato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

7.6 Formas de objetos, que são representadas por uma malha superficial, utilizadas

nas simulações dos métodos de determinação de pontos de fixação 3D. Os ob-

jetos representam algumas formas abstratas e alguns objetos do cotidiano (parte

1 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

7.7 Formas de objetos, que são representadas por uma malha superficial, utilizadas

nas simulações dos métodos de determinação de pontos de fixação 3D. Os ob-

jetos representam algumas formas abstratas e alguns objetos do cotidiano (parte

2 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

7.8 Definição dos ângulos θ1 e θ2 entre as linhas de ação la e os eixos Z dos sis-

temas de coordenadas C1 e C2 respectivamente. . . . . . . . . . . . . . . . . . 161

7.9 Vista frontal, superior e em perspectiva da determinação de dois pontos de fixa-

ção, para objetos do cotidiano e abstratos, utilizando o método de busca heurís-

tica (parte 1 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162



tica (parte 2 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163



tica (parte 3 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

7.12 Definição dos ângulos θ1, θ2 e θ3 entre as linhas de ação la1, la2 e la3 e os

eixos Z dos sistemas de coordenadas C1, C2 e C3 respectivamente. . . . . . . . 165

7.13 Vista frontal, superior e em perspectiva da determinação de três pontos de fixa-


tica (parte 1 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166



tica (parte 2 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

Lista de Figuras xxix



tica (parte 3 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

7.16 Vista frontal, superior e em perspectiva da determinação de dois pontos de fi-

xação, para objetos do cotidiano e abstratos, utilizando o método de otimização

por redes de Hopfield (parte 1 de 3). . . . . . . . . . . . . . . . . . . . . . . . 169








ção, para objetos do cotidiano e abstratos, utilizando o método de otimização








7.22 Padrões de treinamento para a rede feedforward tipo RBF para a fixação 3D. . . 175


xação, para objetos do cotidiano e abstratos, utilizando redes feedforward tipo

RBF previamente treinadas (parte 1 de 3). . . . . . . . . . . . . . . . . . . . . 176







xxx Lista de Figuras

7.26 Vista frontal, superior e em perspectiva da determinação de três pontos de fi-








RBF previamente treinadas e posterior otimização com redes de Hopfield (parte

1 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182




2 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183




3 de 3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184




1 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185




2 de 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

8.1 Mapa do comportamento da rede no seu estado inicial. . . . . . . . . . . . . . 197

8.2 Mapa do comportamento da rede após a realização de 50 retreinamentos. . . . . 197

8.3 Mapas do comportamento da rede para diferentes estágios de retreinamento. . . 198

8.4 Curva de aprendizagem para a fixação 2D por dois pontos de contato. . . . . . 199

8.5 Curva de aprendizagem para a fixação 2D por três pontos de contato. . . . . . . 200

Lista de Figuras xxxi

8.6 Curva de aprendizagem para a fixação 3D por dois pontos de contato. . . . . . 200

8.7 Curva de aprendizagem para a fixação 3D por três pontos de contato. . . . . . . 201

8.8 Objetos apresentados à rede entre retreinamentos. Os valores mostrados re-

presentam a média entre cada 250 retreinamentos. Resultados para a primeira

simulação de apresentação de objetos à rede, em ordem randômica. . . . . . . . 202

8.9 Tempo de execução da rede. Média entre cada 250 retreinamentos. Resultados

para a primeira simulação de apresentação de objetos à rede, em ordem randômica.203

8.10 Tempo de retreinamento da rede. Média entre cada 250 retreinamentos. Resul-

tados para a primeira simulação de apresentação de objetos à rede, em ordem

randômica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

A.1 Histograma de imagens. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

A.2 Resultado do processamento da imagem. Da esquerda para a direita: imagem

original, imagem binarizada e o contorno extraído (parte 1 de 3). . . . . . . . . 227





D.1 Definição da massa do pixel pertencente a figura, e do pixel pertencente ao

fundo da imagem, necessária para o cálculo dos momentos de inércia Ixx Iyy e Ixy. 245

E.1 Pontos de contato PA, PB e PC de fixação de uma garra de três dedos e o centro

de fixção Cf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

E.2 Arco capaz de 120o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

E.3 Cálculo do ponbto Cf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

E.4 Solução geométrica para o cálculo do centro de fixação. . . . . . . . . . . . . . 250

F.1 Objetos apresentados à rede entre retreinamentos. Os valores mostrados re-

presentam a média entre cada 250 retreinamentos. Resultados para a segunda


F.2 Tempo de execução da rede. Média entre cada 250 retreinamentos. Resultados

para a segunda simulação de apresentação de objetos à rede, em ordem randômica.255

xxxii Lista de Figuras

F.3 Tempo de retreinamento da rede. Média entre cada 250 retreinamentos. Resul-

tados para a segunda simulação de apresentação de objetos à rede, em ordem

randômica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255


presentam a média entre cada 250 retreinamentos. Resultados para a terceira



para a terceira simulação de apresentação de objetos à rede, em ordem randômica.257

F.6 Tempo de retreinamento da rede. Média entre cada 250 retreinamentos. Re-

sultados para a terceira simulação de apresentação de objetos à rede, em ordem

randômica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257


presentam a média entre cada 250 retreinamentos. Resultados para a quarta



para a quarta simulação de apresentação de objetos à rede, em ordem randômica. 259


sultados para a quarta simulação de apresentação de objetos à rede, em ordem

randômica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259


presentam a média entre cada 250 retreinamentos. Resultados para a quinta



para a quinta simulação de apresentação de objetos à rede, em ordem randômica. 261


sultados para a quinta simulação de apresentação de objetos à rede, em ordem

randômica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

xxxiii

Lista de Tabelas

4.1 Tabela de comparação dos tempos de processamento da aproximação poligonal,

calculada pelo algoritmo original e pelo algoritmo proposto, de formas de ob-

jetos reais, para diversos valores m de aproximação. Os tempos medidos estão

em segundos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.1 Tabela do tempo de execução do algoritmo de busca heurística para fixação 2D

por dois pontos de contato dos objetos da Figura 5.7. . . . . . . . . . . . . . . 98


por garras de três dedos dos objetos das Figuras 5.9 e 5.10. . . . . . . . . . . . 101

5.3 Tabela do tempo da fixação 2D por Hopfield para os objetos das Figuras 5.11 e

5.12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5.4 Tabela do tempo de determinação da fixação 2D por três pontos de contato

utilizando otimização por redes de Hopfield para os objetos da Figura 5.13. . . 106

5.5 Tabela do tempo de determinação da fixação 2D por garras de dois dedos uti-

lizando RNAs tipo RBF para os objetos da Figura 5.15. . . . . . . . . . . . . . 110

5.6 Tabela do tempo de determinação da fixação 2D por garras de três dedos uti-

lizando redes neurais tipo RBF para os objetos das Figuras 5.16. . . . . . . . . 112

5.7 Tabela do tempo de determinação da fixação 2D por dois dedos utilizando

RNAs tipo RBF e posterior otimização por redes de Hopfield para os objetos

das Figuras 5.17 e 5.18. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.8 Tabela do tempo de determinação da fixação 2D por garras de três dedos uti-

lizando redes neurais tipo RBF e posterior otimização por redes de hopfield para

os objetos das Figuras 5.19 e 5.20. . . . . . . . . . . . . . . . . . . . . . . . . 116

7.1 Tabela de tempos de simplifcação das superfícies dos objetos das Figuras 7.6 e

7.7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160


por dois pontos de contato dos objetos das Figuras 7.9, 7.10 e 7.11. . . . . . . . 164

xxxiv Lista de Tabelas


por três pontos de contato dos objetos das Figuras 7.13 e 7.14. . . . . . . . . . 168

7.4 Tabela do tempo de determinação da fixação 3D por dois contatos utilizando

redes de Hopfield. Tempos para as Figuras 7.16, 7.17 e 7.18. . . . . . . . . . . 171

7.5 Tabela do tempo de determinação da fixação 3D por três pontos de contato

utilizando otimização com redes de Hopfield. Os tempos foram medidos para

os objetos das Figuras 7.19, 7.20 e 7.21. . . . . . . . . . . . . . . . . . . . . . 174

7.6 Tabela do tempo de determinação da fixação 3D por dois pontos de contatos

utilizando RNAs tipo RBF para os objetos das Figuras 7.23, 7.24 e 7.25. . . . . 178

7.7 Tabela do tempo de determinação da fixação 3D por três pontos de contatos

utilizando RNAs tipo RBF para os objetos das Figuras 7.26 e 7.27 . . . . . . . . 181

7.8 Tabela do tempo de determinação da fixação 3D por dois pontos utilizando

RNAs tipo RBF e posterior otimização por redes de Hopfield para os objetos

das Figuras 7.28, 7.29 e 7.30. . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

7.9 Tabela do tempo de determinação da fixação 3D por garras de dois dedos uti-

lizando RNAs tipo RBF e posterior otimização por redes de Hopfield para os

objetos das Figuras 7.31 e 7.32 . . . . . . . . . . . . . . . . . . . . . . . . . . 187

9.1 Comparação dos tempos de processamento da determinação da fixação 2D por

dois pontos de contato utilizando os quatro diferentes métodos descritos. . . . . 210

9.2 Comparação dos tempos de processamento da determinação da fixação 2D por

três pontos de contato utilizando os quatro diferentes métodos descritos. . . . . 210

9.3 Tabela de comparação dos tempos de processamento da determinação da fi-

xação 3D por dois pontos de contato utilizando os quatro diferentes métodos

descritos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

9.4 Tabela de comparação dos tempos de processamento da determinação da fi-

xação 3D por três pontos de contato utilizando os quatro diferentes métodos

descritos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

A.1 Tabela dos tempos da etapa de processamento das imagems utilizadas nas si-

mulações do algoritmo de fixação 2D proposto no Capítulo 5. . . . . . . . . . . 230

B.1 Tabela de resultados de algoritmos de aproximação poligonal (parte 1 de 2). . . 231

B.2 Tabela de resultados de algoritmos de aproximação poligonal (parte 2 de 2). . . 232

Lista de Tabelas xxxv

B.3 Tabela de resultados do algoritmo proposto para a aproximação poligonal. . . . 233

C.1 Valores dos erros de silplificação Emax e Emed e do tempo de processamento

para diferentes porcentagens de simplificação e limiar de energia Umin para o

modelo Bunny. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

C.2 Continuação da Tabela C.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

C.3 Valores dos erros de silplificação Emax e Emed e do tempo de processamento

para diferentes porcentagens de simplificação e limiar de energia Umin para o

modelo Fandisk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

C.4 Continuação da Tabela C.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

C.5 Resultados obtidos na simplificação do Modelo Bunny (34834 vertices, 69451

triângulos) para o método proposto, e para os outros métodos (parte 1 de 2). . . 240

C.6 Resultados obtidos na simplificação do Modelo Bunny (34834 vertices, 69451


C.7 Resultados obtidos na simplificação do Modelo Fandisk (6475 vertices, 12946


C.8 Resultados obtidos na simplificação do Modelo Fandisk (6475 vertices, 12946


xxxvi Lista de Tabelas

xxxvii

Parte I

1

1 Introdução

1.1 Motivação

A interação com objetos é uma das diferentes formas com que sistemas robóticos podem

interagir com o meio ambiente. Tal interação, denominada na robótica como movimentação de

objetos (MURRAY et al., 1994; MASON, 2001), tornou-se interessante para a indústria pela

possibilidade de automatização de tarefas, que se iniciou na década de 1960 com o primeiro

braço robótico desenvolvido, o Unimate (Figura 1.1), e na época foi inserido de forma experi-

mental na linha de produção da General Motors, onde transportava blocos de motores em alta

temperatura (MURRAY et al., 1994).

Figura 1.1: Robô Unimate. Desenvolvido por Joseph Engelberger, em 1961. Peso aproximado

de 1800kg.

Desde a construção do primeiro robô até meados de 1980, mesmo com a instalação de

mais de 1500 unidades (principalmente no Japão e nos EUA), as principais tarefas dos braços

robóticos industriais constituíam-se de operações simples em que não é necessário precisão de

posicionamento ou grandes velocidades de movimentação, tais como as operações de soldagem

e de pintura (CRAIG, 2005).

A agregação de novas tecnologias aos robôs, como por exemplo: novos materiais; melhores

2 1 Introdução

sensores e motores; possibilitou a utilização deles em novas tarefas que até então não eram

possíveis devido aos erros de posicionamento e às baixas velocidades de movimentação. O

histograma da Figura 1.2 mostra as principais áreas de instalação dos manipuladores robóticos1

no ano de 1985, no de 1995, e no período de 2004 a 2006, conquistadas pela utilização de novas

tecnologias.

Figura 1.2: Principais áreas de aplicação dos robôs industriais. Comparação entre as os anos de

1985, 1995 e o período de 2004 a 2006. Dados extraídos de Craig (2005) e IFR (2007).

Pode-se observar que as aplicações de maior crescimento nos anos de 1985 e de 1995 foram

transferência de material e montagem. Também houve crescimento considerável em operações

de soldagem, principalmente para aquelas de pouca precisão e baixa qualidade, que não exigem

precisão de posicionamento e grandes velocidades de deslocamento dos manipuladores.

No período de 2004 a 2006, apesar da constante oscilação de instalações entre as principais

operações destinadas aos robôs, pode-se observar que as principais áreas de aplicação dos robôs

industriais continuaram sendo as operações de soldagem e as operações de movimentação de

materiais, com destaque para a última. Porém, apesar destas operações serem classificadas

com o mesmo nome para todos os períodos apresentados no histograma, as áreas de aplicação

dos robôs do período de 2004 a 2006 são qualitativamente diferentes daquelas das décadas de

1980 e 1990. As principais diferenças entre as mesmas aplicações para as diferentes épocas

são: a precisão de posicionamento; a velocidade de movimentação; e o controle de força. Estas

diferenças estão relacionadas às melhorias provocadas pelo constante desenvolvimento de novas

tecnologias na robótica.

Ainda quanto ao histograma da Figura 1.2, algumas aplicações como pintura e inspeção não

apresentam números de instalações expressivos no período de 2004 a 2006. Este fato se deve

à saturação do mercado, ou seja, as novas instalações nestas aplicações são na grande maioria

1Os manipuladores robóticos utilizados na indústria também são denominados como robôs industriais.

1.1 Motivação 3

realizadas na substituição dos antigos robôs. E ainda, a agregação de novas tecnologias não

promoveu melhores resultados nas operações, pois estas operações não requerem requisitos de

alto desempenho.

Dentre as diversas novas tecnologias agregadas aos robôs, as inovações também estão pre-

sentes nas ferramentas utilizadas em cada tarefa específica, principalmente naquelas que en-

volvem movimentação de material. As ferramentas utilizadas na movimentação de material

são denominadas garras robóticas, e são responsáveis pela fixação e manipulação dos obje-

tos durante as operações. As inovações relacionadas às garras robóticas são uns dos fatores

responsáveis pela melhora da capacidade dos robôs em movimentar materiais, o que, conse-

qüentemente, promove a elevada taxa instalação de robôs em tais operações desde o início da

utilização de manipuladores robóticos na indústria (SANZ et al., 2005).

As primeiras garras desenvolvidas e utilizadas na indústria apresentavam dois dedos (garras

tipo pinça) ou três dedos (garras tipo castanha), cujo acionamento era realizado por um único

atuador, normalmente hidráulico ou pneumático, fato que limitava a capacidade de fixação e,

conseqüentemente, a utilização dos robôs. Os trabalhos no desenvolvimento de garras mais ca-

pazes e de sistemas inteligentes de fixação iniciaram-se no final da década de 1970 e no início da

década de 1980. Salisbury (1982a) propôs uma garra de três dedos, com três graus de liberdade

cada, considerada por muitos autores da área como o trabalho precursor no desenvolvimento

de garras robóticas complexas. Defini-se como garras robóticas complexas aquelas que apre-

sentam múltiplos dedos, com diversos graus de liberdade cada, cujos atuadores são especiais, e

também apresentam sensores de posição, de tato e de força.

Um breve histórico do desenvolvimento das garras robóticas e antropomórficas, assim como

uma descrição das suas principais características, pode ser encontrado em Murray et al. (1994).

Outros trabalhos de Mestrado e de Doutorado realizados no laboratório de Mecatrônica da

EESC-USP, anteriores e contemporâneos a este, também fazem revisões e descrições das prin-

cipais garras robóticas e antropomórficas (VALENTE, 1999; MARQUES, 2008). Para maior

conhecimento das garras robóticas, recomenda-se a leitura destes trabalhos.

Observa-se que as novas garras desenvolvidas apresentam múltiplos dedos compostos por

diversas juntas. Para a realização de tarefas como fixação e manipulação, é necessário que todos

as juntas trabalhem em sincronismo, e para tanto, controladores mais complexos e eficientes de-

vem ser desenvolvidos. Tanto para o projeto das garras de múltiplos dedos e o desenvolvimento

de controladores, quanto para a instalação e a manutenção do sistema, recursos humanos es-

pecializados e altos investimentos são necessários. Por isso, as primeiras garras desenvolvidas

(tipo pinça e castanha) ainda são encontradas em larga escala como ferramentas dos manipu-

4 1 Introdução

ladores robóticos, fato que os torna altamente especializados e incapazes de se adaptarem às

modificações nas condições de operação, ou seja, modificações na forma ou na posição do ob-

jeto a ser fixado (CUTKOSKY, 1985).

Para que a fixação de um objeto, tanto para sistemas providos de garras desenvolvidas,

quanto para sistemas providos de garras primitivas, independa da forma e da posição daquele,

é necesária a utilização de um sistema inteligente capaz de localizar o objeto em seu espaço

de trabalho e de determinar uma fixação adequada. Neste sentido, pode-se destacar o trabalho

realizado por Hanafusa e Asada (1977) como o pioneiro dentre os que se propõem a desenvolver

planejadores de fixação. Hanafusa e Asada (1977) propõem um sistema de escolha a partir da

geometria de uma seção plana do objeto da posição e da orientação de uma garra de três dedos

que permita uma fixação estável do objeto.

Os sistemas inteligentes de fixação baseiam-se fundamentalmente nas características do

objeto para determinar uma fixação adequada. Dentre as diversas características que um objeto

pode apresentar: massa, temperatura, rigidez, forma, textura, cor, entre outras propriedades

químicas, físicas e mecânicas; a forma apresenta-se como a mais adequada para a determinação

da fixação, embora algumas caracterísicas como a massa e a rigidez também sejam importantes,

principalmente para o caso de objetos com densidade variável e deformáveis, respectivamente.

A captura desta informação, ou seja, a captura da forma do objeto, pode ser realizada por

sistemas de visão bidimensional (visão 2D), normalmente composto por uma única câmera,

ou por sistemas de visão tridimensional (visão 3D), que podem ser compostos por duas ou

por diversas câmeras, ou compostos por sensores de profundidade da cena ativos ou passivos

(FERNANDES, 2005). A partir dos dados do sensor de visão, 2D ou 3D, o sistema de fixação

deve então determinar pontos adequados de fixação.

Assim, um planejador de fixação, que determina fixações a partir da forma do objeto, é

fundamental para tornar os sistemas robóticos mais eficientes nas tarefas de movimentação de

objetos, sejam elas destinadas à automação industrial, sejam elas para apoio e realização de

serviços em ambientes menos estruturados como escritórios e residências. O presente trabalho

segue esta linha de pesquisa e seu objetivo é propor um sistema de determinação de pontos de

fixação de objetos, previamente desconhecidos pelo robô, a partir de informações sobre a forma

do objeto adquiridas por um sistema de visão.

Para uma maior compreensão da fixação de objetos por garras robóticas, na Seção 2.1 do

próximo Capítulo, é realizada uma descrição dos trabalhos relevantes da literatura em sistemas

de fixação 2D e fixação 3D, que entende-se como fixação baseada na forma do objeto capturada

por visão 2D e por visão 3D, respectivamente.

1.2 Objetivos do trabalho 5

1.2 Objetivos do trabalho

O presente trabalho, como parte integrante da linha de pesquisa em Habilidades Senso-

Motoras aplicadas ao Desenvolvimento de Mãos Artificiais Robotizadas desenvolvida no Labo-

ratório de Mecatrônica da EESC-USP, tem como principal objetivo propor sistemas de fixação

3D de objetos desconhecidos por garras robóticas baseados em RNAs, sendo que a tomada de

decisão é baseada em informações do objeto obtidas por um sistema de visão. Os sistemas de

visão comumente utilizados na robótica podem ser 2D (visão 2D), ou 3D (visão 3D), conforme

discutido na Seção 2.1. Por este fato, o objetivo geral do trabalho pode ser dividido em dois

objetivos específios.

O primeiro objetivo consiste na revisão dos sistemas de fixação 2D de objetos desconhe-

cidos utilizando RNAs. Dois trabalhos da fixação 2D com RNAs são revisados para cumprir

este objetivo, são eles: o trabalho de Xu et al. (1990) e o trabalho de Valente (1999). Ainda

como parte do primeiro objetivo específico, realizam-se propostas de melhorias dos métodos

revisados.

A partir das observações dos métodos revistos e dos propostos considerando a fixação 2D,

métodos para a fixação 3D de objetos serão apresentados. Portanto, o segundo objetivo especí-

fico consiste na extensão dos métodos de fixação 2D para o caso 3D. Esta extensão é baseada,

fundamentalmente, nas observações e conclusões obtidas no cumprimento do primeiro objetivo

específico.

Por fim, como terceiro objetivo específico, o tempo total de processamento deve ser re-

duzido para que o sistema possa ser utilizado com fins acadêmicos, em pesquisas contem-

porâneas realizadas no mesmo laboratório e em laboratórios parceiros, ou ainda, para que possa

ser introduzido em aplicações industriais e em robôs de serviço. Para atingir tal objetivo, méto-

dos de redução de dados são utilizados para simplificar a representação dos objetos, tanto para

o caso 2D quanto para o 3D. Estes métodos de redução de dados também devem ser baseados

em RNAs.

1.3 Metodologia adotada

Nos sistemas de fixação 2D e 3D revisados e propostos neste trabalho, RNAs são empre-

gadas em substituição aos métodos analíticos, geométricos, de otimização e de busca heurística

utilizados em outros trabalhos. As redes são utilizadas nas etapas de processamento de dados e

de determinação dos pontos de contato. A vantagem das redes neurais está na sua capacidade

6 1 Introdução

de generalização, sua tolerância a ruídos e sua capacidade de aprendizagem.

Na etapa do processamento de dados, as redes são responsáveis por simplificar os dados

que representam a forma do objeto, a fim de diminuir os dados necessários para os cálculos das

etapas de determinação da fixação. Os resultados da simplificação são comparados com outros

algoritmos de simplificação existentes na literatura com o intuito de comparação de desempenho

quanto ao tempo e quanto à qualidade.

Os resultados dos métodos de fixação, 2D ou 3D, são avaliados quanto à sua capacidade

de determinar fixações para objetos desconhecidos. Para isso, bases de objetos são utilizadas,

e mede-se o desempenho de cada método na determinação de fixações satisfatórias2 para cada

um dos objetos da base. A base de objetos 2D é formada por 8100 imagens de setes objetos

obtidas a partir de ambientes virtuais (SAXENA, 2006). A base de objetos 3D é formada por

11700 objetos abstrados contruídos por modelagem computacional.

Além das bases de objetos 2D e 3D, 12 imagens de objetos reais são utilizadas para apre-

sentar os pontos de fixação obtidas pelos métodos de fixação 2D, e oito objetos 3D virtuais

(três com formato abstrato e cinco com formato de objetos do cotidiano) são utilizados para

apresentar os pontos de fixação determinados pelos métodos de fixação 3D.

Vale ressaltar também que, para tornar a avaliação dos diferentes métodos independente da

garra utilizada, a fixação, 2D ou 3D, é determinada para dois e três pontos de contato sem a

consideração das dimensões do objeto e da garra, de colisões, e da acessibilidade aos pontos

de contato. Esta simplificação permite avaliar a capacidade de cada método sem restrições de

carácter cinemático.

Além da qualidade dos resultados, também se investiga o tempo de processamento de cada

método, pois é desejado obter os menores tempos de processamento possíveis. Os tempos de

processamento dos diferentes métodos utilizando RNAs são comparados com os tempos de

processamento do método da busca heurística, que tem sempre 100% de fixação satisfatórias,

porém com tempos elevados.

Todas as simulações são realizadas em um computador tipo Desktop com processador de

64bits com velocidade de 2,0 GHz de processamento. As simulações são realizadas no ambiente

de desenvolvimento Matlab. Esta plataforma utilizada nos testes e simulações é citada em todo

o texto como "computador de testes".

2No Capítulo 3 é apresentada a propriedade force-closure de uma fixação, que define se uma fixação é satis-

fatória ou não.

1.4 Organização do texto 7

1.4 Organização do texto

Esta Dissertação está organizada na seguinte forma:

No Capítulo 2, são apresentados os principais trabalhos que propõem métodos de fixação

de objetos baseados em sua forma 2D e 3D. Para cada um dos métodos apresentados, as prin-

cipais características e resultados são apresentados e discutidos com a finalidade de comparar

os métodos da literatura e seus resultados com os métodos e resultados apresentados e obtidos

neste trabalho.

A fundamentação teórica sobre o tema principal, a fixação de objetos, é realizada no Capí-

tulo 3, com a apresentação do estado da arte da teoria fundamental da fixação.

O Capítulo 4 apresenta modificações na rede neural proposta por Chung et al. (1994), e

modificada por Araújo e Tanaka (1995), para o problema da aproximação poligonal de curvas

definidas em um plano. A rede neural proposta é utilizada na etapa de redução dos dados, que

representam a forma do objeto, nos sistemas de fixação 2D apresentados no Capítulo 5. Simula-

ções com curvas que definem objetos reais são apresentadas, e comparações quanto à qualidade

de aproximação e quanto ao tempo de processamento do algoritmo proposto com o algoritmo

original, e com outros algoritmos de aproximação poligonal, também são apresentadas.

No Capítulo 5, é estudado o problema de fixação 2D utilizando RNAs. O problema é

abordado para fixações por dois e três pontos de contato. Cada uma das etapas do planejador

da fixação 2D é detalhada. Resultados de simulações com imagens de objetos reais são apre-

sentadas para os diferentes métodos de determinação da fixação 2D. E ainda, simulações são

realizadas com uma base de 8100 objetos diferentes para verificar o desempenho das redes.

No Capítulo 6, é proposto um algoritmo para a simplicação de superfícies que representam

objetos 3D. O algoritmo é uma adaptação da rede competitiva de Hopfield para a aproximação

poligonal proposta no Capítulo 4. A simplificação é utilizada no algoritmo de fixação 3D para

reduzir os dados de representação das superfícies que definem objetos. Os resultados obtidos

na simplificação de superfícies são comparados quanto à qualidade da simplificação com ou-

tros algoritmos de simplificação de referência na literatura. Considerações sobre o tempo de

processamento também são apresentadas.

No Capítulo 7, a fixação 3D utilizando RNAs é estudada, e planejadores de fixação 3D

de objetos desconhecidos por dois e três pontos de contato são apresentados. Testes dos algo-

ritmos de fixação 3D são realizados com objetos provenientes de modelagem computacional.

Nos testes é utilizada uma base de 11700 objetos 3D abstratos, que foram obtidos por mode-

8 1 Introdução

lagem computacional. Os resultados obtidos mostram a capacidade de se determinar fixações

adequadas para objetos desconhecidos, e considerações sobre o tempo de processamento são

realizadas em relação às possíveis aplicações.

No Capítulo 8, é apresentado um algoritmo de auto-aprendizagem de fixações baseado nas

RNAs implementadas e simuladas nos Capítulos 5 e 7. Diferentes simulações com as bases

de objetos são realizadas a fim de verificar a capacidade de auto-aprendizagem. Os resulta-

dos obtidos apontam a capacidade das redes em melhorar seu desempenho pelo mecanismo de

aprendizagem proposto.

Por fim, no Capítulo 9 seguem as considerações finais do trabalho assim como várias pro-

postas para trabalhos futuros. Além disso, por motivos didáticos, algumas considerações e

propostas específicas do tema abordado são também realizadas ao final de cada Capítulo.

9

2 Revisão bibliográfica

2.1 Fixação de objetos desconhecidos por garras robóticas

A fixação de um objeto pode ser definida como a aplicação de forças de contato adequadas

que mantêm o objeto em equilíbrio estático, e também capazes de equilibrar carregamentos

externos. Para que uma fixação apresente as características descritas, as forças aplicadas pela

garra sobre o objeto devem estar localizadas em pontos estratégicos, os denominados pontos

de contato ou pontos de fixação. Estes pontos são determinados pelo planejador da fixação

a partir das características do objeto, do tipo de garra, do modelo do contato e dos possíveis

carregamentos externos.

Para os casos em que os objetos são previamente desconhecidos pelo sistema, é necessário

que o planejador reconheça o objeto através da interpretação dos dados obtidos pelos sensores

de visão. Os tipos de sensores utilizados determinam quais os objetos podem ser fixados e

quais as garras mais adequadas para a operação. Por exemplo, os planejadores que reconhecem

a forma do objeto a partir de uma única câmera são eficientes apenas para objetos planos (PE-

DRO; CAURIN, 2008). As informações obtidas por sistemas de visão 2D apresentam somente

informações sobre a seção predominante do objeto, desta forma, o sistema de fixação 2D está

limitado a fixar objetos cuja altura é expressamente menor que a sua seção predominante. De-

vido à limitação de objetos a serem fixados, imposta pelo sistema de visão, as garras mais

empregadas neste caso são as garras primitivas, as garras tipo pinça e castanha, sendo que a

utilização de garras de múltiplos dedos e múltiplos graus de liberdade não é recomendada, pois

a sua grande capacidade de movimentação fica subutilizada.

Para o caso de planejadores que utilizam sensores mais poderosos, como visão estereos-

cópica ou scanner 3D, a obtenção de informações sobre a geometria 3D da peça permite de-

terminar pontos de fixação mais adequados, ou até selecionar regiões de fixação como alças

e cabos, ou ainda determinar uma postura para a garra adequada para uma operação especí-

fica (CUTKOSKY, 1985). Por vezes, uma fixação, que foi determinada a partir dos dados

obtidos por um sistema de visão 3D, somente é executada com sucesso pelas garras mais com-

10 2 Revisão bibliográfica

plexas, pois em alguns casos, tal como aqueles em que os pontos selecionados não estão em

uma disposição geométrica trivial, a fixação pode apenas ser realizada pelas garras de maior

mobilidade.

Os planejadores de fixação podem então ser classificados em relação ao método de aquisi-

ção de dados da cena em duas classes: planejadores de fixação 2D e planejadores de fixação 3D.

O primeiro sistema determina os pontos de contato a partir da forma 2D do objeto, enquanto

que o segundo determina-os a partir da forma 3D. Na literatura, pode-se ainda encontrar dife-

rentes definições para fixação 2D e 3D determinadas pela ocorrência de carregamentos apenas

em um plano, e pela ocorrência de carregamentos no espaço respectivamente. Existem ainda

outros sistemas capazes de fixar objetos que utilizam sensores de força e de tato combinados

com sensores de visão (VISCHER, 1992; ALLEN et al., 1996; HAIDACHER, 2004), contudo,

no presente trabalho os estudos estão concentrados naqueles planejadores que utilizam apenas

informações obtidas pelos sensores de visão. Os principais planejadores de fixação 2D e 3D

propostos na literatura são apresentadas nas Seções 2.1.1 e 2.1.2, repectivamente.

2.1.1 Fixação 2D de objetos desconhecidos

A fixação 2D consiste em aplicar forças de contato, capazes de manter o objeto em equi-

líbrio e resistir a distúrbios, cujas posições de aplicação são determinadas a partir da sua forma

2D. A fixação apresenta basicamente três fases definidas: aquisição de dados da cena, proces-

samento dos dados, e planejamento e execução da fixação.

Nos trabalhos precursores de Hanafusa e Asada (1977) e Backer et al. (1985), as estapas

anteriores ao planejamento da fixação, responsáveis pela aquisição dos dados da cena e de

processamento dos dados para a definição da forma do objeto não foram consideradas. Contudo,

Sanz et al. (1998) e Morales et al. (2001) apresentam as câmeras como os sensores de aquisição

mais adequados para o caso. De fato, nos trabalhos citados nesta Seção, com exceção daqueles

que abstraem a informação, uma única câmera é utilizada como dispositivo de aquisição de

dados da cena.

A câmera pode ser móvel, normalmente localizada junto ao efetuador do braço robótico

(câmera de punho), ou estática em uma posição estratégica, normalmente no topo da cena

(câmera de topo). A utilização de uma câmera implica na necessidade de calibração do sis-

tema, e da transformação das coordenadas da imagem (posição dos pixels na imagem) para um

sistema de coordenadas conhecido pelo robô (sistema de coordenadas global para as câmeras

de topo, e sistema de coordenadas da ferramenta para as câmeras de punho).

2.1 Fixação de objetos desconhecidos por garras robóticas 11

A etapa de processamento dos dados consiste na aplicação, sobre a imagem da cena, de

técnicas de processamento de imagens. O processamento da imagem tem como objetivos bási-

cos a localização do objeto na cena, a determinação da sua forma, normalmente representada

pelo seu contorno, e a extração de algumas de suas características, tais como: área, centro ge-

ométrico, perímetro, momentos principais de inércia, esqueleto, entre outros. Em alguns casos

a forma ainda é simplificada, como em Boissonnat (1982), que simplifica o contorno do objeto

por cinco primitivas elementares, e em Backer et al. (1985), Valente (1999) , e Ballester (2003)

que simplificam o contorno do objeto por uma aproximação poligonal. O objetivo de simpli-

ficar a forma do objeto é, na maioria dos casos, reduzir o custo computacional e o tempo de

processamento das etapas posteriores de determinação dos pontos de contato.

A partir da forma do objeto, simplificada ou não, das suas outras características, das carac-

terísticas da garra considerada e do tipo de contato, pontos adequados para uma fixação devem

ser determinados pelo planejador da fixação 2D. Os principais algoritmos de fixação 2D são

apresentados nos próximos parágrafos, e são descritas: a etapa de processamento de imagens,

quando não abstraída, as características das garras e do contato, e o método de determinação

dos pontos1.

O trabalho realizado por Hanafusa e Asada (1977) é considerado por diversos autores como

o trabalho pioneiro na determinação de pontos de contato a partir da geometria do objeto. A

garra considerada possui três dedos elásticos compostos por molas, dispostos em um anel e

defasados de 120o entre si. Os dedos não apresentam movimentação lateral, a força aplicada é

controlada pela deformação da mola desconsiderando as forças de atrito. O objetivo é encontrar

uma posição no plano xy, e uma orientação θ entre a garra e o objeto, medida no mesmo plano,

em que a força aplicada por cada dedo sobre o objeto (medida pela deformação da mola) seja

mínima. Para tanto, uma busca composta de três etapas é realizada: na primeira etapa, o centro

da garra é posicionado sobre o centróide do objeto; na segunda, a orientação θ da garra é variada

até o ponto de menor deformação das molas; na terceira etapa, a posição da garra no plano xy

é variada mantendo θ constante até um novo ponto de mínima deformação. Como limitações

pode-se citar a ocorrência de escorregamento dos dedos sobre o objeto, pois o sistema não

considera o atrito e o ângulo entre as orientações dos dedos e as direções normais aos contatos,

e ainda segundo Backer et al. (1985), o sistema não é capaz de encontrar o mínimo global de

energia da fixação.

1Recomenda-se a leitura dos trabalhos completos para uma melhor compreensão dos mesmos.


(a) (b)

Figura 2.1: Esquemático da garra de Hanafusa e Asada (1977). A Figura 2.1(a) mostra os dedos

da garra dispostos sobre um anel a 120o entre si, e a Figura 2.1(b) representa a garra fixando

um objeto e as molas deformadas.

Backer et al. (1985) propõem modificações para o sistema de Hanafusa e Asada (1977) a

fim de ampliar a capacidade de fixação do sistema. Movimentos laterais são adicionados a dois

dedos da garra, o atrito é considerado no modelo do contato e um sistema de escolha da fixa-

ção baseado na geometria do objeto, ao contrário de uma busca, é proposto. A movimentação

lateral permite um ajuste adequado entre as posições dos dedos e as direções normais aos con-

tatos, e ainda evita a ocorrência de forças de atrito não desejadas que podem provocas possíveis

escorregamentos. Os pontos de contato são determinados pelo cruzamento entre o polígono que

representa o objeto e o maior circulo inscrito no mesmo (vide Figura 2.2(a)). É demonstrado

pelos autores que o novo sistema é capaz de determinar pontos de fixação mais estáveis que o

sistema anterior de Hanafusa e Asada (1977), contudo, o sistema apresenta falhas para objetos

côncavos, com rasgos ou com reentrâncias, pois os pontos selecionados nestes locais podem

não ser acessíveis para os dedos da garra.

Hanafusa e Asada (1977) utilizam um modelo simplificado de contato, em que a força é

realizada sobre um ponto do objeto e os efeitos de atrito são despresados. Backer et al. (1985)

consideram a ocorrência de forças de atrito no posicionamento dos dedos, o que possibilitou a

obtenção de melhores resultados. De fato, as forças de atrito evitam que os dedos escorreguem

sobre a superfície do objeto durante a fixação. Para tanto, a diferença angular entre a direção

de aplicação da força e a direção normal ao ponto de contato deve estar abaixo de um limiar

definido pelo coeficiente de atrito entre dedo e objeto. A região definida por este limiar é

denominada cone de atrito.

Salisbury (1982a) apresenta oito modelos diferentes de contato entre dedo e objeto, con-

tudo, os modelos podem ser resumidos em três tipos: ponto de contato sem atrito; ponto de


(a) (b)

Figura 2.2: Resultado do sistema proposto por Backer et al. (1985) para duas formas geométri-

cas. A Figura 2.2(a) mostra resultado satisfatório para uma forma qualquer, e Figura 2.2(b)

mostra um exemplo de falha, em que não é possível atingir o ponto vermelho.

contato com atrito; e contato macio (MURRAY et al., 1994). O modelo de ponto de contato

sem atrito permite apenas a aplicação de forças na direção normal ao ponto de contato. O mo-

delo de ponto de contato com atrito permite a aplicação de forças localizadas dentro do cone

de atrito. O modelo de contato macio permite a aplicação de forças localizadas dentro do cone

de atrito, e momentos de atrito, abaixo de um limiar, na mesma direção de aplicação da força

(mais detalhes na Seção 3.2.1).

O modelo de contato entre os dedos e o objeto é decisivo na escolha do tipo de garra a

ser utilizada e no desenvolvimento do algoritmo de determinação dos contados. Por exemplo,

quando se considera o modelo de contato pontual sem atrito, quatro contatos dispostos estrategi-

camente são necessários para imobilizar um objeto suscetível à movimentações no plano, e sete

contatos para movimentos no espaço (LAKSHMINARAYANA, 1978). Quando se considera o

modelo de contato com atrito, três pontos de contato são necessários para resistir a quaisquer

esforços no espaço, e quando se considera o modelo de contato macio, apenas dois pontos são

suficientes para resistir a esforços no espaço (NGUYEN, 1988).

Ainda sobre os trabalhos de Hanafusa e Asada (1977) e Backer et al. (1985), as forças

de contato são determinadas a partir da deformação das molas, e as forças de atrito em cada

contato, para o caso do segundo trabalho, podem ser determinadas analiticamente. Em outros

casos particulares, como o estudado por Abel et al. (1985), em que apenas a força gravitacional


atua sobre o objeto e as forças de contato e atrito são definidas no mesmo plano da gravidade,

é possível determinar as forças de atrito através de equações de equilíbrio estático do objeto.

Contudo, quando se considera modelos completos e todas as possibilidades de carregamen-

tos sobre o objeto, pode-se dizer que é impossível a determinação dos carregamentos de cada

contato (forças de atrito e momentos de atrito) a partir da resolução analítica das equações de

equilíbrio estático do objeto. Nestes casos, a fixação é determinada segundo diferentes critérios

de qualidade e de estabilidade (MURRAY et al., 1994).

Chen e Burdick (1992) utilizam o modelo de contato macio e apresentam um algoritmo

baseado em técnicas de otimização para determinar pontos de contato para garras de dois dedos.

Uma função custo classifica os pontos de fixação de acordo com as características geométricas

da fixação: distância entre pontos, ângulos entre a direção da normal ao ponto e da força, distân-

cia entre centróide e pontos de contato e distância entre linha de ação (definida pela semi-reta

ligando os pontos de contato) e centróide. Técnicas de otimização são utilizadas para encontrar

os pontos críticos da função custo que representam pontos adequados de fixação. Também se

destaca neste trabalho a utilização da forma do objeto simplificada. Nesta simplificação, seções

do contorno do objeto são representadas por polinômios do terceiro grau.

No trabalho realizado por Bendiksen e Hager (1994), uma garra de dedos paralelos é uti-

lizada para fixar objetos planos. Dados da cena são adquiridos por uma única câmera e a forma

do objeto é determinada pelo contorno extraído pelo sistema de processamento de imagens.

Para a determinação dos pontos de contato, uma busca heurística é realizada e cada configu-

ração é avaliada segundo um critério de estabiblidade. Um sistema mapeia os pontos de contato

para o sistema de coordenadas global e a fixação é executada. Dentre os 14 objetos utilizados

nos experimentos, 10 foram fixados com sucesso.

Similar aos trabalho de Chen e Burdick (1992) e Bendiksen e Hager (1994), pode-se tam-

bém citar outros trabalhos como o de Sanz et al. (1998) e Morales et al. (2006b), em que uma

função custo é relacionada à geometria da fixação, e técnicas de busca ou de otimização são

aplicadas a fim de se encontrar um fixação adequada. Estas técnicas de determinação de pontos

de contato requerem muito tempo e recursos computacionais de processamento. A redução do

número de dados para a busca, pela aplicação de técnicas de simplificação da forma do objeto,

reduz significativamente o tempo e os recursos de processamento, contudo, os sistemas ainda

eram para aplicações em robótica na época (XU et al., 1990).

Com o objetivo de melhorar a capacidade do planejador da fixação, Kamon et al. (1994)

utilizam informações de um banco de dados para determinar os pontos de contato. A partir de

uma imagem capturada por uma câmera de topo, algumas informações (ângulos entre dedos e


as normais ao contato, distância entre o centróide e a linha de ação e distância entre os pontos

de contato e o eixo de simetria) são extraídas e comparadas com as informações do banco de da-

dos, e uma primeira fixação é determinada e executada. A partir da imagem adquirida por uma

câmera lateral auxiliar, a fixação é avaliada segundo o comportamento do objeto, como rotação

ou escorregamento, provocado pela execução da fixação. Se a fixação for considerada satis-

fatória ou adequada, as informações são adicionadas ao banco de dados, caso contrário, novas

tentativas são realizadas até ocorrer uma fixação estável, cujas características são adiconadas ao

banco de dados.

O método de Kamon et al. (1994) é capaz de aprender novas fixações e apresenta resposta

rápida para fixação cujas características já foram adicionadas ao banco de dados. Porém, o

mecanismo de verificação da fixação para adição, ou não, ao banco de dados, torna o sistema

lento e inviável para aplicações que exigem rápido tempo de resposta.

Outra proposta interessante, capaz de aprender novas fixações, é apresentada por Xu et al.

(1990), em que é sugerida a utilização de redes neurais artificiais (RNAs) para a determinação

dos pontos de fixação. O trabalho sugere que, inicialmente, uma RNA de Hopfield (HOPFIELD,

1982) pode ser utilizada para determinar uma fixação estável. As RNA de Hopfield podem ser

utilizadas em processos de otimização e de busca, desde que sua função objetivo seja apro-

priada para o caso. Contudo, o valor de convergência da rede depende de uma inicialização

adequada (XU et al., 1990). Para tanto, sugere-se que uma RNA feedforward de múltiplas ca-

madas de neurônios (MLP - sigla do termo em inglês multilayer perceptron) seja utilizada na

etapa de inicialização. A rede MLP, previamente treinada com padrões geométricos, determina

uma inicialização adequada para a RNA de Hopfield que é responsável pelo refinamento da de-

terminação da fixação. O resultado obtido pela rede de Hopfield é comparado com o resultado

da rede MLP, e se os resultados apontarem que a inicialização não foi adequada, o objeto e sua

respectiva fixação são adicionados aos padrões para retreinamento da rede. O sistema de apren-

dizado supervisionado apresenta possibilidades de bons resultados, contudo o elevado tempo

de retreinamento da rede MLP2, impede a execução do aprendizado em tempo de execução

(aprendizado on-line), e ainda, não foi demonstrado nenhum resultado da proposta, sendo que

resultados foram apresentados apenas para as redes de Hopfield na determinação de fixações.

Ainda com relação às RNAs, destaca-se o trabalho realizado por Valente (1999). Assim

como no trabalho de Xu et al. (1990), duas RNAs distintas são utilizadas. A primeira rede

neural, de Hopfield, é responsável por simplificar a forma do objeto. A simplificação con-

2Atualmente, as redes MLP ainda apresentam elevados tempos de treinamento mesmo nos computadores de

maior velocidade de processamento. O tempo de treinamento varia de alguns minuto até horas, dependendo prin-

cipalmente do número de camadas e de neurônios.


siste em reduzir o contorno do objeto, que é extraído de uma imagem, para um polígono de

50 lados. A segunda rede, tipo feedforward, previamente treinada com 15 padrões geométri-

cos, recebe como entrada o polígono de aproximação e determina pontos de contato para garras

de três dedos sem movimentação lateral. Foi estudado o comportamento de redes MLP e de

função de base radial (RBF - sigla do termo em Inglês Radial bases function) na realização

da segunda etapa do processo, e os resultados obtidos mostram que ambas apresentam resul-

tados satisfatórios quanto à qualidade da fixação, contudo, na etapa de treinamento das redes

feedforward, realizada em etapas de pré-execução, as redes RBF apresentaram tempo de trei-

namento menores (segundos de treinamento para a rede RBF contra minutos para a rede MLP).

Uma das desvantagens do sistema proposto por Valente (1999) é o elevado tempo de execu-

ção da rede de aproximação poligonal, que pode chegar a minutos de processamento (PEDRO;

CAURIN, 2008). O tempo de treinamento da rede RBF possibilita a implementação de um sis-

tema de aprendizado em tempo de execução, contudo, o tempo de execução da rede de Hopfield

na etapa de aproximação poligonal, que leva cerca de minutos, impossibilita sua utilização em

sistemas de rápido processamento.

Dentre todos os trabalhos acima citados, muitos apresentam soluções satisfatórias quanto à

qualidade da fixação, porém, os tempos elevados de processamento, principalmente dos sistema

capazes de aprender novas fixações, não permitem que as soluções sejam utilizadas nos sistemas

robóticos de automação industrial ou de serviços, cujo tempo total de resposta deve ser rápido.

Na tentativa de reduzir o tempo de processamento, trabalhos recentes que utilizam técnicas

de rápido processamento têm sido desenvolvidos. Sanz et al. (1998), Morales et al. (2001),

Sanz et al. (2005) e Morales et al. (2006) propõem sistemas de fixação de objetos, previamente

desconhecidos pelo sistema, com reduzidos tempos de processamento, porém sem capacidade

de aprendizagem. Nestes sistemas, a extração das características do objeto é realizada por algo-

ritmos de rápido processamento (vide Sanz et al. (2005)) e regiões candidatas para fixação são

selecionadas a partir de uma aproximação da forma do objeto. Uma busca refinada é realizada

para determinar pontos de fixação para garras de dois e três dedos. Os sistemas são imple-

mentados com dispositivos simples e dedicados, a fim de levar tais tecnologias às indústrias.

O sistema proposto foi testado na indústria de alimentos onde a forma dos objetos apresenta

variações significativas. Bons resultados foram observados com tempos de processamento in-

feriores a 5s. Apesar do rápido tempo de processamento, estes sistemas não são capazes de

aprender novas fixações.


2.1.2 Fixação 3D de objetos desconhecidos

Para a determinação da fixação de objetos de geometria 3D complexa, a utilização de in-

formações sobre apenas uma seção, aquela obtida por um sistema de visão 2D, não é suficiente,

pois a seção representa apenas uma das vistas do objeto, e todo o restante da sua forma não é

considerada nos cálculos (HAUCK et al., 1999). Portanto, a fixação 2D é eficiente apenas para

uma classe de objetos, aqueles que apresentam uma seção predominante, e para fixar de forma

eficiente os objetos das demais classes, em que a geometria 3D é mais complexa, é necessário

utilizar informações sobre toda a superfície do objeto.

A consideração de todo o formato superficial do objeto na determinação de uma fixação

caracteriza a fixação 3D, que pode ser formalmente definida como a aplicação de forças sobre

um objeto por garras robóticas, sendo que tais forças são determinadas a partir da geometria 3D

do objeto. Na fixação 3D, assim como na fixação 2D, as forças devem ser capazes de manter

o objeto em equilíbrio estático e de resistir a qualquer carregamento externo aplicado sobre o

mesmo.

Quando a fixação 3D é comparada com a fixação 2D, a primeira diferença encontrada é

a forma de aquisição e de representação dos dados referentes ao formato do objeto. Na fixa-

ção 2D, o dispositivo utilizado na maioria dos casos é uma câmera, e logo, toda a informação

necessária para a determinação da fixação está contida em uma imagem. Existem algumas vari-

ações na maneira com que as características do objeto, necessárias para se determinar a fixação,

são extraídas das imagens, porém todas as variações podem ser classificadas como métodos de

processamento de imagens ou como métodos de extração de características de imagens.

Ainda quanto à determinação da fixação 2D, as principais diferenças entre os diversos méto-

dos de fixação estão concentradas na forma com que as informações extraídas das imagens são

trabalhadas a fim de se obter uma fixação adequada. Por outro lado, para o caso da fixação

3D, pode-se afirmar que existem diferentes possibilidades de determinação da forma do objeto,

e conseqüentemente, os métodos de determinação da fixação são especializados em função do

método de aquisição dos dados. Esta especialização é evidenciada a seguir juntamente com a

descrição dos trabalhos de destaque na fixação a partir da geometria 3D do objeto.

Uma das formas mais simples e diretas de se determinar pontos de fixação 3D é a extensão

dos resultados da fixação 2D para o caso 3D. Alguns trabalhos (BACKER et al., 1985; XU

et al., 1990) propõem que seus algoritmos para fixação 2D podem ser extendidos para o caso

3D. Backer et al. (1985) propõem que seu algoritmo de fixação 2D pode ser utilizado para

objetos com seção constante segundo uma altura conhecida. Xu et al. (1990) sugerem que seu


algoritmo baseado em RNAs de Hopfield pode ser aplicados para o caso 3D. No caso de Backer

et al. (1985), a estratégia de determinar uma fixação baseada nas informações da forma de

uma seção constante por toda uma altura também conhecida é denominada por alguns autores

como fixação 2,5D, que apresenta as mesmas desvantagens que a fixação 2D aplicada a objetos

complexos. No segundo caso, nenhum resultado experimental ou simulado é comentado ou

apresentado.

A estratégia de estender o algoritmo da fixação 2D para o caso 3D é adotada principalmente

na tentativa de solucionar os problemas relacionados à aquisição dos dados 3D da cena. Pode-

se dizer que uma das principais dificuldades encontradas para a determinação da fixação 3D

consiste na etapa de aquisição dos dados, pois, mesmo com o grande avanço desde a época dos

trabalhos de Backer et al. (1985) e Xu et al. (1990), os dispositivos atuais ainda apresentam

grandes erros e elevados tempos de aquisição (WANG et al., 2005; YAMAZAKI et al., 2006).

De fato, alguns trabalhos recentes (KRAGIC et al., 2001; LEE; LEE, 2003; BLEY et al., 2006)

dedicam-se à investigação e à proposição de sistemas de visão 3D com a finalidade de fornecer

ao planejador da fixação dados e informações sobre a geometria 3D do objeto com erros e tempo

de aquisição reduzidos.

Os sistemas de visão 3D desenvolvidos por Kragic et al. (2001), Lee e Lee (2003) e Bley et

al. (2006) atendem os requisitos de tempo de processamento e de precisão. Contudo, estes sis-

temas requerem elevados recursos computacionais, conforme é descrito pelos próprios autores,

fator que, conseqüentemente, eleva o custo destes sistemas, tornado-os proibitivos em alguns

casos em que se deseja baixo custo, em detrimento da capacidade do sistema.

Na busca de soluções de baixo custo para a fixação 3D, alguns trabalhos utilizam os resulta-

dos da fixação 2D para a determinação das coordenadas tridimensionais dos pontos de fixação.

Diferentemente das propostas de extenção da fixação 2D para o caso 3D, estas soluções con-

sistem na determinação de fixação 2D para uma série de imagens de um mesmo objeto, obtidas

a partir de diferentes posições. A partir dos pontos selecionados em cada uma das diferentes

imagens, algoritmos específicos de triangulação são aplicados a fim de se determinar as coor-

denadas espaciais daqueles pontos.

Taylor et al. (1994) descrevem e discutem as limitações da fixação 2D em relação a deter-

minação da direção normal aos pontos de contato. Segundo Taylor, a utilização de uma única

imagem possibilita apenas a determinação da direção normal aos pontos no plano da imagem,

pois a componente da normal na direção perpendicular à imagem não é considerada. Na tenta-

tiva de solucionar o problema, Taylor et al. (1994) propõem um sistema de mapeamento baseado

na movimentação de uma câmera de punho ao redor do objeto. A partir de uma imagem inicial,


uma fixação por dois pontos de contato é determinada. Um algoritmo de movimentação calcula

a próxima posição da câmera segundo o eixo formado pela semi-reta que une os dois pontos de

fixação. A cada nova posição, a nova imagem é analisada e a direção normal é atualizada. A

movimentação prossegue até que a verificação seja completada, realizando a fixação caso nen-

huma verificação aponte instabilidade, e interrompendo o processo ao encontrar uma situação

de instabilidade. Neste último caso, o processo é reiniciado com uma nova posição de aquisição

da primeira imagem.

No trabalho de Taylor et al. (1994), a superfície do objeto não é reconstruída, portanto,

novos dados são coletados a cada tentativa. O algoritmo é capaz de determinar pontos de con-

tato para garras de dois dedos para objetos de formato 3D complexo. Contudo, o processo de

verificação da fixação pela movimentação da câmera torna o processo demorado, e dependendo

da complexidade da forma do objeto, o processo pode ser repetido várias vezes até que uma

fixação estável seja encontrada.

Também utilizando diversas imagens consecutivas para a fixação 3D, destaca-se o trabalho

de Saxena et al. (2006), em que uma câmera movimenta-se ao redor do objeto, e dois pontos de

contato são determinados para o objeto em cada uma das imagens adquiridas. As coordenadas

3D dos pontos de contato são obtidas por triangulação dos pontos de contato das várias imagens.

Os pontos de fixação para cada imagem são determinados por uma busca heurística, e a principal

vantagem do método é a não necessidade de triangulação de todos os pontos do objeto ou de

reconstruir um modelo virtual do objeto.

Os pontos de contato de uma fixação 3D podem também ser obtidos a partir de imagens

de um sistema de visão estereoscópica (HAUCK et al., 1999). Neste caso, pontos de contato

são determinados para cada uma das duas imagens a partir de um algoritmo de fixação 2D.

Posteriormente, uma triangulação é executada com os pontos selecionados nas duas imagens

para se conhecer as coordenadas x, y e z dos pontos de contato.

A determinação das coordenadas tridimensionais dos pontos de contato a partir da triangu-

lação de resultados da fixação 2D para várias imagens é uma alternativa razoável para solucionar

o problema de aquisição da geometria 3D do objeto. Esta abordagem, é mais rápida em relação

aos tempos de aquisição e de processamento dos dados adquiridos, e os resultados obtidos são

melhores que aqueles da fixação 2D em relação aos objetos mais complexos. Contudo, a não

utilização da geometria 3D completa do objeto na determinação da fixação desclassifica estes

trabalhos como sistemas de fixação 3D, pois a forma de todo o objeto não é considerada, apenas

se consideram as informações geométricas locais na determinação da fixação.

Segundo a classificação adotada, a fixação 3D consiste na determinação de pontos de con-


tato a partir da geometria 3D do objeto. Para o caso dos trabalhos de Saxena et al. (2006) e

Hauck et al. (1999), as fixações determinadas em cada diferente imagem não consideram as

direções normais aos pontos do objeto no sentido perpendicular ao plano da imagem. Para o

caso do trabalho de Taylor et al. (1994), a direção normal é completamente verificada apenas

para pequenas regiões da superfície do obejto, sendo que o restante da mesma não é verificada.

Uma outra abordagem adotada pelos pesquisadores da área, com a finalidade de transpor

as dificuldades relacionadas à aquisição dos sistemas atuais de visão 3D, é a identificação dos

objetos na cena através de comparações das imagens do objeto com uma base de modelos

virtuais (MORALES et al., 2006; MILLER et al., 2003). Nesta abordagem as informações

contidas em uma base de dados são comparadas com a(s) imagem(s) do objeto a fim de se

determinar a posição e a orientação deste na cena. A fixação 3D é então determinada para o

modelo virtual que corresponde ao objeto. Esta estratégia também soluciona o problema da

presença de faces ocultas que ocorrem quando dados são coletados por um sensor de visão

3D estático, ou quando não é possível obter toda a superfície do objeto. Nestes casos, não

se conhece a geometria do objeto na região oculta, mas esta pode ser estimada pelos dados

auxiliares do modelo da base de dados relacionada.

A alternativa de se utilizar modelos virtuais apresenta a desvantagem de se trabalhar apenas

com os objetos cujos modelos já estão disponíveis, objetos previamente desconhecidos não são

fixados quando esta estratégia é adotada, pois não é possível selecionar um modelo correspon-

dente ao objeto e, conseqüentemente, não é possível determinar pontos de contato para o objeto

real. Para se fixar objetos cujos modelos não estão disponíveis na base de dados, é necessário

adquirir dados de todo o entorno do objeto, seja utilizando triangulação a partir de imagens

(YAMAZAKI et al., 2006), seja pela combinação de dados adquiridos por sensores de visão

3D em diferentes posições (ADE et al., 1994), ou seja, pela utilização de diferentes sensores

integrados (WANG et al., 2005).

Para a fixação de objetos de geometria 3D complexa e desconhecida, é necessário que

o sistema conheça toda a superfície do objeto, ou que a superfície conhecida seja suficiente

para se determinar uma fixação adequada. Os dispositivos atuais permitem que a informação

completa seja obtida, desde que diferentes aquisições sejam realizadas em posições estratégicas.

A aquisição de diferentes vistas do objeto pode ser realizada ao mesmo tempo por diferentes

dispositivos (ADE et al., 1994), a partir de movimentações de um único sensor ao redor do

objeto (YAMAZAKI et al., 2006), ou pela integração de diferentes sensores (WANG et al.,

2005). No primeiro e no terceiro caso, a desvantagem principal é o custo que é multiplicado

pelo número de sensores utilizados, e no segundo caso, a desvantagem é o tempo decorrido


para a movimentação do sensor para aquisição em cada diferente posição. E ainda, para os três

casos, é necessário manipular os dados para a correta construção do modelo virtual do objeto.

Devido às dificuldades e às desvantagens de se utilizar os atuais sensores de visão 3D,

alguns autores adotam a hipótese de que os dados da geometria 3D do objeto já foram obtidos

de alguma maneira e estão disponíveis para a determinação da fixação. A partir destas hipóteses

o problema é então abordado como um caso de fixação 3D, em que os pontos de contato são

definidos a partir da geometria 3D do objeto. A adoção de tal hipótese permite que algoritmos

e métodos para a fixação 3D sejam desenvolvidos antes mesmo de uma solução para aquisição

da superfície do objeto que atenda a todos os requisitos da fixação 3D.

Contudo, além das dificuldades de se trabalhar com os sensores de visão 3D, existe outro

fator problemático a ser considerado na fixação 3D: a consideração da terceira coordenada no

problema da fixação aumenta a complexibilidade, em relação à fixação 2D, da relação entre as

forças aplicadas nos pontos de contato e o equilíbrio estático do objeto.

Para o caso da fixação 2D, algumas simplificações e hipóteses permitem a solução analítica

das equações de equilíbrio da fixação (BACKER et al., 1985), e ainda, para os casos mais com-

plexos, as variáveis independentes das equações de equilíbrio que são relacionadas à geome-

tria de fixação podem ser resolvidas pela aplicação direta de técnicas de otimização (CHEN;

BURDICK, 1992) ou pela busca da configuração de melhor qualidade da fixação segundo uma

função custo estabelecida.

Para o caso da fixação 3D, a verificação da estabilidade da fixação, assim como a determi-

nação da qualidade da fixação, não é realizada de forma trivial como aquela realizada para o caso

2D, pois a consideração da terceira coordenada no problema aumenta o número de variáveis in-

depentendes e torna mais complexa a relação entre elas. Portanto, para o desemvolvimento

de algoritmos eficientes de fixação 3D, foi necessário o desenvolvimento de uma teoria capaz

de relacionar as forças aplicadas sobre o objeto e sua disposição geométrica com o equilíbrio

estático do objeto e a capacidade de resistir a esforços externos aplicados sobre o mesmo.

Considera-se na literatura que a teoria da fixação iniciou-se com Nguyen (1988), que propõe

a propriedade force-closure de uma fixação. Esta propriedade relaciona a geometria da fixação

com a sua capacidade de resistir a carregamentos externos. Nesta teoria, a capacidade da fixação

é determinada a partir da construção da envolvente convexa das possíveis forças aplicáveis

(cone de atrito) em cada ponto de contato. Segundo Nguyen (1988), se a envolvente convexa

dos cones de atrito contiver a origem do sistema na qual a mesma é desenhada, então a fixação

resiste a qualquer carregamento e é denominada force-closure. Destaca-se também o trabalho

de Ferrari e Canny (1992), que propõem uma normalização para o cálculo da qualidade de


uma fixação force-closure. Ferrari e Canny (1992) propõem duas diferentes métricas, Q1 e

Q∞ calculadas a partir da envolvente convexa, e que estimam a capacidade de uma fixação de

resistir a carregamentos externos. Outros trabalhos também foram fundamentais na elaboração

da teoria da fixação (MURRAY et al., 1994; PONCE et al., 1993; BORST et al., 1999; BICCHI;

KUMAR, 2001; MILLER; ALLEN, 1999), entre outros colaboradores. A teoria da fixação é

detalhada no Capítulo 3.

Atualmente, a teoria da fixação desenvolvida pelos autores supracitados é amplamente

aceita e utilizada pelos pesquisadores da área, de tal forma que programas específicos como

o GraspIt! (MILLER; ALLEN, 2004) foram implementados para serem utilizados como fer-

ramentas no desenvolvimento de planejadores de fixação e de manipulação em geral. Como

exemplo, o programa GraspIt! é capaz de verificar a estabilidade da fixação, estimar a sua qual-

idade, e ainda verificar colisões e corportamento dinâmico dos objetos e dos dedos da garras

em tarefas de manipulação. Quando integrados com outros sistemas, estes programas também

podem ser utilizados na determinação de fixações adequadas para objetos.

Desta maneira, a teoria da fixação desenvolvida e as considerações adequadas em relação

ao sistema de visão 3D possibilitam a proposição de planejadores de fixação 3D. Dentre os

trabalhos já citados neste texto, e dentre os demais existentes na literatura, destacam-se particu-

larmente os trabalhos de Ade et al. (1994), Fischer e Hirzinger (1997), Borst et al. (1999), Lee et

al. (2002), Miller et al. (2003), Wang et al. (2005), Damian et al. (2005), Morales et al. (2006b),

Yamazaki et al. (2006). Estes trabalhos são brevemente descritos a seguir focando em algumas

características como: garras utilizadas; método de aquisição dos dados do objeto; método de

determinação da qualidade da fixação; método de determinação dos pontos de contato.

Ade et al. (1994) discutem o tempo de processamento para a determinação de pontos de

contato a partir de dados tridimensionais da cena. Na tentativa de reduzir o tempo de aquisição

de dados e de ampliar a capacidade do sistema de sensoriamento, dois scanners 3D, opostos

entre si, são utilizados. As informações dos sensores são combinadas e faces opostas do objetos

são reconstruídas por polígonos. Cada par de polígonos, cada um constituído por polígonos de

uma das faces opostas, é candidato para a fixação. As possíveis fixações são avaliadas segundo

a distância entre si, o paralelismo entre as faces e a distância ao centróide do objeto. Resultados

satisfatórios são apresentados com tempo de processamento de 12s3 a 21s. O tempo obser-

vado no sistema de Ade et al. (1994) indica que sensores do tipo scanner 3D são compatíveis

com a aplicação. Contudo, simplificações de seções da superfície do objeto por polígonos são

necessárias para reduzir o tempo de processamento.

3Ade et al. (1994) não informam qual a configuração do computador utilizado para determinar os pontos de

fixação.


Borst et al. (1999) utilizam em seu trabalho modelos virtuais de objetos, ou seja, nenhum

sistema de visão é proposto ou utilizado. Para se determinar os pontos de fixação do objeto

para a garra DLR Hand, Figura 2.3, 100 diferentes fixações candidatas são geradas para cada

objeto. A geração de cada fixação inicia-se com a seleção aleatória de um ponto próximo ao

centróide do objeto, este ponto é o centro de um sistema de coordenadas. A orientação deste

sistema de coordenadas também é aleatória e o cruzamento do seu eixo x com a superfície do

objeto determina o primeiro ponto de fixação. O segundo e o terceiro ponto de fixação são

determinados pelo cruzamento de retas cujo ângulo com o eixo x é de 1200 e 240o (ângulos

medidos em um mesmo plano). Cada candidato da fixação é avaliado segundo o critério Q1

proposto por Ferrari e Canny (1992), que determina o menor carregamento externo necessário

para desestabilizar o objeto fixado, sendo que quanto maior o valor de Q1, cujo limite é a

unidade, melhor é a fixação. Filtros são aplicados para eliminar os candidatos cujos pontos

estão próximos aos planos de suporte do objeto, os pontos próximos às bordas, e os pontos que

não podem ser "atingidos" pelos dedos da garras. Tempos de processamento obtidos variam de

14s a 29s em um computador comum, e de 2s a 4s em um computador de oito núcleos4.

Figura 2.3: DLR Hand.

Miller et al. (2003) utilizam o sistema de visão proposto em Kragic et al. (2001), que pode

ser resumido como um sistema capaz de identificar, a partir de uma base de dados, contendo

formatos de objetos, e a partir das imagens de um sistema de visão estereoscópica, qual o

modelo que melhor representa o objeto da cena, qual a sua posição e qual a sua orientação. A

principal característica deste sistema é o processamento das informações em tempo real. Uma

vez que o objeto é identificado, uma simplificação é realizada. Nesta simplificação, a forma do

objeto é aproximada por formas primitivas, cubos, esferas, cones, etc. Esta forma simplificada

pode não ser uma aproximação otimizada, pois o objetivo é utilizá-la para determinar qual a

melhor postura da mão para a fixação. Quatro diferentes posturas da Barret Hand, Figura 2.4,

são utilizadas.

4Os computadores utilizados no trabalho de Borst et al. (1999) apresentavam processadores de 200MHz.


Figura 2.4: Barret Hand.

Uma vez definida a postura da garra mais adequada para a forma do objeto, candidatos da

fixação são gerados, e estes são constituídos de uma posição e orientação, em relação ao objeto,

para a fixação. Cada fixação candidata é avaliada em tempo de execução no programa de análise

de fixações GraspIt!, que fornece a medida Q1 da fixação. A melhor fixação dentre todas as

candidatas é selecionada. Simulações do algoritmo proposto são realizadas com objetos cujo

modelo virtual está disponível na base de dados. Resultados satisfatórios em relação à capaci-

dade de determinação de uma fixação estável foram alcançados, com tempo de processamento

variando de 10s a 480s, utilizando um computador comum com velocidade de processamento

de 1GHz.

Similar ao trabalho de Miller e Allen (1999), Morales et al. (2006b) também utilizam o sis-

tema de visão proposto por Kragic et al. (2001) e o programa GraspIt! para avaliar os candidatos

gerados por diferentes posições e trajetórias de execução da fixação. A principal diferença en-

tre os trabalhos, além do tipo da garra utilizada (que para este caso consiste em uma garra

antropomórfica, cuja postura pode apresentar cinco variações daquelas propostas por Cutkosky

(1985)), a etapa de determinação da fixação é realizada antes da execução do algoritmo. Ou

seja, uma vez que se sabe quais são os objetos a serem fixados, a fixação determinada também é

armazenada na base de dados juntamente com a forma do objeto. Desta maneira, ao identificar

o objeto, obtém-se a postura da mão e a melhor orientação e trajetória de fixação. Sobre os tem-

pos de processamento, uma vez que a identificação ocorre em tempo real, e a fixação de todos

objetos já foram previamente determinadas por uma avaliação exaustiva de todas as possíveis

possibilidades de fixação, a fixação é determinada em tempo real.

Os sistemas propostos por Miller et al. (2003) e Morales et al. (2006b) apresentam as limi-


Figura 2.5: Robô ARMAR, utilizado por Morales et al. (2006b).

tações de que não é possível determinar fixações e ,conseqüentemente, realizá-las para objetos

apresentados ao sistema pela primeira vez. Ou seja, os sistemas são capazes apenas de fixar

os objetos cujos modelos estão disponíveis na base de dados. Wang et al. (2005) propõem um

sistema diferente daqueles anteriores em que a forma do objeto, definida por uma nuvem de

pontos, é obtida por um sistema de visão multisensorial composto por um scanner 3D, um ge-

rador de linhas por feixes de luz, e duas câmeras. A nuvem de pontos é obtida em 3s e a malha

superficial do objeto é formada em menos de 2s. O modelo reconstruído do objeto é avaliado

para um simulador similar ao GraspIt!, porém mais enxuto, a fim de poupar recursos computa-

cionais. Vários candidatos de fixação (orientação e posição da garra na fixação ) são gerados e

avaliados, sendo que o melhor dentre eles é a fixação selecionada. O tempo de avaliação obser-

vado foi de 7s para um total de 33 candidatos. Testes com 110 objetos diferentes resultaram em

94% de fixações satisfatórias.

Yamazaki et al. (2006) também reconstroem o objeto a partir dos dados obtidos por um

sistema capaz de obter a forma do objeto por várias imagens adquiridas durante a movimen-

tação da câmera ao redor do mesmo. A partir da forma reconstruída, pontos de contato são

determinados por uma busca heurística utilizando uma função custo relacionada às carcterís-

ticas geométricas da fixação. O tempo de processamento e o desempenho do método não são

apresentados e discutidos pelo autor.

Na utilização de RNAs para a determinação de pontos de fixação 3D, destaca-se o trabalho


de Lee et al. (2002), no qual um sistema de visão estereoscópica é utilizado para capturar a

superfície do objeto, e uma RNA tipo MLP, previamente treinada como padrões geométricos,

para determinar três pontos de fixação do objeto. O treinamento prévio da rede é realizado com

14 formas geométricas e seus respectivos pontos de contato determinados por um algoritmo

genético. A utilização das RNAs permite a determinação de fixações adequadas para objetos

diferentes daqueles de treinamento, contudo, esta capacidade não é explorada pelo autor, sendo

que apenas um resultado para objetos diferentes daqueles de treinamento é apresentado.

27

3 Teoria fundamental da fixação

A teoria da fixação estuda o mecanismo de interação entre manipuladores e objetos através

de contatos mecânicos realizados por garras robóticas. O propósito deste Capítulo é estudar

o mecanismo destas interações na fixação. As teorias e os conceitos envolvidos na fixação de

objetos, ou seja, os modelos de contato, as forças de contato e seus efeitos sobre os objetos,

as condições para equilíbrio estático, e os métodos de avaliação da qualidade da fixação são

brevemente explanados. Para uma maior compreensão da teoria da fixação de objetos por garras

robóticas recomenda-se a leitura de Bicchi e Kumar (2001), Mason (2001), Murray et al. (1994),

Nguyen (1988) e Craig (2005), trabalhos nos quais este texto foi parcialmente inspirado.

3.1 Movimentação e carregamentos de corpos rígidos

Nesta Seção, é introduzida a teoria de movimentação de corpos rígidos, translação e ro-

tação na representação de transformação homogênea, e a teoria de carregamentos equivalentes

quando forças são aplicadas em diferentes pontos de contato sobre um objeto. As teorias da

movimentação de corpos rígidos e das transformações homogêneas são apresentadas por mo-

tivos didáticos para compreenção da formulação dos carregamentos equivalentes.

3.1.1 Movimentação em R3 e transformações homogêneas

A movimentação de partículas no espaço Euclidiano pode ser descrita pela sua posição,

relativa a um sistema de coordenadas cartesianas inercial, em cada instante t do movimento.

O percurso de uma partícula p durante uma movimentação é caracterizado por uma curva de

pontos no espaço, definida em um sistema de coordenadas inercial I, rip(t) ∈ R

3. Cada coorde-

nada x,y e z de rip(t) determina a projeção da posição da partícula p no espaço sobre o sistema

inercial em cada instante de tempo.

28 3 Teoria fundamental da fixação

Na robótica, em especial, o interesse é a movimentação de um conjunto de partículas que

formam um corpo rígido. Um corpo rígido é então definido como um conjunto de pontos, ou

partículas, cujas distâncias entre si são invariantes no tempo e no espaço. Desta forma, se p e q

são dois pontos quaisquer do corpo rígido, então:

‖rip(t)− ri

q(t)‖ = ‖rip(t0)− ri

q(t0)‖ = constante. (3.1)

Define-se como "movimentação rígida" de um corpo rígido, doravante mencionado como

um objeto, aquela que é contínua no tempo e cujas distâncias entre pontos de um mesmo corpo

são mantidas constantes, logo a movimentação de um corpo rígido composta por translação e

rotação é uma movimentação rígida.

Dado um objeto rígido, representado por um sistema de coordenadas O ∈ R3 fixo ao

mesmo1, uma movimentação rígida é representada por um mapeamento ioT (t), que descreve

a posição e a orientação de O em relação a I em cada instante de tempo t. A movimen-

tação do corpo rígido também pode ser extendida para o movimento de vetores no espaço.

Se ropq = ro

q − rop é o vetor posição do ponto p ao ponto q descrito no sistema O, então a movi-

mentação do vetor no espaço é dado por:

ioT (t) · ro

pq =io T (t) · ro

q −io T (t) · ro

p. (3.2)

Uma propriedade interessante é que, além de manter a distância entre pontos, a movimen-

tação também mantém a posição relativa entre vetores. Dados dois vetores posição rop e ro

q

quaisquer, então:

ioT (t) · (ro

p × roq) =i

o T (t) · rop × i

oT (t) · roq. (3.3)

Desta maneira, as propriedades da movimentação de corpos rígidos permitem que a posição

e a orientação no espaço sejam definidas por um sistema de coordenadas ortonormal fixo a um

ponto do corpo rígido, pois a Equação 3.3 garante que o sistema não é alterado por qualquer

movimentação rígida.

A movimentação rígida pode ser definida como uma combinação de uma rotação pura e

uma translação pura.

1O centro do sistema de coordenadas é representado com a letra que o representa na sua foma minúscula, assim,

o centro do sistema de coordenadas O é o ponto o.

3.1 Movimentação e carregamentos de corpos rígidos 29

Definidos o sistema de coordenadas ortonormal O fixo ao corpo, e um sistema de coorde-

nadas inercial I, define-se a matriz:

IoR = [ioRx

ioRy

ioRz], (3.4)

como a matriz de rotação pura de I para O. Os vetores IoRx, I

oRy e IoRz ∈ R

3 são as projeções dos

eixos x, y e z do sistema O sobre o sistema I, respectivamente.

Sejam R ∈ Rn×n e ri,com i = 1 . . .n ∈ R

n as colunas de uma matriz de rotação qualquer R,

então:

1. rTi · r j =

{0 se i �= j

1 se i = j

2. R ·RT = RT ·R = I e R−1 = RT

3. det(R) = 1

As transformações no espaço que apresentam as características acima formam o grupo de

rotação SO(n):

SO(n) = {R ∈ Rn×n | R ·RT = 1 e det(R) = 1}. (3.5)

O grupo de rotação SO(n) é formado por todas as n possíveis orientações relativas que um

sistema pode apresentar em relação a outro. As possibilidades de orientação relativa podem ser

reduzidas caso haja alguma restrição de movimentação2.

A rotação R ∈ SO(n) é uma movimetação rígida que mantém as relações 3.1 e 3.3. Além

disso, o produto entre duas matrizes ioR e o

cR∈ SO(n) resulta em uma matriz também pertencente

a SO(n) segundo a relação:

ioR ·oc R =i

c R. (3.6)

A rotação rígida de um corpo é compreendida como apenas um caso particular de uma

movimentação. Uma movimentação geral, é então definida como composição de uma rotação

e de uma translação. Seja o sistema O fixo ao corpo e um sistema inercial I, rio ∈ R

3 é o vetor

posição da origem do sistema O descrito no sistema I, e ainda, ioR é a orientação do sistema O

relativo ao sistema I. Então, dado um vetor posição roq descrito no sistema O, então o mesmo

vetor pode ser descrito no sistema I, ou seja riq, é dado por:

riq = ri

o +io R · ro

q. (3.7)

2A restrição pode ocorrer por diversos fatores, como colisão com outros corpos rígidos presentes no mesmo

espaço.


As transformações de rotação e de translação possuem as características de movimentação

rígida apresentadas anteriormente, e de forma geral, são representadas por diversos autores por

uma matriz de transformação homogênea:

ioT =

[ioR ri

o

0 1

]. (3.8)

Desta maneira, uma movimentação qualquer de um corpo rígido no espaço Euclidiano é

representada por:

ioT (t) =

[ioR(t) ri

o(t)

0 1

]. (3.9)

A matriz ioT (t) é definida como transformação homogênea, e apresenta valores diferentes

em cada instante t. Quando se considera apenas as posições e as orientações relativas entre

dois sistemas, omite-se o termo (t). De forma geral o grupo de transformações homogêneas é

formado por:

SE(n) = {(p,R) : p ∈ Rn,R ∈ SO(n)} = R

n ×SO(n). (3.10)

Para o espaço Euclidiano SE(3) = R3 × SO(3) e a transformação consecutiva de dois sis-

temas de coordenadas é determinada por:

icT =i

o T ·oc T =

[ioR ·oc R i

oR · roc + ri

o

0 1

]. (3.11)

As transformações homogêneas são úteis na determinação de posições dos elementos de

sistemas multicorpos de cadeia aberta ou fechada. Para cada corpo, um sistema de coordenadas

é associado, e a partir de transformações homogêneas é possível determinar as posições de

cada corpo em um sistema de coordenadas global. Para um determinado sistema multicorpo, as

transformações homogêneas são determinadas a partir das relações geométricas, como ângulos

e posições relativas entre os corpos (vide Craig (2005) e Denavit e Hartemberg (1955)).

3.1.2 Velocidade em R6 de um corpo rígido

O conjunto de transformações homegêneas ioT (t) que definem a posição e a orientação do

sistema O, solidário a um corpo rígido, em relação as sistema inercial I em cada instante de

tempo t, define uma trajetória ψ io do corpo rígido. A trajetória ψ i

o do corpo rígido define a

posição e a orientação, e a sua derivada no tempo, ψ io, define a velocidade de translação e de

rotação do corpo rígido em cada instante de tempo e posição no espaço.


A descrição da velocidade de translação e de rotação de um corpo rígido, segundo uma

trajetória ψ io, não é trivial como para o caso de uma única partícula q cuja posição é representada

pelo vetor riq, em que vi

q = ddt ri

q(t). Neste caso, deve-se considerar os efeitos da movimentação

combinada de translação e rotação.

Primeiramente, considera-se o caso de uma rotação pura em R3 descrita no tempo, e repre-

sentado por ioR(t) ∈ SO(3). O sistema de coordenadas I é o sistema inercial e O é o sistema fixo

ao corpo. Se q é um ponto fixo ao corpo então:

riq(t) =i

o R(t) · roq, (3.12)

e sua velocidade é dada por:

viq(t) =

ddt

riq(t) =i

o R(t) · roq. (3.13)

Desta forma, ioR(t) relaciona a velocidade de um ponto em I com sua posição em O no

tempo.

Pode-se ainda reescrever a Equação 3.13 na seguinte forma:

viq(t) =i

o R(t) · ioR−1(t) · i

oR(t) · roq. (3.14)

Murray et al. (1994) define a velocidade angular instantânea, ω , como:

ω io/i =i

o R(t) · ioR−1(t), (3.15)

que corresponde à velocidade angular instantânea do objeto, representado pelo sistema de co-

ordenadas O, em relação ao sistema I. A velocidade angular relativa está descrita no sistema

I.

O operador ˆ , lê-se operador chapéu, é definido da seguinte forma: se ω = [ωx ωy ωz]T

então:

ω =

⎡⎢⎢⎣

0 −ωz ωy

ωz 0 −ωx

−ωy ωx 0

⎤⎥⎥⎦ . (3.16)

De forma similar, a velocidade angular instantânea do corpo em relação ao sistema I e

descrita no sistema O sistema O é definida como:

ωoo/i =i

o R−1(t) · ioR(t). (3.17)


As Equações 3.15 e 3.17 estão relacionadas da seguinte forma:

ωoo/i =i

o R−1 · ω io/i · i

oR, (3.18)

ou

ωoo/i =i

o R−1 ·ω io/i. (3.19)

Retornando à Equação 3.13, a velocidade do ponto q pode ser então representada no sistema

I por:

viq(t) = ω i

o/i(t) ·io R(t) · roq = ω i

o/i(t)× riq(t), (3.20)

ou ainda, pode-se representar a velocidade do ponto q no sistema O pela relação:

voq(t) =i

o RT (t) · vqi(t) = ωo

o/i(t)× roq. (3.21)

As Equações 3.20 e 3.21 descrevem as velocidades de translação de todas as partículas de

um corpo rígido em termos da velocidade angular espacial ω io/i(t), e da velocidade angular do

corpo ωoo/i(t) respectivamente.

Considerando agora uma movimentação geral ioT (t) ∈ SE(3), composta por uma rotação

ioR ∈ SO(3), e translação ri

o ∈ R3. De forma análoga ao caso de rotação pura pode-se escrever:

ioT · i

oT−1 =

[ioR ro

i

0 1

]·[

ioRT −i

oRT · rio

0 1

], (3.22)

e então:

V io/i =i

o T · ioT−1, (3.23)

e

V io/i =

⎡⎣ vi

o/i

ω io/i

⎤⎦ =

[−i

oR · ioRT · ri

o + roi

(ioR · i

oRT )ˇ

], (3.24)

em que ˇ é o operador inverso de ˆ, ou seja, (x) ˇ = x, e vio/i é a velocidade de translação relativa

entre as origens dos sistemas O e I, medida no sistema I.

O termo V io/i é denominado velocidade espacial e pode ser usado para encontrar a veloci-

dade de um ponto q, fixo ao corpo, em relação ao sistema I.

viq(t) =i

o T (t) · roq =i

o T (t) · ioT−1(t) · ri

q(t) (3.25)

e então:

viq(t) = V i

o(t) · riq(t) = ω i

o/i(t)× riq(t)+ vi

o/i(t). (3.26)


A componente linear vio/i(t) da Equação 3.26, não é a velocidade da origem do sistema O

descrita em I conforme a intuição sugere, mas sim a velocidade, medida no sistema I, do ponto

virtual fixo ao sistema do corpo O, que no instante t passa pela origem de I.

Também é possível determinar a velocidade do corpo rígido em relação ao sistema O (ins-

tantâneo). O termo relativo ao tempo "(t)" é omitido das próximas equações para melhorar a

visualisação.

V oo/i =i

o T−1 · ioT =

[ioRT i

oR · rio

0 0

], (3.27)

e

V oo/i =

⎡⎣ vo

o/i

ωoo/i

⎤⎦ =

[ioRT · ri

o

(ioRT · i

oR)ˇ

]. (3.28)

E a velocidade de um ponto q no sistema O é dada por:

voq = V o

o/i · roq, (3.29)

ou ainda:

voq = ωo

o/i × roq + vo

o/i, (3.30)

em que voo/i é a velocidade relativa entre a origem de I e de O, descrito no sistema O, e ωo

o/i é a

velocidade angular relativa entre I e O, também descrita no sistema O.

A velocidade de um corpo rígido descrito no sistema de coordenadas do corpo O e no

sistema de coordenadas inercial I é relacionada segundo a expressão:

V io/i =i

o T ·V oo/i · i

oT−1. (3.31)

Pode-se escrever também que:

ω io/i =i

o R ·ωoo/i (3.32)

e

vio/i = −ω i

o/i × rio + ri

o = rio × (i

oR ·ωoo/i)+i

o R · voo/i. (3.33)

Reescrevendo 3.32 e 3.33 na forma matricial, obtém-se a expressão:

V io/i =

⎡⎣ vi

o/i

ω io/i

⎤⎦ =

[ioR ri

o · ioR

0 ioR

]·⎡⎣ vo

o/i

ωoo/i

⎤⎦ (3.34)


A matriz 6× 6 da Equação 3.34 é denominada matriz adjunta associada a uma transfor-

mação homogênia T , e escrita na forma AdT . Desta maneira, dado T ∈ SE(3) então

AdT =

[R r ·R0 R

]. (3.35)

De forma geral, a matriz AdT mapeia as velocidades e rotações de um corpo do sistema de

coordenadas fixo ao mesmo, para um sistema de referência inercial.

A matriz Adg também é invertível segundo a relação:

(AdT )−1 =

[RT −(RT · r)ˇ ·RT

0 RT

]=

[RT −RT · r0 RT

]= Ad(T )−1. (3.36)

A matriz adjunta e sua inversa são utilizadas nos cálculos dos carragamentos equivalentes

na próxima Seção.

3.1.3 Carregamentos e carregamentos equivalentes

Um carregamento generalizado, seja o carregamento da fixação ou seja um carregamento

externo, atuando em um corpo rígido consiste em uma componente puramente linear e uma

componente puramente torcional atuando em um ponto. Pode-se representar este carregamento

generalizado como um vetor em R6:

F =

[f

τ

]em que : f ∈ R

3, e τ ∈ R3. (3.37)

ou na forma expandida:

F =[

f1 f2 f3 τ4 τ5 τ6

]T(3.38)

Os valores do carregamento aplicado em um ponto do corpo rígido, ou seja, os valores de

F , dependem do sistema de coordenadas no qual esta escrito. Se O é o sistema de coordenadas

do objeto, então considera-se a notação Fo = [( f o)T (τo)T ]T .

Quando os carregamentos são combinados com movimentações infinitesimais, obtém-se

o trabalho instantâneo realizado. Considerando a movimentação de um corpo rígido parame-

trizado por ioT (t) (Equação 3.9), definido na Seção 3.1.1, e considerando ainda I o sistema de

coordenadas inercial e O o sistema de coordenadas fixo ao objeto, a representação da velocidade

instantânea do corpo rígido é dada por V oo/i, e Fo representa o carregamento aplicado. As repre-

sentações são referentes ao sistema de coordenadas O e seu produto escalar fornece o trabalho


infinitesimal:

δW = V oo/i · (Fo)T = (vo

o/i · ( f o)T +woo/i · (τo)T ). (3.39)

O trabalho realizado pelo carregamento Fo na movimentação V oo/i, durante o intervalo de

tempo [t1, t2], é dado por:

W =∫ t2

t1V o

o/i · (Fo)T dt (3.40)

Dois carregamentos são denominados equivalentes se ambos produzem o mesmo traba-

lho para qualquer possível movimentação do corpo. Carregamentos equivalentes podem ser

utilizados para reescrever carregamentos em diferentes sistemas de coordenadas. Por exemplo:

deseja-se reescrever o carregamento Fo, aplicado na origem do sistema de coordenadas O, como

um carregamento equivalente aplicado na origem do sistema de coordenadas C. Para computar

o carregamento equivalente uiliza-se o trabalho instantâneo realizado pelo carregamento em

uma movimentação arbitrária. Sendo ocT a configuração do sistema C relativo ao sistema O, e

igualando os trabalhos instantâneos realizados por Fc e Fo na mesma movimentação arbitrária,

obtem-se:

V oi/c ·Fc = V o

o/i ·Fo, (3.41)

V oi/c · (Fc)T = V o

i/c · (AdocT )T ·Fo, (3.42)

cancelando V oi/c obtém-se:

Fc = (AdocT )T ·Fo. (3.43)

A Equação 3.43 transforma um carregamento aplicado na origem do sistema O em um

carregamento equivalente aplicado na origem do sistema C. Expandindo a Equação 3.43 obtém-

se: [f c

τc

]=

[ocRT 0

−ocRT · ro

cocRT

]·[

f o

τo

], (3.44)

em que: [ocRT 0

−ocRT · ro

cocRT

]= (Ado

cT )T . (3.45)

A transformação adjunta transposta rotaciona os momentos e as forças aplicadas do sistema

O para o sistema C e inclui momentos adicionais na forma −roc × f o, que é o momento gerado

pela força f o em uma distância roc .


Se diversos carregamentos são aplicados em diferentes pontos de contato sobre um corpo

rígido, então um carregamento equivalente, aplicado sobre o corpo rígido, pode ser determi-

nado somando cada um dos diferentes carregamentos representados em um mesmo sistema de

coordenadas. Desta forma, dado um conjunto de carregamentos Fci, i = 1, . . . ,n, aplicados

em diferentes sistemas de coordenadas dos contatos Ci, o carregamento da fixação escrito no

sistema de coordenadas do objeto é dado por:

Fo =n

∑i=1

(Adcio T )T ·Fci. (3.46)

Da mesma forma, o carregamento da fixação pode se representado em qualquer sistema de

coordenadas, sejam estes pertencentes ao corpo rígido ou sejam estes fora do corpo rígido. O

carregamento da fixação resultantes dos diversos carregamentos aplicados em um corpo rígido

pode ser utilizado para calcular o efeito de diversas forças aplicadas por garras robóticas com

múltiplos dedos sobre um objeto durante uma tarefa de fixação.

Por fim, para melhor entendimento, os carregamentos que podem ser aplicados sobre um

objeto são listados:

• Carregamento do contato: é aquele aplicado pela ponta do dedo de uma garra sobre o

objeto. Este carregamento normalmente é descrito no sistema de coordenadas do próprio

contato.

• Carregamento da fixação: é obtido pelo somatório dos carregamentos dos contatos.

Normalmente este carregamento é descrito no sistema de coordenadas do objeto ou da

fixação.

• Carregamento externo: este carregamento pode ser aquele necessário para a realiza-

ção de um tarefa específica, ou pode ser formado por distúrbios externos, normalmente

indesejados e imprevisíveis. O carregamento externo também pode ser composto pelo

carregamento de uma tarefa específica e por distúrbios.

3.2 Estática da fixação 37

3.2 Estática da fixação

A fixação é a aplicação de carregamentos de contato (forças e momentos) em pontos sobre

a superfície do objeto capazes de mantê-lo em equilíbrio estático e de resistir a carregamen-

tos externos3 aplicados sobre o objeto. As forças e momentos aplicados pelos dedos de uma

garra são transmitidos para o objeto a partir do contato entre a superfície dos corpos. Existem

vários modelos de contato, sendo que cada tipo modela diferentes capacidades de transmissão

de carregamentos. Os tipos de contato, representados por modelos apropriados, caracterizam as

condições para equilíbrio estático de um objeto durante uma fixação.

3.2.1 Modelos de contato

Um objeto, tratado como corpo rígido, livre no espaço, apresenta seis graus de liberdade

(GDL) de movimentação, ou seja, seis parâmetros independentes são necessários para definir

sua posição e sua orientação relativa a um sistema de referência inercial. Se o objeto entra em

contato com outro corpo (uma mesa por exemplo), restrições de movimentação são impostas

ao objeto que perde alguns dos seis GDL de movimentação (no caso da mesa, o objeto perde

a capacidade de translação na vertical e rotação nas direções paralelas à mesa). As restrições

impostas pelo contato entre corpos depende da natureza do contato entre eles.

Em Salisbury (1982a), um Capítulo completo é dedicado para descrever os modelos de

contato e seus efeitos na movimentação de objetos. São descritos oito tipos de contato entre

corpos, sendo que cada um impõe uma restrição diferente, desde o contato sem restrição até o

contato com restrição total dos seis GDL4.

Os oito tipos de contato de Salisbury (1982a) indicam como objetos interagem entre si de

uma forma geral. Contudo, para o caso particular de contato entre dedos de uma garra e objetos

em uma fixação, o contato pode ser resumido por três modelos simplificados (NGUYEN, 1988),

sendo eles:

Contato pontual sem atrito O contato ocorre em apenas um ponto do objeto. Forças de atrito

não estão presentes e a força aplicada no contato ocorre somente na direção normal à

superfície do objeto. Qualquer força com componente na direção tangencial ao contato

provoca escorregamento entre dedo e objeto.

3Os carregamentos externos podem ser carregamento característicos de uma aplicação, que normalmente po-

dem ser estimados e previstos, ou ainda, os carregamentos externos podem ser distúrbios, que normalmente não

podem ser previstos.4Vide Salisbury (1982a) para mais detalhes.


Contato pontual com atrito O contato ocorre em apenas um ponto. Forças de atrito estão

presentes, e portanto, a força de contato pode ser composta por uma componente normal

e uma componente tangencial ao contato, sendo que a relação entre as componentes deve

obedecer os limites de atrito para que não haja escorregamento.

Contato macio O contato é realizado em uma área de contato que surge pela deformação do

dedo, provocada pelo carregamento do contato, pois o objeto é considerado um corpo

rígido e não se deforma. O atrito entre as superfícies de contato permite que um mo-

mento de atrito seja aplicado na direção normal à área de contato, além da força com

componentes normal e tangencial.

(a) (b) (c)

Figura 3.1: Possíveis carregamentos para os três tipos fundamentais de contato propostos por

Nguyen (1988). Figura 3.1(a) contato pontual sem atrito, Figura 3.1(b) contato pontual com

atrito e Figura 3.1(c) contato macio.

Segundo Nguyen (1988), todos os demais modelos de contato (incluindo os modelos de

Salisbury (1982a)) podem ser construídos pela combinação entre os três modelos fundamentais

que são diferentes entre si pela ocorrência e pela natureza do atrito.

O modelo de contato pontual sem atrito não permite a aplicação de forças com componentes

na direção tangencial, pois estas forças provocariam escorregamentos devido a ausência do

atrito. Este tipo de contato é interessante em análises de fixação form-closure (descrita nas

próximas Seções). Contudo, a restrição da direção de aplicação da força dificulta a seleção de

pontos de contato, pois deve ser levado em consideração a capacidade da garra em posicionar

as pontas de seus dedos (os efetuadores) em cada contato, segundo a direção normal.

O modelo de contato pontual com atrito permite a aplicação de forças com componentes

tangenciais e normais. A componente tangencial da força é equilibrada por uma força de atrito.

O modelo de atrito adotado neste trabalho é o modelo de atrito de Coulomb, pois, dentre os

diversos modelos sofisticados, mais completos e apurados existentes na literatura, este é o que

representa o atrito de forma simples e satisfatória.


Segundo a lei de Coulomb as forças máximas para o atrito são determinadas pela equação:

f j max = μest · f3 e ainda f j ≤ μest · f3 (3.47)

em que μest é o coeficiente de atrito estático, e j = 1,2 é o índice que indica as duas possíveis

direções perpendiculares de decomposição da força de atrito. Em geral, o coeficiente de atrito

estático é maior que o coeficiente de atrito dinâmico. Segundo a lei de Coulomb, o coeficiente

de atrito depende do material do objeto e da superfície, sendo então independente da forma da

superfície e da área de contato. Como nesta abordagem não são considerados os efeitos do atrito

dinâmico, o coeficiente estático é representado na forma simplificada μ .

Um bom experimento para a determinação do coeficiente de atrito é a experiência do bloco

escorregando sobre uma rampa inclinada. Um bloco é posicionado sobre uma rampa com in-

clinação variável. A rampa, inicialmente na horizontal, é inclinada progressivamente até que o

bloco atinja o limite do escorregamento. O valor do ângulo limite de inclinação da rampa, o

ângulo α , está relacionado com o valor do coeficiente de atrito pela equação:

tan(α) = μ. (3.48)

Para o caso particular da fixação, o ângulo α é a máxima diferança angular, entre a direção

de aplicação da força pelo dedo da garra e a direção normal da superfície, para que não ocorra

escorregamentos. A região compreendida pelo ângulo limite α é denominada cone de atrito

(vide Figuras 3.1(b) e 3.1(c)).

Caso a força de contato esteja compreendida dentro do cone de atrito, o contato pode ser

realizado, caso contrário, a fixação não pode ser relizada, pois, ocorrerá escorregamento entre

o dedo da garra e o objeto.

O modelo mais completo, o contato macio, considera a ocorrência de deformação da ponta

do dedo da garra durante o contato e a formação de uma área de contato. Cada elemento

infinitesimal da área de contato é capaz de realizar uma força de atrito infinitesimal. Quando as

diversas forças infinitesimais são somadas, gera-se um momento de atrito (vide Figura 3.1(c)).

Segundo Higdon et al. (1984), o momento de atrito é desenvolvido como resultado de uma

força normal f3 exercida por uma área sobre outra. O momento binário τ6 necessário para pro-

duzir uma rotação depende da força normal f3, do coeficiente de atrito de Coulomb, e da dis-

tribuição da pressão normal sobre a área de contato. Neste trabalho, considera-se que a pressão

é distribuída uniformemente sobre a área de contato, embora a elasticidade e a irregularidade

da superfície do objeto normalmente alterem-na.


A força normal por unidade de área é igual à pressão do contato P, e a força normal sobre

o elemento de área é igual ao produto da pressão unitária e do elemento de área, então:

dP =f3

AdA, (3.49)

considerando circular a área de contato, e transformando a área infinitesimal em coordenadas

polares, pode-se obter a seguinte relação:

dP =f3

π · r2drdθ . (3.50)

A força infinitesimal de atrito, d fa, quando o movimento é eminente, é igual à pressão

multiplicada pelo coeficiente de atrito estático:

d fa = μdP = μf3

π · r2drdθ . (3.51)

O momento de atrito τ6 sobre o elemento de área em relação à linha central do eixo é dado

por:

dτ6 = rd fa = μf3

π · rdrdθ , (3.52)

e então:

τ6 = μ∫ D

2

0

∫ 2π

0

f3

π · rdrdθ . (3.53)

Para área de contato circular a expressão 3.53 pode ser simplificada por:

τ6 =1

3μ f3D. (3.54)

A aproximação da área de contato por uma área circular é conveniente para simplificação

dos cálculos e estimação dos momentos de atrito, contudo, na prática a área de contato pode

apresentar as mais variadas formas e os momentos de atrito devem ser calculados pela equação:

τ6 = γ f3, (3.55)

em que γ é o coeficiente do momento de atrito estático, que relaciona a área de contato e o

coeficiente μ . O coeficiente γ é obtido experimentalmente, ou pode ser previamente estimado.

3.2.2 Base do contato e mapa da fixação G

O contato entre dedo e o objeto pode ser também descrito pelo mapeamento de forças exer-

cidas no contato sobre o objeto. Assume-se, para tanto, a hipótese de que o contato é realizado


em um único ponto, mesmo para os casos de contato macio, e que não há escorregamento ou

rolagem5.

Por conveniência, define-se o sistema de coordenadas do contato Ci com origem no ponto

de contato ci e eixo Zci alinhado com a direção normal ao ponto ci, e os demais eixos, Xci e Yci,

alinhados com as direções tangenciais. A localização do ponto de contato ci relativo ao sistema

de coordenadas do objeto O é descrita pela tranformação homogênea ociT ∈ SE(3).

Para mapear as forças de contato descritas no sistema de fixação Ci para carregamentos

equivalentes no sistema do objeto O, define-se a base de carregamento B que mapeia os car-

regamentos de contato para cada diferente modelo. Desta forma, o carregamento de um contato

Fci é definido como:

Fci = B · f ci. (3.56)

Para o modelo contato pontual sem atrito:

B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0

0

1

0

0

0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

e f ci = f ci3 (3.57)

em que f ci3 é a força na dirção zci, e f ci

3 ≥ 0 para as garras convencionais, ou seja, o dedo pode

apenas empurrar o objeto, ou f ci3 < 0 para as garras com ventosas ou sistemas de sucção.

Para o modelo contato pontual com atrito:

B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

1 0 0

0 1 0

0 0 1

0 0 0

0 0 0

0 0 0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

e f ci = [ f ci1 f ci

2 f ci3 ], (3.58)

em que f ci1 e f ci

2 são as forças tangenciais de modo que

√( f ci

1 )2 +( f ci2 )2 ≤ μ f ci

3 , com f ci3 ≥ 0

para as garras comuns e f ci3 < 0 para as garras com ventosas .

5Os efeitos de rolagem e escorregamento entre objetos em contato são descritos em detalhes por Murray et al.

(1994).


A restrição significa que a força aplicada deve pertencer à região representada pelo cone de

atrito FCci, ou seja:

FCci = { f ci ∈ R3 |

√( f ci

1 )2 +( f ci2 )2 ≤ μ f ci

3 } (3.59)

Finalmente, para o modelo de contato macio:

B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 0

0 0 0 0

0 0 0 1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

e f ci = [ f ci1 f ci

2 f ci3 τci

6 ], (3.60)

em que f ci1 , f ci

2 e f ci3 devem obedecer a lei de Coulomb,

√( f ci

1 )2 +( f ci2 )2 ≤ μ f ci

3 , e τci6 , o

momento aplicado na direção Zci de Ci, deve respeitar a lei | τci6 |≤ γ | f ci

3 |. Desta forma, o cone

de atrito para o modelo de contato macio é definido como:

FCci = { f ci ∈ R4 |

√( f ci

1 )2 +( f ci2 )2 ≤ μ f ci

3 e | τci6 |≤ γ | f ci

3 |} (3.61)

Para determinar o efeito das forças de contato sobre o objeto, as forças devem ser trans-

formadas do sistema de coordenadas da fixação Ci para o sistema de coordenadas do objeto

O. Se ociT é a transformação homogênea do i-ésimo sistema de coordenadas do contato Ci para

o sistema do objeto, então, a força exercida por um contato pode ser escrita no sistema de

coordenadas do objeto como:

Foi = (AdociT

−1)T ·Fci =

[ociR

T 0

roci · o

ciRociR

]·Bci · f ci com f ci ∈ FCci. (3.62)

Define-se então o mapa do contato Gci ∈Rk×m, em que k é o número de contatos da fixação

e m é o número de carregamento aplicaveis no contato. A matriz G é um o mapa linear resul-

tante do produto entre a base do contato representada por Bci e a transformação adjunta entre o

sistema do contato Ci e o sistema do objeto O.

Gci = (AdociT

−1)T ·Bci (3.63)

3.3 Propriedades da fixação 43

Se existirem k dedos em contato com o objeto, e considerando que o mapa de contato é

linear, o carregamento resultante no objeto devido às forças aplicadas nos contatos é dado por:

Fo = Fo1 + · · ·+Fok, (3.64)

ou:

Fo = Gc1 · f c1 + · · ·+Gck · f ck. (3.65)

Resumindo a Equação 3.65 pode-se escrever:

Fo = G · f c, (3.66)

em que todas as forças aplicadas nos contatos são representadas pelo vetor:

f c =

⎡⎢⎢⎣

f c1

...

f ck

⎤⎥⎥⎦ , (3.67)

e o mapa da fixação G é então definido como:

G =[

Gc1 · · · Gck]

=[

(Adoc1T−1)T ·Bc1 · · · (Ado

ckT−1)T ·Bck]. (3.68)

3.3 Propriedades da fixação

O mapa da fixação G é capaz de transformar as forças aplicadas em cada um dos pontos

de contato Ck, que estão descritas no sistema de coordenadas específico de cada contato, em

carregamentos equivalentes descritos em um único sistema de coordenadas, que pode ser o do

objeto O por exemplo. O mapa G leva em consideração a geometria da fixação, ou seja, a dis-

posição dos pontos de contato em relação a ao sistema de coordenadas escolhido expressa pela

matriz adjunta transposta (AdociT

−1)T referente a cada contato, e leva também em consideração a

capacidade de aplicação de carregamentos em cada contato expressa pelas bases Bck do modelo

adotado para os contatos.

No início do Capítulo foi definido que uma fixação adequada é aquela que garante: 1) a

estabilidade estática do objeto quando apenas as forças de contato são aplicadas sobre o mesmo;

e que também garante 2) a estabilidade estática quando carregamentos externos são aplicados

devido a ocorrência de carregamentos de reação nos contatos.


Desta maneira, ao se fixar um objeto por n dedos em n posições distintas sobre a sua su-

perfície, as equações de equilíbrio estático são: Para o caso 1, as forças de contato descritas no

mesmo sistema de coordenadas O devem se anular, ou seja:

Fo =n

∑k=1

Gck · f ck = 0 (3.69)

em outras palavras, as forças aplicadas em cada um dos contatos, devem se anular quando

descritas em um mesmo sistema de coordenadas.

Para o caso 2, as forças de contato devem equilibrar as forças e os momentos de um car-

regamento externo Fex = [ f ex1 f ex2 f ex3 τex4 τex5 τex6]T , ou seja:

n

∑k=1

Gck · f ck +Fex = 0. (3.70)

Vale lembrar que as forças em cada um dos contatos f ck não são iguais nas equações 3.69

e 3.70, pois são casos distintos de equilíbrio estático.

Uma fixação adequada deve então satisfazer ambas as equações 3.69 e 3.70. Contudo, a

verificação das condições de equilíbrio para uma fixação qualquer não é possível na prática, pois

mesmo que as matrizes G e B sejam conhecidas, ou seja, mesmo que as posições de contatos e os

tipos de contato estejam definidos, é impossível determinar os valores das forças nos contatos,

pois o número de incógnitas sempre é maior que o número de equações, mesmo se o número de

pontos contatos for pequeno6.

Em alguns trabalhos, como em Abel et al. (1985), hipóteses simplificadoras são considera-

das: todas as forças agem segundo o mesmo plano; as forças externas ocorrem apenas em uma

direção (apenas forças gravitacionais); o modelo considerado é o ponto de contato pontual com

atrito; e apenas dois pontos de contato realizam a fixação. Neste caso, o objetivo de se adotar

as hipóteses é reduzir o número de variáveis da Equação 3.70, a fim de permitir a resolução

analítica das equações de equilíbrio.

Hipóteses simplificadoras, como aquelas citadas, permitem a resolução analítica do pro-

blema para casos específicos, no entanto, para casos complexos e genéricos, com carregamen-

tos externos ocorrendo em várias direções, com consideração do modelo de contato macio, a

resolução analítica do problema, ou seja, é impossível a determinação das forças de contato.

Na tentativa de solucionar esta dificuldade, vários pesquisadores empenharam-se na elabo-

ração de uma teoria capaz de fornecer métodos de análise de equilíbrio do objeto (LAKSHMI-

6Cada diferente tipo de modelo de contato exige diferentes mínimos pontos de contato.


NARAYANA, 1978; NGUYEN, 1988). Estas novas teorias definem algumas propriedades da

fixação: estabilidade, propriedade force-closure, e propriedade form-closure, que são capazes

de caracterizar as capacidades da fixação. Estas propriedades da fixação permitem uma avali-

ação adequada das condições de equilíbrio do objeto na fixação sem a necessidade da resolução

das equações de equilíbrio.

Contudo, a definição das propriedades da fixação requer o conhecimento do mapa da fi-

xação G, ou seja, os pontos de contato devem estar definidos. Na etapa do planejamento da

fixação, quando se deseja definir os pontos de contato, em função ou não de um carregamento

externo esperado, a utilização apenas das propriedades da fixação não é satisfatória, pois com

elas, apenas as condições de equilíbrio são verificadas.

Alguns autores utilizam as próprias equações de equilíbrio estático do objeto, Equações

3.69 e 3.70, no planejamento da fixação. Neste caso, o objetivo é encontrar uma relação geomé-

trica entre os pontos de contato e o objeto que minimizem as forças de contato. Os resultados

são satisfatórios quando se adota a hipótese de que todas as forças, de contato ou externas, são

aplicadas em um mesmo plano, sobre um objeto de formato bidimensional (PFEIFFER, 1996).

Para os casos mais complexos de fixação, deve-se adotar uma estratégia de avaliação da

fixação capaz de considerar todas as possibilidades de contato (toda a superfície do objeto), e

todos os possíveis carregamentos externos. Diversos pesquisadores, Ferrari e Canny (1992),

Ponce et al. (1993), Murray et al. (1994), Miller e Allen (1999) propõem métricas da qualidade

da fixação a partir da envolvente convexa7 de uma fixação. A envolvente convexa é construída

para a análise da propriedade force-closure de uma fixação.

As propriedades da fixação propostas por Lakshminarayana (1978) e Nguyen (1988), e as

métricas da qualidade da fixação definidas por Ferrari e Canny (1992) formam a base da teoria

fundalmental da fixação, e são formalmente apresentadas nas próximas Seções. Vale ressaltar a

contribuição de outros autores da área na elaboração da teoria da fixação, cuja grande maioria

são descritos em Bicchi e Kumar (2001), e Murray et al. (1994), além das revisões realizadas

pela maioria dos trabalhos citados no Capítulo 1 desta Dissertação.

3.3.1 Estabilidade da fixação

Segundo Mason (2001), diferentes abordagens utilizam o mesmo termo "estabilidade" para

definir a capacidade de um sistema em permanecer em um estado de equilíbrio. No entanto,

7O termo envolvente convexa é a tradução para a lingua Portuguesa do termo em Inglês convex hull, o qual é

encontrado na literatura.


Bicchi e Kumar (2001) apresentam dois significados na definição da estabilidade de uma fixa-

ção, um segundo a teoria de Lyapunov, e outro segundo a teoria de Lagrange. Bicchi e Kumar

(2001) apresentam uma revisão completa dos trabalhos que investigam a estabilidade da fixação

em relação as duas teorias citadas.

Em relação à teoria de Lyapunov, a estabilidade de uma fixação está relacionada com

seu comportamento dinâmico, e define como estabilidade a capacidade de um objeto, quando

movido de um estado inicial para um estado intermediário por um agente externo, de retornar

ao estado inicial, quando a ação do agente externo é removida.

Em relação à teoria de Lagrange, a estabilidade representa um mínimo local de energia

potencial para manter a fixação. Esta energia potencial é determinada pela magnitude das forças

de contato e/ou pelas forças requeridas nas articulações da garra e do manipulador durante a

fixação. Valente (1999) faz uma revisão dos trabalhos que determinam fixações para objetos a

partir da busca por fixações estáveis segundo a teoria de Lagrange.

Neste trabalho, adota-se a definição da estabilidade segundo a teoria de Lagrange, pois,

interessa-se apenas pelos efeitos estáticos das forças de contato sobre o objeto. Os efeitos

dinâmicos das forças sobre o objeto não são considerados.

3.3.2 Propriedade Force-closure de uma fixação

A propriedade force-closure de uma fixação, introduzida por Nguyen (1988), diz que uma

fixação executada por k pontos de contato é considerada force-closure no caso em que é possível

aplicar forças e momentos nos k pontos de contato, tal que qualquer carregamento externo Fex

possa ser balanceado.

Antes de apresentar as ferramentas para verificação da propriedade force-closure, é necessário

definir o espaço de carregamento (WS8). O espaço de carragemanto tem dimensão seis, que re-

presentam as três dimensões dos carregamentos puramente lineares (forças) e as três dimensões

dos carregamentos puramente torcionais (momentos) que podem ser aplicados em um objeto.

Com o objetivo de permitir uma melhor visualização, pode-se dividir o WS em dois espaços

tridimensionais, um representando os carregamentos puramente lineares, o espaço das forças,

force space (FS), e o segundo representanto os carregamentos puramente torcionais, o espaço

dos momentos, torque space (τS).

Também é necessário definir o conceito de envolvente convexa. Dado um conjunto de pon-

tos p ∈ Rm, a envolvente convexa deste conjunto é uma forma geométrica convexa de dimensão

8A sigla WS é definida pelo termo em inglês wrench space.


m, tal que todos os pontos do conjunto p estão contidos no seu interior, ou seja, a forma convexa

encapsula todos os pontos de p.

Dado um conjunto de pontos p = [p1 . . . pm]T ∈ R2, então a envolvente convexa PL1

é

definida como:

PL1= ConvexHull(

m⋃i=1

pi) (3.71)

A expressão gráfica da envolvente convexa para um conjunto qualquer de pontos p ∈ R2

pode ser exemplificada graficamente pela Figura 3.2.

Figura 3.2: Exemplo de uma envolvente convexa para um conjunto de pontos no plano. À

esquerda o conjunto de pontos, e à direita a envolvente convexa em vermelho gerada pelo algo-

ritmo QuickHull (BARBER et al., 1996).

Para uma fixação por k dedos, o carregamento sobre o objeto é resultante da soma dos car-

regamentos de cada um dos contatos. Relembrando, tem-se que Foi é o carrgamento do i-ésimo

ponto de contato representado no sistema de coordenadas do objeto, então é definido como es-

paço de carregamento da fixação (GWS9), o espaço formado pelos possíveis carregamentos que

podem ser aplicados em cada um dos k pontos de contato.

O espaço de carregamento da fixação GWS apresenta dimensão seis, GWS∈ R6, porém,

pode-se também dividi-lo em dois espaços distintos, o espaço de carregamento lineares da fixa-

ção (GFS10), em que GFS∈ R3, e o espaço de carregamentos torcionais da fixação (GτS11), em

que GτS∈ R3.

Desta forma, o GFS é formado pelas componentes puramente lineares dos possíveis car-

regamentos nos pontos de contato. Foi visto que quando se considera a ocorrência de atrito no

9A sigla GWS refere-se ao termo em Inglês grasp wrench space.10A sigla GFS refere-se ao termo em Inglês grasp force space.11A sigla GτS refere-se ao termo em Inglês grasp torque space.


contato, os possíveis carregamentos lineares em cada contato formam uma região denominada

cone de atrito.

É possível discretizar a região definida pelo cone de atrito por um número q de forças

localizadas sobre uma superfície cônica (BORST et al., 1999). Pela definição da envolvente

convexa, o cone de atrito pode ser definido de forma alternativa como:

FCci = ConvexHull(q⋃

j=1

f ci, j). (3.72)

em que f ci, j é a j-ésima força da discretização do cone de atrito.

Assim, na construção do GFS, é necessário considerar todas as possibilidades de forças

definidas pela representação simplificada do cone de atrito em cada contato. Vale lembrar que

o carregamento em cada contato deve ser normalizado, tal que o maior dos módulo de todas as

força seja unitário.

O GτS é formado pelos momentos resultantes de todas as possíveis forças aplicadas em

cada contato. Ou seja, para o contato no ponto ci, é necessário calcular o momento resultante

de cada uma das forças f ci, j de discretização do cone de atrito definida pelo produto vetorial

roci × f ci, j, lembrando que ro

ci é a distância do centróide do objeto ao ponto de contato ci. Vale

ressaltar que mesmo para o caso do contato macio, em que existe a ocorrência de momentos

de atrito na direção normal ao contato, a consideração apenas dos momentos resultantes das

forças no contato é satisfatória, pois a distância roci, na maioria dos casos, provê ordem de

grandeza maior ao momento resultante do produto vetorial em comparação ao momento de

atrito. Também é necessário normalizar as componentes de GτS antes da construção.

Um vez que o GWS (GFS e GτS) é definido, é possível determinar sua envolvente convexa.

Dado um conjunto de pontos de contato em uma fixação tal que C = [C1, . . . ,Ck], capazes de

aplicar um carregamento F = [Fc1, . . .Fck] sobre o objeto, a envolvente convexa desta fixação é

denominada por:

FL1= ConvexHull(

k⋃i=1

Fci). (3.73)

A envolvente convexa do carregamento de uma fixação representa o espaço de carrega-

mentos que podem ser aplicados sobre o objeto, resultantes de combinações dos carregamentos

em cada um dos contatos. Se a origem do sistema em que a envolvente convexa é desenhada

estiver encapsulado pela própria envolvente, então é possível conseguir uma combinação de car-

regamentos nos pontos do contato cuja resultante é nula, o que satisfaz a condição 1 (Equação

3.69). E ainda, se a origem estiver contida dentro da envolvente convexa e não estiver sobre


algum ponto da superfície da envolvente, então é possível equilibrar qualquer carregamento

externo através de uma combinação dos carregamentos aplicados nos pontos de contato, o que

satisfaz a condição 2 (Equação 3.70).

Então, pode-se dizer que, se a envolvente convexa do GWS contiver a sua origem, e ainda

se origem não estiver sobre a superfície da envolvente, então as condições 1) e 2) para uma

fixação adequada estão satisfeitas e denomina-se esta fixação adequada como uma fixação force-

closure.

Uma fixação force-closure não é necessariamente uma fixação estável. A estabilidade se-

gundo a teoria de Lagrange é definida como um estado local de mínima energia potencial. Em

uma fixação force-closure, para que a capacidade de resistir a qualquer carregamento externo

seja conseguida, podem ocorrer forças maiores que as mínimas possíveis, desta forma, segundo

a teoria de Lagrange, um fixação force-closure pode não ser estável, embora as condições de

equilíbrio possam ser satisfeitas.

3.3.3 Propriedade Form-closure de uma fixação

A movimentação de um corpo rígido pode ser restringida por contatos entre o manipulador

e a superfície do objeto. Quando uma fixação promove esta restrição pela disposição geomé-

trica dos contatos, sem considerar os carregamentos exercidos nos mesmos, denomina-se esta

fixação como form-closure. Na análise da propriedade form-closure de uma fixação interessa-

se exclusivamente pela restrição de movimentação provocada pelos contatos em relação as suas

posições, sem considerar as forças necessárias para mantê-los. Logo, esta propriedade é pura-

mente geométrica.

Esta restrição geométrica é interessante nos casos em que se deseja imobilizar um objeto

em relação a um sistema inercial12, fato que contrasta com a propriedade force-closure, em que

se deseja manter a posição do objeto constante em relação à ferramenta de fixação13. Apesar

destas diferença, Mason (2001) define que uma fixação form-closure é um caso simplificado de

uma fixação force-closure, quando a mesma é relizada por pontos de contato sem atrito.

Devido às diferenças entre estas duas propriedades, as operações em que se deseja obter

a propriedade form-closure são distintas daquelas em que se deseja obter a propriedade force-

closure na fixação de um objeto. Esta propriedade é importante em aplicações industriais como

12Na lingua inglesa, a restrição da movimentação do objeto em relação a um sistema de referência inercial é

denominada to fix.13Na lingua inglesa, a restrição da movimentação do objeto em relação à ferramenta de fixação é denominada to

grasp.


montagem de dispositivos, em que se deseja manter imóvel algumas peças para a montagem de

outras na mesma. Mais exemplos podem ser encontrados em Bicchi e Kumar (2001). Como

estas aplicações não estão no foco deste trabalho, esta propriedade é descrita de forma breve,

portanto, recomenda-se, para uma melhor compreensão, a leitura de Lakshminarayana (1978),

que realiza seu desenvolvimento na fixação de objetos.

O termo form-closure foi proposto por Reuleaux (1986) no estudo das condições necessárias

para restrição dos movimentos em cadeias cinemáticas para o caso plano. Reuleaux (1986)

demonstra que quando a movimentação do objeto está restrita à movimentação no plano, a imo-

bilização de um corpo rígido é realizada por, no mínimo, quatro contatos pontuais sem atrito.

Para o caso tridimensional, o objeto apresenta seis graus de liberdade de movimentação, e,

segundo Lakshminarayana (1978), são necessários sete pontos de contato para restringir total-

mente qualquer movimentação do objeto no espaço. A estratégia de fixação baseada na busca

da propriedade form-closure dedica-se à determinação da localização dos pontos de contato,

podendo ser menor que quatro ou sete, dependendo da forma do objeto. Ainda, segundo Mason

(2001), objetos com formas circulares, ou gerados por revolução de um perfil ao redor de um

eixo, não apresentam uma fixação form-closure.

3.3.4 Avaliação e Medida da qualidade da fixação

Através da análise da envolvente convexa dos carregamentos de uma fixação, é possível

determinar se esta é force-closure ou não. A definição introduzida na Seção 3.3.2 diz que uma

fixação force-closure é capaz de equilibrar qualquer carregamento externo. Contudo, apenas

por esta simples análise da envolvente convexa não é possível determinar, dentre várias fixações

diferentes para um mesmo objeto, qual é a melhor, ou seja, qual é a fixação que melhor resiste

aos carregamentos externos.

Na maioria dos casos em que se pretende fixar um objeto, deseja-se obter não somente

uma fixação force-closure, mas sim uma fixação force-closure de boa qualidade. Portanto,

uma medida de qualidade deve ser utilizada para selecionar, dentre diversas fixações, a melhor

fixação. Normalmente, a busca por fixações de boa qualidade é a tarefa desempenhada pelo

planejador da fixação, portanto, utilizam-se medidas de qualidade para selecionar as fixações

mais adequadas. Na literatura, diferentes formulações podem ser encontradas como propostas

de medidas da qualidade da fixação para implementação de planejadores. Na maioria dos casos,

esta qualidade é determinada por uma função custo que pode relacionar as forças nos contatos

e/ou a disposição geométria entre eles.

A existência de diferentes métricas dificulta a análise e comparação dos planejadores de


fixação, pois, cada diferente métrica considera critérios específicos de avaliação, o que provoca

divergências na avaliação de resultados. Portanto, a formalização de uma métrica de avaliação

da fixação, com capacidade de abranger todos os tipos de garras e modelos de contato propostos,

é fundamental.

Ferrari e Canny (1992) propõem duas métricas de qualidade da fixação, Q∞ e Q2, baseadas

nos trabalhos de Markenskoff e Papadimitriou (1989) e Kirkpatric et al. (1990), respectiva-

mente. Estas métricas são baseadas na envolvente convexa dos carregamentos dos contatos

aplicados sobre o objeto, e atualmente são amplamente utilizadas pelos pesquisadores da área

na avaliação de fixações de maneira geral, pois, as principais caracterísiticas das métricas são:

a capacidade de se trabalhar com garras de diferentes quantidades de dedos (não há limitantes

superiores); e a capacidade de se utilizar diferentes modelos de contato.

Segundo Ferrari e Canny (1992), uma fixação pode ser melhor que outra pela sua capaci-

dade de equilibrar um mesmo carregamento externo com forças de contato de magnitude menor.

Esta capacidade pode ser medida pela razão entre a magnitude do carregamento equilibrado e a

magnitude das forças aplicadas nos contatos. Vale relembrar que a envolvente convexa do GWS

indica quais os carregamentos que uma fixação pode equilibrar.

Se cada ponto dentro da envolvente convexa representa um carregamento externo que pode

ser equilibrado, e a sua superfície representa os carregamentos que provocam o limite do equi-

líbrio estático, então, o menor carregamento externo que pode ser aplicado é o ponto da super-

fície com a menor distância à sua origem. Segundo Kirkpatric et al. (1990), a eficiência de uma

fixação é medida por esta distância.

Esta medida de qualidade pode ainda apresentar diferentes valores para diferentes metodolo-

gias de construção da envolvente convexa. Ferrari e Canny (1992) propõem duas metodologias

de construção da envolvente convexa para avaliação da qualidade da fixação. A primeira consi-

dera limites independentes das magnitudes das forças de cada contato, fato que maximiza o pior

caso. A segunda considera o limite da soma das magnitudes das forças de todos os contatos. A

primeira metodologia maximiza o menor dos carregamentos equilibráveis pelos contatos, en-

quanto que a segunda minimiza a magnitude dos somatório das forças. A segunda abordagem

é interessante na busca de fixações estáveis segundo a teoria de Langrange, enquanto que a

primeira abordagem é interessante na busca de fixações otimizadas em relação à capacidade de

resistir à carregamentos externos.


Maximização do menor carregamento externo

Nesta abordagem, o carregamento em cada contato é considerado independente, e com

máxima magnitude igual a um. Como a relação entre um carregamento externo e as forças nos

contatos é linear, para carregamentos externos com magnitudes maiores que a unidade deve-se

redimensionar as magnitudes das forças aplicadas nos contatos.

Na Seção 3.3.2 é mostrado que o cone de atrito pode ser representado por um número finito

de forças q, localizadas na superfície do cone de atrito. Considerando a força f oi como a força

aplicada no i-ésimo contado e descrita no sistema de coordenadas do objeto, pode-se dizer que

esta força é uma combinação linear das q forças de simplificação do cone de atrito, assim:

f oi =q

∑j=1

αoi, j · f oi, j (3.74)

com αoi, j ≥ 0 e ∑qj=1 αoi, j ≤ 1. Os vetores f oi, j, com ( j = 1, . . . ,q), são os vetores de discretiza-

ção do cone de atrito descritos em O.

As forças f oi, j também provocam momentos em relação ao centroide do objeto, sendo roci a

distância entre o ponto de contato e o centróide do objeto, então:

τoi =q

∑j=1

αoi, j · (roci × f oi, j). (3.75)

Utilizando a notação Foi = [( f oi)T (τoi)T ]T para o carregamento do contato ci, descrito em

O, então é possível afirmar que:

Foi =q

∑j=1

αoi, j ·Foi, j. (3.76)

O mesmo procedimento pode ser realizado para todos os n pontos de contato, então:

Fo =n

∑i=1

Foi, (3.77)

e o conjunto de todos os carregamentos sobe o objeto é dado por:

FoL∞ = Fo1 ⊕ . . .⊕Fon. (3.78)

A Equação 3.78 é o somatório de Minkowisk (vide Anexo A) dos carregamentos em cada

contato, que pode ser geometricamente representado por uma envolvente convexa, definida por:

FoL∞ = ConvexHull(

n⊕i=1

{Foi,1, . . . ,Fo,q}). (3.79)


A envolvente convexa da Equação 3.79 é construída considerando que a força em cada

carregamento tem magnitude máxima unitária, e a qualidade Q∞, medida pela menor distância

entre a superfície da envolvente convexa e sua origem, é maximizada pela considerção da não

dependência entre as magnitudes das forças de contato.

Minimização do somatório das forças de contato

Para o caso em que se considera que o somatório de todas as forças de todos os contatos

tem valor unitário, então o somatório das forças de contato é dado por:

f o =n

∑i=1

f oi. (3.80)

Se cada força de contato f oi é uma combinação linear daquelas de discritização do cone de

atrito, então:

f o =n

∑i=1

q

∑j=1

αi, j · f oi, j, (3.81)

com αoi, j ≥ 0 e ∑ni=1 ∑q

j=1 αoi, j ≤ 1.

De forma similar pode-se dizer que:

Fo =n

∑i=1

q

∑j=1

αi, j ·Foi, j. (3.82)

Finalmente, o conjunto dos carregamentos possíveis é representado pela envolvente con-

vexa:

FoL1

= ConvexHull(n⋃

i=1

{Fi,1, . . . ,Fi,q}). (3.83)

cuja menor distância da sua supérfície à origem é a medida de qualidade Q1.

A qualidade Q1 considera que o somatório das magnitudes da força é limitado, desta forma,

quando uma fixação apresenta melhor qualidade Q1 que outra, pode-se dizer que a primeira é

mais estável que a segunda. Quando se utiliza esta medida em planejadores de fixação, obtém-se

uma fixação com estabilidade segundo a teoria de Lagrange.


3.4 Resumo do Capítulo 3

O objetivo do presente Capítulo foi apresentar a teoria envolvida na fixação de objetos

por garras robóticas e a principal contribuição para a compreensão do texto desta Dissertação

é a verificação da condição force-closure de uma fixação e a determinação da qualidade da

mesma. Porém, antes da apresentação destes assuntos específicos, foi necessário apresentar

outras formulações de fenômenos envolvidos na fixação.

Primeiramente, foi apresentado o conceito das transformações homogêneas e a teoria de

movimentação de corpos rígidos no espaço. Estes conceitos são utilizados para definir o mapa

de uma fixação G, que transforma os carregamentos de cada contato, cujo espaço é definido

pela base de contato B, em carregamentos equivalentes definidos em um único sistema de coor-

denadas, neste caso, o sistema de coordenadas do objeto.

Utilizando-se o mapa da fixação G e a base dos contatos B, é possível determinar as

equações de equilíbrio estático do objeto em uma fixação. Contudo, na maioria dos casos,

este sistema de equações é linearmente dependente e não possui uma única solução.

A fim de possibilitar a análise qualitativa de uma fixação quanto a sua capacidade de resistir

a carregamentos externos, foi apresentada a propriedade force-closure de uma fixação. Uma

fixação force-closure é definida como aquela capaz de se manter em equilíbrio na ausência de

carregamentos externos, ou seja, quando somente o carregamento da fixação é aplicado sobre o

objeto, que permanece em equilíbrio estático.

Para a verificação da propriedade force-closure de uma fixação é necessário recorrer a uma

ferramenta específica, a envolvente convexa. A envolvente convexa representa o espaço dos

possíveis carregamentos que podem ser aplicados por uma fixação, e conseqüentemente, re-

presenta os carregamentos externos que uma fixação pode equilibrar. Se a envolvente convexa

contiver a sua origem, então a fixação é capaz de equilibrar um carregamento externo nulo, ou

seja, a fixação é capaz de se manter em equilíbrio na ausência de carregamentos externos. Neste

caso, diz-se que a fixação é force-closure.

Por fim, a análise da propriedade force-closure de uma fixação não permite determinar,

dentre uma série de fixações para um mesmo objeto, qual é a fixação que melhor resiste aos

diferentes carragemantos externos. Para este fim, recorre-se a uma métrica de qualidade da

fixação. Se a envolvente convexa de uma fixação representa os carregamentos que podem ser

equilibrados, e ainda, a sua superfície representa os limites em que o equilíbrio entre carrega-

mento da fixação e externo é atingido, então o ponto da superfície da envolvente convexa mais

próximo a sua origem é o ponto em que o desequilíbrio é mais facilmente atingido, e portanto,

3.4 Resumo do Capítulo 3 55

a distância deste ponto à origem da mesma envolvente é a medida da qualidade da fixação.

As teorias, definições, propriedades e equações apresentadas neste Capítulo são fundamen-

tais para a plena compreensão dos Capítulos 5, 7 e 8 deste trabalho.

57

Parte II

Fixação 2D utilizando redes neurais

artificiais

59

4 Aproximação poligonal utilizando redes deHopfield

Neste Capítulo é apresentado um algoritmo de rápido processamento, baseado em redes

neurais, para o problema da aproximação poligonal de curvas. O algoritmo aqui proposto con-

siste em modificações na regra de ativação originalmente proposto por Araújo e Tanaka (1995).

Simulações e comparações mostram que o novo algorimo apresenta respostas com qualidade

equivalente ao algoritmo original, contudo, o tempo de processamento observado foi signifi-

cantemente menor.

4.1 Introdução

No reconhecimento de padrões geométricos, é crucial o emprego de formas geométricas

aproximadas ou reduzidas, sendo que, a técnica de aproximação poligonal, que permite a des-

crição da forma de maneira compacta, simplifica sua análise, além de reduzir a demanda com-

putacional na etapa de processamento de dados.

A aproximação poligonal é uma abordagem bastante utilizada para a simplificação de for-

mas bidimensionais. O objetivo é representar uma forma geométrica por um polígono, cujos

vértices são alguns dos pontos da curva original, sendo que as características relevantes são

preservadas na aproximação.

A abordagem consiste na escolha dos melhores vértices para a representação do polígono

com perdas mínimas de informação. Em geral, as soluções existentes apresentam respostas

otimizadas quanto à qualidade da aproximação, porém, os algoritmos existentes, em sua maio-

ria, requerem muito esforço computacional. A dificuldade encontrada em tais abordagens é a

obtenção de respostas satisfatórias com tempo reduzido que permitam a aplicação da técnica

em tarefas onde o tempo de processamento é crítico.

Algumas técnicas propõem o uso de recursos não convencionais na tentativa de simplificar

os cálculos. Dentre as várias estratégias não convencionais pode-se destacar as redes neurais

60 4 Aproximação poligonal utilizando redes de Hopfield

artificiais. Chung et al. (1994) propõe uma rede de Hopfield para a solução do problema da

aproximação poligonal, que posteriormente fora modificada por Araújo e Tanaka (1995) a fim

de melhorar a qualidade dos resultados.

As modificações propostas por Araújo e Tanaka (1995) estão concentradas na matriz de

pesos de aprendizagem da rede neural, de modo que as diferenças entre o polígono de apro-

ximação e a curva aproximada tivessem maior influência no cálculo dos pesos. Os resultados

obtidos com as modificações foram satisfatórios em várias situações, porém, o custo computa-

cional para o cálculo da aproximação ainda é elevado, conforme será mostrado neste Capítulo.

Dentre as desvantagens do algoritmos de Araújo e Tanaka (1995), pode-se citar que, quando

o número de vértices da aproximação é próximo ao da curva inicial, ou quando o número de

pontos da curva inicial é elevado, o tempo total de cálculo gasto pelo algoritmo não permite sua

utilização em operações que exigem rápido processamento, tal como os sistemas robóticos.

O novo algoritmo propõe uma variação da rede competitiva de Hopfield apresentada por

Araújo e Tanaka (1995) como solução para o problema do custo computacional para resolver o

problema da aproximação poligonal. A proposta envolve modificações na construção da matriz

de aprendizado, na rede competitiva, na construção da regra de ativação e na função energia

U . As modificações evitam operações que não influenciam no resultado final, portanto, evita

operações desnecessárias, sem perda da qualidade da aproximação.

A Seção 4.3 apresenta o modelo de rede neural competitiva de Hopfield proposta por Araújo

e Tanaka (1995) e discute alguns resultados preliminares. Na Seção 4.4 são propostas modi-

ficações na matriz de pesos H, na regra de ativação, e o algoritmo proposto é apresentado.

Simulações são realizadas e os resultados são comparados com resultados obtidos por vários

métodos na Seção 4.5. Formas de objetos reais também são utilizadas para comparar o algo-

ritmo original com o proposto na Seção 4.5.3. Por motivos didáticos na proxima Seção, Seção

4.2, a rede competitiva de Hopfield é brevemente apresentada.

4.2 Rede de Hopfield

A rede neural proposta por Hopfield (1982) apresenta uma formação recurssiva em que

cada neurônio é conectado a todos os demais neurônios da rede. A conexão entre os neurônios

é caracterizada pelos pesos wi j, que é o peso da conexão entre o neurônio i e o neurônio j. Os

pesos entre os neurônios de toda a rede formam uma matriz simétrica de pesos W , wi j = w ji,

e com diagonal principal nula, caracterizando que a conexão de um neurônio com si mesmo

é inexistente ou nula. A Figura 4.1 mostra uma rede de Hopfield de seis neurônios e suas

4.2 Rede de Hopfield 61

conexões.

Figura 4.1: Exemplo de uma rede de Hopfield com seis neurônios e suas conexões.

A ativação de cada neurônio da rede é determinada por uma função degrau aplicada sobre

um somatório ponderado dos valores de entrada do neurônio subtraído de um limiar Tj. Os

valores de entrada de cada neurônio são os valores atribuído a cada um dos demais neurônios,

no instante anterior t, multiplicados pela sua conexão com o neurônio avaliado.

xi(t +1) = fh

[N

∑j=1

wi j · x j(t)−Tj

]i = 1,2, · · · ,N (4.1)

em que N é o número total de neurônios da rede e x j e Tj são respectivamente o valor de ativação

e o limiar do j-ésimo neurônio. A função degrau fh é uma função não linear que determina uma

ativação bipolar (-1,+1) ou binária (0,1).

Na arquitetura da rede de Hopfield, valores iniciais são atribuídos à rede, 0 e 1 para o

caso binário, ou -1 e +1 para o caso bipolar. A conexão mútua entre os neurônios permite que a

ativação de um neurônio influencie na ativação dos demais. Desta forma, a rede inicial passa por

diversos estados intermediários até a convergência em um estado estável que ocorre quando não

há mais mudanças na ativação dos neurônios. O estado estável significa que há mais neurônios

mantendo as ativações do que neurônios tentando invertê-las.

O ponto de mínimo valor da função energia dada pela equação 4.2 corresponde ao ponto de

estabilidade atingido pela rede.

E = −1

2∑

i∑j �=i

wi j · xi · x j +∑i

xi ·Ti (4.2)

A convergência da rede de um estado inicial até um de mínima energia possibilita a utiliza-


ção das redes competitivas de Hopfield em problemas de otimização, para tanto, é necessário

associar uma função objetivo com a função energia, desta maneira, a rede poderá convergir para

uma solução otimizada segundo um mínimo local.

O caso da aproximação poligonal consiste em um clássico problema de otimização. Equa-

cionando o problema da aproximação em termos de uma função energia, é possível determinar

uma solução para o problema através da rede de Hopfield. O ponto de mínimo da função

energia, para o caso da aproximação, consiste em um polígono que minimiza o desvio entre o

polígono aproximado e a curva original.

4.3 Algoritmo original

A presente Seção apresenta o modelo de rede competitiva de Hopfield proposto por Araújo

e Tanaka (1995) para a determinação dos melhores vértices da aproximação poligonal. Porém,

para melhor compreensão do algoritmo é recomendado a leitura de Chung et al. (1994) e Araújo

e Tanaka (1995).

A partir de um polígono composto por n pontos, é definido P = [p1, p2, . . . , pn]T como o

vetor de vértices do polígono, sendo que cada elemento tem duas componente x e y em um

sistema de referência inercial. Deseja-se representar o polígono por um número reduzido de m

elementos, ou seja m < n.

A rede neural proposta apresenta configuração bidimensional, denominada matriz neural

V , de dimensões n×m. Cada uma das m colunas apresenta n neurônios, onde cada neurônio

representa um vértice ou elemento do vetor P, sendo que apenas um neurônio é ativado por

coluna. Os neurônios ativados de cada coluna representam os vértices selecionados de aproxi-

mação. Desta forma, o neurônio ativado na primeira coluna representa o primeiro vértice da

aproximação, e assim sucessivamente até que na m-ésima coluna, o neurônio ativado representa

o último vértice da aproximação.

Uma vez definida a matriz neural Vn×m, define-se a regra de aprendizado, ou a matriz de

pesos H. Para tanto, o desvio entre curva e corda é definido. Primeiramente, dada uma curva

P = [px, px+1, px+2, . . . , px+n−1, py]T constituída de n pontos ordenados, e px py e px py represen-

tando, respectivamente, o trecho da curva e a corda do ponto px ao ponto py. Araújo e Tanaka

(1995) definem como desvio ponto-corda o somatório das distâncias entre os pontos da curva P

e a corda px py como:

hx,y =x+n−1

∑k=x+1

d(pk, px py). (4.3)

4.3 Algoritmo original 63

Figura 4.2: Desvio entre curva e corda definido como o somatório das distâncias entre a curva

px py e a corda px py.

Define-se então a matriz Hn×n formada pelo desvio ponto-corda entre todos os pontos da curva

como:

H = [hx,y], (4.4)

em que x,y = 1,2,3, . . . ,n.

Após a construção da matriz H, a seleção dos melhores pontos de aproximação é definida

por um método iterativo onde cada etapa da iteração consiste na análise de uma coluna da matriz

de neurônios da matriz V . A regra winner-takes-all é aplicada sobre uma regra de ativação, ou

função energia U , calculada para cada elemento de uma mesma coluna, sendo que a unidade

vencedora recebe o valor 1 (ativada) e as demais recebem o valor 0 (não ativada). A função

energia U é calculada da seguinte maneira:

Ux,i =n

∑y=1

−(hy,x ·Vy,i−1 +hx,y ·Vy,i+1), (4.5)

para x = 1, . . . ,n e i = 1, . . . ,m. Em que x é o neurônio da i-ésima coluna. Para cada ponto

neurônio x, pertencente à i-ésima coluna verificada, é calculada a energia Ux,i, que recebe

o somatório das conexões com os elementos das colunas vizinhas, da direita e da esquerda,

conforme mostra a Figura 4.3. Para que nenhum ponto px seja ativado em colunas vizinhas,

modifica-se o cálculo dos elementos de H dado pela Equação 4.6 válida para todo x = y.

hx,y = ∞ (4.6)

A aproximação poligonal utilizando a rede competitiva de Hopfield pode ser resumida da

seguinte forma:

1. Entrada: pontos de uma curva P = [p1, p2, . . . , pn]T ordenada no sentido horário e o

número de vértices do polígono de aproximação m.


Figura 4.3: Esquemático do cálculo da função energia U para um elemento qualquer. Figura

modificada de Valente (1999).

2. Estado final da rede: as unidades ativas representam os vértices do polígono de aproxi-

mação.

3. Método.

(a) Regra de aprendizado: construção da matriz de pesos H, formada pelo somatório

das distâncias de pontos de curva e corda.

(b) Estado inicial da rede: escolha inicial dos m pontos selecionados o mais eqüidis-

tantes possível.

(c) Regra de propagação: cálculo da função energia para todos os neurônios da coluna

avaliada.

(d) Regra de ativação winner-takes-all para obtenção do novo neurônio ativado na col-

una.

(e) Repetição dos passos c) e d) para todas as colunas até não haver mais mudanças na

rede.

(f) Geração dos vértices do polígono de aproximação a partir das unidades ativas da

rede.

4.4 Algoritmo proposto

O algoritmo proposto apresenta modificações na rede apresentada na Seção anterior. Espera-

se, como resultado, obter uma aproximação onde os pontos selecionados sejam os mesmos, ou

4.4 Algoritmo proposto 65

semelhantes, aos calculados pelo algoritmo original, porém, com tempo total de processamento

e recursos computacionais utilizados reduzidos.

A principal estratégia adotada no novo algoritmo é executar o cálculo dos elementos da

matriz H apenas quando forem solicitados. Cada elemento da matriz é ainda calculado segundo

a Equação 4.3.

Determinada a regra de aprendizagem ou seja, o cálculo dos elementos da matriz de pe-

sos H, utiliza-se a matriz de representação neural V introduzida na Seção anterior, onde cada

neurônio pode assumir um valor binário 0 ou 1. Os vetores P = [p1, . . . , pn]T e S = [s1, . . . ,sm]T

são definidos. O vetor P é formado pelos vértices da curva inicial. O vetor S é formado por m

ponteiros que indicam quais vértices foram selecionados na aproximação, desta forma se s1 = 3,

significa que o terceiro vértice da curva, ou o elemento p3 ∈ P foi selecionado para a aproxima-

ção. Conforme foi discutido na Seção anterior, cada coluna da matriz V representa os vértices

candidatos, ou seja, os pontos do vetor P. O índice dos elementos do vetor P selecionado em

cada uma das m colunas da matriz V compõem o vetor S.

A matriz neural V é inicializada com pontos eqüidistantes em cada uma das colunas. Uma

vez inicializada a rede, inicia-se o processo de iteração. A função energia é calculada e a

regra de ativação é aplicada para cada uma das colunas. A Figura 4.4 mostra a função energia

calculada pela Equação 4.5 para um estágio de iteração.

Figura 4.4: Função energia para uma etapa de iteração.


Uma vez inicalizada a rede, começa o processo de iteração. A função energia é calculada

e a regra de ativação é aplicada para cada um das colunas. A Figura 4.4 mostra a função ener-

gia onde pode ser obervado que os vales são os pontos onde houve a penalização imposta pela

restrição da equação 4.5, e a região entre os vales, ou topo, indica a região de interesse (vide

Figura 4.5) onde está localizado o ponto selecionado. A região de interesse esta compreendida

entre o vértice selecionado da coluna anterior e o vértice selecionado da coluna posterior, con-

forme mostra a Figura 4.5, em outras palavras, a região de interesse é formada pelos neurônios

localizados entre o neurônio ativado da coluna anterior e o neurônio ativado da coluna posterior

à coluna avaliada.

Figura 4.5: Região de interesse para o cálculo da matriz H.

Considerando que o ponto selecionado está dentro da região de interesse, a equação da

função energia é simplificada até a seguinte expressão:

Ux,y = −(hS(y−1),x +hx,S(y+1)) para S(y−1) < x < S(y+1) com y = 1, . . . ,m, (4.7)

em que S(y− 1) é a posição do ponto A dentro do vetor P, e S(y + 1) é a posição do ponto C

dentro do vetor P (vide figura 4.5), ou ainda, S(y−1) é o neurônio ativado da coluna anterior e

S(y+1) é o neurônio ativado da coluna posterior.

A nova equação para o cálculo da função energia evita as multiplicações por 0, ou seja,

multiplicações dos elementos da matriz V não selecionados. Outra modificação é o cálculo de

4.5 Simulações e resultados 67

U apenas dentro da região de interesse.

As modificações no método da rede competitiva de Hopfield podem ser resumidas como:

• Mudança na ordem de cálculo da matriz de pesos H, evitando o cálculo de termos não

utilizados.

• Modificação na regra de propagação. Aplicação da função energia apenas sobre a região

de interesse.

• Mudança no equacionamento da função energia, eliminando multiplicações desnecessárias.

O algoritmo proposto pode ser então resumido como:

1. Entrada: pontos de uma curva P = [p1, p2, . . . , pn]T ordenada no sentido horário e o

número de vértices do polígono de aproximação m.

2. Estado final da rede: as unidades ativas representam os vértices do polígono de aproxi-

mação.

3. Método.

(a) Estado inicial da rede: escolha inicial dos m pontos selecionados o mais eqüidistante

possíveis.

(b) Regra de propagação: cálculo da função energia para cada coluna somente na região

de interesse. Nesta etapa os pesos da matriz H serão calculados conforme a neces-

sidade.

(c) Regra de ativação winner-takes-all para obtenção do novo estado da rede.

(d) Repetição dos passos c) e d) até não haver mais mudanças na rede.

(e) Geração dos vértices do polígono de aproximação a partir das unidades ativas da

rede.

4.5 Simulações e resultados

Simulações foram realizadas para verificar o desempenho do algoritmo proposto quanto à

qualidade da aproximção e quanto ao tempo de processamento. O método proposto foi imple-

mentado na linguagem Matlab, e as simulações foram realizados em um computador de 2,0GHz

do tipo IBM-PC.


A qualidade das respostas foi medida pelos seguintes parâmetros: somatório do erro qua-

drático:

EQ =n

∑i=1

(di)2; (4.8)

e erro máximo:

EM = max{di} para i = 1,2, . . . ,n (4.9)

em que d é a distância entre um ponto da curva original à curva de aproximação (vide Figura

4.2).

4.5.1 Comparação com o algoritmo original

Na primeira simulação, o resultado do algoritmo proposto foi comparado com o algoritmo

original proposto por Araújo e Tanaka (1995) e utilizado por Valente (1999) na etapa do com-

pactação dos dados. Para cada possível valor de aproximação m, ou seja 3 ≤ m ≤ (n− 1), os

parâmetros de qualidade EQ, EM e o tempo de processamentoto foram medidos para ambos os

algoritmos. No experimento foram utilizadas as curvas da Figura 4.6.

(a) (b) (c)

Figura 4.6: As formas acima são freqüentemente utilizadas pelos autores da área para avaliação

dos algoritmos de aproximação poligonal. Figura 4.6(a) Leaf shape, Figura 4.6(b) Chromosomeshape e Figura 4.6(c) Semi-circle shape.

As três formas foram utilizadas na avaliação dos resultados do resultado do algoritmo de

aproximação poligonal por diversos autores, entre eles: Rosenfeld e Weszka (1975), Teh e Chin

(1989), Ansari e Huang (1991), Chung et al. (1994), Ray e Ray (1992a), Ray e Ray (1992b),

Cornic (1997), Wu (2003), Marji e Siy (2003), Marji e Siy (2004), Sarkar (1993) e Huang e Sun

(1999).


Figura 4.7: Gráficos de comparação entre o algoritmo proposto, em azul, e o algoritmo ori-

ginal, em vermelho, para o Leaf shape (Figura 4.6(a)). Figura 4.7(a) mostra o erro máximo

por aproximação m, Figura 4.7(b) mostra o somatório do erro quadrático por aproximação m e

Figura 4.7(c) mostra o tempo de processamento por aproximação m.A forma Leaf shape tem

inicialmente 120 pontos.


Figura 4.8: Gráficos de comparação entre o algoritmo proposto, em azul, e o algoritmo original,

em vermelho, para o Chromosome shape (Figura 4.6(b)). Figura 4.8(a) mostra o erro máximo

por aproximação m, Figura 4.8(b) mostra o somatório do erro quadrático por aproximação me Figura 4.8(c) mostra o tempo de processamento por aproximação m. A forma Chromosomeshape tem inicialmente 60 pontos.


Figura 4.9: Gráficos de comparação entre algoritmo proposto, em azul, e o algoritmo original,

em vernelho, para o Semi-circle shape (Figura 4.6(c)). Figura 4.9(a) mostra o erro máximo

por aproximação m, Figura 4.9(b) mostra o somatório do erro quadrático por aproximação m e

Figura 4.9(c) mostra o tempo de processamento por aproximação m. A forma Semi-circle shapetem inicialmente 100 pontos.


Os gráficos anteriores mostram os parâmetros medidos EM e EQ e o tempo de processa-

mento, pelo valor m de aproximação, para as formas leaf shape, chromossome shape e semi-

circle shape.

Pode-se observar que para as três formas a qualidade da aproximação, expressa pelos pa-

râmetros EQ e EM, foram mantidas, no entanto, o tempo de processamento observado foi

consideravelmente reduzido para valores de aproximação acima de 5% do número total de pon-

tos n. Em média o algoritmo original foi 400 vezes mais lento que o algoritmo proposto neste

trabalho.

O código fonte do algoritmo original utilizado nesta comparação foi gentilmente sedido por

Carlos Magno de Oliveira Valente.

4.5.2 Comparação com demais algoritmos

Na segunda comparação, os curvas da Figura 4.6 foram aproximadas e comparadas com

outros algoritmos de aproximação poligonal. As Tabelas B.1 e B.2, localizadas no Apêndice B,

mostram os resultados obtidos em alguns trabalhos relevantes. Novos parâmetros de qualidade

da aproximação são definidos, sendo eles: somatório do erro quadrático ponderado:

EQp =n

∑i=1

(di)2/TC; (4.10)

e erro máximo ponderado:

EMp = max{di}/TC para i = 1,2, . . . ,n, (4.11)

em que TC é a taxa de compressão TC = nm .

Os resultados do algoritmo proposto foram comparados com os resultados dos demais

algoritmos (ROSENFELD; WESZKA, 1975; TEH; CHIN, 1989; ANSARI; HUANG, 1991;

CHUNG et al., 1994; RAY; RAY, 1992a, 1992b; CORNIC, 1997; WU, 2003; MARJI; SIY,

2003, 2004; SARKAR, 1993; HUANG; SUN, 1999).

Os gráficos das Figuras 4.10 a 4.15 a seguir comparam os resultados do algoritmo proposto,

e os resultados dos demais algoritmos para cada valor m de aproximação poligonal. Para as

aproximações por determinado m realizadas por mais de um autor, foi selecionado aquele que

apresentou a melhor qualidade de aproximação. Os dados obtidos com o algoritmo proposto

estão na Tabela B.3, também localizada no Apêndice B.


Figura 4.10: Comparação do algoritmo proposto com outros algoritmos. Somatório do erro

quadrático por aproximação do Leaf Shape.

Figura 4.11: Comparação do algoritmo proposto com outros algoritmos. Erro máximo por

aproximação do Leaf Shape.



quadrático por aproximação do Chromosome Shape.


aproximação do Chromosome Shape.



quadrádico por aproximação do Semi Circle Shape.


aproximação do Semi Circle Shape.


4.5.3 Simulação com imagens reais

Para verificar a capacidade do algoritmo de aproximação proposto de realizar aproxima-

ções poligonais em tempos reduzidos, formas de objetos reais são aproximadas pelo algoritmo

original e pelo algoritmo proposto. A simulação com formas de objetos reais tem o objetivo

de mostrar a eficiência do algoritmo proposto para utilização em sistemas mecatrônicos, neste

caso, para utilização em um sistema de fixação de objetos.

As aproximações são realizadas com as figuras utilizadas nas simulações do algoritmo de

fixação 2D (As imagens de objetos utilizadas são aquelas das Figuras A.2, A.3 e A.4 localizadas

no Apêndice A) para m = 50, m = 100 e m = 150 pontos. A curva original, o contorno do objeto,

é extraído segundo o método de processamento de imagens apresentado no Apêndice A.

Os resultados das simulações são apresentados na tabela a seguir.

Tabela 4.1: Tabela de comparação dos tempos de processamento da aproximação poligonal,

calculada pelo algoritmo original e pelo algoritmo proposto, de formas de objetos reais, para

diversos valores m de aproximação. Os tempos medidos estão em segundos.

m = 50 m = 100 m = 150

Figura Alg. Prop. Alg. Orig. Alg. Prop. Alg. Orig. Alg. Prop. Alg. Orig.

Figura A.2(a) 0,1361 69,893 0,1612 167,53 0,1994 728,37

Figura A.2(b) 0,1998 210,27 0,3389 498,75 0,3447 1080,6

Figura A.3(a) 0,1718 137,68 0,3877 423,40 0,4975 1295,9

Figura A.3(b) 0,6251 708,07 0,5327 1189,4 0,8466 3664,5

Figura A.3(c) 0,2470 271,20 7,1519 637,18 0,3638 821,69

Figura A.3(d) 0,4322 447,65 0,2799 1674,3 5,3440 2525,5

Figura A.3(e) 0,2746 237,60 0,4018 711,69 0,3420 1504,7

Figura A.4(a) 0,4731 36,774 0,0749 119,61 0,0490 509,57

Figura A.4(b) 0,3807 280,84 0,3281 1059,5 0,5568 1346,1

Figura A.4(c) 0,0891 26,269 1,2513 133,88 0,0399 199,06

Figura A.4(d) 0,3006 347,59 0,3118 802,49 0,7193 1683,1

Figura A.4(e) 0,5237 692,35 0,2939 3067,2 0,5387 6505,4

Os tempos de processamento apresentados pelo algoritmo original são extremamente infe-

riores aqueles apresentados pelo algoritmo original. Porém, é importante ressaltar que o tempo

de processamento do algoritmo original depende principalmente do número de pontos da curva

orignal, pois o número de pontos determina o tamanho da matriz de pesos H. As formas uti-

lizadas para a obtenção dos valores da Tabela 4.1 foram obtidas de imagens de alta resolução (4

Mega pixels), e desta forma, cada forma apresenta um elevado número de pontos n.

Quando se utiliza curvas iniciais definidas por pouco pontos, é cpossível obter reduzidos

tempos de processamento com a utilização do algoritmo original, tal como os resultados obtidos


por Valente (1999), que utiliza imagens de baixa resolução1.


A aproximação poligonal é uma técnica que pode ser usada em várias áreas da ciência,

porém, muitos métodos existentes levam em consideração a obtenção de uma aproximação

otimizada, dentre as inúmeras possíveis soluções existentes, sendo que o tempo de processa-

mento é elevado. Portanto, o uso de técnicas de determinação de aproximações otimizadas é

inviável para sistemas com requisitos de processamento em tempo real.

Neste Capítulo, modificações do algoritmo de Araújo e Tanaka (1995) foram apresentadas

como uma solução para o elevado tempo de processamento das técnicas de aproximação poli-

gonal.

As modificações do algoritmo original estão concentradas na construção da matriz de pe-

sos H e no cálculo da função energia U , que no caso do método original, apresenta cálculos

desnecessários que provocam tempos elevados para a obtenção das respostas.

Simulações foram realizadas e os resultados obtidos mostraram que foi possível diminuir o

tempo de processamento sem perda da qualidade da aproximação, porém a aproximação obtida

pode, em muitos casos, não ser uma aproximação otimizada.

Como proposta para trabalhos futuros é sugerido a análise da qualidade da aproximação

em função da inicialização da rede. Testes, não descritos neste texto, mostraram que a resposta

da rede é influenciada pela sua inicialização, que deve ser otimizada a fim de se melhorar as

respostas.

Também é proposta a avaliação dos resultados apresentados pela rede em função do cáculo

dos pesos da rede, em outras palavras, a medida do erro da aproximação de uma curva de

vários pontos (corda) por uma reta. Chung et al. (1994) propõem que o erro de aproximação

de uma corda por uma reta é determinado pela maior distância entre os pontos da corda e a

reta, e Araújo e Tanaka (1995) mostram que melhores resultados são obtidos quando o erro é

representado pelo somatório das distâncias entre os pontos da corda e a reta de aproximação.

Logo, o desempenho da rede também depende do método utilizado para se determinar os pesos

da rede, e poderia ser investigado.

Por fim, as medidas de tempo realizadas nas comparações entre os algoritmos foram reali-

1Segundo informações de Valente (1999), a câmera utilizada capturava imagens de 128×128 pixels, e desta

forma, as formas dos objetos apresentavam em média 400 pontos de contorno.


zadas a partir do processamento em um computador do tipo desktop a partir de programas im-

plementados em uma linguagem de desenvolvimento sem recursos de processamento em tempo

real. Para uma real medida da eficiência do algoritmo em sistema robóticos, é desejável testar o

algoritmo em um computador dedicado, com hardware e software que permitam execução em

tempo real.

79

5 Fixação 2D de objetos desconhecidos

5.1 Introdução

A utilização de garras robóticas em ambientes fabrís pode ser encontrada em larga escala

com o objetivo de fixar objetos, e com a finalidade de movimentação de material, montagem,

inspeção de peças, entre outras diversas aplicações. Contudo, os sistemas manipuladores e

as garras robóticas industriais apresentam alto grau de especialização e são incapazes de se

adaptarem às variações das condições de operação, sejam elas mudanças na geometria do ob-

jeto a ser fixado, ou mudanças na orientação e posição do mesmo no espaço de trabalho do

manipulador.

Na área científica, muitos trabalhos propõem diferentes abordagens para o problema da fi-

xação de objetos previamente desconhecidos. Dentre os trabalhos que se focam no problema da

fixação, pode-se destacar os trabalhos que utilizam informações obtidas por sistemas de visão

para informar ao manipulador a forma do objeto a ser fixado. Os principais sistemas de visão

utilizados nas indústrias e nos trabalhos acadêmicos são: visão estereoscópica (HAUCK et

al., 1999); scanners laser (WANG et al., 2005); sistemas compostos por scanners e câmeras

(SAXENA et al., 2006) e os sistemas formados por somente uma câmera (BALLESTER,

2003)(MORALES et al., 2006).

Nas aplicações industrias, pela necessidade de tempo total de processamento reduzido, os

manipuladorers providos de um sistema de visão composto por uma única câmera, ou visão

bidimensional (2D), apresentam-se como os mais adequados quando comparados aos outros

sistemas de visão tridimensionais (3D). As câmeras apresentam, de forma geral, baixo custo de

instalação, facilidade de calibração, e permitem rápido processamento das informações devido

ao número reduzido de dados, quando comparados com os sistemas de visão 3D.

Ainda para as aplicações industriais, além do reduzido tempo de aquisição e de processa-

mento dos dados obtidos pelo sistema de visão, o tempo de tomada de decisão, ou seja, o tempo

decorrido para a determinação dos pontos de fixação, também deve ser reduzido. Na busca de

80 5 Fixação 2D de objetos desconhecidos

sistemas rápidos de fixação, baseados em informações 2D do objeto, pode-se destacar os tra-

balhos de Xu et al. (1990), Bendiksen e Hager (1994), Kamon et al. (1994), Valente (1999),

Morales et al. (2001), Ballester (2003), Sanz et al. (2005), e Morales et al. (2006).

Os trabalhos citados propõem sistemas baseados em diferentes técnicas e algoritmos de

planejamento da fixação, desde uma busca heurística exaustiva pela melhor fixação, até a de-

terminação de pontos de fixação por RNAs, sendo que alguns ainda apresentam sistemas de

aprendizagem com auxílio de sistemas supervisores.

Nos trabalhos de Morales et al. (2001), de Ballester (2003), de Sanz et al. (2005) e de

Morales et al. (2006), técnicas de rápido processamento e mecanismos de busca são utilizados

para a determinação de uma fixação estável para objetos de formatos desconhecidos. Os re-

sultados apresentados são satisfatórios, mas pode-se citar algumas desvantagens como erros na

fixação de objetos com geometria complexa muito diferente da forma retangular e elipsoidal.

Nos trabalhos de fixação 2D de objetos desconhecidos, pode-se ainda citar aqueles que

utilizam técnicas não convencionais. Os trabalhos de Xu et al. (1990) e Valente (1999) utilizam

RNA na tentativa de obter resultados mais satisfatórios quanto à qualidade da fixação de objetos

com geometria complexa, de tornar o sistema mais rápido, e de prover ao sistema a capacidade

de aprendizado.

Xu et al. (1990) utilizam uma rede competitiva de Hopfield para a determinação de pontos

de contato para objetos 2D . O propósito da rede competitiva é encontrar uma fixação adequada

a partir da otimização de uma função que modela a estabilidade da fixação, o processo de

otimização da função é realizado pela rede de Hopfield. Os resultados apresentados por Xu et

al. (1990) mostram a capacidade de se determinar fixações estáveis utilizando redes de Hopfield.

Uma das desvantagens do método é a grande quantidade dos pontos de entrada da rede, fato que

implica em um elevado tempo de processamento da RNA.

Ainda utilizando RNAs, Valente (1999) propõe modificações para o algoritmo de Xu et

al. (1990). A principal modificação consiste na redução da quantidade de pontos necessárias

para representar a forma do objeto, apresentada como entrada de uma nova rede rede tipo

feedforward em substituição à rede de Hopfield. Também é estudado o comportamento de dife-

rentes tipos e configurações das RNAs feedforward quanto à qualidade das respostas e quanto

ao tempo de treinamento. Os resultados obtidos mostram que as fixações determinadas com in-

formações reduzidas da forma do objeto são satisfatórias, e que os melhores resultados, quanto

à qualidade da resposta, são obtidos com redes MLP. Porém, quanto ao tempo de treinamento,

os melhores resultados são obtidos com as redes RBF.

5.2 Teoria e equacionamento da fixação 2D 81

Os resultados obtidos por Xu et al. (1990) e Valente (1999) mostram a capacidade das RNAs

em determinar pontos de fixação para objetos a partir de informações 2D. Contudo, os tempos

de processamento, de etapas específicas de ambos os métodos, impedem sua utilização como

sistemas com resposta em tempo compatíveis com as aplicações.

Na tentativa de se obter melhores resultados na utilização de RNAs como solução do pro-

blema da fixação a partir de informações 2D do objeto, este Capítulo apresenta um algoritmo,

também baseado em RNAs, para a determinação de pontos de fixação. O algoritmo proposto é

baseado em modificações dos algoritmos de Xu et al. (1990) e Valente (1999). Outra caracte-

rística de destaque do algoritmo proposto é o tempo reduzido de execução de todas as etapas de

cálculos, característica até então não apresentada pelos sistemas de fixação baseados em RNAs.

O algoritmo é implementado para determinação de fixação de objetos 2D por dois e três pontos

de contato.

Este Capítulo está organizando na seguinte forma: na Seção 5.2 é apresentado o equaciona-

mento da fixação 2D de objetos por dois e três contatos, e na Seção 5.4 são apresentados os

quatro diferentes métodos de determinação de pontos de contato utilizados no algoritmo pro-

posto. Por fim, conclusões e discussões sobre a proposta são apresentadas na Seção 5.5.

5.2 Teoria e equacionamento da fixação 2D

Em síntese, a fixação de um objeto consiste na aplicação de forças, produzidas pelo contato

entre os dedos de uma garra e a superfície do contato, capazes de manter o objeto em equi-

líbrio quando carregmentos externos são aplicados sobre o objeto ou não. Em uma fixação, as

forças aplicadas pelos dedos da garras, o equilíbrio estático do objeto e a capacidade de resistir

a carregamentos externos depende fundamentalmente: das posições em que os contatos são re-

alizados; do tipo de contato; e do número de dedos em contato. Nesta Seção, o equacionamento

das forças de fixação 2D é realizado segundo as teorias apresentadas no Capítulo 3. Porém,

antes do equacionamento, é necessário definir algumas simplificações e hipóteses dos objetos e

das garras consideradas.


5.2.1 Simplificações e hipóteses

Quanto aos objetos, considera-se algumas hipóteses:

• O objeto apresenta densidade constante.

• O objeto é rígido.

• A sua superfície é uniforme.

• O coeficiente de atrito de Coulomb é constante por todo a sua superfície.

Quanto às garras, primeiramente é considerado que a ponta dos seus dedos dedos são ca-

pazes de se deformar, de maneira a manter uma superfície de contato, porém ainda considera-se

que todos os carregamentos aplicados no contato estão concentrados em um único ponto da

superfície do objeto.

O equacionamento desta Seção é realizado para dois e três pontos de contato. Tendo em

vista o número de pontos de contato reduzido, ambas as garras industriais e antropomórficas

são capazes de realizar a fixação.

Em relação às garras industriais, considera-se que: 1) as garras tipo pinça apresentam dois

dedos paralelos acionados por um único atuador. Desta forma, defini-se como centro de fixação

o ponto de fechamento da garra. O espaço de trabalho de cada dedo é composto por uma linha

definida como linha de ação la (vide Figura 5.2(a)). As linhas de ação de ambos os dedos

ocorrem segundo a mesma direção; 2) As garras tipo castanha apresentam dedos defasados em

120o, também acionados por um único atuador, sendo que o centro de fixação é o ponto em que

as direções de movimentação, ou linhas de ação, dos dedos se encontram no centro de fixação

ch(vide Figura 5.2(b)). O tipo de contato considerado é o contato macio, devido à capacidade

de deformação das pontas dos dedos.

Em relação as garras antropomórficas, considera-se que: 1) a garra antropomórfica é capaz

de realizar a postura de fixação tipo pinch (fixação de precisão por dois pontos opostos) e desta

forma realizar a fixação por dois pontos de contato; 2) a mão também é capaz de realizar a

postura de fixação tripod (fixação de precisão por três pontos de contato), de forma que seja

possível realizar a fixação pelos três pontos de contato determinados pelo planejador da fixação.

Desta forma, os pontos de contato são determinados independentemente de qual a ferra-

menta utilizada para a fixação, e para tornar o sistema ainda mais flexível, não são consideradas

as dimensões das garras, ou seja, é possível fixar objetos de qualquer ordem dimensional.


Para que seja realizada uma fixação, é necessário que todas as forças aplicadas sejam po-

sitivas, que a soma entre elas seja zero e que os momentos resultantes sejam também nulos.

As forças aplicadas em cada contato devem ser reescritas como carregamentos equivalentes no

sistema de coordenadas da fixação. Para tanto, os sistemas de coordenadas de cada ponto de

contato, do objeto e da fixação devem ser definidos.

5.2.2 Sistemas de coordenadas

Sistemas de coordenadas do objeto: Define-se como o sistema de coordenadas do objeto

aquele formado pelos eixos XO paralelo ao primeiro momento principal de inércia da forma

2D do objeto e ZO paralelo ao segundo momento principal de inércia, o centro do sistema de

coordenadas do objeto coincide com o centróide do objeto, o ponto co.

Figura 5.1: Definição do sistema de coordenadas do objeto.


Sistema de coordenadas da fixação: Para o caso de forças aplicadas em um objeto plano,

define-se o sistema de coordenadas de fixação como: seu centro coincide com o centro da

fixação, o ponto ch, e o eixo XH é alinhado com a semi-reta chc1, o eixo ZH forma com o eixo

XH o plano XHZH no qual a forma do objeto é definida, o eixo YH é obtido pelo produto vetorial

entre ZH e XH .

(a)

(b)

Figura 5.2: Definição do sistema de coordenadas da fixação. A Figura 5.2(a) mostra o sistema

de coordenadas da fixação por dois contato, e a Figura 5.2(b) mostra o sistema para a fixação

por trê contatos.


Sistema de coordenadas do contato: Dado um ponto de contato ci (i =1,2 para dois contatos,

e i =1,2,3 para três contatos), define-se o sistema de coordenadas do contato com centro em ci

e eixo Zi alinhado com a direção normal à superfície do objeto. Para a fixação 2D, o plano de

contato contém os eixos Zi e Xi. As Figuras 5.3(a) e 5.3(b) mostram os sistemas de coordenadass

para os contatos na fixação por dois e três pontos, respectivamente. Nas figuras, θi é o ângulo

entre a linha de ação lai do dedo da garra e o eixo Zi segundo a direção normal ao ponto de

contato.

(a)

(b)

Figura 5.3: Definição do sistema de coordenadas dos contatos para fixação por dois pontos de

contato (Figura 5.3(a)), e para fixação por três pontos de contato (Figura 5.3(b)).


5.2.3 Equacionamento da fixação 2D por 2 pontos de contato

Para que a fixação seja estável, é necessário que as forças aplicadas pelos dedos da garra

sejam capazes de equilibrar as forças externas exercidas sobre o objeto, tais como a força da

gravidade e distúrbios externos. O equacionamento é realizado no sistema de coordenadas da

fixação e, desta maneira, as forças externas calculadas em outros sistemas de cordenadas devem

ser transformadas para o sistema de fixação.

No Capítulo 3 foi mostrado que o mapa da fixação G é capaz de transformar os carregamen-

tos dos contatos (forças e momentos), aplicadas nos pontos de contato, em carregamentos equi-

valentes descritos no sistema de coordenadas da fixação. A transfomação é dada pela seguinte

equação:

Fh = G ·Fci (5.1)

em que Fci é o vetor formado pelas forças e momentos aplicados nos pontos de contato. O

modelo de contato considerado é o contato macio, que define as forças de contato como:

Fci = [ f ci1 f ci

2 f ci3 τ6

ci], (5.2)

sendo que f ci1 e f ci

2 são as forças de atrito nas direções tangenciais, f ci3 é a força normal, e τci

6 é o

momento de atrito também na direção normal. As forças de atrito e o momento de atrito devem

estar dentro do limite de escorregamento, ou cone de atrito, para que seja possível executar a

fixação.

A matriz G, definida como o mapa da fixação, é determinada por:

G =

[hciR

T 0

rhci ·hci R h

ciR

]·B, (5.3)

em que B é a base do tipo contato considerado:

B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 0

0 0 0 0

0 0 0 1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

, (5.4)

e hciR é a matriz de transformação homogênia do sistema de coordenadas da fixação H para o

sistema de coordenadas do contato Ci. A Figura 5.4 mostra uma fixação qualquer por garra de

dois dedos. Tem-se que βi é o ângulo entre a direção do eixo Zi e a direção do eixo Zo.


Figura 5.4: Definição do sistema de coordenadas dos contatos c1 e c2.

Substituindo os termos da Equação 5.3 obtém-se:

Gc1 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

cos(β1) 0 cos(β1) 0

0 1 0 0


0 −l 0 −sen(β1)

l · cos(β1) 0 −l · cos(β1) 0

0 0 0 cos(β1)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

(5.5)

e

Gc2 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣


0 1 0 0


0 −l 0 −sen(β1)

−l · cos(β2) 0 l · cos(β2) 0

0 0 0 cos(β2)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

, (5.6)

em que l e −l são as distâncias entre os pontos de contato c1 e c2, respectivamente, e o centro

da fixação ch, medidos no sistema de coordenadas da fixação.

Tranformando as forças de contato descritas no sistema de coordenadas dos contatos para

o sistema de referência da fixação obtém-se:

Fh = Gc1 · f c1 +Gc2 · f c2 (5.7)


ou na forma expandida:

Fh =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

f c11 · cos(β1)− f c1

3 · sen(β1)+ f c21 · cos(β2)− f c2

3 · sen(β1)

f c12 + f c2

2

f c11 · sen(β1)+ f c1

3 · cos(β1)+ f c21 · sen(β2)+ f c2

3 · cos(β1)

f c12 · l − τc1

6 · sen(β1)+ f c22 · l − τc2

6 · sen(β2)

l · f c11 · cos(β1)− l · f c1

3 · sen(β1)+ l · f c21 · cos(β2)− l · f c2

3 · sen(β1)

τc16 · cos(β1)+ τc2

6 · cos(β2)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

. (5.8)

As forças de contato escritas no sistema de coordenadas da fixação devem ser capazes de

equilibrar forças externas, também escritas no sistema de coordenadas da fixação.

Se as forças externas aplicadas no objeto, expressas no sistema de coordenadas de fixação,

são:

Fexh =[Fexh

1 Fexh2 Fexh

3 τexh4 τexh

5 τexh6

]T, (5.9)

então, para que aconteça o equilíbrio estático do obejto, a seguinte relação deve ser satisfeita

Fexh +Fh = 0 (5.10)

ou:

−Fexh = Fh (5.11)

ou ainda, na forma expandida:⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

−Fexh1

−Fexh2

−Fexh3

−τexh4

−τexh5

−τexh6

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

=

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

f c11 · cos(β1)− f c1

3 · sen(β1)+ f c21 · cos(β2)− f c2

3 · sen(β1)

f c12 + f c2

2

f c11 · sen(β1)+ f c1

3 · cos(β1)+ f c21 · sen(β2)+ f c2

3 · cos(β1)

f c12 · l − τc1

6 · sen(β1)+ f c22 · l − τc2

6 · sen(β2)

l · f c11 · cos(β1)− l · f c1

3 · sen(β1)+ l · f c21 · cos(β2)− l · f c2

3 · sen(β1)

τc16 · cos(β1)+ τc2

6 · cos(β2)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

.

(5.12)

O sistema acima apresenta as seis equações de equilíbrio do objeto quando o carregamento

da fixação é realizado por dois pontos de contato e equilibra carregamentos externos aplicados

sobre o objeto.



A determinação dos pontos de contato para fixação estável de objetos por três pontos de

contato depende, além da forma do objeto, das características construtivas do tipo de garra. Para

as garras de três dedos, pode-se considerar que existem fundamentalmente duas possíveis vari-

ações, de acordo com a capacidade de movimentação lateral dos dedos: aquelas com capacidade

de movimentação lateral e aquelas sem capacidade de movimentação lateral. A movimentação

lateral dos dedos é chamada de movimento de adução e abdução.

As garras com capacidade de adução e abdução, quando comparadas àquelas sem a mesma

capacidade, possuem um espaço de trabalho mais amplo e podem alcançar os mesmos, segundo

diferentes orientações. Por outro lado, uma garra que não apresenta movimentos de adução e

abdução mantém constante a posição relativa entre os dedos. Tal simplificação limita a capaci-

dade de fixação destas garras.

É possível considerar que uma garra com movimentos laterais é capaz de realizar as mes-

mas fixações de uma garra sem estes movimentos, e ainda, para certos casos, é possível alinhar

a linha de ação de cada dedo com a direção normal ao contato. Desta forma, uma fixação ade-

quada para garras sem movimentos de adução e abdução, também será para aquelas com a ca-

pacidade de movimentação. Para simplificar o estudo da fixação por garras de três dedos, neste

trabalho são consideradas apenas as garras sem o movimento lateral dos dedos. Recomenda-se

para os trabalhos futuros investigar algoritmos de seleção de pontos de contato para as garras

de três dedos com capacidade de movimentação lateral.

Uma vez definida as características das garras, as demais considerações e hipóteses ado-

tadas são as mesmas para o caso de fixação por 2 pontos de contato. A Figura 5.5 mostra os

sistemas de coordenadas dos contatos e o sistema de coordenadas da fixação. O centro da fixa-

ção é determinado através do algoritmo apresentado no Apêndice E, sendo o eixo Xh alinhado

com o segmento de reta que liga o centro de fixação ch com o primeiro ponto de contato c1, o

eixo Yh é difinido na direção normal ao plano análizado e o eixo Zh é definido pelas direções de

Xh e Yh.

Uma vez determinados os sistemas de coordenadas dos contatos e da fixação, a linha de

ação do contato c1, representada por la1 é definida pelo segmento de reta entre os ponto ch e c1,

e da mesma forma obtém-se la2 e la3. O comprimento dos segmentos de retas chc1, chc2 e chc3

são definidos respectivamente por l1, l2 e l3.


Figura 5.5: Definição do sistema de coordenadas da fixação, linha de ação e direção normal aos

pontos de fixação para uma garra de três dedos sem adução abdução.

As forças necessárias para manter o equilíbrio do objeto durante a fixação quando forças e

momentos externos são aplicados são expressas pela seginte relação:

Fh = Gc1 · f c1 +Gc2 · f c2 +Gc3 · f c3 = −Fexh, (5.13)

e na forma expandida:⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

−Fexh1

−Fexh2

−Fexh3

−τexh4

−τexh5

−τexh6

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

=

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

f c11 c(β1)− f c1

3 s(β1)

f c12

f c11 s(β1)+ f c1

3 c(β1)

−τ6c1s(β1)

f c11 l1c(β1)− f c1

3 l1s(β1)

f c12 l1 + τ6

c1c(β1)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

+

5.3 Verificação da condição force-closure e avaliação da fixação 91

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

f c21 c(β2)− f c2

3 s(β2)

f c22

f c21 s(β2)+ f c2

3 c(β2)

f c22 l2c(120o)− τ6

c2s(β2)

f c21 l2(c(β2)s(120o)− s(β2)c(120o))− f c2

3 (l22s(β2)s(120o)+ s(β2)c(120o))

f c22 l2c(120o)+ τ6

c2c(β2)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

+

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

f c31 c(β3)− f c3

3 s(β3)

f c32

f 1c3s(β3)+ f 3

c3c(β3)

f 2c3l3c(240o)− τ6

c3s(β3)

f 1c3l3(c(β3)s(240o)− s(β3)c(240o))− f 3

c3(l32s(β3)s(240o)+ s(β3)c(240o))

f 2c3l3c(240o)+ τ6

c3c(β3)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

, (5.14)

em que c(β ) e s(β ) são respectivamente o cosseno e o seno do ângulo β .

O sistema acima apresenta as seis equações de equilíbrio do objeto quando três carrega-

mentos de contato e carregamentos externos são aplicadas no objeto.

5.3 Verificação da condição force-closure e avaliação da fixa-ção

Na Seção 3.3 desta Dissertação, foi discutida a dificulade de se resolver as equações de

equilíbrio estático de um objeto durante uma tarefa de fixação. O equacionamento da fixação

2D, tanto para dois quanto para três pontos de contato, é mostrado nas Seções 5.2.3 e 5.2.4. São

apresentadas as seis equações de equilíbrio estático do objeto, que relacionam os carregamentos

de cada um dos contatos, que geram o carregamento da fixação, e a geometria da fixação1 com

os carregamentos externos. Vale lembrar que um carregamento externo é formado tanto pelo

carregamento da tarefa, como por distúrbios.

Para o caso mais simples da fixação 2D, ou seja, aquela realizada por dois pontos de con-

tato, mesmo se a geometria da fixação for conhecida, não é possível resolver as equações de

equilíbrio e encontrar os carregamentos dos contatos, pois o sistema formado é linearmente de-

pendente. Logo, para o caso em que se deseja determinar a geometria da fixação que promove

1A geometria da fixação é compreendida como a disposição dos pontos de contato sobre o objeto.


para a fixação a maior capacidade de equilibrar esforços externos, deve-se recorrer a teorias e

técnicas avançadas a fim de transpor as dificuldades de resolução do problema.

Na Seção 3.3.4, foi apresentada a definição da envolvente convexa de um carregamento

da fixação. Recordando, a envolvente convexa representa os possíveis carregamento que uma

geometria de fixação pode apresentar, e como conseqüência, a envolvente convexa também

apresenta o espaço dos carregamentos externos que a fixação pode equilibrar. Apesar da envol-

vente convexa não determinar os carregamentos em cada um dos pontos de contato necessários

para manter o objeto em equilíbrio, é possível avaliar a capacidade de uma fixação.

Se a envolvente convexa de uma fixação contiver a origem do sistema em que a mesma

é definida, então a fixação relacionada a ela é capaz de se manter em equilíbrio quando não

existem carregamentos externos sobre o objeto. Esta é uma importante característica da fixação,

e quando uma fixação apresenta-a, diz-se que esta fixação é force-closure.

Para o caso da fixação 2D, existem duas possibilidades de construção da envolvente con-

vexa. Ambos dependem fundamentalmente da consideração dos carregamentos com dimensão

três ou seis. No primeiro caso, considera-se que as componentes lineares dos carregamentos

ocorrem somente no plano xy do objeto, e a componente torcional do carregamento ocorre ape-

nas na direção z, e então, as equações de equilíbrio são reduzidas de seis para três, porém ainda

sem solução analítica.

Quando os carregamentos com apenas três dimensões são considerados, a envolvente con-

vexa apresenta também dimensão três, sendo duas dimensões para as componentes lineares dos

carregamentos, e uma dimensão para a componente torcional. Se a envolvente convexa contiver

a sua origem, então a fixação é force-closure.

Para o caso em que se considera todo o possível espaço dos carregamentos, a envolvente

convexa tem dimensão seis, assim como os carregamentos, porém é possível dividí-la em duas

envolventes distintas para melhor vizualização e análise. Nesta divisão, uma envolvente con-

vexa representa as componentes lineares do carregamento da fixação, e a outra representa as

componentes torcionais. Neste caso, se cada uma das envolventes contiver a sua própria origem,

então a fixação é force-closure e, caso contrário, se alguma das duas envolventes não contiver a

sua origem, a fixação não é force-closure.

Para os casos citados, deseja-se saber, dentre uma série de fixações force-closure para um

objeto, qual é a melhor, ou seja, qual é aquela que melhor resiste aos carregamentos exter-

nos. Este é o papel desempenhado por um planejador de fixação, ou seja, o planejador deve

determinar para um objeto qual é a melhor fixação dentre todas as possibilidades.

5.4 Métodos de determinação dos pontos de contato 93

Muito autores utilizam funções custo que relacionam a geometria da fixação, e alguns

critérios específicos para cada aplicação, para determinar a fixação de melhor desempenho por

meio da seleção da fixação que apresentar a melhor função custo. Esta estratégia permite se-

lecionar a fixação que apresenta a melhor função custo para a aplicação específica, porém a

condição force-closure pode não ser atingida.

A fim de normalizar e padronizar o cálculo da qualidade da fixação, Ferrari e Canny (1992)

propõem métricas para se determinar a qualidade de uma fixação force-closure. Segundo Fer-

rari e Canny (1992), a qualidade da fixação é medida pela menor distância entre o centro da

envolvente convexa e a sua origem. Esta métrica pode ser aplicada para os dois casos discutidos

nesta Seção. Contudo, vale ressaltar que em alguns casos, uma função custo pode ser adequada

para se determinar uma fixação force-closure de qualidade (NGUYEN, 1988).

5.4 Métodos de determinação dos pontos de contato

As Equações 5.12 e 5.14 relacionam os carregamentos externos aplicados sobre um ob-

jeto com as características geométricas da fixação e com as forças aplicadas em cada contato,

respectivamente para fixação com garras de dois e três dedos. Nos dois casos, o número de

incógnitas é maior que o número de equações, e portanto, não existe uma única solução para o

equilíbrio estático do objeto.

Ainda quanto às equações de equilíbrio, caso seja determinada a geometria da fixação por

um método, a determinação das forças em cada contato continua sendo impossível, pois mesmo

neste caso, ainda há mais incógnitas do que equações. Desta forma, a verificação da capacidade

da fixação de resistir a carregamentos externos deve ser realizada pela análise da propriedade

force-closure da fixação. Portanto, a solução das equações de equiíbrio estático consiste em

encontrar pontos de contato, cujas características geométricas proporcionem uma fixação force-

closure.

Existem inúmeros métodos desenvolvidos para se determinar pontos adequados de fixação,

dentre eles, interessa-se especialmente por aqueles baseados em RNAs. A determinação de fixa-

ções utilizando RNAs envolve outros métodos, tal como o método de determinação da fixação

por busca heurística. Neste caso, a busca heurística é utilizada a fim de se determinar pontos de

fixação para os padrões de treinamento da RNA.

Nesta Seção, são apresentados os métodos de determinação de pontos de contato por busca

heurística, por otimização com redes de Hopfield, por redes feedforward tipo RBF, e ainda é

apresentada uma nova configuração de RNAs para a determinação da fixação: a combinação


das redes RBF e Hopfield, sugerida por Xu et al. (1990). Estes métodos são descritos de forma

detalhada. Resultados da apliacação dos métodos com imagens reais são apresentados junta-

mente com os tempos de processamento da etapa de determinação da fixação, e ainda, uma

base de dados de 8100 figuras, obtidas de modelos virtuais (SAXENA, 2006), é utilizada para

simular e avaliar o desempenho de cada método.

5.4.1 Fixação 2D por busca heurística

A busca heurística de uma fixação adequada2 consiste na avaliação de todas as possíveis fi-

xações (ou um conjunto previamente selecionado de fixações) para um objeto. O mecanismo de

busca consiste na avaliação de cada fixação segundo critérios pré-determinados. Estes critérios

envolvem algumas características definidas pelas relações geométricas dos pontos de contato

como as direções normais aos contatos, pelos ângulos de ponta e pela posição relativa entre os

pontos de contato. A fixação também pode ser avaliada quanto à configuração da garra para

fixar o objeto nos pontos avaliados, nesta caso, também pode ser considerado a executabilidade

da fixação, ou seja, se a garra é capaz de atingir os pontos de fixação, e também quanto as forças

e os momentos necessários para controlar as juntas dos dedos da garra durante a fixação. Con-

tudo, pelas hipóteses consideradas no início do Capítulo, as restrições de fixação estabelecidas

pelas dimensões das garras em relação aos objetos, e pela executabilidade da fixação, que pode

não ser realizada pela ocorrência de colisões, não são consideradas.

Desta maneira, na busca heurística, notas são atribuídas para cada combinação de fixação

escolhida randomicamente, ou segundo uma ordem qualquer pré-determinada. O resultado

final, isto é, a fixação escolhida, é aquela que atingir nota igual a um determinado limiar, ou é

aquela que apresentar a menor nota dentre todas as combinações. Também é possível que não

haja uma fixação que atenda as exigências estabelecidas ou a condição force-closure3, ou que

não atinja um valor abaixo do limiar estabelecido, nestes casos, considera-se que não é possível

determinar uma fixação satisfatória para o objeto.

Para cada diferente caso de fixação, critérios específicos de avaliação dependentes das ca-

racterísticas dos objetos e das características das garras devem ser considerados. Para os casos

aqui estudados, os critérios estabelecidos estão relacionados à geometria da fixação, pois se-

gundo Nguyen (1988), para os casos de fixação por dois e três pontos de contato, é possível

relacionar a geometria da fixação com a propriedade force-closure. Outra possibilidade de de-

terminação da qualidade da fixação é a utilização das medidas de qualidade Q1 e Q∞ descritas

2Uma fixação adequada é aquela que apresenta a propriedade force-closure.3Em alguns casos específicos, pode-se definir critérios capazes de definir uma fixação adequada, porém não

force-closure.


no Capítulo 3, porém, as medidas não consideram as características geométricas expressas em

uma função custo específica.

Para a fixação por dois pontos de contato, quando se considera o modelo de contato macio,

a fixação é force-closure quando os pontos de contato estão em faces opostas do objeto, e a

direção da linha de ação em cada contato está dentro do cone de atrito. Para fixação por três

pontos de contato, basta que a direção da linhas de ação de cada contato esteja dentro do cone

de atrito.

O mecanismo de busca descrito é o mesmo tanto para dois quanto para três pontos de

contato, sendo que a única diferença é a função custo estabelecida para cada caso.

Garras de dois dedos

No caso da fixação por garras de dois dedos, o algoritmo de busca avalia quantitativamente

cada possível par de pontos, sendo que os pontos são aqueles resultantes da aproximação po-

ligonal, que é aplicada para reduzir a quantidade de pontos e conseqüentemente, o esforço

computacional dos cálculos da busca.

A nota de cada fixação é calculada segundo a expressão matemática:

fcusto = A ·Σθi +B ·d(co, la)+C ·abs(αI −αla), (5.15)

em que θi é o ângulo entre a linha de ação la, definida pela semi-reta ligando os pontos de

contato c1 e c2, e a direção normal ao ponto de contato ci; d(co, la) é a distância entre o

centróide do objeto e a linha de ação; e abs(αI −αla) é a diferença angular absoluta entre a

direção do momento principal de inércia αI , e a direção da linha de ação αla .

Os parâmetros A, B, e C representam a contribuição de cada termo na nota final que estima

a qualidade da fixação. Quanto menor o valor de fcusto, melhor é a fixação. A definição dos

valores de A, B, e C deve ser realizada de acordo com a importância do termo que cada valor

está ponderando.

Dentre os termos da Equação 5.15, o de maior importância é o termo referente a diferença

entre linha de ação e normal ao ponto, o termo Σθi. Quando a diferença angular é elevada, as

forças de atrito necessárias para equilibrar as forças de contato são elevadas, e quando forças

externas são aplicadas, o equilíbrio estático pode ser facilmente desfeito. Segundo Nguyen

(1988), se a linha de ação estiver dentro dos cones de atrito de cada um dos pontos de contato, a

fixação é force-closure, e sua qualidade está relacionada com a diferença angular expressa pelo

termo Σθi. Este termo está relacionado com a estabilidade de Lagrange da fixação.


Figura 5.6: Definição dos parâmetros para cálculo da função custo para fixação por dois pontos

de contato.

O termo de segunda maior importância é a distância entre a linha de ação e o centróide

do objeto, o termo d(co, la). Esta distância quando elevada implica na influência da força de

gravidade na estabilidade da fixação. Estas forças geram carregamentos na forma de momentos

quando a distância entre a linha de ação e o centróide é alta. Não há limites superiores para

d(co, la) que podem provocar a perda da propriedade force-closure, porém, quanto maior o

termo menos estável é a fixação.

Por último, porém ainda importante, a diferença angular entre a direção do segundo mo-

mento principal de inércia e a linha de ação, que influencia diretamente na estabilidade da

fixação (SANZ et al., 2005).

Os parâmetros adotados foram A = 100, B = 100, C = 500. Não foram utilizados métodos

determinísticos na adoção dos parâmetros, que podem variar dependendo do caso e da imple-

mentação. Por exemplo, a escala da imagem do objeto e a distância entre o objeto e a câmera

pode alterar o significado do parâmetro C que pondera a distância entre o centróide do objeto e

a linha de ação da fixação.

O algoritmo proposto foi implementado e simulado no computador de testes. As simulações

foram realizadas com objetos comuns encontrados em ambientes fabrís, domésticos, escritórios,

entre outros. A Figura 5.7 mostra fotos de objetos do cotidiano, com 640 × 480 pixels de

resolução, e a respectiva resposta obtida. Pode-se observar que com a busca heurística é possível

encontrar dois pontos de fixação satisfatórios para todos os objetos.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)

Figura 5.7: Resultados do algoritmo de busca heurística para dois pontos de fixação para objetos

do cotidiano. As linhas vermelhas mostram a direção de aproximação dos dedos da garra para

o momento da fixação.


A Tabela 5.1 apresenta os tempos de processamento da execução da busca heurística para

cada um dos objetos mostrados na Figura 5.7. Na Tabela 5.1 não é mostrado o tempo do

processamento da imagem e da aproximação poligonal.

Tabela 5.1: Tabela do tempo de execução do algoritmo de busca heurística para fixação 2D por

dois pontos de contato dos objetos da Figura 5.7.

Busca heurística [s]Figura 5.7(a) 0,2625

Figura 5.7(b) 0,2160

Figura 5.7(c) 0,2335

Figura 5.7(d) 0,2032

Figura 5.7(e) 0,2521

Figura 5.7(f) 0,2589

Figura 5.7(g) 0,2598

Figura 5.7(h) 0,2505

Figura 5.7(i) 0,1300

Figura 5.7(j) 0,2892

Figura 5.7(k) 0,2536

Figura 5.7(l) 0,2610

Pode-se verificar que para todos os objetos utilizados nesta simulação é possível encontrar

uma fixação force-closure. O tempo de processamento da etapa de busca heurística foi reduzido

devido a redução das combinações avaliadas quanto à posição em relação ao momento principal

de inércia. Os pontos são divididos em dois grupos separados pela direção do momento princi-

pal de inércia do objeto, e a avaliação foi realizada apenas para os pares contendo um elemento

de cada grupo. Em outras simulações, cujos resultados não são mostrados, foi verificado que

a não divisão em grupos torna o algoritmo cerca de 10 vezes mais lento, sem melhoria alguma

nos resultados.

Nos testes com as 8100 imagens da base de dados, foi possível determinar uma fixação

satisfatória por dois pontos de contato para 100% dos objetos.

Garras de três dedos

Para as garras de três dedos, todos os conjuntos de três de pontos devem ser avaliados, e

neste caso, não é possível dividir os pontos em grupos de candidatos. O mesmo procedimento

de processamento de imagens e aproximação da forma do objeto por um polígono de 100 lados

é adotado, sendo que os pontos candidatos são formados pelos 100 pontos selecionados na

aproximação poligonal. Considerando então o conjunto de pontos candidatos, cada combinação

possível de três pontos é avaliada sengundo uma função custo que leva em consideração:


• A distância entre o centróide do objeto e o centro de fixação. O centro de fixação para

três pontos de contato é definido no Apêndice E.

• A diferença angular entre a linha de ação e a normal ao ponto de fixação.

Desta maneira, a função custo é definida como:

fcusto = A ·Σθi +B ·d(co,ch), (5.16)

em que θi é o ângulo entre a linha de ação de cada dedo l1, l2 e l3, definida pela semi-reta

ligando os pontos de contato c1, c2, c3 e o centro da fixação ch, e d(co,ch) é a distância entre o

centróide do objeto e o centro de fixação.

Figura 5.8: Definição dos parâmetros para cálculo da função custo para fixação por três dedos.

Similar ao algoritmo de fixação por dois dedos, a estratégia de fixação por três dedos ado-

tada leva em consideração a distância entre o centróide e o centro de fixação e a diferença

angular entre as linhas de ação e a direção normal ao ponto de contato. A posição relativa entre

a direção do momento principal de inércia e dos pontos de fixação não é considerada.

Os parâmetros A e B da Equação 5.16 representam a contribuíção de cada termo na nota

final, que estima a qualidade da fixação. Quanto menor a nota melhor é a fixação. A definição


dos valores de A e B deve ser realizada de acordo com a importância do termo que o mesmo

está multiplicando. Para este caso, se a linha de ação das forças estiver fora do cone de atrito,

a fixação é instável, portanto, o parâmetro A é o mais significativo na busca de uma fixação

force-closure. O termo ponderado pelo parâmetro B é responsável por penalizar as fixações nas

extermidades do objeto, sendo de relativa importância, porém a resolução da imagem, e a dis-

tância entre câmera e objeto na aquisição, devem ser levados em consideração na determinação

do parâmetro B.

O método de busca heurística para garras de três dedos foi implementado e simulações

com imagens reais foram realizadas no computador de testes. As Figuras 5.9 e 5.10 mostram os

resultados obtidos, e a partir delas pode-se observar que o algoritmo de busca heurística também

é capaz de determinar três pontos de fixação para todos os objetos de teste.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 5.9: Resultados do algoritmo de busca heurística para três pontos de fixação para objetos

do cotidiano. As linhas vermelhas mostram a direção de aproximação dos dedos da garra para

o momento da fixação (parte 1 de 2).


(a) (b) (c)

Figura 5.10: Resultados do algoritmo de busca heurística para três pontos de fixação para ob-

jetos do cotidiano. As linhas vermelhas mostram a direção de aproximação dos dedos da garra

para o momento da fixação (parte 2 de 2).

Os tempos de determinação de três pontos de contato para cada um dos objetos mostrados

nas imagens das Figuras 5.9 e 5.10 são mostrados na Tabela 5.2.


garras de três dedos dos objetos das Figuras 5.9 e 5.10.


Figura 5.9(b) 10,7642

Figura 5.9(c) 12,1357

Figura 5.9(d) 10,4243

Figura 5.9(e) 12,6787

Figura 5.9(f) 11,5055

Figura 5.9(g) 10,2894

Figura 5.9(h) 8,03370

Figura 5.9(i) 10,0774

Figura 5.10(a) 13,4464

Figura 5.10(b) 9,66960

Figura 5.10(c) 9,92430

Os tempos observados são altos quando comparados com os tempos da busca heurística

para garras de dois dedos. Esta diferença é proveniente do cálculo do centro da fixação para

cada combinação, e é principalmente proveniente da avaliação de todas as combinações, ao

contrário do caso anterior, em que os pontos são divididos em dois grupos de candidatos e a

avaliação é realizada apenas para os pares formados por elementos de cada um dos grupos.

O método de determinação de três pontos de contato por busca heurística também foi tes-

tado com os 8100 objetos da base de dados. Foi possível determinar uma fixação force-closure

para 8035 objetos (99,2% dos objetos).


5.4.2 Fixação 2D por otimização utilizando redes competitivas de Hopfield

O mecanismo de busca heurística avalia todas as possíveis combinações de fixação entre os

pontos da aproximação poligonal, porém, não há um mecanismo de busca, ou seja, é necessário

avaliar todas as combinações em uma ordem qualquer, e selecionar a que apresentar a melhor

nota, ou até que um limiar seja atingido. O mecanismo de busca pela melhor fixação pode

ser otimizado de diversas maneiras, sendo que uma delas é utilizar como ferramenta de busca

uma rede competitiva de Hopfield (XU et al., 1990). A rede de Hopfield é capaz de encontrar

mínimos locais de uma função qualquer em poucas iterações, sendo que não é necessário avaliar

todo o domínio da função.

A rede competitiva para a fixação 2D implemetada é similar àquela da aproximação poli-

gonal4. Uma matriz neural V é formada por m colunas que representam os pontos de contato,

sendo que para a fixação por dois pontos de contato m = 2, e para fixação por três pontos de

contato, m = 3. Cada uma das m colunas é formada pelos n pontos da aproximação poligonal.

A regra de aprendizado, os pesos da conexão entre os neurônios das colunas vizinhas de V , é

calculada segundo a mesma função custo da busca heurística, ou seja, as Equações 5.15 e 5.16,

respectivamente para dois e três pontos de contato.

Uma vez determinada a matriz neural V e a regra de aprendizado, é necessário inicializar

a rede. A rede é inicializada da seguinte forma: para cada coluna um único neurônio é ati-

vado, este neurônio ativado representa o ponto selecionado para um contato, e desta forma,

um neurônio é ativado para cada coluna, representando o ponto selecionado para um contato, e

desta forma, os neurônios ativados em cada uma das colunas formam a fixação. Os neurônios

ativados na inicialização da rede estão igualmente espaçados.

O mecanismo de execução da rede consiste em um processo iterativo, e em cada etapa da

iteração uma coluna de V é avaliada, para cada neurônio da coluna avaliada é determinado o

peso da conexão com os neurônios das colunas vizinhas. O neurônio que apresentar o menor

valor de ativação dentre todos aqueles de uma mesma coluna é ativado, e os demais neurônios

da mesma coluna são desativados. A próxima coluna é então avaliada dando continuidade

ao proceso iterativo, que termina quando não houver modificações na matriz V . Quando não

há mais mudanças dos neurônios ativados em toda a rede, diz-se que a rede convergiu. Os

neurônios ativados em cada uma das m colunas no estado de convergência da rede representam

os melhores pontos de contato.

O algoritmo foi implementado no computador de testes para se determinar pontos de fixação

4Vide Xu et al. (1990), que demonstram a convergência da rede de Hopfield para fixação 2D e 3D.


por dois e três pontos de contato, e os resultados obtidos são mostrados a seguir.


As imagens das Figuras 5.11 e 5.12 mostram os resultados obtidos com o método de de-

terminação por otimização com redes de Hopfield para fixação por dois contatos. Em alguns

casos não foi possível determinar pontos de contato adequados, nestes casos apresenta-se um

"x" vermelho no centro da imagem.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 5.11: Resultados do algoritmo de otimização com redes de Hopfield para determinação

de dois pontos de fixação para objetos do cotidiano. As linhas vermelhas mostram a direção de

aproximação dos dedos da garra para o momento da fixação (parte 1 de 2).


(a) (b) (c)


de dois pontos de fixação para objetos do cotidiano. As linhas vermelhas mostram a direção de

aproximação dos dedos da garra para o momento da fixação (parte 2 de 2).

A Tabela 5.3 apresenta os tempos de processamento da execução da rede de Hopfield para

cada um dos objetos mostrados nas Figuras 5.11 e 5.12. Na Tabela 5.2 não é mostrado o tempo

do processamento da imagem e da aproximação poligonal. Os tempos de execução da rede

de Hopfield para determinação de dois pontos de fixação variam de objeto para objeto. Este

comportamento deve-se a complexidade da forma deste objeto, fazendo com que formas mais

complexas demandem um maior tempo de execução da rede.

Em comparação com rede de Hopfield com a busca Heurística, pode-se observar que não é

possível determinar uma fixação satisfatória para vários objetos de teste utilizando o primeiro

método, porém o seu tempo de execução é significativamente menor.

Além disso, nas simulações com os objetos da base de dados, foi possível determinar uma

fixação force-closure para apenas 5086 objetos (62,8% do total de objetos).

Tabela 5.3: Tabela do tempo da fixação 2D por Hopfield para os objetos das Figuras 5.11 e 5.12.

Rede de Hopfield [s]Figura 5.11(a) 0,0690

Figura 5.11(b) 0,0238

Figura 5.11(c) 0,0567

Figura 5.11(d) 0,0209

Figura 5.11(e) 0,0314

Figura 5.11(f) 0,0419

Figura 5.11(g) 0,0318

Figura 5.11(h) 0,0214

Figura 5.11(i) 0,0321

Figura 5.12(a) 0,0217

Figura 5.12(b) 0,0223

Figura 5.12(c) 0,0214



As imagens da figura a seguir mostram os resultados obtidos com o método de determinação

por otimização com redes de Hopfield para garras de três dedos.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)


de três pontos de fixação para objetos do cotidiano.


Tabela 5.4: Tabela do tempo de determinação da fixação 2D por três pontos de contato uti-

lizando otimização por redes de Hopfield para os objetos da Figura 5.13.


Figura 5.13(b) 0,1119

Figura 5.13(c) 0,1039

Figura 5.13(d) 0,1120

Figura 5.13(e) 0,1239

Figura 5.13(f) 0,1016

Figura 5.13(g) 0,1226

Figura 5.13(h) 0,1044

Figura 5.13(i) 0,1093

Figura 5.13(j) 0,1041

Figura 5.13(k) 0,0967

Figura 5.13(l) 0,0947

Ao comparar os tempos de processamento da rede de Hopfield, mostrados na Tabela 5.4,

com os tempos de processamento da busca heurística, mostrados na Tabela 5.2, para fixação por

três pontos de contato, pode-se verificar a significativa diminuição do tempo de processamento.

E ainda, é possível determinar pontos adequados de fixação para sete objetos dos doze objetos

de teste. Desta forma, pode-se dizer que a rede de Hopfield apresenta bons resultados quando

o tempo de processamento é um dos requisitos do sistema em detrimento da qualidade das

respostas.

Nas simulações com os objetos da base de dados, foi possível determinar uma fixação

adequada por três pontos de contato para 1545 objetos (19,1% do total de objetos).

5.4.3 Fixação 2D por redes neurais feedforward tipo RBF

A capacidade de generalização e de classificação das redes neurais também pode ser uti-

lizada para a determinação de fixações para garras robóticas. Em Valente (1999), o método de

determinação de pontos de contato por redes neurais, no qual esta implementação é baseada, é

apresentado, portanto, recomenda-se a leitura deste texto para maior compreensão.

Em síntese, as redes neurais tipo feedforward, quando devidamente treinadas, são capazes

de determinar pontos adequados para uma fixação estável. Neste caso, a rede neural é treinada

com padrões geométricos divididos em classes, e seus respectivos pontos de fixação. Em etapa

de execução, a rede neural recebe como entrada a representação simplificada do objeto obtida

pela aproximação poligonal do contorno do objeto, e a resposta obtida representa uma estima-

tiva dos pontos de fixação.


Pode-se então dividir este método em duas partes: a primeira é a etapa pré-execução em

que a rede é treinada; e a segunda é a etapa em que a rede é executada e os pontos de fixação

são determinados.

Para a primeira primeira etapa, formas geométricas são selecionadas para o treinamento

da rede. Dependendo do tipo de aplicação, pode-se adaptar os padrões de treinamento com

a finalidade de melhorar o desempenho da rede para um caso específico, ou pode-se treinar a

rede com alguns padrões representantes das classes geométricas mais comuns a fim de garantir

rendimento satisfatório da rede para as formas mais variadas possíveis.

Baseado nas formas utilizadas por Valente (1999), são selecionadas formas representantes

de três classes geométricas: retângulos, elipsóides e triângulos. A Figura 5.14 mostra as formas

geométricas utilizadas no treinamento da rede.

Figura 5.14: Padrões geométricos 2D utilizados no treinamento das redes neurais feedforwardtipo RBF.

Para cada um dos padrões geométricos 2D apresentados na Figura 5.14, os melhores pontos

de fixação são determinados pelo algoritmo de busca heurística apresentado na Seção 5.4.1 para

dois e três pontos de contato. Os padrões geométricos definidos e suas respectivas respostas são

utilizados para treinamento da rede neural. O tempo de treinamento determina a escolha do tipo

de rede feedforward a ser utilizado, neste caso, a rede selecionada é a rede tipo RBF. Segundo

Valente (1999), que investiga o comportamento das redes feedforward nesta tarefa, ambos os

tipos RBF e MLP apresentam resultados satisfatórios quanto à qualidade da fixação determinada


e quanto ao tempo de execução, contudo, as primeras apresentam tempo de treinamento menor

que as segundas. Tempo de treinamento reduzido é fundamental para a implementação de

sistemas capazes de aprender novas fixações.

Tendo em mãos os padrões de treinamento e seus respectivos melhores pontos de fixação,

pode-se iniciar o treinamento da rede. Vale ressaltar que é necessário, para o correto funciona-

mento da rede, normalizar as suas entradas e saídas, tanto na etapa de treinamento, quanto na

etapa de execução. A entrada da rede consiste em um vetor de 200 pontos formado pelas co-

ordenadas x e y dos pontos obtidos da aproximação poligonal, os valores são redimensionados

a fim de que o máximo valor seja unitário, e o mínimo seja zero, e rotacionados a fim de posi-

cionar o lado da forma geométrica de maior comprimento com o eixo x. As respostas esperadas

para os padrões geométricos também recebem a mesma normalização.

Na etapa de execução, a rede recebe como entrada os 200 pontos resultantes da aproximação

poligonal normalizados segundo a descrição acima, e as resposta obtidas são aproximadas para

aqueles mais próximos pertencentes aos dados de entrada da rede. As respostas obtidas devem

sofrer modificações inversas àquelas da normalização a fim de se obter valores coerentes com

a imagem do objeto. Para se determinar os pontos reais no espaço de trabalho do robô, ainda

é necessário transformar os pontos selecionados do sistema de coordenadas da imagem para

o sistema de coordenadas global, neste caso, para as câmeras de topo, os cálculos são mais

simples que para as câmeras posicionadas nos efetuadores, além da facilidade de calibração do

primeiro tipo de disposição do sensor de visão.


O método de busca heurística para garras de dois dedos apresentado anteriormente foi uti-

lizado para determinar as respostas dos padrões geométricos de treinamento. A rede neural

treinada com estes dados foi utilizada para a determinação de dois pontos de fixação para os ob-

jetos selecionados. A Figura 5.15 mostra os resultados obtidos e a Tabela 5.5 mostra os tempos

de processamento da rede para cada um dos objetos.

Nas imagens da Figura 5.15, as imagens com um "x" vermelho são aquelas em que a

fixação determinada não apresenta a propriedade force-closure. O índice de ocorrência de erros

é alto, e melhorias ainda devem ser investigadas em trabalhos futuros.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)


de três pontos de fixação para objetos do cotidiano.


Tabela 5.5: Tabela do tempo de determinação da fixação 2D por garras de dois dedos utilizando

RNAs tipo RBF para os objetos da Figura 5.15.

Rede RBF [s]Figura 5.15(a) 0,0473

Figura 5.15(b) 0,0350

Figura 5.15(c) 0,0364

Figura 5.15(d) 0,0360

Figura 5.15(e) 0,0354

Figura 5.15(f) 0,0351

Figura 5.15(g) 0,0363

Figura 5.15(h) 0,0351

Figura 5.15(i) 0,0365

Figura 5.15(j) 0,0362

Figura 5.15(k) 0,0355

Figura 5.15(l) 0,0371

Apesar do índice de erros apresentado pela rede RBF, a resposta considerada insatisfatória

para alguns objetos é determinada sempre próxima a uma região em que se encontra soluções

satisfatórias. Desta forma, pode-se concluir que a rede RBF apresenta bom desempenho como

classificadora, e, ao se ajustar adequadamente seus parâmetros, tal como o raio da sua função

de base, pode-se conseguir bons desempenhos em tarefas de classificação. Na simulação ap-

resentada, o raio da função de base da rede RBF foi ajustado com valor abaixo de 1, ou seja,

o rede foi configurada para trabalhar como determinadora dos pontos de contato, e não como

classificadora.

Em relação aos tempos de processamento, pode-se verificar pelos valores apresentados na

Tabela 5.5, que o tempo de processamento é reduzido em comparação com a busca heurística.

Nas simulações com os objetos da base de dados, foi possível determinar uma fixação force-

closure para apenas 645 objetos (7,7% do total de objetos).


Outra rede RBF foi treinada com as formas geométricas e seus respectivos três pontos de

fixação obtidos pelo método de busca heurística para fixação por três contatos. Simulações

foram realizadas com os objetos selecionados e os resultados são mostrados na Figura 5.16, e

na Tabela 5.6.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)

Figura 5.16: Resultados do algoritmo baseado em RNAs RBF na determinação de três pontos

de fixação para objetos do cotidiano.


Tabela 5.6: Tabela do tempo de determinação da fixação 2D por garras de três dedos utilizando

redes neurais tipo RBF para os objetos das Figuras 5.16.

Redes RBF [s]Figura 5.16(a) 0,1794

Figura 5.16(b) 0,1330

Figura 5.16(c) 0,0994

Figura 5.16(d) 0,0931

Figura 5.16(e) 0,1094

Figura 5.16(f) 0,1052

Figura 5.16(g) 0,0921

Figura 5.16(h) 0,1019

Figura 5.16(i) 0,0948

Figura 5.16(j) 0,1232

Figura 5.16(k) 0,1075

Figura 5.16(l) 0,0991

A partir das observações das respostas mostradas na Figura 5.16 e dos tempos de processa-

mento apresentados na Tabela 5.6, pode-se verificar que a rede RBF apresenta melhor desempe-

nho para a determinação de três pontos de contato, cujo desempenho em relação a qualidade é

semelhante àquele apresentado pela rede de Hopfield, e em relação aos tempos de processameto,

pode-se dizer estes são reduzidos em comparação com a busca heurística.

Nas simulações com os objetos da base de dados, foi possível determinar uma fixação

adequada por três pontos de contato para 2110 objetos (26,0% do total de objetos).

5.4.4 Fixação 2D por redes feedforward e de Hopfield combinadas

Avaliando os resultados da rede feedforward e da rede de Hopfield, pode-se chegar a al-

gumas conclusões, dentre elas: (1) a inicialização da rede de Hopfield afeta diretamente sua

resposta, tendo em visa que inicializações inadequadas geram respostas não satisfatórias; (2)

pode haver pontos estáveis ou mais adequados para a fixação nas proximidades dos pontos

determinados pela rede feedforward.

Baseado nestas duas observações, Xu et al. (1990) propõem a utilização das duas redes em

cascata com o objetivo de reunir as características positivas das duas redes na determinação

da fixação. Nesta configuração em cascata, a rede feedforward é responsável por classificar o

objeto, e sua resposta é uma inicialização mais adequada para a rede otimizadora de Hopfield,

que busca nas regiões vizinhas dos pontos de fixação selecionados pela rede RBF, melhores

pontos de fixação.

Na presente Seção, a rede em cascata é composta pelas redes RBF e Hopfield sem qualquer


modificação, de tal forma que o resultado da rede RBF é utilizada como inicialização adequada

da rede de Hopfield.


As Figuras 5.17 e 5.18 mostram os resultados obtidos para os objetos selecionados e a

Tabela 5.7 mostra os tempos de processamento. Em comparação com os resultados das redes

anteriores, de forma isolada para cada uma delas, é possível verificar uma melhora significativa

da qualidade das respostas, principalmente a queda do índice de respostas não satisfatórias.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 5.17: Resultados do algoritmo baseado em RNAs RBF e posterior otimização por redes

de Hopfield na determinação de dois pontos de fixação para objetos do cotidiano (parte 1 de 2).


(a) (b) (c)

Figura 5.18: Resultados do algoritmo baseado em RNAs RBF e posterior otimização por redes

de Hopfield na determinação de dois pontos de fixação para objetos do cotidiano (parte 2 de 2).

Os tempos de processamento das redes RBF e de Hopfield para determinação de dois pontos

de contato são apresentados na Tabela 5.7.

Tabela 5.7: Tabela do tempo de determinação da fixação 2D por dois dedos utilizando RNAs

tipo RBF e posterior otimização por redes de Hopfield para os objetos das Figuras 5.17 e 5.18.

Redes RBF e Hopfield [s]Figura 5.17(a) 0,1283

Figura 5.17(b) 0,0738

Figura 5.17(c) 0,0692

Figura 5.17(d) 0,0473

Figura 5.17(e) 0,0591

Figura 5.17(f) 0,0603

Figura 5.17(g) 0,0619

Figura 5.17(h) 0,0626

Figura 5.17(i) 0,0588

Figura 5.18(a) 0,0583

Figura 5.18(b) 0,0616

Figura 5.18(c) 0,0590

A utilização da rede RBF como classificadora e da rede de Hopfield como otimizadora

melhorou o desempenho na determinação da fixação. Em relação a qualidade das respostas,

o desempenho apresentado pelas duas redes em conjunto é melhor que o desempenho de cada

rede separada, sendo que onze fixações são satisfatórias para a redes redes em conjunto contra

sete e seis fixações satisfatórias para as rede de Hopfield e RBF, respectivamente. Em relação

aos tempos de processamento, o desempenho também é satisfatório.

O novo método proposto foi simulado na determinação de fixações para os 8100 objetos da

base de dados. Foram obtidas 6143 fixações force-closure, aproximadamente 75,8% do total de

imagens.



Da mesma forma que para a determinação de dois pontos de contato, as redes combinadas

também podem ser utilizadas para determinar três pontos de contato. Os resultados das simula-

ções com os objetos de teste são apresentados nas Figuras 5.19 e 5.20.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 5.19: Resultados do algoritmo baseado em redes neurais RBF e posterior otimização

por redes de Hopfield na determinação de três pontos de fixação para objetos do cotidiano. As

linhas vermelhas mostram a direção de aproximação dos dedos da garra para o momento da

fixação (parte 1 de 2).


(a) (b) (c)

Figura 5.20: Resultados do algoritmo baseado em redes neurais RBF e posterior otimização

por redes de Hopfield na determinação de três pontos de fixação para objetos do cotidiano. As

linhas vermelhas mostram a direção de aproximação dos dedos da garra para o momento da

fixação (parte 2 de 2).

Os tempos de processamento medidos na determinação de três pontos de contato pelas redes

combinadas são apresentados na Tabela 5.8.

Tabela 5.8: Tabela do tempo de determinação da fixação 2D por garras de três dedos utilizando

redes neurais tipo RBF e posterior otimização por redes de hopfield para os objetos das Figuras

5.19 e 5.20.


Figura 5.19(b) 0,0393

Figura 5.19(c) 0,1383

Figura 5.19(d) 0,0899

Figura 5.19(e) 0,1173

Figura 5.19(f) 0,1012

Figura 5.19(g) 0,1078

Figura 5.19(h) 0,0408

Figura 5.19(i) 0,1389

Figura 5.20(a) 0,1186

Figura 5.20(b) 0,0969

Figura 5.20(c) 0,1147

Similar aos resultados obtidos pelas redes de Hopfield e RBF combinadas na determinação

de dois pontos de contato, para três pontos de contato também houve melhora significativa

no desempenho das redes na determinação dos pontos de contato e em relação aos tempo de

processamento.

O novo método proposto foi simulado na determinação de fixações para os 8100 objetos da

base de dados. Foram obtidas 6425 fixações force-closure, aproximadamente 79,3% do total de

imagens.



Neste Capítulo, a fixação 2D de objetos desconhecidos foi estudada. Diferentes métodos

de fixação 2D baseados em RNAs foram descritos e resultados de simulações com imagens

de objetos do cotidiano e com uma extensa base de dados foram apresentados para cada um

dos métodos. O principal objetivo deste Capítulo foi o estudo da capacidade das RNAs na

determinação de pontos de contato e das limitações apresentadas pelo diferentes métodos.

Foram apresentados três métodos de fixação 2D baseados em RNAs: o método proposto por

Valente (1999), que utiliza redes RBF previamente treinadas; o método proposto por Xu et al.

(1990), que utiliza redes de Hopfield; e foi apresentada uma proposta de combinação das redes

RBF e de Hopfield. Adicionalmente, também foi apresentado um método de busca heurística,

que é utilizado na etapa de treinamento da rede RBF.

Simulação com oito imagens de objetos reais foram realizadas para cada um dos métodos

na determinação de dois e de três pontos de contato a fim de apresentar os resultados obtidos,

e ainda, simulações foram realizadas com uma base de 8100 objetos. O objetivo de tais simu-

lações foi avaliar o desempenho da rede em relação à qualidade das respostas e em relação ao

tempo de processmento.

Os resultados obtidos nas simulações mostraram que, de forma geral, é possível determinar

pontos adequados de fixação para objetos desconhecidos, desde que as redes estejam adequada-

mente treinadas e configuras. E ainda, o tempo de processamento observado é reduzido.

Em relação aos resultados obtidos com a rede RBF, foi possível verificar que a mesma não

apresenta um bom desempenho em relação a qualidade das respostas, pois, apenas 7,7% das

respostas foram satisfatórias para os 8100 objetos da base dedos. Porém, a rede RBF apresenta

diversos parâmetros de configuração, como número de neurônios, raio da função de base radial,

tipo de treinamento, entre outros menos expressivos. Logo, deve-se ainda investigar a relação

entre o desempenho da rede e seus parâmetros de configuração. Um das vantagens da rede RBF

é a possibilidade de treiná-las com formas padrões adequadas para cada aplicação específica.

Em relação aos resultados obtidos com a rede de Hopfield, os resultados obtidos são melho-

res que aqueles obtidos pelas redes RBF quanto à qualidade das respostas, porém com pequena

desvantagem em relação ao tempo de processamento. Uma das principais características ob-

servadas para este tipo de rede, é o seu desempenho em função da sua inicialização, pois se

verificou a dependência dos resultados em relação à inicialização da rede. Uma das vantagens

da rede, é a possibilidade de se trabalhar com dados não normalizados.


Em relação a proposta de combinação das redes RBF e de Hopfield para a fixação 2D,

observou-se uma melhora significativa na qualidade das respostas sem significante aumento no

tempo de processamento, o que indica que a rede RBF apresenta melhores resultados como

classificadora, e que a sua resposta é uma boa inicialização para a rede de Hopfield. Resultados

expressivos foram alcançados com a combinação das duas redes, chegando a cerca de 70% de

fixações satisfatórias para os 8100 objetos da base de dados.

119

Parte III

Fixação 3D utilizando redes neurais

artificiais

121

6 Simplificação de superfícies utilizando redesde Hopfield

Este Capítulo apresenta um algoritmo, baseado em redes neurais de Hopfield, para a simpli-

ficação de malhas superfíciais de modelos 3D de objetos. Tais modelos são representados por

uma nuvem de pontos definidos no espaço, e uma malha de elementos triangulares que ligam

estes pontos formando a topologia do objeto. Dentre os pontos da nuvem, um número reduzido

pode ser selecionado a fim de representar o objeto, sem perda das principais características da

sua forma. Para a tarefa de simplificação do objeto, é proposto um algoritmo baseado em redes

de Hopfield, inspirado naquele utilizado para a aproximação poligonal apresentado no Capítulo

4. A rede neural é utilizada na tentativa de simplificar as etapas de cálculos da simplificação

e o objetivo é obter simplificações de boa qualidade, porém com tempo de processamento re-

duzido. Os resultados obtidos com a rede neural proposta, com simulações na simplificação

de malhas de objetos, mostram que a qualidade da simplificação é similar àquelas obtidas por

outros métodos, segundo métricas de um software avaliador dedicado, e que o tempo total de

processamento observado é compatível com as aplicações em robótica, nas quais pretende-se

aplicar este método.

6.1 Introdução

Uma malha superficial, ou malha tridimensional (malha 3D), é composta por elementos

geométricos fundamentais (triângulos, quadrados, retângulos, ou polígonos) conectados orde-

nadamente entre si, e é utilizada na representação de objetos, ou de formas geométricas quais-

quer, em diversas aplicações.

Estas aplicações são inúmeras e distintas. As malhas 3D são utilizadas, de forma geral na

Engenharia, em programas dedicados de projeto, conhecidos pelo acrônimo do inglês Computer-

Aided Design (CAD), em análises pelo método dos elementos finitos (neste caso a malha

pode ser volumétrica), entre outros. São utilizadas também na implementação de jogos (video

games), e em computação gráfica em geral, tal como animações e realidade virtual.

122 6 Simplificação de superfícies utilizando redes de Hopfield

Na robótica existem programas de desenvolvimento que utilizam as malhas 3D para repre-

sentar ambientes, objetos e robôs, e que simulam a interação física entre os mesmos. Pode-se

citar como exemplo o programa IBEX (ETTLIN et al., 2005) desenvolvido para simular inte-

rações de robôs autônomos com o meio ambiente, e destinado ao desenvolvimento da robótica

móvel, e também pode-se citar o programa GraspIt! (MILLER; ALLEN, 2004), que foi desen-

volvido para simulação, análise e desenvolvimento de problemas de fixação e manipulação de

objetos por garras robóticas.

Nestes exemplos citados, as malhas 3D, que representam os objetos e o ambiente, são obti-

das de maneira sintética através de programas CAD, que em sua maioria utilizam para formar o

objeto primitivas geométricas como cubos, elipsóides, superfícies de revolução, e operações de

conjunto como união, intersecção, e outras operações como extrusão e corte. Estes programas

CAD geram automaticamente a malha 3D dos objetos modelados.

De forma geral, a criação, ou a modelagem, de objetos em programas CAD é muito de-

morada e requer que o usuário tenha conhecimentos específicos do programa utilizado para a

modelagem. O tempo de criação depende fundamentalmete da complexidade dos objetos que

se deseja criar. Por este motivo, e pelo desenvolvimento de equipamentos e técnicas de aquisi-

ção de dados espaciais de uma cena (FERNANDES, 2005), as malhas 3D podem também ser

obtidas pela reconstrução de dados reais adquiridos por dispositivos de visão 3D, tal como o

scanner 3D. Esta técnica é utilizada principalmente para criar modelos de objetos complexos,

e em muitos casos, o objeto é modelado manualmente e depois digitalizado com o dispositivo

adequado.

Esta abordagem alternativa requer que a malha seja reconstruída a partir de uma nuvem de

pontos espaciais, ou seja, aqueles pontos obtidos pelos sistemas de visão 3D. A reconstrução da

malha não é trivial, pois a mesma deve ser realizada apenas conhecendo-se a nuvem de pontos,

que normalmente não está organizada, e não há informações adicionais sobre a conectividade

entre os pontos. Existem diversos métodos para reconstruir malhas 3D a partir de nuvem de

pontos, e para os leitores mais interessados recomenda-se a leitura de Gois (2004) e Polizzeli

(2008), nos quais é realizada uma revisão dos métodos clássicos de reconstrução de malhas 3D

a partir de nuvens de pontos, assim como novos métodos são apresentados.

Uma malha 3D pode apresentar um elevado nível de detalhamento, sendo composta por

centenas, e até milhares, de elementos fundamentais como vértices e triângulos por exemplo.

Esta característica é comum tanto para as malhas 3D geradas por programas CAD, quanto

para as malhas 3D reconstruídas a partir de uma nuvem de pontos. Em algumas aplicações,

é interessante notar a presença de muitos detalhes com a finalidade de promover realismo, e

6.1 Introdução 123

observa-se esta necessidade em animações gráficas e em jogos virtuais. No caso das animações

gráficas, as cenas são renderizadas a partir de cenários virtuais ricos em detalhes, o que demanda

horas de processamento para uma única cena. No caso dos jogos, a exigência de realismo

promove o constante desenvolvimento de softwares de renderização e placas gráficas de alto

desempenho.

Contudo, em outras aplicações necessita-se de versões simplificadas das malhas 3D. Por

exemplo, na transmissão de visualizações via linha de comunicação, pode-se utilizar diferentes

níveis de detalhamento (LOD1) de uma malha, sendo que neste caso inicia-se a transmissão com

uma malha de pouco detalhamento, e progressivamente aumenta-se o detalhamento a medida

que os dados são transmitidos.

Diferentes níveis de detalhamento também são utilizados em computação gráfica na apre-

sentação de um mesmo objeto a diferentes distâncias do observador. Quando o objeto está pró-

ximo, utiliza-se uma malha com muitos detalhes, e a medida que o objeto afasta-se, utilizam-se

malhas menos refinadas. O objetivo desta técnica é melhorar o desempenho da renderização

da cena. Pode-se ainda utilizar níveis de detalhamento na representação de topologias, e neste

caso, melhora-se o detalhamento nas regiões próximas ao observadoor, enquanto que aquelas

distantes apresentam poucos detalhes (HOPPE, 1996).

Existem ainda outras aplicações em que se requer o uso de malhas simplificadas para reduzir

tanto os recursos computacionais requeridos (memória, espaço em disco rígido e processador),

quanto os tempos de execução no processamento de tarefas que utilizam as informações conti-

das na malha 3D. Para o caso especial da fixação 3D de objetos, também é interessante o uso

de malhas 3D simplificadas. Em muitos casos utiliza-se sensores 3D para adquirir uma nuvem

de pontos que define um objeto, e que retornam ao sistema uma grande quantidade de pontos,

que devem ser simplificados a fim de reduzir os tempos de processamento, e, principalmente,

de simplificar os cálculos específicos que utilizam as informações referentes à forma do objeto

que estão contidas na malha 3D.

A simplificação de malhas 3D que representam objetos e topografias é fundamental para

funcionamento adequado de várias aplicações. Na literatura existem inúmeros métodos propos-

tos que utilizam diferentes abordagens para resolver este problema. Cignoni et al. (1998a) faz

uma breve, porém completa, apresentação e descrição dos tipos fundamentais de simplificação

de superfícies. No trabalho também são discutidas algumas das características como qualidade

de simplificação, tempos de processamento e desvantagens de cerca de 21 métodos que repre-

sentam os tipos fundamentais de abordagens. Ainda em Cignoni et al. (1998a), seis trabalhos

1LOD é a sigla do termo inglês level of detail.


escolhidos como os mais eficientes são comparados quantitativamente na simplificação de três

malhas obtidas por diferentes métodos: o fandisk representa a classe do objetos modelados em

programa CAD, o bunny representa a classe de mallhas 3D reconstruídas a partir de pontos obti-

dos por scanners 3D, e o femur representa a classe daquelas malhas obtidas pela reconstrução

de dados extraídos de imagens.

No caso específico estudado neste trabalho, também se deseja utilizar versões simplifi-

cadas das malhas 3D para se determinar pontos de contatos para fixação de objetos. Segundo

a proposta inicial do trabalho de se utilizar RNAs nas etapas de determinação da fixação, neste

Capítulo é apresentado uma nova proposta de simplificação de superfícies baseado em RNAs

competitivas de Hopfield. A proposta da utilização de RNAs para o problema da simplificação é

inovador para a área, e comparações com os resultados apresentados por Cignoni et al. (1998a),

dos seis principais trabalhos de simplificação, mostram a eficiência da nova proposta.

O Capítulo segue esta organização: na Seção 6.2, o algoritmo de simplificação de superfí-

cies proposto, baseado em redes de Hopfield, é descrito; na Seção 6.2.2, diferentes estratégias

de simplificação de malhas utilizando a proposta são discutidas; na Seção 6.3, o algoritmo é

simulado na simplificação de alguns objetos a fim de se verificar a capacidade de simpificação,

e comparações com outros métodos de simplificação são realizadas a fim de comprovar a ca-

pacidade do método proposto; por fim, conclusões e propostas são realizadas na Seção 6.4.


6.2.1 Descrição

O modelo de rede neural competitiva de Hopfield para a simplificação de superfícies é

apresentado nesta Seção. A arquitetura da rede é baseada naquela utilizada para aproximação

poligonal apresentada no Capítulo 4.

Nesta abordagem, a superfície do objeto é definida por uma nuvem de pontos representada

pelo vetor p = [p(1),. . . ,p(n)]T , sendo que cada elemento de p tem componentes x, y, e z em um

sistema de referência inercial, e ainda, os pontos estão ligados entre si por uma malha superficial

composta por triângulos como elementos geométricos elementares.

A Figura 6.1(a) mostra um modelo reconstruído a partir de dados adquiridos por um scanner

3D, a Figura 6.1(b) mostra os pontos de aquisição e a Figura 6.1(c) mostra a malha triangular.

A malha superfícial do objeto é obtida a partir da nuvem de pontos pela triangulação de

Delaunay (OKABE et al., 2000), sendo que os pontos da nuvem compõem os vértices dos triân-


(a)

(b) (c)

Figura 6.1: Elementos de malhas da superfície de um modelo reconstruído pela triangulação

de Delaunay. Figura 6.1(a) mostra o modelo reconstruído, Figura 6.1(b) mostra a nuvem de

pontos, e a Figura 6.1(c) mostra os elementos triangulares da malha.


gulos da malha. As relações geométrica entre os pontos da nuvem e os elementos triangulares

da malha são utilizados na construção da regra de aprendizado da rede neural. Porém, antes da

formalização desta regra, deve-se definir a arquitetura da rede neural.

A rede neural apresenta um total de n neurônios, sendo que cada neurônio, que representa

um único ponto da nuvem de pontos, está ligado a todos os demais neurônios da rede. A conexão

entre cada neurônio recebe um peso w, assim a conexação entre os neurônios i e j é definida por

w(i, j), e ainda, o peso muda de acordo com o sentido da conexão, tal que a conexão w(i, j) que

vai do neurônio i para o neurônio j é diferente da conexão w( j, i) que vai do neurônio j para o

neurônio i, ou seja w(i, j) �= w( j, i). A conexão de um neurônio com ele mesmo tem peso nulo

(w(i, i) = 0).

O conjunto de pesos entre todos os neurônios, e em todos os sentidos, de conexão forma

a matriz de pesos W . Para a definição da construção da matriz de pesos W deve-se definir a

"vizinhança" de um ponto na triangulação. Na triangulação de uma superfície, cada ponto

p(i) torna-se o vértice de um conjunto de triângulos Ei = [ei(1), ...,ei(s)]T , em que cada ele-

mento de Ei possui três coordenadas, sendo que cada coordenada representa o vértice de um

triângulo e é formada pelo índice de um ponto p da nuvem de pontos. Os vértices de cada

triângulo do conjunto Ei, diferentes do ponto p(i), formam a vizinhança Vi do ponto, tal que

Vi = [vi(1), ...,vi(s)]T . A Figura 6.2 mostra em azul o i-ésimo ponto, em vermelho o conjunto

Ei, e em verde os pontos de Vi.

Figura 6.2: Vizinhança de um ponto qualquer de uma malha. Em azul o ponto selecionado, em

vermelho os triângulos da vizinhança e em verde os pontos vizinhos do ponto em azul.


Uma das interessantes características da triangulação de Delaunay é que, ao se retirar um

ponto da nuvem inicial, e retriangular a nuvem alterada, a única região afetada pela retirada do

ponto é aquela definida pela sua vizinhança, ou seja, são afetados apenas os triângulos de Ei na

reconstrução da malha ao se retirar o i-ésimo ponto. A Figura 6.3(b) mostra a nova triangulação

Ei′, em vermelho tracejado, formada ao se retirar o i-ésimo ponto (ponto azul da Figura 6.3(a))

da nuvem de pontos.

(a) (b)

Figura 6.3: Efeito sobre a malha de superfície ao retirar um ponto. Figura 6.3(a) mostra a malha

antes de se retirar o ponto azul, Figura 6.3(b) mostra a malha reconstruída após a retirada do

ponto.

A partir da Figura 6.3, pode-se verificar que ao se reconstruir a malha após a retirada do

ponto p(i), a vizinhança de cada um dos pontos vizinhos daquele retirado é também modifi-

cada, assim como o conjunto de triângulos dos quais os vizinhos (pontos verdes de 6.3(b)), são

vértices.

Ao se retirar um ponto p(i) qualquer de uma malha e ao se efetuar a retriangulação, o

que ocorre é a simplificação parcial da malha pela simplificação de Ei por E ′i. Cignoni et al.

(1998b) define como erro de aproximação de superfícies o somatório das distâncias entre os

elementos de malha da superfície original, que foram retirados na simplificação, aos elementos

de malha da superfície aproximada. Para o caso em que o i-ésimo ponto é retirado da nuvem de

pontos, o erro é definido pelo somatório das distâncias do ponto p(i) aos triângulos Ei′ da nova

triangulação.


Figura 6.4: Cálculo do erro de simplificação.

O erro de simplificação ao se retirar o ponto p(i) é dado por:

δ i =s

∑k=1

d(p(i),Ei′(k)) (6.1)

em que d(p(i),Ei′(k)) é a distância Euclidiana do ponto p(i) ao triângulo Ei′(k).

Definido o erro de aproximação ao se retirar um ponto p(i) qualquer, pode-se então definir

a construção da matriz de pesos W . Dado um ponto p(i) qualquer, sua vizinhança Vi e a nova

triangulação Ei′, o peso das conexões que partem de p(i) tem valores nulos quando o neurônio

no qual a conexão chega não faz parte da vizinhança Vi. Para as conexões que partem de p(i)

e chegam nos neurônios cujos pontos relacionados pertencentes à vizinhança Vi, os pesos são

calculados da seguinte maneira:

w(i, j) = ∑d(p(i),Ei′ ∩Evi′(x)) (6.2)

em que vi(x) é o ponto p( j) pertencente a vizinhança Vi, e o termo Ei′ ∩Evi′(x) é formado

pelos triângulos de Ei′ que tem como um de seus vétices o ponto vi(x) (ou p( j)).

Desta maneira, a conexão de um neurônio com todos os demais neurônios não é nula so-

mente quando o segundo neurônio faz parte da sua vizinhança, e neste caso, o peso da conexão

é o somatório da distância do primeiro ponto aos triângulos obtidos na retriangulação que tem

o segundo ponto como vértice.

Para cada neurônio i também existe um limiar de ativação T (i). O limiar é definido da


seguinte forma:

T (i) = λs

∑j=1

Area(Ei′( j)). (6.3)

em que Area(Ei′( j)) é a área do j-ésimo triângulo de Ei′, e λ é um escalar de ponderação

(λ ∈ R).

Definida a construção da matriz de pesos e dos limiares de ativação, pode-se definir o

processo de simplificação pela rede de Hopfield. Inicialmente, todos os neurônios estão ati-

vados, ou seja, x(i) = 1 para i = 1, . . . ,n, e para cada neurônio i uma função energia é calculada

segundo a relação:

U(i) =n

∑j=1

w(i, j)x( j)+T (i). (6.4)

O neurônio que apresentar a menor energia de ativação é desativado, ou seja, seu estado

x(i) muda de 1 para 0. Em outras palavras, o neurônio que representa o ponto com menor erro

de aproximação ao ser retirado é desativado. O termo λ da Equação 6.3 é um escalar de valor

escolhido de acordo com o caso de aplicação do algoritmo. Este termo pondera a ampliação

de área entre os pontos da superfície provocada pela retirada de pontos durante a simplificação.

Por exemplo, para os casos em que se deseja uma aproximação com distribuição regular de

pontos ao longo da superfície, o termo λ tem grande importância. Para os casos em que pode

haver regiões de maior concentração de pontos e outras com menor concentração, o termo λpode ser pequeno ou até mesmo nulo.

A simplificação pela rede competitiva segue um processo iterativo. Na primeira iteração

todos os neurônios estão ativados, a função energia de toda a rede é calculada e o neurônio de

menor energia é desativado. Ao desativar um neurônio qualquer k, a triangulação Ek é modifi-

cada para Ek′, e conseqüentemente os neurônios vizinhos de k, pertencentes a V k, também terão

seus vizinhos modificados. Desta forma, ao desativar um neurônio k, o peso das conexões dos

vizinhos de k com seus próprios vizinhos é modificada. Portanto, a matriz de pesos é dinâmica,

e a cada iteração a matriz de pesos W deve ser atualizada.

Então, em cada iteração da rede um neurônio é desativado, a triangulação é reconstruída

localmente, os pesos de conexão são atualizados e a função energia é recalculada para aqueles

neurônios cujas conexões mudaram. Neste estágio, o neurônio com menor energia é desati-

vado e o processo iterativo prossegue até que permaneçam apenas m neurônios ativados. Os m

neurônios ativados ao final do processo representam os m pontos da simplificação.


6.2.2 Estratégias de simplificação

Na primeira iteração de execução da rede neural, a energia de cada neurônio deve ser calcu-

lada para se determinar aquele de menor energia que será desativado. Então, deve-se determinar

a vizinhança Vi e a triangulação Ei′ a partir da malha original para o ponto p(i), deve-se cal-

cular os pesos w(i, j), ou seja, deve-se calcular as distâncias entre o ponto p(i) e os triangulos

de Ei′, assim como as áreas destes. Ao finalizar este mesmo procedimento para cada um dos n

neurônios, e após calcular a função energia dos mesmo, aquele de menor energia é desativado.

Quando um neurônio é desativado, a malha original é atualizada, e inicia-se a próxima iteração

em que todos os neurônios ainda ativos serão novamente avaliados.

Este processo pode ser acelerado, pois pode ocorrer que qualquer um dos neurônios avali-

ados na primeira iteração apresente energia nula (U = 0). Como o valor de U é estritamente

positivo, pode-se afirmar que este neurônio é o que apresenta mínima energia, ou um dos que

apresentam mínima energia, caso outros neurônios apresentem energia também nula. A energia

nula de um neurônio pode ocorrer para aqueles que representam pontos em uma região plana e

quando o termo λ é nulo. Neste caso, pode-se concluir uma iteração com a desativação de um

neurônio do interior da região plana, mesmo que ainda restem neurônios a serem verificados.

A malha original é atualizada, e inicia-se a próxima iteração, que pode ser concluída da mesma

maneira sem a necessidade da verificação de todos os neurônios.

Seguindo esta linha de raciocínio, pode-se adotar um limiar de mínima energia Umin. Desta

forma, pode-se finalizar uma etapa de iteração assim que algum neurônio apresentar ener-

gia menor ou igual ao limiar. O limiar de mínima energia estabelece um erro de aproxi-

mação aceitável, pois em determinadas aplicações pode-se trabalhar com aproximações não

otimizadas. Esta estratégia permite acelerar o processo iterativo com conseqüente detrimento

da qualidade da simplificação.

Outra estratégia de simplificação interessante, principlamente para o caso estudado nesta

dissertação, é a simplificação de apenas uma região limitada do objeto. Nesta estratégia, a rede

é construída apenas para os pontos da região que pretende-se simplificar e executa-se o processo

iterativo. Pode-se ainda simplificar diferentes regiões do objeto em escalas diferentes, ou seja,

pode-se reduzir metade da malha de um objeto para 20% dos pontos originais, enquanto que

para a outra metada pode-se reduzir a malha para 10%.

As simulações realizadas com diferentes limiares de mínima energia são apresentados na

próxima Seção, enquanto que a estratégia de simplificação de regiões definidas é utilizada no

próximo Capítulo em que o algoritmo de fixação 3D é apresentado.



Para avaliar a capacidade de simplificação do algoritmo proposto, duas diferentes simula-

ções foram realizadas. Na primeira, diferentes simplificações foram realizadas para um mesmo

objeto a fim verificar a qualidade das respotas do algoritmo em função do parâmetro Umin. Na

segunda, os melhores resultados obtidos na primeira simulação são comparados com resultados

apresentados por outros métodos de simplificação.

Nas simulações são utilizadas duas malhas, que também são utilizadas por diversos autores

na avaliação de algoritmos de simplificação. Foram utilizados o modelo Bunny (Figura 6.5(a))

e o modelo Fandisk (Figura 6.5(b))2.

(a) (b)

Figura 6.5: Figura 6.5(a) mostra o modelo Bunny, que possui com 34834 vertices e malha de

69451 triângulos, e a Figura 6.5(b) mostra o modelo Fandisk que possui com 6475 vertices e

malha de 12946 triângulos.

Cada uma das simplificações realizadas é avaliada pelo programa Metro(descrito a seguir),

e apresenta-se, para cada caso, o erro máximo de simplificação Emax, e o erro médio quadrático

de simplificação Emed .

6.3.1 A ferramenta de avaliação Metro

Antes da descrição das simulações realizadas e da apresentação dos resultados obtidos,

é necessário apresentar os critérios de medida do erro de simplificação de superfícies. Foi

descrita anteriormente a métrica proposta por Cignoni et al. (1998b), que pode ser sintetizada

como: dado duas superfícies, a original S1 e a aproximada S2, o erro de aproximação é dado

pelas distâncias entre os pontos da superfície S1 à superfície S2. Em função das distâncias entre

2O modelo Femmur não foi utilizado pois não foi possível encontrar o arquivo da malha 3D.


os pontos de S1 e a curva S2, diferentes medidas de aproximação podem ser obtidas: o erro

máximo Emax, o erro médio Eavg e o erro médio quadrático Emed .

A fim de difundir e formalizar as medidas de qualidade da simplificação descritas acima,

um programa dedicado denominado Metro foi desenvolvido e é apresentado em Cignoni et al.

(1998b). O Metro possibilita a avaliação da simplificação de uma superfície a partir da compara-

ção da malha simplificada com a original, de forma independente do método de simplificação

utilizado. Segundo (CIGNONI et al., 1998a) o programa foi utilizado por mais de 250 autores

na análise de algoritmos de simplificação na época da publicação.

Além das medidas de qualidade da aproximação, o software também calcula outras carac-

terísticas das superfícies como: volume encapsulado (apenas para as malhas fechadas); área;

menor diagonal do cubo que o contém; volume entre as superfícies; e também fornece uma

saída visual em que uma escala de cores, que indica o valor do erro em cada ponto da rede, é

aplicada sobre a superfície original.

A fim de formalizar os resultados das simulações, utiliza-se o Metro como avaliador da

qualidade da simplificação. Este procedimento permite comparar o resultado do algoritmo pro-

posto com os resultados de outros algoritmos, e também possibilita que outros trabalhos também

utilizem os dados em futuras comparações.

6.3.2 Desempenho em função do limiar Umin

Na Seção 6.2.2 foi discutida a possibilidade de se trabalhar com diferentes valores do parâ-

metros Umin, para se reduzir o tempo de processamento, em detrimento da qualidade da simpli-

ficação.

Para avaliar a dependência da qualidade dos resultados e do tempo de processamento da

simplificação em função do limiar de energia Umin, diferentes simplificações foram realizadas

para o modelo Bunny e para o modelo Fandisk. Para cada diferente porcentagem de simplifi-

cação, 0,5%, 1%, 5%, 10%, 25% e 50% dos pontos do modelo original, o limiar foi variado de

0 a 2,5. Para cada diferente simplificação o tempo de processamento e o erro médio quadrático

Emed foram medidos3.

Os gráficos das Figuras 6.6 e 6.7 mostram os resultados obtidos para o modelo Bunny e

para o modelo Fandisk, respectivamente.

3O erro máximo de simplificação Emax também foi medido nas simulações, mas os valores não são apresentados

pois não verifica-se dependência entre Umin e Emax.


Resultados obtidos para o modelo Bunny.

(a)

(b)

Figura 6.6: Resultados para diferentes porcentagens de simplifcação do modelo Bunny em

função do limiar Umin. A Figura 6.6(a) mostra o erro médio quadrático de cada porcentagem

de simplificação em função do limiar, e a Figura 6.6(b) mostra o tempo de simplificação em

função do mesmo limiar.


Resultados obtidos para o modelo Fandisk.

(a)

(b)

Figura 6.7: Resultados para diferentes porcentagens de simplifcação do modelo Fandisk em

função do limiar Umin. A Figura 6.7(a) mostra o erro médio quadrático de cada porcentagem

de simplificação em função do limiar, e a Figura 6.7(b) mostra o tempo de simplificação em

função do mesmo limiar.


Pela análise dos gráficos, pode-se verificar que, tanto para o modelo Bunny, quanto para

o Modelo Fandisk, o melhor resultado, ou seja, Umin = 0, ocorre quando não se utiliza um

limiar no processo iterativo da rede neural, e ainda, o tempo de processamento é reduzido com

a utilização de um limiar, porém, a estratégia prejudica a qualidade da aproximação. Pode-se

também verificar a melhora do desempenho do método, em relação ao tempo de processamento,

com o aumento de Umin, porém, o desempenho em relação a qualidade da simplificação reduz-se

com o aumento de Umin, ou seja, o erro médio Emed aumenta.

Os dados coletados nestas simulações, e que foram utilizados na construção dos gráficos

das Figuras 6.6 e 6.7, encontram-se nas Tabelas C.1, C.2, C.3 e C.4 do Apêndice C.

6.3.3 Comparação com outros algoritmos

Na segunda simulação o objetivo é comparar os resultados do algoritmo proposto com

outros métodos de simplificação de malhas. Os métodos utilizados nesta comparação são: Mesh

decimation proposto por Schroeder et al. (1992), Simplification envelopes proposto por Cohen et

al. (1996), Multiresolution decimation proposto por Ciampalini et al. (1997), Mesh optimization

proposto por Hoppe et al. (1993), Progressive meshes proposto por Hoppe (1996), Quadric

error metrics simplication proposto por Garland e Heckbert (1997)4.

Nas simulações foram utilizadas as malhas do modelo Bunny (Figura 6.5(a)) e do modelo

Fandisk (Figura 6.5(b)). O modelo Bunny foi simplificado para 50%, 25%, 10%, 5%, 1% e

0,5% dos 34834 pontos do modelo original, e o modelo Fandisk foi simplificado para 50%,

25%, 10%, 5% e 1% dos pontos do modelo original. Para cada simplificação o erro máximo

Emax e o erro médio quadrático Emed foram medidos. Para a simplificação dos dois modelos com

o algoritmo proposto, foi utilizado Umin = 0, pois neste caso obtém-se a melhor simplificação.

Os gráficos das Figuras 6.8(a) e 6.8(b) mostram os erros máximos e médios na simplificação

do modelo Bunny. E os gráficos das Figuras 6.9(a) e 6.9(b) mostram os erros máximos e médios

na simplificação do modelo Fandisk.

Os resultados dos diversos algoritmos utilizados na construção dos gráficos encontram-se

nas Tabelas C.5, C.6, C.7 e C.8 do Apêndice C.

4Os resultados dos métodos citado foram extraídos de Cignoni et al. (1998a).


(a)

(b)

Figura 6.8: Gráficos de comparação do método proposto com outros métodos da literatura

na simplificação do modelo Bunny. Os gráficos das Figuras 6.8(a) e 6.8(b) mostram respectiva-

mente o erro máximo Emax e o erro médio Emed medidos para diferentes níveis de simplificação.


(a)

(b)

Figura 6.9: Gráficos de comparação do método proposto com outros métodos da literatura na

simplificação do modelo Fandisk. Os gráficos das Figuras 6.9(a) e 6.9(b) mostram respectiva-

mente o erro máximo e o erro médio medidos para diferentes níveis de simplificação.


A partir dos gráficos das Figuras 6.8 e 6.9 pode-se verificar que o método proposto apresenta

desempenho próximo, e por vezes melhor, que o desempenho apresentado por outros métodos

de destaque na literatura. Então, pode-se afirmar que o método de simplificação por redes de

Hopfield é eficiente.

As Figuras 6.10 e 6.11 mostram as malhas após a execução da simplificação utilizando

o algoritmo proposto. As Figuras 6.10(a) e 6.10(b) mostram os modelos originais do Bunny

e do Fandisk respectivamente, as Figuras 6.10(c), 6.11(a), 6.11(c), 6.11(e) e 6.12(a) mostram

respecticamente as simplificaçãoes para 50%, 25%, 10%, 5% e 1% para o Bunny, e as Figuras

6.10(d), 6.11(b), 6.11(d), 6.11(f) e 6.12(b) mostram respecticamente as simplificaçãoes para

50%, 25%, 10%, 5% e 1% do modelo Fandisk.

(a) (b)

(c) (d)

Figura 6.10: Representação dos modelos simplificados pelo método proposto (parte 1 de 3).


(a) (b)

(c) (d)

(e) (f)



(a) (b)



Neste Capítulo foi apresentada uma nova proposta de algoritmo de simplificação de super-

fícies baseado em redes neurais artificiais. A rede selecionada para cumprir a tarefa foi uma

rede competitiva de Hopfield, o que atende a proposta inicial de se utilizar redes neurais.

Os resultados obtidos na simplificação de modelos 3D complexos foram comparados com

os resultados obtidos por outros métodos de destaque na literatura. As comparações apontam

que a nova proposta é capaz de simplificar malhas superficiais com desempenho similar aos

melhores métodos de simplificação.

Também foi avaliado o desempenho do método proposto em função do limiar de desati-

vação de neurônios Umin. Os resultados mostram que é possível acelerar os tempos de proces-

samento utilizando valores elevados de Umin, porém ocorre detrimento da qualidade da simpli-

ficação. Contudo, a aplicação em que se deseja utilizar a rede de simplificação não exige ótimo

desempenho em relação a qualidade, e sim em relação ao tempo de processamento, então o uso

de valores elevados de Umin é conveniente e os resultados obtidos são satisfatórios.

Ainda sobre o tempo de processamento da rede de simplificação, as simulações foram re-

alizadas em um computador do tipo desktop não dedicado, e a implementação foi realizada no

ambiente de desenvolvimento Matlab. Esta plataforma não apresenta o desempenho que aque-

las dedicadas que são utilizadas em sistemas robóticos. Portanto, para verificar o desempenho

do método, é necessário implementá-lo em uma linguagem apropriada e executá-lo em um com-

putador dedicado. Esta nova simulação também deve ser realizada para os demais métodos da

literatura, afim de verificar qual o método que melhor atende aos requisitos de um sistema de

6.5 Agradecimentos 141

fixação 3D.

Por fim, apesar de não se ter uma boa indicação de que o método atende os requisitos

de tempo de processamento, o método destaca-se pelos bons resultados apresentados e pela

inovadora utilização de redes neurais no caso de simplificação de superfícies.

6.5 Agradecimentos

O autor gostaria de agradecer ao aluno de iniciação científica Christoffer Tenório Emídio

de Souza, autor de Souza (2007), pelo apoio na elaboração e na implementação do método pro-

posto neste Capítulo. E ao colega de laboratório Rafael Vidal Aroca, pela ajuda na programação

em C++, utilizada no pós-processamento dos resultados das simplifiicações.

143

7 Fixação 3D de objetos desconhecidos

7.1 Introdução

Como citadado anteriormente, a fixação é definida como a aplicação de forças, realizadas

por garras robóticas sobre o objeto, capazes de mantê-lo em equilíbrio estático na presença, ou

não, de carregamentos externos. Quando os pontos de aplicação das forças são definidos a partir

da geometria 3D do objeto, a fixação é denominada como fixação 3D.

A fixação de objetos por garras robóticas tem sido explorada com a finalidade de realizar

diversas tarefas1, e tem como precursor o trabalho realizado por Hanafusa e Asada (1977),

conforme discutido nos Capítulos 1 e 5. Nos primeiros trabalhos de investigação da fixação,

posteriores ao de Hanafusa e Asada (1977), esta é determinada a partir da forma 2D do objeto,

pois, a representação deste por uma única seção é satisfatória em muitos casos2, e também, esta

consideração simplifica o mecanismo de determinação dos pontos de contato, o que dispensa

a utilização de recursos computacionais avançados e teorias sofisticadas. Estas características

relacionadas à fixação 2D ainda tem sido exploradas por pesquisadores no desenvolvimento de

sistemas de fixação de baixo custo e de rápido processamento (SANZ et al., 2005).

Contudo, pontos de contato definidos a partir da seção plana de um objeto podem ser ina-

dequados para aqueles de geometria 3D complexa3. No caso da fixação 2D, é possível apenas

determinar a direção normal à superfície com componente no plano da seção 2D, sendo que

a componente no plano transversal àquele não pode ser determinada. Então, para os casos de

objetos com geometria 3D complexa, é necessário considerar toda a superfície do objeto na

determinação dos pontos de contato, que por sua vez, é uma tarefa de maior complexidade que

a tarefa relativa na fixação 2D.

1A descrição das tarefas em que se utilizam fixações por garras robóticas é realizada de forma completa no

Capítulo 1.2Os processos tradicionais de usinagem (torneamento, fresamento, furação, etc) geram peças que podem ser

representadas pela forma de uma única seção predominante.3Processos de fabricação como fundição, prototipagem 3D, conformação, entre outros, permitem a obtenção

de peças com geometria complexa.


A principal diferença entre a fixação 3D e a fixação 2D pode ser resumida pela maneira

de se representar a forma do objeto na etapa de determinação dos pontos de fixação. Porém,

quando se explora todas as etapas necessárias para se determinar uma fixação, tanto 2D quanto

3D, desde a aquisição dos dados até a execução da fixação, verifica-se que todas as etapas

comuns aos dois métodos apresentam algumas diferenças.

No Capítulo 1, estas diferenças foram apresentadas e discutidas, relembrando, elas estão

presentes: na forma de aquisição dos dados da cena em que se encontra o objeto, e conseqüen-

temente no dispositivo utilizado nesta etapa; nas técnicas de processamento dos dados, a fim de

se extrair a forma do objeto dos dados da cena; na teoria da fixação envolvida, pois o elevado

número de variáveis das equações de equilíbrio no caso da fixação 3D não permite que a teoria

da fixação 2D, desenvolvida a partir de diversas simplificações, seja diretamente utilizada; e

no método de seleção dos pontos de contato da fixação, que deve ser apropriado por dois mo-

tivos, pela quantidade de pontos que definem um objeto, que são maiores para o caso 3D, e pela

ocorrência de um número maior de incógnitas das equações de equilíbrio.

Todas estas diferenças entre a fixação 2D e 3D podem ser traduzidas como dificuldades a

serem transpostas no desenvolvimento e implementaçção da fixação 3D. De fato, ao se analisar

os trabalhos que propõem sistemas de fixação, 2D ou 3D, desde a proposta de Hanafusa e Asada

(1977), até as propostas recentes, pode-se verificar que o pleno desenvolvimento de sistemas de

fixação 3D foi possível apenas após meados da década de 1990.

O desenvolvimento destes sistemas ocorreu devido ao desenvolvimento dos dispositivos de

aquisição de profundidade de cenas, ou visão 3D, e dos algoritmos de processamento destes da-

dos; devido ao desenvolvimento de uma teoria da fixação aplicável aos casos mais complexos;

devido ao desenvolvimento de garras mais complexas capazes de promover diferentes possi-

bilidades de fixação; e devido também ao desenvolvimnento de recursos computacionais mais

poderosos.

Pode-se dizer então que o advento destas novas tecnologias e teorias permitiu o desenvolvi-

mento da fixação 3D de objetos, e os trabalhos de maior destaque nesta linha são: Ade et al.

(1994), Fischer e Hirzinger (1997), Borst et al. (1999), Lee et al. (2002), Miller et al. (2003),

Wang et al. (2005), Damian et al. (2005), Morales et al. (2006b) e Yamazaki et al. (2006). Estes

trabalhos são descritos de maneira detalhada no Capítulo 1, e dentre eles, focou-se naqueles que

utilizam RNAs na determinação da fixação.

Para o caso da fixação 2D, alguns trabalhos destacam-se na utilização de RNAs para a fi-

xação de objetos desconhecidos. A aplicações de redes neurais na fixação 2D é extensivamente

explorada no Capítulo 5, e resultados satisfatórios são obtidos tanto para o tempo de processa-


mento quanto para a qualidade das fixações determinadas.

Para o caso 3D, poucos trabalhos propõem RNAs para a determinação de pontos de fixação

de objetos. Pode-se dizer que a primeira proposta de redes neurais para o caso é apresentada por

Xu et al. (1990), que apresentam uma rede competitiva de Hopfield capaz de determinar pontos

de fixação para os casos 2D e 3D, porém resultados são apresentados somente para o caso 2D.

Outro trabalho que utiliza RNAs para o caso 3D é apresentado por Lee et al. (2002), que utilizam

redes MLP previamente treinadas com formas padrões, porém, novamente a capacidade em

determinação de pontos de contato para objetos de geometria 3D complexa não é comprovada.

Objetiva-se neste Capitulo estudar a capacidade das redes neurais na determinação de pon-

tos de fixação 3D, e três diferentes métodos são propostos utilizando os resultados obtidos no

Capítulo 5 e nos trabalhos de Lee et al. (2002) e Xu et al. (1990). O Capítulo está organizado

na seguinte forma: na Seção 7.2 é apresentado o equacionamento da fixação 3D para dois e três

pontos de contato; a Seção 7.4 apresenta os quatro diferentes métodos de determinação da fixa-

ção 3D, por busca heurística (Seção 7.4.2), por redes competitiva de Hopfield (Seção 7.4.3), por

redes feedforward tipo RBF (Seção 7.4.4) e por redes RBF e redes de Hopfield (Seção 7.4.5).

Os resultados obtidos pelas diferentes configurações de RNAs são discutidos na Seção 7.5, onde

conclusões e propostas para trabalhos futuros também são apresentadas.

7.2 Teoria e equacionamento da fixação 3D

O equilíbrio estático do objeto na fixação 3D depende da posição em que o contato é reali-

zado, do tipo de contato, e do número de dedos em contato. Nesta Seção o equacionamento do

equilíbrio estático do objeto na fixação 3D é apresentado segundo a teoria da fixação do Capí-

tulo 3. Contudo, antes de realizar o equacionamento, é necessário definir e apresentar algumas

simplificações e hipóteses, e definir os sistemas de coordenadas envolvidas no equacionamento

da fixação 3D.


As simplificações e hipóteses consideradas para o equacionamento da fixação 3D são as

mesmas que aquelas consideradas para a fixação 2D. Relembrando, as simplificações e hipóte-

ses são realizadas quanto aos objetos, quanto às garras, e quanto aos tipos de contato.

Os objetos são considerados rígidos com densidade constante, e com coeficiente de atrito

de Coulomb constante por toda a sua superfície. Sobre os dedos das garras considera-se que


existe deformação nas pontas durante o contato, portanto, considera-se o modelo de contato

macio. Contudo, considera-se que os carregamentos dos contatos ocorrem em apenas um ponto

da superfície do objeto. São consideradas fixações por dois e três pontos de contato.

7.2.2 Sistemas de coordenadas

Sistemas de coordenadas do objeto: o sistema de coordenadas do objeto O para a fixação

3D é definida da seguinte maneira. O centro co do sistema coincide com o centróide do objeto,

o eixo Xo é paralelo à direção do momento principal de inércia, e da mesma forma Yo e Zo são

paralelos ao segundo e terceiro momento principais de inércia respectivamente. A Figura 7.1

apresenta o sistema de coordenadas do objetos para uma forma 3D qualquer.

Figura 7.1: Definição do sistema de coordenadas do objeto para a Fixação 3D.


Sistema de coordenadas da fixação: antes de definir este sistema de coordenadas, é necessário

definir o centro de fixação ch. O ponto ch é determinado da mesma maneira que no caso da fi-

xação 2D, pois para dois pontos de contato, o ponto ch está sobre a linha de ação dos dedos

no ponto médio entre os pontos de contato c1 e c2, e para três pontos de contato, o ponto ch

está sobre o plano formado pelos pontos de contato c1, c2 e c3, e coincide com o ponto de en-

contro das linhas de ação la1, la2 e la3. O eixo Zh é paralelo à linha de ação la1, o eixo Xh está

sobre o plano da fixação, e o eixo Yh é obtido pelo produto vetorial entre Zh e Xh. As Figuras

7.2(a) e 7.2(b) mostram os sistemas de coordenadas da fixação por dois e três pontos de contato,

respectivamente.

(a)

(b)

Figura 7.2: Sistema de coordenadas de uma fixação 3D.


Sistema de coordenadas do contato: dado um ponto de contato da fixação ci (i=1,2 para dois

pontos de fixação, e i=1,2,3 para três pontos de fixação) define-se o sistema de coordenadas do

contato com centro em ci e eixo Zi alinhado com a direção normal à superfície do objeto no

mesmo ponto. Não há regras para a escolha da direção de Xi e Yi, porém, recomenda-se sempre

que possível escolher a direção de Yi alinhado, ou o mais próximo possível, com a direção de Yh,

ou então o mesmo para Xi e Xh. As Figuras 7.3(a) e 7.3(b) mostram os sistemas de coordenadas

dos contatos para as fixações por dois e três pontos de contato, respectivamente.

(a)

(b)

Figura 7.3: Sistemas de coordenadas dos contatos Ci para uma fixação 3D.



Para que a fixação seja estável, é necessário que as forças aplicadas pelos dedos da garra se-

jam capazes de equilibrar os carregamentos externos exercidos sobre o objeto, tais como a força

da gravidade e distúrbios externos. O equacionamento é realizado no sistema de coordenadas

da fixação e, desta maneira, as forças externas calculadas em outros sistemas de cordenadas

devem ser transformadas para o sistema de fixação.

No Capítulo 3, foi mostrado que o mapa da fixação G é capaz de transformar os carrega-

mentos dos contatos (forças e momentos), em carregamentos equivalentes, descritos no sistema

de coordenadas da fixação. A transfomação é dada pela seguinte equação:

Fh = G ·Fci (7.1)

em que Fci é o vetor formado pelas forças e momentos aplicados nos pontos de contato. O

modelo de contato considerado é o contato macio, que define as forças de contato como:

Fci = [ f ci1 f ci

2 f ci3 τ6

ci], (7.2)

sendo que f ci1 e f ci

2 são as forças de atrito nas direções tangenciais ao contato, f ci3 é a força

normal ao contato, e τci6 é o momento de atrito na direção normal ao contato. As forças e os

momentos de atrito devem estar dentro do limite de escorregamento, ou cone de atrito, para que

seja possível executar a fixação.

A matriz G, definida como o mapa da fixação, é determinada por:

G =

[hciR

T 0

rhci ·hci R h

ciR

]·B, (7.3)

em que B é a base do tipo contato considerado:

B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 0

0 0 0 0

0 0 0 1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

, (7.4)

e hciR é a matriz de transformação homogênea do sistema de coordenadas da fixação H para o

sistema de coordenadas do contato Ci.

150 7 Fixação 3D de objetos desconhecidosS

ub

stit

uin

do

os

term

os

da

equ

ação

5.3

ob

tém

-se:

Gc1

=

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

c(α 1

)c(β

1)

s(α 1

)c(β

1)

−s(β

1)

0

c(α 1

)s(β

1)s

(γ1)−

s(α 1

)c(γ

1)

s(α 1

)s(β

1)s

(γ1)+

c(α 1

)c(γ

1)

c(β 1

)s(γ

1)

0

c(α 1

)s(β

1)c

(γ1)+

s(α 1

)s(γ

1)

s(α 1

)s(β

1)c

(γ1)−

c(α 1

)s(γ

1)

c(β 1

)c(γ

1)

0

−l·(s

(α1)c

(β1))

−l·(s

(α1)s

(β1)s

(γ1)+

c(α 1

)c(γ

1))

−l·(s

(α1)s

(β1)c

(γ1)−

c(α 1

)s(γ

1))

c(α 1

)s(β

1)c

(γ1)+

s(α 1

)s(γ

1)

l·(c

(α1)c

(β1))

l·(c

(α1)s

(β1)s

(γ1)−

s(α 1

)c(γ

1))

l·(c

(α1)s

(β1)c

(γ1)+

s(α 1

)s(γ

1))

s(α 1

)s(β

1)c

(γ1)−

c(α 1

)s(γ

1)

00

0c(

β 1)c

(γ1)

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦(7

.5)

e Gc2

=

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

c(α 2

)c(β

2)

s(α 2

)c(β

2)

−s(β

2)

0

c(α 2

)s(β

2)s

(γ2)−

s(α 2

)c(γ

2)

s(α 2

)s(β

2)s

(γ2)+

c(α 2

)c(γ

2)

c(β 2

)s(γ

2)

0

c(α 2

)s(β

2)c

(γ2)+

s(α 2

)s(γ

2)

s(α 2

)s(β

2)c

(γ2)−

c(α 2

)s(γ

2)

c(β 2

)c(γ

2)

0

l·(s

(α2)c

(β2))

l·(s

(α2)s

(β2)s

(γ2)+

c(α 2

)c(γ

2))

l·(s

(α2)s

(β2)c

(γ2)−

c(α 2

)s(γ

2))

c(α 2

)s(β

2)c

(γ2)+

s(α 2

)s(γ

2)

−l·(c

(α2)c

(β2))

−l·(c

(α2)s

(β2)s

(γ2)−

s(α 2

)c(γ

2))

−l·(c

(α2)s

(β2)c

(γ2)+

s(α 2

)s(γ

2))

s(α 2

)s(β

2)c

(γ2)−

c(α 2

)s(γ

2)

00

0c(

β 2)c

(γ2)

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦(7

.6)

emq

ue

le−l

são

asd

istâ

nci

asen

tre

os

po

nto

sd

eco

nta

toc 1

ec 2

,re

spec

tivam

ente

,e

oce

ntr

od

afi

xaç

ãoc h

,e

são

med

ido

sn

osi

stem

ad

e

coo

rden

adas

da

fix

ação

.O

sân

gu

los

α,

βe

γsã

oo

sân

gu

los

de

Eu

ler

de

rota

ções

con

secu

tivas

emX

,Ye

Z,

resp

ecti

vam

ente

,q

ue

tran

sfo

rmam

o

sist

ema

da

fix

ação

par

ao

sist

ema

de

coo

rden

adas

do

con

tato

.

Tra

nsf

orm

and

oo

sca

rreg

amen

tos

do

sco

nta

tos,

des

crit

os

no

ssi

stem

asd

eco

ord

enad

asd

os

mes

mo

s,p

ara

osi

stem

ad

eco

ord

enad

asd

afi

xaç

ão

obté

m-s

e:

Fh=

Gc1·F

c1+

Gc2·F

c2(7

.7)


As forças de contato escritas no sistema de coordenadas da fixação devem ser capazes de

equilibrar forças externas, também escritas no sistema de coordenadas da fixação.

Se as forças externas aplicadas no objeto, expressas no sistema de coordenadas de fixação,

são:

Fexh =[Fexh

1 Fexh2 Fexh

3 τexh4 τexh

5 τexh6

]T, (7.8)

então, para que aconteça o equilíbrio estático do obejto, a seguinte relação deve ser satisfeita:

Fexh +Fh = 0 (7.9)

ou:

−Fexh = Fh (7.10)

O sistema acima apresenta as seis equações de equilíbrio do objeto quando dois dedos

exercem forças de contato e forças externas são aplicadas no objeto.


De forma similar ao caso da fixação 3D por dois pontos de contato, para uma fixação 3D

com três pontos de contato deseja-se que a seguinte relação seja satisfeita:

Fh = G ·Fci (7.11)

tal que G e B são definidos da mesma forma que a definida na Seção 7.2.3.

Para o caso da fixação 3D por três pontos de contato, expandindo a Equação 7.11 obtém-se:

Fh = Gc1 ·Fc1 +Gc2 ·Fc2 +Gc3 ·Fc3 (7.12)

em que Gc1, Gc2 e Gc3 são dados pelas Equações 7.13, 7.14, e 7.15.

152 7 Fixação 3D de objetos desconhecidosG

c1=

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

c(α 1

)c(β

1)

s(α 1

)c(β

1)

−s(β

1)

0

c(α 1

)s(β

1)s

(γ1)−

s(α 1

)c(γ

1)

s(α 1

)s(β

1)s

(γ1)+

c(α 1

)c(γ

1)

c(β 1

)s(γ

1)

0

c(α 1

)s(β

1)c

(γ1)+

s(α 1

)s(γ

1)

s(α 1

)s(β

1)c

(γ1)−

c(α 1

)s(γ

1)

c(β 1

)c(γ

1)

0

−l1·(s

(α1)c

(β1))

−l1·(s

(α1)s

(β1)s

(γ1)+

c(α 1

)c(γ

1))

−l1·(s

(α1)s

(β1)c

(γ1)−

c(α 1

)s(γ

1))

c(α 1

)s(β

1)c

(γ1)+

s(α 1

)s(γ

1)

l 1·(c

(α1)c

(β1))

l 1·(c

(α1)s

(β1)s

(γ1)−

s(α 1

)c(γ

1))

l 1·(c

(α1)s

(β1)c

(γ1)+

s(α 1

)s(γ

1))

s(α 1

)s(β

1)c

(γ1)−

c(α 1

)s(γ

1)

00

0c(

β 1)c

(γ1)

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦(7

.13

)

Gc2

= ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

c(α 2

)c(β

2)

s(α 2

)c(β

2)

−s(β

2)

0

c(α 2

)s(β

2)s

(γ2)−

s(α 2

)c(γ

2)

s(α 2

)s(β

2)s

(γ2)+

c(α 2

)c(γ

2)

c(β 2

)s(γ

2)

0

c(α 2

)s(β

2)c

(γ2)+

s(α 2

)s(γ

2)

s(α 2

)s(β

2)c

(γ2)−

c(α 2

)s(γ

2)

c(β 2

)c(γ

2)

0

−l2s(

12

0o )·(s

(α2)c

(β2))

−l2s(

12

0o )·( s(

α 2)s

(β2)s

(γ2)

+c(

α 2)c

(γ2)

)−l

2s(

12

0o )·( s(

α 2)s

(β2)c

(γ2)

−c(α

2)s

(γ2)

)c(

α 2)s

(β2)c

(γ2)+

s(α 2

)s(γ

2)

l 2s(

12

0o )·(c

(α2)c

(β2))

−l2c(

12

0o )·(−

s(β 2

))

l 2s(

12

0o )·( c(

α 2)s

(β2)s

(γ2)

−s( α

2)c

(γ2)

)

−l2c(

12

0o )·(c

(β2)s

(γ2))

l 2s(

12

0o )·( c(

α 2)s

(β2)c

(γ2)

+s(

α 2)s

(γ2)

)

−l2c(

12

0o )·(c

(β2)c

(γ2))

s(α 2

)s(β

2)c

(γ2)−

c(α 2

)s(γ

2)

l 2c(

12

0o )·(s

(α2)c

(β2))

l 2c(

12

0o )·( s(

α 2)s

(β2)s

(γ2)

+c(

α 2)c

(γ2)

)l 2

c(1

20

o )·( s(

α 2)s

(β2)c

(γ2)

−c(α

2)s

(γ2)

)c(

β 2)c

(γ2)

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦(7

.14

)


Gc3

= ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

c(α 3

)c(β

3)

s(α 3

)c(β

3)

−s(β

3)

0

c(α 3

)s(β

3)s

(γ3)−

s(α 3

)c(γ

3)

s(α 3

)s(β

3)s

(γ3)+

c(α 3

)c(γ

3)

c(β 3

)s(γ

3)

0

c(α 3

)s(β

3)c

(γ3)+

s(α 3

)s(γ

3)

s(α 3

)s(β

3)c

(γ3)−

c(α 3

)s(γ

3)

c(β 3

)c(γ

3)

0

−l3s(

24

0o )·(s

(α3)c

(β3))

−l3s(

24

0o )·( s(

α 3)s

(β3)s

(γ3)

+c(

α 3)c

(γ3)

)−l

3s(

24

0o )·( s(

α 3)s

(β3)c

(γ3)

−c( α

3)s

(γ3)

)c(

α 3)s

(β3)c

(γ3)+

s(α 3

)s(γ

3)

l 3s(

24

0o )·(c

(α3)c

(β3))

−l3c(

24

0o )·(−

s(β 3

))

l 3s(

24

0o )·( c(

α 3)s

(β3)s

(γ3)

−s( α

3)c

(γ3)

)

−l3c(

24

0o )·(c

(β3)s

(γ3))

l 3s(

24

0o )·( c(

α 3)s

(β3)c

(γ3)

+s(

α 3)s

(γ3)

)

−l3c(

24

0o )·(c

(β3)c

(γ3))

s(α 3

)s(β

3)c

(γ3)−

c(α 3

)s(γ

3)

l 3c(

24

0o )·(s

(α3)c

(β3))

l 3c(

24

0o )·( s(

α 3)s

(β3)s

(γ3)

+c(

α 3)c

(γ3)

)l 3

c(2

40

o )·( s(

α 3)s

(β3)c

(γ3)

−c(α

3)s

(γ3)

)c(

β 3)c

(γ3)

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦(7

.15

)

emq

ue

l 1,

l 2e

l 3sã

oas

dis

tân

cias

entr

eos

po

nto

sd

eco

nta

toc 1

,c 2

ec 3

,re

spec

tivam

ente

,e

oce

ntr

od

afi

xaç

ãoc h

.O

sân

gu

los

α,

βe

γsã

oo

s

âng

ulo

sd

eE

ule

rd

ero

taçõ

esco

nse

cuti

vas

emX

,Ye

Z,re

spec

tivam

ente

,q

ue

tran

sfo

rmam

osi

stem

ad

afi

xaç

ãop

ara

osi

stem

ad

eco

ord

enad

asd

o

con

tato

.A

sfo

rças

de

con

tato

escr

itas

no

sist

ema

de

coo

rden

adas

da

fix

ação

dev

emse

rca

paz

esd

eeq

uil

ibra

rfo

rças

exte

rnas

,es

crit

asn

om

esm

o

sist

ema

de

coo

rden

adas

.S

eas

forç

asex

tern

asap

lica

das

no

ob

jeto

,ex

pre

ssas

no

sist

ema

de

coo

rden

adas

de

fix

ação

,sã

o:

Fex

h=

[ Fex

h 1F

exh 2

Fex

h 3τe

xh 4τe

xh 5τe

xh 6

] T ,(7

.16

)

entã

op

ara

qu

eac

on

teça

oeq

uil

íbri

oes

táti

cod

oo

bej

to,

ase

gu

inte

rela

ção

dev

ese

rsa

tisf

eita

:

−Fex

h=

Fh

(7.1

7)

Osi

stem

aap

rese

nta

seis

equ

açõ

esd

eeq

uil

íbri

od

oo

bje

toq

uan

do

três

ded

os

exer

cem

forç

asd

eco

nta

toso

bre

oo

bje

to.


7.3 Verificação da condição force-closure e avaliação da fixa-ção 3D

Como citado anteriormente, se uma fixação é capaz de equilibrar qualquer carregamento

externo, então esta fixação é denominada force-closure. Uma das possíveis maneiras de se veri-

ficar se uma fixação é force-closure é a partir da análise da envolvente convexa do carregamento

equivalente daqueles aplicados nos pontos de contato.

A envolvente convexa das forças é construída com as direções das forças, que podem ser

exercidas nos contatos, descritas no sistema de coordenadas da fixação, ou do objeto. A en-

volvente convexa dos momentos é construída com as direções dos momentos de atrito e dos

momentos gerados pelas forças que podem ser exercidas no contato. Estes momentos também

devem ser descritos no sistema de coordenadas da fixação, ou do objeto.

Desta forma, duas envolventes convexas são construídas. A envolvente convexa das forças,

é utilizada para verificar se a fixação é capaz de resistir aos carregamentos externos puramente

lineares. Se a envolvente convexa das forças contiver a origem do sistema em que é construída,

então a fixação é capaz de resistir a qualquer carregamento puramente linear. A envolvente con-

vexa dos momentos é utilizada para verificar a capacidade da fixação de resistir a carregamento

externos puramente torcionais. Se a envolvente convexa dos momentos contiver a origem, então

a fixação é capaz de resistir a qualquer carregamento puramente torcional.

Se as duas envolventes contiverem suas respectivas origens, então a fixação é force-closure.

Nas Figuras 7.4 e 7.5 são apresentados dois exemplos de envolventes convexas de fixações

force-closure para fixação por dois e três pontos de contato, respectivamente.

A partir das envolventes convexas de uma fixação, também é possível determinar uma me-

dida de qualidade para a fixação. Esta qualidade pode ser determinada pela menor distância

entre o centro da envolvente convexa e a superfície da envolvente convexa. O ponto da super-

fície da envolvente convexa em que ocorre a menor distância representa a direção normal do

menor carregamento, em módulo, necessário para desequilibrar o objeto. Esta relação é válida

tanto para o carregamento puramente linear (forças), quanto para o carregamento puramente

torcional (momentos), porém o ponto em que ocorre a mínima distância não é o mesmo nas

duas envolventes.

Para o caso em que se constrói apenas uma envolvente convexa de dimensão seis, a qual-

idade da fixação é determinada pela menor distância Euclidiana entre o centro do sistema e a

superfície da envolvente convexa.

7.3 Verificação da condição force-closure e avaliação da fixação 3D 155

Figura 7.4: Exemplos de envolventes convexas para uma fixação 3D por dois pontos de contato.

Figura 7.5: Exemplos de envolventes convexas para uma fixação 3D por três pontos de contato.


7.4 Métodos de seleção de pontos de contato

Na fixação, o equilíbrio do objeto deve ser estabelecido e mantido, ou seja, as Equações 7.10

e 7.17 devem ser satisfeitas. Ambas as equações apresentam diversas incógnitas, que superam

o número de equações, portanto, não existe uma única solução capaz de garantir o equilíbrio do

objeto.

Na Seção 7.3, foi apresentado o método de verificação da propriedade force-closure de

uma fixação. A verificação desta propriedade permite verificar a capacidade de uma fixação de

resistir a qualquer carregamento externo sem a necessidade de resolução das Equações 7.10 e

7.10, pois, a verificação é realizada apenas a partir da geometria da fixação. Na mesma Seção,

também são apresentadas as medidas da qualidade de uma fixação force-closure, que permitem

avaliar e comparar quantitativamente diferentes fixações.

Os diferentes métodos de seleção de pontos de contato4 utilizam as medidas de qualidade

da fixação, ou outras métricas também relacionadas à geometria da fixação e ao equilibrio do

objeto, a fim de determinar, para um determinado objeto, pontos adequados de fixação.

São inúmeros os métodos propostos para se determinar pontos de contato a partir da geome-

tria do objeto, e eles podem ser constituídos desde métodos exaustivos de busca pela melhor

fixação, até métodos complexos baseados em algoritmos avançados, como redes neurais (XU et

al., 1990) e algoritmos genéticos (LEE; LEE, 2003).

O método proposto neste Capítulo é similar àquele proposto no Capítulo 5 para a fixação

2D, e o mesmo é composto pela integração de diferentes métodos, sendo eles: busca heurística,

otimização por redes de Hopfield, redes feedforward, e redes feedforward e de Hopfield com-

binadas. Os quatro métodos são detalhados nas próximas Seções, e resultados na determinação

de fixações para dois e três dedos de contato são apresentados.


Além das simplificações e hipóteses consideradas para o equacionamento da fixação 3D por

dois e três pontos de contato, é preciso considerar algumas simplificações e hipóteses comple-

mentares para a descrição dos métodos avaliados. Neste caso, as considerações são realizadas

principalmente quanto aos objetos a ser fixados.

Considera-se que os objetos são convexos, ou apresentam regiões côncavas que não são

representativas ou que não modificam a forma geral do objeto. Não existem faces ocultas, ou

4Os métodos de seleção de pontos de contato são tambérm denominados de planejadores da fixação.

7.4 Métodos de seleção de pontos de contato 157

seja, toda a superfície é satisfatoriamente representada pela nuvem de pontos e pela sua malha

superficial.

Devido à indisponibilidade de um sistema de visão 3D capaz de mapear toda a superfícies

do objeto no momento do desenvolvimento do trabalho, e pelo fato de que o estudo de sis-

temas de visão 3D e reconstrução de objetos não ser o escopo deste trabalho5, utilizou-se nas

simulações e testes dos métodos implementados modelos sintéticos de objetos, em sua maioria

de forma abstrata, obtidos por um software CAD, e utilizou-se também modelos obtidos de

repositórios de modelos virtuais disponível na internet.

Considerou-se também que o objeto está apoiado em um plano e que qualquer fixação é

exeqüível nos pontos não pertencentes ao plano em contato com o apoio, mesmo se houver

alguma possível colisão na execução da fixação. A fixação é preferencialmente realizada com

a aproximação da garra pelo topo do objeto. A consideração da direção de aproximação na

fixação reduz o número de possibilidade de fixação, mas de forma geral, esta consideração não

é essencial.

Também é necessário simplificar a forma do objeto, pois, na maioria dos casos, a grande

quantidade de dados torna também elevado o número de possibilidades de fixações, o que im-

plica em custos de processamento (recursos computacionais e tempo). Para reduzir o número de

dados, e conseqüentemente o número de combinação de fixações e os recursos necessários para

o processamento, utiliza-se o método de simplificação de superfícies apresentado no Capítulo

6.

Para os metódos de determinação da fixação por busca heurística e por redes de Hopfield,

pode-se utilizar diretamente o método de simplificação proposto. Porém, para os casos em que

se utiliza redes neurais feedforward na determinação da fixação, é necessário normalizar os

dados de entrada da rede.

A normalização de entrada da rede consiste em uma translação seguida de uma rotação

e um redimensionamento para que o centróide do objeto seja coincidente com o sistema de

coordenadas global, para que a maior dimensão do objeto esteja na direção x do mesmo sistema

de coordenadas, e para que a maior dimensão seja unitária. E ainda, simplifica-se o objeto como

parte da normalização das entradas da rede.

Para a simplificação, dividi-se o objeto em seções específicas, e utiliza-se a capacidade do

método de simplificação de trabalhar com regiões limitadas a fim de simplificar cada seção

específica. Na divisão do objeto em seções específicas, utiliza-se um sistema de coordenadas

5Alguns trabalhos como Gois (2004) e Polizzeli (2008) dedicam-se ao estudo deste sistemas.


cilíndricas auxiliar, concêntrico com o sistema de coordenadas do objeto, cujos eixos ’z’ são

paralelos, e divide-se o objeto em camadas na direção perpendicular ao eixo z.

Cada uma das diferentes camadas é subdividida segundo o ângulo θ do sistema de coor-

denadas auxiliar. Os pontos que pertencem a um mesmo subgrupo de uma camada formam

uma seção específica. Desta forma, o objeto é dividido em seções específicas, porém, os grupos

pertencentes a extremidade inferior, aquela em contato com a superfície de apoio do objeto, são

descartados pela consideração de que não é possível realizar uma fixação nas proximidades do

apoio.

Cada subgrupo de pontos que compõem uma seção específica é simplificado por um único

ponto. O ponto selecionado na simplificação é aquele que melhor representa a seção especí-

fica. O conjunto de pontos resultante da simplificação de todas as seções específicas formam a

entrada da rede neural feedforward.

Para avaliar e apresentar as fixações determinadas pelos diferentes métodos avaliados, são

apresentadas as respostas obtidas para oito objetos de teste. As Figuras 7.6 e 7.7 apresentam

os objetos de teste da fixação 3D, e a Tabela 7.1 mostra os tempos de simplificação obtidos

utilizando a estratégia descrita nos parágrafos anteriores. E ainda, uma extensa base de da-

dos, constituída por 11700 objetos 3D de formas abstratas, também foi utilizada para avaliar a

capacidade de cada método em determinar fixações force-closure.

(a) (b)

Figura 7.6: Formas de objetos, que são representadas por uma malha superficial, utilizadas

nas simulações dos métodos de determinação de pontos de fixação 3D. Os objetos representam

algumas formas abstratas e alguns objetos do cotidiano (parte 1 de 2).


(a) (b)

(c) (d)

(e) (f)

Figura 7.7: Formas de objetos, que são representadas por uma malha superficial, utilizadas

nas simulações dos métodos de determinação de pontos de fixação 3D. Os objetos representam

algumas formas abstratas e alguns objetos do cotidiano (parte 2 de 2).


Tabela 7.1: Tabela de tempos de simplifcação das superfícies dos objetos das Figuras 7.6 e 7.7.

Objeto No Vértices No Triângulos Tempo de simplificação[s]

Figura 7.6(a) 843 1350 0,7528

Figura 7.6(b) 1363 2562 1,2686

Figura 7.7(a) 1541 2987 1,5147

Figura 7.7(b) 4213 6594 10,465

Figura 7.7(c) 5975 11765 21,904

Figura 7.7(d) 1771 3008 1,3619

Figura 7.7(e) 2289 3985 1,6993

Figura 7.7(f) 1053 1709 3,9168

7.4.2 Fixação 3D por Busca Heurística

A qualidade de uma fixação pode também ser estimada por uma função custo calculada

a partir das relações geométricas da fixação e de critérios específicos para diferentes casos.

Para um objeto qualquer, que apresenta diversas fixações possíveis, cada fixação apresenta uma

função custo.

Na busca heurística, a função custo é determinada para todas as possíveis combinações de

fixação, e então, é selecionada como a fixação mais adequada para o objeto aquela que apresen-

tar a melhor função custo. O processo de busca pode ser ainda otimizado pelo estabelecimento

de um limiar de busca, assim, quando alguma fixação atingir o limiar, seleciona-se esta fixação

como a mais adequada e finaliza-se a busca.

Pode-se então determinar através de uma busca heurística uma fixação adequada, e se na

função custo for utilizada as medidas de qualidade da fixação obtidas a partir da sua envol-

vente conexa, pode-se conseguir uma fixação force-closure de qualidade. Apesar da capacidade

de se determinar fixações com a busca heurística, o mecanismo de busca exige recursos com-

putacionais, e em geral, o processamento desta etapa é computacionalmente custoso. Com o

objetivo de se reduzir os recursos computacionais e tempos de processamento, diferentes es-

tratégias de busca podem ser adotadas, e neste caso, utiliza-se a estratégia de reduzir o número

de possíveis fixações como conseqüência da simplificação da superfície do objeto.

A busca heurística é implementada para se determinar dois e três pontos de fixação para os

objetos de teste6. Antes da busca, cada objeto é simplificado pelo método proposto no Capítulo

6, e a busca é realizada. Para os dois casos de fixação, por dois ou três pontos de contato, a

diferença na implementação da busca é a função custo relacionada à fixação.

6Os objetos de testes selecionados são constituídos por algumas formas abstratas e objetos do cotidiano


Fixação por 2 contatos

A superfície simplificada do objeto contém pontos, que quando combinados em pares, for-

mam as possíveis fixações para o objeto. Para cada possível fixação, a seguinte função custo é

relacionada:

fcusto = A ·Σθi +B ·d(co, la)+C ·abs(αI −αla)+D ·abs(γ), (7.18)

em que θi é o ângulo entre a direção normal à superfície ao ponto de contato (vide Figura 7.8),

ci e a linha de ação la, d(co, la) é a distância entre o centróide do objeto e a linha de ação,

abs(αI −αla) é a diferença angular entre a direção da linha de ação e a direção do momento

principal de inércia, e γ é o cosseno diretor da linha de ação com o eixo z. Os pesos A, B, C, D

são escalares que ponderam os termos da Equação 7.18.

Figura 7.8: Definição dos ângulos θ1 e θ2 entre as linhas de ação la e os eixos Z dos sistemas

de coordenadas C1 e C2 respectivamente.

Os termos de fcusto estão relacionados com a estabilidade da fixação, uma fixação estável é

aquela que apresenta a menor função custo, ou seja, apresenta o mínimo somatório dos termos.

Cada termo está relacionado com uma característica específica da fixação. O termo θi está

relacionado com o cone de atrito. Quando este termo apresenta valor elevado, as forças de

atrito na fixação são consideráveis, quando o termo é pequeno, a força de contato tem direção

próxima à direção da normal ao contato. O termo d(co, la) está relacionado aos momentos, em

relação ao centróide do objeto, gerados pela aplicação das forças de contato, e deseja-se que a


linha de ação da fixação esteja próxima ao centróide do objeto. O termo abs(αI −αla) relaciona

a direção da fixação com direção do momento principal de inércia do objeto, deseja-se que

estejam alinhados o máximo possível para minimizar os efeitos de inércia. O termo auxiliar

abs(γ) é o angulo da linha de ação com a direção z (normal à superfície de apoio do objeto)

como o objeto deve ser fixado preferencialmente pelo seu topo, este termo penaliza fixações nas

outras direções, desde que exista alguma satisfatória na direção z.

A busca heurística por dois pontos de contato foi implementada no computados de testes,

e fixações foram determinadas para os objetos de teste. Na implementação foram utilizados os

pesos A = 200, B = 90, C = 150 e D = 507, e as respostas obtidas são apresentadas nas Figuras

7.9, 7.10 e 7.11.

(a) (b) (c)

(d) (e) (f)

Figura 7.9: Vista frontal, superior e em perspectiva da determinação de dois pontos de fixação,

para objetos do cotidiano e abstratos, utilizando o método de busca heurística (parte 1 de 3).

7Os valores de A, B, C e D foram determinados empiricamente.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)




(a) (b) (c)

(d) (e) (f)



Os tempos de processamento da fixação 3D por dois pontos de contato utilizando a busca

heurística foram medidos e são apresentados na Tabela 7.2.


dois pontos de contato dos objetos das Figuras 7.9, 7.10 e 7.11.


Figura 7.9(d) 1,2795

Figura 7.10(a) 1,2824

Figura 7.10(d) 1,2474

Figura 7.10(g) 1,2735

Figura 7.10(j) 1,2751

Figura 7.11(a) 1,2572

Figura 7.11(d) 1,2865

Também se utilizou a base de objetos 3D para avaliar o desempenho da busca heurística

na determinação de dois pontos de fixação. Nos testes foi possível determinar uma fixação

force-closure para todos os objetos.



Para o caso de três pontos de contato, as possíveis fixações são formadas pelos conjuntos

de três diferentes pontos. Cada possível fixação é avaliada pela seguinte função custo:

fcusto = A ·Σθi +B ·d(co,ch)+C ·abs(γ) (7.19)

em que θi é o ângulo entre a direção normal à superfície ao ponto de contato ci e a linha de

ação lai, d(co,ch) é a distância entre o centróide do objeto e o centro de fixação, e γ é o cosseno

diretor do ângulo entre a normal ao plano de fixação e o eixo z. Os pesos A, B, C são escalares

que ponderam os parâmetros da Equação 7.19.

Figura 7.12: Definição dos ângulos θ1, θ2 e θ3 entre as linhas de ação la1, la2 e la3 e os eixos

Z dos sistemas de coordenadas C1, C2 e C3 respectivamente.

Todos os termos da Equação 7.19 têm o mesmo significado, quanto à estabilidade da fixa-

ção, que os termos da Equação 7.18. A exceção é a ausência do termo que relaciona a posição

da fixação com o momento de inércia. No caso da fixação por três contatos, este termo não

tem significado, pois, a disposição dos contatos garante que qualquer configuração seja capaz

de reduzir aos efeitos de inércia.


A busca heurística por três pontos de contato foi implementada no computados de testes,

e fixações foram determinadas para os objetos de teste. Na implementação foram utilizados os

pesos A = 100, B = 50 e C = 1508. Os pontos de contato obtidos para os objetos de testes são

mostrados nas Figuras 7.13, 7.14 e 7.15.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 7.13: Vista frontal, superior e em perspectiva da determinação de três pontos de fixação,


8Os valores de A, B e C foram determinados empiricamente.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)




(a) (b) (c)



Os tempos de processamento da busca heurística por três pontos de contato também foram

medidos para os objetos de testes, e os mesmos são apresentados na Tabela 7.2.


três pontos de contato dos objetos das Figuras 7.13 e 7.14.


Figura 7.13(d) 114,5424

Figura 7.13(g) 89,92680

Figura 7.14(a) 34,00910

Figura 7.14(d) 120,0924

Figura 7.14(g) 87,60460

Figura 7.14(j) 81,60400

Figura 7.15(a) 81,12600

No teste com os objetos da bases de dados, os resultados obtidos com a busca heurística por

três pontos de contato foi similar ao resultado da busca heurística por dois pontos de contato,

ou seja, foi possível determinar uma fixação force-closure para todos os 11700 objetos testados.

7.4.3 Fixação 3D por otimização utilizando redes competitivas de Hopfield

A determinação de pontos de contato por busca heurística exige que todas as possíveis

fixações sejam avaliadas. Este procedimento não é otimizado, sendo que inúmeras combinações

são avaliadas, mesmo depois da avaliação daquela que será considerada a melhor fixação. O

mecanismo de busca pode ser otimizado utilizando-se a rede competitiva de Hopfield. Neste

caso, a arquitetura da rede, o processo iterativo e os critérios de convergência são utilizados na

tentativa de acelerar o processo de busca e de reduzir o número de avaliações realizadas, muitas

delas desnecessárias.


A rede competitiva proposta é semelhante àquela desenvolvida para a fixação 2D, tendo

apenas como diferença as funções custo relacionadas às fixações, que neste caso são as funções

das Equações 7.18 e 7.19, respectivamente para dois e três pontos de contato.

A rede de Hopfield é capaz de encontrar mínimos de energia, que correspondem a fixações

satisfatórias. O mínimo de energia pode ser local ou global, sendo que a convergência depende

da sua inicialização. Neste caso particular, nenhum método é utilizado para determinar a ini-

cialização da rede, que é realizada escolhendo-se a ativação eqüidistante dos neurônios.

A rede foi implementada no computador de teste e fixações por dois e três pontos de contato

foram determinadas para os objetos de teste. Os resultados obtidos são mostrados nas Figuras

7.16, 7.17 e 7.18.


(a) (b) (c)

(d) (e) (f)


para objetos do cotidiano e abstratos, utilizando o método de otimização por redes de Hopfield

(parte 1 de 3).


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)



(parte 2 de 3).


(a) (b) (c)

(d) (e) (f)



(parte 3 de 3).

Os tempos de processamento foram medidos e são apresentados na Tabela 7.4. Pode-se

observar a redução do tempo de processamento em comparação com os valores apresentados

na Tabela 7.2, porém, pode-se observar também a redução do desempenho na determinação de

fixações force-closure, pois, no teste com os objetos da base de dados, foi possível determinar

84,2% de fixações satisfatórias.

Tabela 7.4: Tabela do tempo de determinação da fixação 3D por dois contatos utilizando redes

de Hopfield. Tempos para as Figuras 7.16, 7.17 e 7.18.


Figura 7.16(d) 0,5040

Figura 7.17(a) 0,2025

Figura 7.17(d) 0,3464

Figura 7.17(g) 0,3054

Figura 7.17(j) 0,3278

Figura 7.18(a) 0,2411

Figura 7.18(f) 0,2523



O método de determinação de fixação 3D por redes de Hopfield também foi implementado

para a determinação de três pontos de fixação. Os resultados obtidos são apresentados nas

Figuras 7.19, 7.20 e 7.21.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)



(parte 1 de 3).


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)



(parte 2 de 3).


(a) (b) (c)



(parte 3 de 3).

Os tempos de execução foram medidos e são apresentados na Tabela 7.5. Similar aos

resultados obtidos com a rede de Hopfield na fixação 3D por dois pontos de contato, para o

caso de três pontos de contato houve uma redução significativa no tempo de processamento,

porém com redução do desempenho da rede, pois, nos testes com os objetos da base de dados,

foram obtidas 77,6% de fixações satisfatórias.

Tabela 7.5: Tabela do tempo de determinação da fixação 3D por três pontos de contato uti-

lizando otimização com redes de Hopfield. Os tempos foram medidos para os objetos das

Figuras 7.19, 7.20 e 7.21.


Figura 7.19(d) 2,1885

Figura 7.19(g) 3,8546

Figura 7.20(a) 5,0939

Figura 7.20(d) 3,7056

Figura 7.20(g) 3,6894

Figura 7.20(j) 3,5502

Figura 7.21(c) 5,4816

7.4.4 Fixação 3D por redes feedforward tipo RBF

A determinação de pontos de contato para a fixação 3D também pode ser realizada por redes

neurais feedforward. Para tanto, é necessário treinar a rede neural com padrões geométricos e

seus respectivos melhores pontos de fixação.

A utilização de redes neurais na determinação da fixação é amplamente investigada para

o caso 2D (XU et al., 1990; VALENTE, 1999; PEDRO; CAURIN, 2008). Para o caso da

fixação 3D, poucos trabalhos investigam o comportamento das redes na determinação de pontos


de contato, contudo, destaca-se nesta área o trabalho de Lee et al. (2002), que utiliza redes

feedforward tipo MLP na determinação de pontos de contato para uma garra robótica de três

dedos.

Resultados preliminares9 mostram que os resultados das redes tipo RBF e MLP são equiva-

lentes quanto à qualidade das respostas, porém, as redes MLP apresentam tempo de treinamento

elevados em comparação com o treinamento das redes RBF10.

Desta forma, utiliza-se uma rede RBF na determinação da fixação, pois se deseja tempos re-

duzidos de treinamento. A determinação da fixação por uma rede feedforward pode ser dividida

em duas etapas distintas: treinamento e execução.

Na etapa de treinamento, é necessário selecionar padrões geométricos para o treino, que po-

dem ser específicos para uma determinada aplicação, ou que podem ser variados para aplicações

em geral. Como se deseja que a rede apresente capacidade de fixar uma grande variedade de

objetos, utiliza-se no treinamento representantes de três classes geométricas, cubos, cilindros

e elipsóides (Figura 7.22). Para completar os dados de treinamento, os pontos de fixação de

cada um dos objetos são selecionados pelo método de busca heurística. Todos os dados de trei-

namento (entradas e saídas) devem ser normalizados segundo a descrição realizada na Seção

7.4.1.

Figura 7.22: Padrões de treinamento para a rede feedforward tipo RBF para a fixação 3D.

9Os resultados da comparação entre o comportamento das redes feedforward tipo MLP e RBF estão omitidos,

pois seria necessário dedicar um Capítulo para apresentá-los.10Os resultados da comparação entre os tempos de treinamento das redes RBF e MLP para a fixação 3D são

coerentes com aqueles obtidos na mesma comparação para o caso da fixação 2D.


Na etapa de execução, a superfície do objeto é simplificada, e cada ponto da simplificação

é uma das entradas da rede. As entradas devem receber a mesmo normalização que aquela

realizada para os padrões geométricos na etapa de treinamento, e as respostas obtidas com

a rede devem sofrer as transformações inversas daquelas da normalização, a fim de se obter

resultados corentes com o objeto original.


Uma rede neural RBF foi treinada para determinar dois pontos de fixação, e os resultados

obtidos para os objetos de testes são mostrados nas Figuras 7.23, 7.24 e 7.25.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figura 7.23: Vista frontal, superior e em perspectiva da determinação de dois pontos de fixa-

ção, para objetos do cotidiano e abstratos, utilizando redes feedforward tipo RBF previamente

treinadas (parte 1 de 3).


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)





(a) (b) (c)




Os tempos de processamento da rede RBF na determinação de dois pontos de contato tam-

bém foram medidos. A Tabela 7.6 apresenta os tempos de processamento observados, e pode-se

observar que os mesmo são inferiores àqueles observados nas Tabelas 7.2 e 7.4, porém, como

conseqüência observa-se a redução do desempenho da rede, pois, nos testes com os objetos da

base de dados, foram obtidas apenas 34,6% de fixações satisfatórias.

Tabela 7.6: Tabela do tempo de determinação da fixação 3D por dois pontos de contatos uti-

lizando RNAs tipo RBF para os objetos das Figuras 7.23, 7.24 e 7.25.


Figura 7.23(d) 0,0212

Figura 7.23(g) 0,0213

Figura 7.24(a) 0,0204

Figura 7.24(d) 0,0299

Figura 7.24(g) 0,0201

Figura 7.24(j) 0,0210

Figura 7.25(c) 0,0190


Uma rede feedforward tipo RBF também foi implementada para a determinação de três

pontos de fixação de objetos 3D. As Figuras 7.26, 7.27 apresentam os resultados obtidos para

os objetos de testes.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)

Figura 7.26: Vista frontal, superior e em perspectiva da determinação de três pontos de fixa-



.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)





Os tempos de processamento da rede RBF para a determinação de três pontos de contato

para o caso 3D foram medidos e são apresentados na Tabela 7.7. Ao comparar os valores com

aqueles apresentados nas Tabelas 7.3 e 7.5, pode-se verificar uma redução significativa do tempo

de processamento, porém o desempenho da rede também é reduzido, sendo que apenas 51,9%

das fixações determinadas para os objetos da base de dados foram satisfatórias.

Tabela 7.7: Tabela do tempo de determinação da fixação 3D por três pontos de contatos uti-

lizando RNAs tipo RBF para os objetos das Figuras 7.26 e 7.27 .


Figura 7.26(d) 0,0218

Figura 7.26(g) 0,0261

Figura 7.26(j) 0,0217

Figura 7.27(a) 0,0251

Figura 7.27(d) 0,0226

Figura 7.27(g) 0,0245

Figura 7.27(l) 0,0263

7.4.5 Fixação 3D por redes feedforward e de Hopfield combinadas

Pode ser verificado, tanto para a fixação 2D, quanto para a fixação 3D, que as redes com-

petitivas de Hopfield geram fixações satisfatórias, porém a resposta, na maioria das vezes, não

corresponde ao mínimo global. Como a função custo utilizada é a mesma que aquela da busca

heurística, ao se comparar o resultado de um mesmo objeto para os diferentes métodos, pode-se

verificar que a fixação determinada pela busca heurística, que corresponde ao mínimo global, é

diferente da fixação determinada pela rede de Hopfield. Pode-se observar também que as redes

feedforward apresentam resultados próximos àqueles que seriam adequados para fixação. Este

tipo de resposta é característico da capacidade de generalização da rede feedforward, que ocorre

em detrimento da capacidade de precisão da resposta11.

Pode-se então utilizar as duas redes combinadas a fim de se otimizar as respostas. Nesta

combinação, a rede feedforward é responsável por classificar o objeto, gerando respostas pró-

ximas às regiões em que se encontram os melhores pontos de fixação. A resposta da rede

feedforward é então utilizada como inicialização da rede de Hopfield, que por sua vez, é res-

ponsável por otimizar as repostas.

Neste método de determinação da fixação, as redes RBF e de Hopfield são as mesmas

descritas nas Seções anteriores. A rede RBF é previamente treinada com os padrões geométricos

11A capacidade de generalização da rede RBF é obtida aumentando-se o raio da função de base radial. A

diminuição do mesmo raio melhora a precisão da resposta, porém com queda na capacidade de generalização.


da Figura 7.22, cujos pontos de contato são determinados pela busca heurística, e a rede de

Hopfield tem a mesma arquitetura que a apresentada anteriormente e utiliza a função custo das

Equações 7.18 e 7.19 para otimizar a fixação por dois e três pontos de contato respectivamente.


As rede combinadas foram implementadas para determinar dois pontos de fixação de obje-

tos 3D, e os resultados obtidos com os objetos de testes são apresentados nas Figuras 7.28, 7.29

e 7.30.

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)



treinadas e posterior otimização com redes de Hopfield (parte 1 de 3).


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)





(a) (b) (c)




Os tempos de processamento foram medidos e são apresentados na Tabelas 7.8. A partir da

observação de que os tempos de processamento estão entre os tempos apresentados nas Tabelas

7.4 e 7.6, e ainda, a partir dos resultados dos testes com os objetos da base de dados, em que

no total foram determinadas 92,1% de fixações satisfatórias, pode-se concluir que a combi-

nação das duas redes neurais melhora o desempenho na determinação de pontos de fixação sem

aumentar significativamente o tempo de processamento.

Tabela 7.8: Tabela do tempo de determinação da fixação 3D por dois pontos utilizando RNAs

tipo RBF e posterior otimização por redes de Hopfield para os objetos das Figuras 7.28, 7.29 e

7.30.


Figura 7.28(d) 0,1422

Figura 7.28(g) 0,1082

Figura 7.29(a) 0,2217

Figura 7.29(d) 0,1991

Figura 7.29(g) 0,2441

Figura 7.29(j) 0,1921

Figura 7.30(a) 0,2422


As redes RBF e de Hopfield também foram combinadas para determinar três pontos de

fixação de objetos 3D. Os resultados obtidos na determinação de pontos de contato para os

objetos de testes são apresentados nas Figuras 7.31 e 7.32.


(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)





Os tempos de processamento foram medidos e são apresentados na Tabela 7.9. Novamente,

os resultados da combinação das duas redes neurais promoveu melhoras no desempenho quanto

à quantidade de fixações satisfatórias nos testes com a base de dados. Foram obtidas 96,7% de

fixações satisfatórias, e ainda, não houve aumento siginificativo do tempo de treinamento.

Tabela 7.9: Tabela do tempo de determinação da fixação 3D por garras de dois dedos utilizando

RNAs tipo RBF e posterior otimização por redes de Hopfield para os objetos das Figuras 7.31

e 7.32


Figura 7.31(d) 1,2213

Figura 7.31(g) 1,0946

Figura 7.31(j) 0,8888

Figura 7.32(a) 2,0610

Figura 7.32(d) 1,1547

Figura 7.32(g) 1,6554

Figura 7.32(j) 2,0102


Neste Capítulo foi investigado o comportamento das RNAs na determinação de pontos de

fixação para objetos 3D desconhecidos. O objetivo principal foi avaliar a capacidade das redes

em relação à qualidade das respostas e em relação aos tempos de processmaneto.

Para o caso da fixação 3D, ao contrário do que é observado para a fixação 2D, existem

poucos trabalhos que utilizam RNAs se determinar os pontos de contato, destacando-se apenas

o trabalho de Lee et al. (2002). Contudo, os mesmos métodos testados para o caso 2D foram

testados para o caso 3D, ou seja, foram implementados os seguintes métodos: o método uti-

lizando redes RBF previamente treinadas, segundo a proposta de Lee et al. (2002); o método

utilizando redes de Hopfield; e um novo método proposto como uma combinação das redes

RBF e de Hopfield.

Os métodos foram implementados e simulações foram realizadas com uma base de dados

formada por um total de 11700 objetos abstratos e obtidos por modelagem computacional. E

resultados foram apresentados para oito modelos de objetos do cotidiano e de formas abstratas.

Em geral, pode-se dizer que as RNAs são capazes de determinar pontos adequados de fixa-

ção, porém as mesmas devem ser adequadamente configuradas e treinadas. Dentre os resulta-

dos, destacam-se aqueles obtidos com a nova proposta de combinação das redes, neste caso, um

total de 92,1% de fixação satisfatórias foi alcançado para dois pontos de contato, e 97,6% para


três pontos de contato. Estes resultados são significativamente melhores que aqueles obtidos

com a rede RBF e com a rede de Hopfield, no entanto, não houve aumento expressivo no tempo

de processamento.

7.6 Agradecimentos

O autor gostaria de agradecer aos colegas de laboratório Rafael Vidal Aroca, Dalton Mat-

suo Tavares e José Martins Júnior pela ajuda na obtenção e criação dos modelos 3D para as

simulações dos algoritmos de fixação 3D.

189

Parte IV

Proposta de um sistema de fixação de

auto-aprendizagem

191

8 Fixação 2D e 3D com auto-aprendizagem

Nos Capítulos 5 e 7 desta Dissertação, foram apresentadas diferentes configurações de

RNAs para a determinação de fixações de objetos, e resultados satisfatórios são apresentados.

Contudo, pode-se ainda explorar as capacidades das redes de classificação e generalização para

desenvolver um sistema de auto-aprendizagem para fixação de objetos. Neste sentido, um algo-

ritmo de auto-aprendizagem, baseado nas diferentes RNAs apresentadas nos Capítulos suprac-

itados, é apresentado no presente Capítulo. Uma característica importante do algoritmo é que o

mesmo pode ser aplicado tanto para o caso da fixação 2D quanto para o caso 3D. Os primeiros

resultados da auto-aprendizagem são apresentados pela simulação do algoritmo proposto com as

bases de objetos 2D e 3D, e os resultados obtidos apontam a capacidade de auto-aprendizagem

das RNAs destinadas à determinação de pontos de fixação de objetos.

8.1 Introdução

A capacidade dos robôs de fixar objetos é uma das características desejadas para muitas

aplicações. Em algumas delas, os objetos a serem fixados apresentam geometria complexa e

pode-se dizer que é impossível de se determinar, a priori, quais as geometrias dos objetos que

serão apresentados ao sistema. Nestes casos, diz-se que o objeto é desconhecido pelo robô.

Portanto, a fixação de objetos desconhecidos é um dos maiores desafios na área de fixação e

manipulação de objetos por garras robóticas, e tal característica é fundamental principalmente

para os robôs que devem trabalhar em ambientes não estruturados, como robôs de serviço por

exemplo.

A melhor forma de se determinar pontos de fixação para objetos é a partir da geometria

do mesmo. Desta forma, quando se deseja fixar um objeto desconhecido, a primeira etapa é a

obtenção da sua forma. Uma vez que se conhece a geometria do objeto, que pode ser 2D ou

3D, diversas estratégias podem ser adotadas para se determinar os pontos de fixação do objeto.

192 8 Fixação 2D e 3D com auto-aprendizagem

As diferentes estratégias de se fixar objetos desconhecidos são apresentadas na Seção 2.11, e

dentre elas é importante recordar os sistemas propostos para aplicações industriais, tendo como

principal trabalho aquele realizado por Morales et al. (2006b). Tais sistemas são baseados em

algoritmos de rápido processamento, e uma das desvantagens é a não capacidade de aprendiza-

gem, ou seja, o sistema não melhora seu desempenho a medida em que objetos são apresentados

para fixação. Se algum objeto for apresentado pela segunda vez ao sistema, mesmo qua a fi-

xação determinada na primeira apresentação tenha sido satisfatória, todos os cálculos serão

repetidos, e para aqueles cuja fixação determinada não é satisfatória, não há posibilidade de

fixá-lo, mesmo existindo uma forma de fixá-lo adequadamente.

Outra proposta interessante é a formação de uma base de dados de objetos, tal como pro-

posta em Kamon et al. (1994). A base de dados é formada por formas de objetos, suas ca-

racterísticas geométricas, e respectivos pontos adequados de fixação. O objetivo da formação

de uma base de dados é permitir que objetos apresentados pela segunda vez ao sistema sejam

fixados sem a necessidade de cálculos, pois apenas uma busca na base de dados é realizada.

Neste caso, pode-se dizer que ao adicionar informações de um objeto à base de dados, o mesmo

torna-se conhecido pelo sistema, e ainda, não há melhorias no desempenho do sistema quando

objetos ainda desconhecidos são apresentados ao sistema pela primeira vez, mesmo que exista

uma extensa base de dados formada.

Uma alternativa interessante é a utilização de RNAs previamente treinadas para determinar

fixações de objetos desconhecidos. Para o caso da fixação 2D, cita-se os trabalhos de Xu et al.

(1990) e Valente (1999), e para o caso 3D cita-se o trabalho de Lee et al. (2002). A fixação

utilizando os diferentes tipos de RNAs das citações anteriores é apresentada nos Capítulos 5 e

7 do presente trabalho, e a partir dos resultados obtidos, pode-se concluir que as RNAs, quando

adequadamente configuradas e treinadas, constituem uma poderosa ferramenta para a fixação

de objetos desconhecidos.

Contudo, apesar dos bons resultados em relação à qualidade das respostas e aos tempos

de processamento apresentados pelas RNAs, pode-se explorar algumas das suas características

como a sua capacidade de classificação, de generalização e de retreinamento na tentativa de

melhorar o seu desempenho na tarefa de fixar objetos.

Neste sentido, a proposta apresentada neste Capítulo é um sistema de fixação com capaci-

dade de auto-aprendizagem, ou seja, o sistema é capaz de aprender novas fixações a medida

em que é executado, e ainda, o sistema apresenta tempos reduzidos de aprendizagem e de exe-

cução. O algoritmo é baseado em RNAs conforme a proposta inicial de utilizá-las nas etapas

1Recomenda-se a leitura da Seção 2.1 para conhecimento das estratégias de fixação de objetos desconhecidos.


de determinação da fixação, pois o mesmo é desenvolvido com base nos resultados obtidos por

Xu et al. (1990) e Valente (1999) para o caso 2D, nos resultados obtidos por Lee et al. (2002)

para o caso 3D, e nos resultados obtidos nos Capítulos 5 e 7 desta Dissertação. Simulações com

objetos de extensas bases de objetos mostram a capacidade de auto-aprendizagem do algoritmo

proposto, e os tempos de processamento de aprendizagem e de execução são compatíveis com

as aplicações de fixação de objetos.

Este Capítulo está organizado da seguinte forma: na Seção 8.2, o algoritmo de auto-

aprendizagem proposto é apresentado; e na Seção 8.3 duas diferentes simulação são realizadas

para verificar as capacidades e limitações da proposta. E por fim, considerações e discuções dos

resultados são apresentados na Seção 8.4.


8.2.1 Descrição

O algoritmo proposto neste Capítulo consiste em um sistema de auto-aprendizagem baseado

nas RNAs tipo feedforward e de Hopfield. A principal característica do algoritmo é a capaci-

dade de aprender novas fixações a partir da avaliação de um supervisor e de um mecanismo de

retreinamento da rede feedforward. O algoritmo apresenta diversas etapas, sendo que em cada

uma, um diferente método de determinação de fixação é utilizado. Os diferentes métodos de

fixação utilizados são: busca heurística; redes feedforward; e otimização por redes de Hopfield;.

Os diferentes algoritmos de fixação são utilizados em etapas específicas do algoritmo de

auto-aprendizagem, que é por sua vez dividido em 5 etapas. Cada etapa é responsável por

cálculos e procedimentos definidos, explicados a seguir na seqüência de execução do algoritmo.

Rede feedforward Nesta etapa inicial, um rede neural feedforward tipo RBF, configurada como

classificadora, é utilizada para determinar uma fixação inicial, ou seja, uma classifcação

do objeto é realizada. A rede é previamente treinada com alguns padrões geométricos,

cujos pontos de fixação são determinados pelo método de busca heurística. Esta etapa é

baseada no algoritmo proposto por Valente (1999) para o caso 2D, e no algoritmo pro-

posto por Lee et al. (2002) para o caso 3D.

Otimização com redes de Hopfield Por vezes, a fixação determinada na etapa anterior não

apresenta a propriedade force-closure, mas podem haver soluções satisfatórias quanto à

propriedade nas proximidades dos pontos iniciais. Na tentativa de otimizar o resultado


da primeira rede, ou seja, encontrar uma fixação force-closure e de boa qualidade, uma

rede competitiva otimiza o resultado buscando uma fixação que representa o mínimo local

mais próximo da sua inicialização. O mínimo global (a melhor fixação dentre todas as

possíveis) pode também ser alcançado, caso a inicialização da rede seja adequada. Mas

de forma geral, encontra-se apenas mínimos locais, que são satisfatórios na maioria dos

casos.

Supervisor Um sistema supervisor avalia a resposta da rede de otimização segundo a pro-

priedade force-closure. Se a resposta for considerada não satisfatória, é necessário utilizar

um método de busca, diferente dos anteriores, capaz de determinar uma diferente fixação

que deve ser satisfatória, e então, é necessário executar o procedimento de aprendizagem.

Se a fixação for considerada satisfatória, as próximas etapas não serão executadas, e o

procedimento é finalizado nesta etapa.

Busca heurística Esta etapa é realizada para se determinar uma fixação satisfatória no caso

em que a avaliação do supervisor da etapa anterior apontar que a fixação determinada

pelas redes neurais não é satisfatória. Nesta etapa, todas as possíveis combinações são

avaliadas segundo um critério estabelecido, ou uma função custo. A combinação que

apresentar a melhor nota, segundo o critério estabelecido, é a melhor fixação. Caso a

melhor fixação não apresente a condição force-closure, não é possível fixar o objeto e não

há aprendizagem.

Mecanismo de aprendizagem Caso a fixação determinada pela rede não for force-closure, e a

fixação determinada pela busca heurística for, a rede neural feedforward é retreinada.

No retreinamento, são utilizados todos os padrões anteriores adicionados da presente

forma apresentada ao sistema, que é então considerada com um novo padrão de treina-

mento. A resposta esperada para o novo padrão de treinamento é aquela determinada pela

busca heurística. Em outras palavras, se para uma determinada forma as redes neurais

feedforward e de Hopfield não apresentam uma resposta satisfatória, e se pela busca heu-

rística é possível obter uma fixação estável, então esta forma é adicionada como padrão

de treinamento e a rede feedforward é retreinada com os padrões atualizados.

Cada uma das etapas acima desempenha um papel fundamental na auto-aprendizagem. Ini-

cialmente, a rede tipo feedforward é responsável por classificar os objetos de acordo com os

padrões de treinamento, apresentando uma estimativa de uma fixação satisfatória2, contudo a

capacidade de generalização das redes feedforward implica em uma resposta não otimizada, e

desta forma a fixação determinada pode não ser adequada.

2Relembrando, uma fixação satisfatória é uma fixação force-closure.


Para melhorar a resposta apresentada pela rede feedforward, uma rede competitiva é res-

ponsável por otimizar os resultados. A resposta obtida pela rede de Hopfield é um mínimo

local, ou global, que depende da sua inicialização (XU et al., 1990). O resultado da rede de

Hopfield pode ser satisfatório dependendo da sua inicialização, portanto, se o resultado não é

satisfatório, então a inicialização pode não ser adequada, ou seja, se a resposta não é satisfatória,

a rede feedforward não é capaz de classificar o objeto. No caso em que a rede RBF não é capaz

de classificar um determinado objeto, a forma deste objeto é considerada como a representante

de uma nova classe de formas, e então a rede é retreinada com as formas padrões anteriores

adicionadas da nova.

O algoritmo apresentado possui a capacidade de aprender novas fixações a partir da consi-

deração de novos padrões de treinamento da rede feedforward, encontrados a medida em que o

algoritmo é utilizado. Para verificar a capacidade de auto-aprendizagem do sistema, simulações,

descritas nas próximas Seções, foram realizadas.


8.3.1 O algoritmo proposto é capaz de aprender novas fixações?

O algoritmo de auto-aprendizagem proposto utiliza um mecanismo de retreinamento das

redes RBF na tentativa de melhorar o seu desempenho na determinação de pontos de contato

para a fixação de objetos. Em relação à sua capacidade de auto-aprendizagem, algums questões

podem ser discutidas:

"A rede é capaz de aprender novas fixações?"

"A cada novo retreinamento, o que acontece com o desempenho da rede em comparação com

o estado da rede anterior ao retreinamento?"

"A freqüência de retreinamento diminui com o uso da rede?"

"Existe algum limite de adição de padrões de treinamento? Se existe, como este limite é

determinado?"

A fim de responder as questões listadas, simulações foram realizadas, e para tanto, extensas

bases de objetos, uma de objetos 2D e outra de objetos 3D, foram utilizadas. Para o caso 2D,


a base de dados é formada pelas imagens disponibilizadas em SAXENA (2006). Os dados

utilizados consistem em imagens adiquiridas a partir de fotos de diversas posições de uma cena

contendo objetos do cotidiano modelados em um ambiente virtual. No total, utilizou-se 8100

imagens de sete objetos diferentes, sendo cerca de 1200 imagens para cada objeto. Para o caso

3D, a base de dados é formada por 2925 objetos 3D abstratos modelados em um software CAD3.

8.3.2 Simulações e resultados

As fim de responder as questões sobre a capacidade do sistema de auto-aprendizagem pro-

posto, duas simulações foram realizadas.

Primeira Simulação

Na primeira simulação, os objetos foram apresentados às redes sempre em uma mesma or-

dem. Na primeira apresentação de todos os objetos à rede, não foi permitida a capacidade de

auto-aprendizagem, e para cada objeto verificou-se a propriedade force-closure da fixação deter-

minada. A Figura 8.1 apresenta a resposta da rede sem a capacidade de auto-aprendizagem para

a fixação 2D por dois pontos de contato. A imagem, nomeada como "Mapa de comportamento

da rede, mostra em cada um de seus pixels a resposta obtida, os pixels em vermelho claro repre-

sentam os objetos cuja fixação não foi force-closure, e os pixels em verde claro representam os

objetos cuja fixação determinada foi force-closure.

O resultado desta primeira etapa foi utilizado nas próximas etapas da primeira simulação.

Na segunda etapa, foi permitido a capacidade de auto-aprendizagem, ou seja, a cada fixação não

force-closure determinada, executou-se o processo de retreinamento da rede com os padrões

iniciais adicionados do novo padrão e sua respectiva resposta obtida pela busca heurística. Os

objetos da base de dados foram apresentados na mesma ordem que aquela da primeira etapa,

até que um total de 50 formas foram adicionadas aos padrões de treinamento, ou seja, até

o retreinamento com 50 novas formas. Espera-se que, ao adicionar 50 formas aos padrões

geométricos, não sejam obtidas respostas satisfatórias somente para as 50 formas adicionadas,

o que aconteceria se fosse formada uma base de dados de fixações, mas espera-se que seja

possível determinar fixações satisfatórias para outros objetos, diferentes daquelas 50 formas

adicionadas, cujas fixações não foram satisfatórias na primeira etapa.

3No total, foram criados 11700 objetos 3D, porém, devido ao tempo de processamento requerido para a real-

ização das simulações, apenas aqueles mais complexos foram utilizados.


Figura 8.1: Mapa do comportamento da rede no seu estado inicial.

Após a aprendizagem de 50 novos padrões, interrompeu-se o processo, e executou-se o

mesmo procedimento da primeira etapa, ou seja, todos os objetos da base foram apresentados

à rede em uma mesma ordem, e também não foi permitido a capacidade de aprendizagem. A

diferença nesta etapa da simulãção com a primeira etapa é a rede utilizada, que neste caso foi

aquela retreinada com os padrões iniciais adicionados das 50 novas formas. A Figura 8.2 mostra

o mapa do comportamento da rede após 50 retreinamentos.

Figura 8.2: Mapa do comportamento da rede após a realização de 50 retreinamentos.


O procedimento descrito foi realizado com o objetivo de avaliar o desempenho de uma

rede que "aprendeu" 50 novas formas geométricas. Contudo, pode-se repetir o procedimento

para diferentes quantidades de formas geométricas aprendidas. Para cada diferente quantidade

de formas adicionadas aos padrões geométricos, pode-se medir a quantidade de fixações satis-

fatórias, apresentando à mesma cada um dos objetos da base e verificando a resposta obtida. A

Figura 8.3 mostra os mapas do comportamento da rede para diferentes estágios de aprendiza-

gem.

Figura 8.3: Mapas do comportamento da rede para diferentes estágios de retreinamento.

Ao traçar em um gráfico a curva de quantidade de fixações satisfatórias por número de

formas adicionadas aos padrões de retreinamento, obtém-se a curva denominada formas adi-

cionadas aos padrões × fixações satisfatória que é também denominada como curva de apren-

dizagem, e a partir desta curva é possível responder à algumas das questões sobre a capacidade

de aprendizagem das redes.


O gráfico da Figura 8.4 apresenta a curva de aprendizagem para a fixação 2D por dois

pontos de contato. A base de objetos utilizada nesta simulação contém 8100 exemplares, e as

simulações foram realizadas para diferentes quantidade de formas adicionadas aos padrões para

retreinamento (de 0 a 800 com passo de 50).

Figura 8.4: Curva de aprendizagem para a fixação 2D por dois pontos de contato.

A partir da curva de aprendizagem da Figura 8.4, pode-se verificar que, inicialmente, fixa-

ções satisfatórias foram determinadas para cerca de 6170 objetos, porém ao adicionar 50 formas

geométricas aos padrões de treinamento, houve cerca de 7200 fixações satisfatórias. Pode-se

responder a primeira questão em relação à capacidade de aprendizagem, sendo que houve mel-

hora no desempenho da rede retreinada em relação à rede inicial.

Ainda em relação à curva da Figura 8.4, pode-se dizer que o desempenho da rede melhora a

cada nova aprendizagem, porém, pode-se observar uma linha de tendência (linha horizontal por

volta de 7200) e não há melhoras significativas após este valor ser atingido, e em alguns casos,

o desempenho apresenta algumas pequenas oscilações, contudo, o desempenho é sempre maior

que 90%.

Simulações similares foram realizadas para a fixação 2D por três pontos de contato, para a

fixação 3D por dois pontos de contato, e para a fixação 3D por três pontos de contato. As curvas

de para cada caso são apresentadas nas Figuras 8.5, 8.6 e 8.7 repectivamente.


Figura 8.5: Curva de aprendizagem para a fixação 2D por três pontos de contato.

Figura 8.6: Curva de aprendizagem para a fixação 3D por dois pontos de contato.


Figura 8.7: Curva de aprendizagem para a fixação 3D por três pontos de contato.

Nas simulações realizadas para as diferentes configurações de rede, para fixação 2D ou

3D, por dois ou três pontos de contato, observa-se o mesmo comportamento: há melhora da

qualidade das respostas apresentadas a medida que novas formas são adicionadas aos padrões

de treinamento e que a rede é retreinada; e existe uma linha ou valor de tendência, sendo que

não há melhoras significativas após este valor ser atingido.

Segunda Simulação

Na primeira simulação, é possível verficar a capacidade de auto-aprendizagem, e ainda, é

possível verificar a melhoria do desempenho após vários retreinamentos. Contudo, duas das

questões sobre a capacidade de auto-aprendizagem não foram respondidas na primeira simula-

ção:

"A freqüência de retreinamento diminui com o uso da rede?"

"Existe algum limite de adição de padrões de treinamento? Se existe, como este limite pode

ser determinado?"

Estas questões não puderam ser respondidas a partir dos resultados da primeira simula-

ção, pois, naquele caso, os objetos das bases de dados foram apresentados à rede sempre em

uma mesma ordem, e para cada diferente estágio de rede, atingido após um certo número de


retreinamentos, uma verificação exaustiva foi realizada4.

Em uma condição real de trabalho, não há como verificar o desempenho de cada estágio

intermediário da rede através de uma simulação exaustiva utilizando uma base de objetos, e

portanto, não é possível determinar quando o valor de tendência foi atingido, e quando o re-

treinamento deve ser interrompido.

Para responder estas questões sobre o desempenho da rede, uma segunda simulação foi rea-

lizada. Nesta simulação, os exemplares da base de objetos foram apresentados aleatoriamente à

rede e não houve restrições ou limites de retreinamento. O número de apresentações de objetos

entre cada retreinamento foi medido, e desta forma, é possível verificar o aumento da quanti-

dade de objetos apresentados à rede necessários para que um novo retreinamento ocorra. Os

tempos de execução e de retreinamento da rede também foram medidos.

A rede testada nesta simulação é novamente aquela para a fixação 2D por dois pontos de

contato, e objetos foram apresentados à rede até a execução de 10000 retreinamentos. O gráfico

da Figura 8.8 mostra a média de objetos apresentados à rede entre 250 retreinamentos, e os

gráficos das Figuras 8.9 e 8.10 apresentam o tempo de execução e de retreinamento da rede,

repectivamente, para cada intervalo de 250 retreinamentos.

Figura 8.8: Objetos apresentados à rede entre retreinamentos. Os valores mostrados represen-

tam a média entre cada 250 retreinamentos. Resultados para a primeira simulação de apresen-

tação de objetos à rede, em ordem randômica.

4Cada uma das verificações leva cerca de 2 horas de processamento no computador de testes.


Figura 8.9: Tempo de execução da rede. Média entre cada 250 retreinamentos. Resultados para

a primeira simulação de apresentação de objetos à rede, em ordem randômica.

Figura 8.10: Tempo de retreinamento da rede. Média entre cada 250 retreinamentos. Resultados

para a primeira simulação de apresentação de objetos à rede, em ordem randômica.


Esta mesma simulação foi repetida outras quatro vezes, e os resultados são mostrados no

Apêndice F. Nos resultados obtidos nas cinco simulações, o mesmo comportamento pode ser

verificado, ou seja, a quantidade de objetos apresentados à rede entre retreinamentos aumenta

significativamente no início da simulação, porém a curva do gráfico apresenta oscilações após

1000 retreinamentos, aproximadamente. Contudo, os tempo de retreinamento e de execução da

rede aumentam linearmente a cada retreinamento.

Desta forma, a adição de novas formas aos padrões geométricos e o retreinamento da rede

melhoram o desempenho da mesma, e pode-se dizer que não há um limite de adição de formas

acima do qual pode haver detrimento da capacidade de determinar fixações satisfatórias. Apesar

disso, a adição de valores aumenta o tempo de execução e de retreinamento da rede, tal que,

os tempos de execução e de retreinamento podem tornar-se maiores que aqueles de execução

da busca heurística, e neste caso, pode-se dizer que é mais conveniente executar uma busca

heurística do que executar a rede, pois os tempos de execução são os mesmos, porém, o melhor

desempenho em relação à qualidade das resposta é alcançado com a busca heurística.

Então, pode-se propor a verificação do tempo de retreinamento da rede como critério de

parada, ou seja, quando o tempo de retreinamento atingir um determinado limiar, que pode ser

relacionado ao tempo de busca heurística, interrompe-se o processo de aprendizagem, e a rede

passa a ser utilizada sem a capacidade de aprender novas fixações.

Desta forma, quando existe um mecanismo de determinação do melhor momento de in-

terrupção da aprendizagem, pode-se afirmir que o algoritmo apresenta a capacidade de auto-

aprendizagem, pois, neste caso, o sistema é capaz de aprender novas fixação e de melhorar seu

desempenho com retreinamentos da rede, e ainda, o sistema é decidir qual o melhor momento

de parada do retreinamento sem detrimento da capacidade do sistema (tanto para a qualidade

das respostas quanto para o tempo de processamento).

A rede utilizada neste segundo tipo de simulação da auto-aprendizagem foi aquela para

a determinação de dois pontos de contato para objetos 2D. O tempo de execução da busca

heurística por dois pontos de contato para objetos 2D medido no Capítulo 5, e mostrados na

Tabela 5.1, apresentou valores em torno de 0,3s de processamento. Portanto, pode-se adotar

para este caso o tempo de execução da rede igual ou superior a 0,3R s, como critério de parada

de adição de formas aos padrões para o retreinamento. O termo R é um escalar de ponderação,

podendo ser maior ou menor que 1, dependendo da aplicação.

Para os outros casos da fixação, fixação 2D por três pontos de contato e fixação 3D por dois

e três pontos de contato, pode-se encontrar um critério de parada de aprendizagem semelhante

àquele encontrado nestas simulações. Devido aos tempos necessários para a realização de cada


simulação (cerca de dias e até semanas para o caso da fixação 3D por três contatos), estas

simulações serão futuramente realizadas.


Neste Capítulo, um algoritmo de auto-aprendizagem de fixações foi apresentado. A pro-

posta abrange tanto a fixação 2D quanto a fixação 3D. O algoritmo proposto é baseado nas

RNAs tipo RBF e de Hopfield combinadas, e um sistema supervisor e um de retreinamento da

rede RBF permite o aprendizado de novas fixações, e ainda, é possível melhorar o desempenho

da rede com pouco retreinamentos.

Diferentes simulações foram realizadas para verificar a capacidade de auto-aprendizagem, e

nas simulações foram utilizadas extensas bases de objetos. Na primeira simulação, foi verificada

a capacidade da rede de melhorar o seu desempenho à medida que novas formas são adicionadas

aos padrões de treinamento, sendo que a capacidade de auto-aprendizagem foi verificada em

todos os casos, 2D ou 3D por dois ou três pontos de fixação.

Na segunda simulação, os objetos foram apresentados à rede em uma ordem aleatória e,

neste caso, foi avaliado o comportamento da rede em uma situação sem qualquer controle de

auto-aprendizagem. O objetivo da simulação foi determinar uma relação capaz de indicar qual

o limite de treinamento. Nos resultados obtidos verificou-se que o principal ponto negativo

da proposta é o tempo de retreinamento e de execução da rede, pois observou-se que o tempo

aumenta linearmente com o número de novas aprendizagens. Logo, após uma série de retreina-

mentos da rede, o tempo de execução e retreinamento tornam o sistema inviável. Portanto,

pode-se utilizar o tempo de execução ou de retreinamento da rede como critério de parada da

aprendizagem, o que caracteriza a auto-aprendizagem.

Apesar dos bons resultados obtidos, a segunda simulação foi realizada somente para o caso

da fixação 2D por dois pontos de contato, sendo necessário realizar a mesma situação para os

demais casos.

Por fim, estes primeiros resultados apontam que é possível desenvolver um sistema de auto-

aprendizagem de fixação utilizando redes neurais, contudo, ainda é necessário investigar a fundo

o comportamento deste novo algoritmo a fim de conhecer melhor as suas vantagens e desvanta-

gens.

207

9 Conclusões Finais

A crescente necessidade em diversas áreas - industrial, médica, serviços - de sistemas fle-

xíveis e adaptáveis, que atendam a diferentes condições de trabalho, motivou a pesquisa e de-

senvolvimento de sistemas inteligentes e capazes de se adaptarem às diferentes condições de

trabalho sem a necessidade de reestruturação e readequação das suas instalações.

No campo da fixação de objetos por garras robóticas, a atual necessidade de sistemas ca-

pazes de fixar diferentes tipos de objetos em posições aleatórias também tornou-se uma ne-

cessidade para a flexibilização dos processos que envolvem, de forma direta ou indireta, os

manipuladores robóticos e os robôs de serviço.

Nas últimas décadas, pode-se destacar inúmeros trabalhos cujas propostas são sistemas

flexíveis capazes de realizar tarefas de fixação inteligente. Dentre todos, destacam-se aqueles

que utilizam sistemas de visão como fonte de informação sobre os objetos existentes no espaço

de trabalho de um robô. Se por um lado os sistemas propostos apresentaram maior flexibilidade

e adaptabilidade quanto à posição e à forma do objeto, surge outro problema relacionado ao

sistema de visão que deve ser capaz de capturar e informar ao sistema qual a forma do objeto.

Outro fator de importância é a necessidade de baixo tempo de resposta do sistema e baixo

custo computacional. Em aplicações industriais existe a necessidade de sistemas rápidos com

baixo custo de instalação. Trabalhos recentes estudam a relação entre velocidade e custo de

instalação do sistema e propõem a utilização de algoritmos e técnicas de cálculos simples com

bom tempo de resposta, porém em detrimento da capacidade do sistema. Por outro lado, em

algumas aplicações, pode-se investir em recursos computacionais avançados, a fim de permitir

o ótimo desempenho do sistema.

Desta maneira, a fixação de objetos é uma importante área de pesquisa da robótica, seja

para aplicações industriais, para robôs de serviços, ou para outras aplicações em que também é

desejavel a interação entre robôs e objetos do meio. A necessidade de robôs capazes de interagir

com objetos, ou seja, fixá-los e manipulá-los, motivou o desenvolvimento de novas garras mais

capazes e de planejadores inteligentes de fixação e de manipulação.

208 9 Conclusões Finais

Neste contexto, o desenvolvimento de planejadores avançados de fixação e de manipulação

são tão importantes quanto o desenvolvimento das garras, pois, mesmo para as garras com

menor capacidade de movimentação, tal como as garras industriais, é necessário o uso de um

planejador de fixação e manipulação, para que uma tarefa de interação um um objeto seja rea-

lizada com sucesso. Para o caso das garras mais avançadas, com diversos dedos e muitos graus

de liberdade e sensores, a utilização de planejadores de fixação e manipulação é ainda mais

importante para que seja possível utilizar toda a capacidade de fixação e de manipulação da

mesma.

A fixação e a manipulação podem ser consideradas como formas de interagir com um ob-

jeto, e diferenciam-se entre si pelo equilíbio estático e dinâmico do objeto em relação à garra.

Na grande maioria dos casos, uma tarefa de manipulação é precedida de uma fixação. Portanto,

a fixação é uma etapa importante no processo de interação de robôs com objetos por meio de

garras robóticas.

Neste trabalho, foram estudados diversos sistemas de fixação de objetos. E o foco princi-

pal foi a utilização de redes neurais na determinação de pontos de fixação baseados na forma

geométrica do objeto. Uma vez que é possível dividir os sistemas utilizados para a obtenção

da forma do objeto em sistemas de visão 2D e 3D, o estudo foi realizado para os dois casos, e

ainda, para cada um dos casos, duas maneiras de se fixar objetos foram estudadas, a fixação por

dois pontos de contato e a fixação por três pontos de contato. A fixação por dois e três pontos

de contato resumem os tipos de garras utilizadas nas indústriais, e mais, representam as duas

formas mais simples de se realizar uma fixação de precisão utilizando garras antropomórficas.

O objetivo deste trabalho foi avaliar a capacidade das redes neurais na determinação de

pontos adequados de fixação para objetos, e também verificar a capacidade das redes de apren-

der novas fixações através de um sistema de auto-aprendizagem. Para cada um dos casos, 2D

e 3D, simulações foram realizadas com diferentes métodos propostos na literatura e com novas

propostas realizadas neste trabalho. Para o algoritmo de auto-aprendizagem proposto, também

aplicável para ambos os casos, diferentes simulações foram realizadas. Nas simulações, foram

utilizados objetos do cotidiano e extensas bases de objetos para comprovar as capacidades e

limitações do método. Nas próximas Seções, 9.1, 9.2 e 9.3, são apresentadas as conclusões

e propostas de trabalhos futuros para a fixação 2D, para a fixação 3D, e para o algoritmo de

auto-aprendizagem, respectivamente.

9.1 Conclusões e propostas para a fixação 2D 209

9.1 Conclusões e propostas para a fixação 2D

No Capítulo 5, foram apresentadas aplicações de redes neurais na determinação de pontos

de fixação de objetos a partir da geometria 2D dos mesmos. Os estudos foram realizados a fim

de verificar a capacidade dos diferentes métodos que utilizam RNAs propostos na literatura (XU

et al., 1990; VALENTE, 1999) em determinar pontos de fixação para objetos desconhecidos, e

ainda, uma nova proposta utilizando RNAs também foi apresentada.

Quatro diferentes métodos de determinação de pontos de contato, e seus resultados, foram

apresentados, são eles: busca heurística, redes de Hopfield (XU et al., 1990), redes feedforward

tipo RBF (VALENTE, 1999), e a nova proposta que combina as redes de Hopfield e RBF. Para

cada um dos quatro difetentes métodos, duas diferentes implementações foram apresentadas,

uma para a determinação de dois pontos de contato, e outra para três pontos de contato.

Os resultados para o método de busca heurística cumpriram as espectativas iniciais. Foi

possível determinar pontos adequados de fixação para todos os objetos, tanto para os objetos

de teste, quanto para os objetos da base de dados. E ainda, o tempo de processamento do

método é elevado, devido, principalmente, à avaliação de todas as possíveis combinações de

fixação, sendo que esta é a sua principal característica negativa. O método de busca heurística

foi apresentado pois o mesmo é utilizado na determinação dos pontos de fixação das formas

padrões para o treinamento da rede RBF e para comparações entre os tempos de processamento.

O método proposto por Xu et al. (1990) também foi implementado e simulado na deter-

minação de dois e três pontos de fixação de objetos desconhecidos. A partir dos resultados

obtidos nas simulações, foi observado que a principal característica do método é a rapidez de

execução da rede, porém a taxa de fixações satisfatórias é baixa, apenas 62,8% (para a fixação

por dois pontos de contato, o melhor caso) das fixações determinadas para os 8100 objetos da

base de dados foram satisfatórias. Um dos prováveis motivos do baixo desempenho da rede de

Hopfield é a inicialização adotada, segundo Xu et al. (1990), a convergência da rede depende

de sua inicialização.

A rede RBF para a fixação 2D, apresentada em Valente (1999), também apresentou rápido

processamento. Apesar disso, a taxa de fixações satisfatórias é baixa e menor que aquela da

rede de Hopfield, mesmo para a configuração da rede de melhor desempenho. Destaca-se neste

método a possibilidade de configuração da rede para tarefas específicas, a partir do seu trei-

namento com formas geométricas padrões. Outra característica interessante da rede RBF é a

sua capacidade de classificação, porém, quando se configura a rede para cumprir esta tarefa,

perde-se a precisão das respostas.


O quarto método apresentado consiste em uma combinação das redes RBF e de Hopfield.

O objetivo desta combinação é melhorar o desempenho de cada uma delas, a partir da utiliza-

ção das suas principais características particulares. Neste método, a rede RBF é configurada

como classificadora, e treinada com formas elementares, e sua resposta consiste em uma ini-

cialização para a rede de Hopfield, que por sua vez, é responsável por encontrar uma fixação

satisfatória próxima a resposta da primeira rede. Os resultados obtidos mostram que é possível

melhorar o desempenho dos métodos que utilizam apenas uma das redes, e ainda, o tempo de

processamento também foi reduzido (vide Tabelas 9.1 e 9.2). O tempo de processamento do

método proposto apresenta melhores resultados que aqueles apresentados por cada uma das

redes utilizadas de forma isolada nos métodos anteriores.

Tabela 9.1: Comparação dos tempos de processamento da determinação da fixação 2D por dois

pontos de contato utilizando os quatro diferentes métodos descritos.

Figura Busca Heurística Rede de Hopfield Rede RBF Redes RBF e Hopfield

Figura A.2(a) 0,2625s 0,0690s 0,0473s 0,1283s

Figura A.2(b) 0,2160s 0,0238s 0,0350s 0,0738s

Figura A.3(a) 0,2335s 0,0567s 0,0364s 0,0692s

Figura A.3(b) 0,2032s 0,0209s 0,0360s 0,0473s

Figura A.3(c) 0,2521s 0,0314s 0,0354s 0,0591s

Figura A.3(d) 0,2589s 0,0419s 0,0351s 0,0603s

Figura A.3(e) 0,2598s 0,0318s 0,0363s 0,0619s

Figura A.4(a) 0,2505s 0,0214s 0,0351s 0,0626s

Figura A.4(b) 0,1300s 0,0321s 0,0365s 0,0588s

Figura A.4(c) 0,2892s 0,0217s 0,0362s 0,0583s

Figura A.4(d) 0,2536s 0,0223s 0,0355s 0,0616s

Figura A.4(e) 0,2610s 0,0214s 0,0371s 0,0590s

Tabela 9.2: Comparação dos tempos de processamento da determinação da fixação 2D por três

pontos de contato utilizando os quatro diferentes métodos descritos.

Figura Busca Heurística Rede de Hopfield Rede RBF Redes RBF e Hopfield

Figura A.2(a) 12,5083s 0,2378s 0,1794s 0,1271s

Figura A.2(b) 10,7642s 0,1119s 0,1330s 0,0393s

Figura A.3(a) 12,1357s 0,1039s 0,0994s 0,1383s

Figura A.3(b) 10,4243s 0,1120s 0,0931s 0,0899s

Figura A.3(c) 12,6787s 0,1239s 0,1094s 0,1173s

Figura A.3(d) 11,5055s 0,1016s 0,1052s 0,1012s

Figura A.3(e) 10,2894s 0,1226s 0,0921s 0,1078s

Figura A.4(a) 8,03370s 0,1044s 0,1019s 0,0408s

Figura A.4(b) 10,0774s 0,1093s 0,0948s 0,1389s

Figura A.4(c) 13,4464s 0,1041s 0,1232s 0,1186s

Figura A.4(d) 9,66960s 0,0967s 0,1075s 0,0969s

Figura A.4(e) 9,92430s 0,0947s 0,0991s 0,1147s


No entanto, apesar dos bons resultados obtidos com o método que utiliza as redes com-

binadas, algumas ressalvas e considerações, e conseqüentes propostas para trabalhos futuros,

devem ser apresentados em relação aos métodos, aos resultados e à continuidade dos trabalhos.

Primeiramente, em relação ao sistema de aquisição e de processamento da imagem, deve-

se considerar que: as imagens foram obtidas em um ambiente com controle de iluminação,

e com uma câmera previamente calibrada, o que favoreceu e permitiu a aplicação direta do

processamento da imagem apresentado no Apêndice A. Em uma aplicação real, por vezes, não

é possível controlar a iluminação, e é necessário realizar calibrações manuais ou automáticas

do sistema de aquisição. Assim, um sistema de visão 2D, que atende estes requisitos, é uma das

propostas de continuação do trabalho.

Outra proposta interessante é a detecção e verificação de colisões na execução da fixa-

ção determinada. Na implementação dos diferentes métodos de fixação do Capítulo 5 em um

sistema robótico real, é necessário verificar a possibilidade de realizar a fixação nos pontos de-

terminados, ou se haverá colisões com outras partes do próprio objeto durante a fixação. Nas

simulações realizadas, foram apenas verificados os ângulos de ponta do contorno do objeto.

Outras simplificações importantes que foram adotadas no desenvolvimento e na implemen-

tação dos métodos foram: a não consideração da geometria da garra e do objeto; e a não con-

sideração de uma garra específica (industrial ou antropomórfica) para realizar a fixação. Estas

simplificações foram realizadas para permitir a avaliação do método em determinar fixações a

partir da geometria do objeto somente, sem considerar o cinematismo da garra e suas restrições.

Para os casos em que se deseja determinar pontos de fixação para garras específicas, o

espaço de trabalho da garra deve ser considerado afim de se selecionar pontos de contato cuja

fixação seja exeqüível. Neste sentido, pode-se também selecionar uma postura da mão, cujo

espaço de trabalho melhor abrange a superfície do objeto. Ou ainda, para uma tarefa específica,

que apresenta para a sua execução uma postura da mão mais adequada, pode-se pré-selecionar

regiões da superfície do objeto que permitem a fixação segundo aquela postura, e então, utilizar

os planejadores de fixação para determinar os pontos de contato que promovem uma fixação

satisfatória. Levando em conta estas propostas, os métodos apresentados podem ser aplicados a

qualquer tipo de garra, tanto industriais, quanto antropomórficas.

Por fim, uma outra proposta interessante é a implementação dos métodos de fixação em

um robô manipulador para testes com objetos reais. Dentro desta proposta, existem duas pos-

sibilidades: 1) Implementação do sistema no robô SCARA do Laboratório de Mecatrônica da

EESC-USP. O robô apresenta arquitetura aberta e sistema operacional de tempo real (vide Aroca

(2008)), e ainda, o mesmo é provido de uma garra industrial tipo pinça. 2) Outra possibilidade


é a aplicação do método na nova garra antropomórfica denominada Kangûera (BENANTE et

al., 2007; MASSARO, 2006), desenvolvida pelo mesmo laboratório. Nestas implementações,

poderá ser verificado o comportamento das fixações determinadas pelo método e executadas

por um sistema real, e ainda, poderá ser verificado a capacidade do sistema de operar em tempo

real.

9.2 Conclusões e propostas para a fixação 3D

O objetivo principal do Capítulo 7 foi estudar o comportamento das RNAs na determinação

de pontos de fixação de objetos de geometria 3D desconhecida. Os estudos foram baseados nos

trabalhos de Xu et al. (1990) e Lee et al. (2002), e nos resultados obtidos no Capítulo 5, no qual

foi estudado o comportamento das redes para o caso da fixação 2D. Também foi proposto um

novo método de determinação de fixação 3D baseado em RNAs.

Ao longo do texto, foram apresentados quatro métodos de determinação de pontos de fi-

xação 3D: busca heurística; rede de Hopfield; rede feedforward tipo RBF; e a proposta de

combinação das redes RBF e de Hopfield. Para cada diferente método, duas implementações

foram realizadas, uma para fixação por dois pontos de contato e outra para três pontos de con-

tato. Cada uma delas foi simulada com uma base de dados de 11700 objetos 3D abstratos, e

ilustrações de alguns resultados foram apresentados para oito diferentes objetos do cotidiano,

sendo que o tempo de processamento foi medido a fim de comparações entre os métodos.

O método de busca heurística foi implementado e simulado, apesar deste método não ser

baseado em RNAs. O motivo da implementação é a sua utilização na etapa de treinamento

das redes RBF com a determinação dos pontos de contato dos objetos pertencentes aos padrões

de treinamento e comparação dos tempos de execução. Os resultados obtidos estão dentro das

espectativas para o método, ou seja, foi possível encontrar uma fixação satisfatória para todos

os objetos, porém, o tempo de processamento foi elevado devido à verificação de todas as

possibilidades de fixação.

O segundo método apresentado consiste em uma rede de Hopfield (XU et al., 1990). Uma

das principais características da rede é que não há etapa de treinamento, e a mesma pode apre-

sentar número variável de neurônios para diferentes objetos, ou seja, não é preciso realizar uma

normalização da sua entrada, em relação a quantidade de pontos do objeto, para a execução da

rede. Outra característica interessante é que não é necessário a utilização de toda a superfície

do objeto como entrada da rede, ou seja, pode-se determinar pontos de fixação para superfícies

incompletas. Desta forma, pode-se determinar uma fixação por pontos de contato pertencentes


à regiões definidas por algum método de seleção de regiões de fixação, ou ainda, pode-se deter-

minar fixações para objetos com faces ocultas.

Com relação ao tempo de processamento da rede de Hopfield, os resultados obtidos foram

satisfatórios. Tempos reduzidos de processamento foram obtidos, o que aponta que a rede

converge em poucas iterações. Aponta-se a dimensão 3D dos objetos como o principal fator

pela ocorrência da elevada taxa de respostas satisfatórias, pois, a existência de uma dimensão a

mais que o caso 2D aumenta as possiblidades de fixação, e conseqüentemente, a ocorrência de

mínimos locais, considerando as duas variáveis, é menor. Logo, consegue-se atingir mínimos

próximos ao mínimo global.

Também foi avaliado o comportamento da rede feedforward na determinação de pontos

de fixação de objetos de geometria 3D desconhecida. O algoritmo implementado foi baseado

naquele proposto por Lee et al. (2002). Similar à rede feedforward para o caso 2D, o correto

funcionamento da rede depende fundamentalmente da normalização dos dados de entrada. Com

este propósito, utilizou-se o método de simplificação de superfícies do Capítulo 6, e ainda, é

necessário utilizar toda a superfície do objeto, ou seja, não é possível utilizar a rede para seções

incompletas do objeto, ou para aqueles que apresentam faces ocultas.

Na etapa de treinamento da rede feedforward, foram utilizados os 15 objetos da Figura

7.4.1, sendo que para cada um deles, os pontos de fixação foram determinados pelo método

de busca heurística. Nos testes da rede em etapa de execução, o desempenho foi baixo em

relação à qualidade das fixações determinadas, pois foram obtidas apenas 35,0% de fixações

force-closure para dois pontos de contato, e 51,9% para três pontos de contato. Em relação ao

processamento, tempos reduzidos foram obtidos.

Sobre o tempo de treinamento da rede, em resultados preliminares não apresentados neste

trabalho, as redes feedforward tipo RBF apresentaram tempo de treinamento de poucos segun-

dos (de 1s a 10s dependendo da configuração da rede), enquanto que as redes tipo MLP apre-

sentaram até horas de treinamento. Estes resultados são similares àqueles obtidos por Valente

(1999) no treinamento das rede feedforward para o caso 2D.

O último método apresentado no Capítulo 7 consiste na nova proposta de combinação das

redes RBF e de Hopfield, similar àquela proposta no Capítulo 5 para a fixação 2D. A primeira

RNA da combinação é uma rede RBF classificadora que apresenta como resposta uma estima-

tiva de fixação do objeto. Na maioria dos casos, esta estimativa não é propriamente uma fixação

force-closure, porém, ela pode estar próxima a uma. No sentido de encontrar uma fixação ade-

quada próxima àquela apresentada pela rede classificadora, utiliza-se uma rede de Hopfield, que

recebe como inicialização a saída da rede RBF. Resultados satisfatórios foram obtidos tanto em


relação a taxa de fixações force-closure determinadas para os objetos da base de dados, quanto

em relação aos tempos de processamento.

Com relação à qualidade das respostas apresentadas pelas rede combinadas, cerca de 92,0%

das fixações determinadas para os 11700 objetos foram force-closure para o caso de dois pontos

de contato, e cerca de 97% para três pontos de contato. Com relação ao tempo de processa-

mento, os tempos observados foram reduzidos, e pode-se comparar os tempos obtidos pelos

diversos métodos a partir das Tabelas 9.3 e 9.4.

Tabela 9.3: Tabela de comparação dos tempos de processamento da determinação da fixação

3D por dois pontos de contato utilizando os quatro diferentes métodos descritos.

Figura Busca Heurística Rede de Hopfield Rede RBF Redes RBF e de Hopfield

7.6(a) 1,3927 s 0,2819 s 0,0196 s 0,1472 s

7.6(b) 1,2795 s 0,5040 s 0,0212 s 0,1422 s

7.7(a) 1,2824 s 0,2025 s 0,0213 s 0,1082 s

7.7(b) 1,2474 s 0,3464 s 0,0204 s 0,2217 s

7.7(c) 1,2735 s 0,3054 s 0,0299 s 0,1991 s

7.7(d) 1,2751 s 0,3278 s 0,0201 s 0,2441 s

7.7(e) 1,2572 s 0,2411 s 0,0210 s 0,1921 s

7.7(f) 1,2865 s 0,2523 s 0,0190 s 0,2422 s

Tabela 9.4: Tabela de comparação dos tempos de processamento da determinação da fixação

3D por três pontos de contato utilizando os quatro diferentes métodos descritos.

Figura Busca Heurística Rede de Hopfield Rede RBF Redes RBF e de Hopfield

7.6(a) 35,49620 s 4,4257 s 0,0615 s 0,8541 s

7.6(b) 114,5424 s 2,1885 s 0,0218 s 1,2213 s

7.7(a) 89,92680 s 3,8546 s 0,0261 s 1,0946 s

7.7(b) 34,00910 s 5,0939 s 0,0217 s 0,8888 s

7.7(c) 120,0924 s 3,7056 s 0,0251 s 2,0610 s

7.7(d) 87,60460 s 3,6894 s 0,0226 s 1,1547 s

7.7(e) 81,60400 s 3,5502 s 0,0245 s 1,6554 s

7.7(f) 81,12600 s 5,4816 s 0,0263 s 2,0102 s

De forma geral, pode-se dizer que as RNAs são capazes de determinar pontos de fixação sat-

isfatórios em tempo reduzido, desde que as mesmas sejam devidamente configuradas, treinadas

e combinadas. Contudo, algumas ressalvas e considerações devem ser levadas em conta, assim

como propostas para continuação do trabalho também devem ser realizadas. As considerações

e propostas para trabalhos futuros são realizadas em relação ao sistema de aquisição do objeto,

e em relação às garras utilizadas para executar a fixação.

Primeiramente, em relação ao sistema de visão 3D, sabe-se da dificuldade de se adquirir

toda a superfície do objeto, de forma que os sistemas de visão 3D ainda estão em fase de


desenvolvimento, e que o tema é uma importante e promissora área da ciência. Portanto, é

proposto o desenvolvimento de um sistema de visão capaz de mapear toda a superfície do objeto

com tempos reduzidos e com boa precisão. Estes são os principais requisitos para um sistema

de visão 3D destinado à fixação de objetos por garras robóticas.

Ainda relacionado ao sistema de visão, após a obtenção da nuvem de pontos do objeto,

existe a necessidade de se reconstruir a malha do mesmo, e ainda, pode-se também desejar

simplificá-la. De forma análoga ao sistema de visão 3D, a reconstrução e a simplificação de

malhas 3D constituem linhas de pesquisa de destaque. Neste trabalho, foi utilizado um método

de reconstrução de malhas cujo bom desempenho é reconhecido pela literatura, porém, existem

algumas restrições e desvantagens, que são tratadas em trabalhos específicos como os traba-

lhos de Gois (2004) e Polizzeli (2008). Então, deve-se pesquisar e avaliar os métodos de re-

construção de superfícies, afim de apontar o mais apropriado para o caso estudado. Quanto à

simplificação de superfícies, o método utilizado foi aquele proposto no Capítulo 6, contudo, no-

vas comparações com outros métodos devem ser realizadas para se verificar aquele que melhor

atende aos requisitos dos métodos de fixação 3D.

Outras considerações devem ser realizadas em relação as ferramentas necessárias para re-

alizar a fixação do objeto. No desenvolvimento deste trabalho, não foi considerada qual a garra

que realizaria a fixação, e desta forma, os métodos foram avaliados em relação a capacidade de

determinar pontos de fixação a partir da geometria 3D do objeto somente. Contudo, o cinema-

tismo e a capacidade de movimentação das garras destinadas à fixação devem ser consideradas

na determinação dos pontos de contato, pois é desejado que a fixação determinada possa ser

executada pela ferramenta selecionada.

Para as garras industriais, do tipo pinça e castanha, a simplicidade dos movimentos fa-

cilita a determinação da posição das mesmas para realizar a fixação nos pontos determinados.

Por outro lado, para as garras antropomórficas, tal como a Kangûera (BENANTE et al., 2007;

MASSARO, 2006) que atualmente está em fase de construção, a grande capacidade de movi-

mentação e as inúmeras possibilidades de configuração dificultam a determinação da maneira

com que a fixação será executada. Alternativas, complementares aos métodos apresentados no

Capítulo 7, podem ser adotadas. Pode-se estimar uma postura da mão mais adequada para o ob-

jeto e para a operação, e a partir do espaço de trabalho de cada um dos dedos da garra, pode-se

selecionar quais as regiões da superfície do objeto em que a fixação pode ser realizada, e então

pode-se determinar os melhores pontos de contato dentro das regiões específicas utilizando o

método baseado nas redes de Hopfield, que possibilita o trabalho com apenas algumas regiões

do objeto.


9.3 Conclusões e propostas para o algoritmo deauto-aprendizagem

No Capítulo 8, foi apresentado um algoritmo de auto-aprendizagem para a fixação de obje-

tos desconhecidos. O algoritmo é baseado nas RNAs apresentadas nos Capítulos 5 e 7, porém

naqueles casos, não havia possibilidade de se melhorar o desempenho das redes por uma mecan-

ismo de auto-aprendizagem.

A nova proposta de auto-aprendizagem utiliza um supervisor, um mecanismo de retreina-

mento, e um critério de parada de aprendizagem. O supervisor avalia a resposta da rede obtida

para cada objeto, ou seja, a fixação determinada. A fixação é avaliada em relação à propriedade

force-closure, e se a fixação não apresentar a propriedade, ela é denominada como insatisfatória,

e inicia-se o processo de aprendizagem da rede através de um mecanismo de retreinamento.

Nesta etapa, determinam-se pontos de fixação satisfatórios por uma busca heurística, e a rede

neural é retreinada com a nova forma e os padrões de treinamento anteriores.

O objetivo do algoritmo proposto é melhorar o desempenho da rede, e para verificar a

capacidade de auto-aprendizagem, duas diferentes simulações foram realizadas com extensas

bases de dados de objetos 2D e 3D.

Na primeira simulação, os objetos da base de dados foram apresentados à rede em uma

ordem pré-determinada, e nesta etapa foi permitida a capacidade de auto-aprendizagem. Cada

estado intermediário da rede, que sofreu o processo de aprendizagem, foi avaliado. Nesta avali-

ação, os objetos foram novamente apresentados à rede, porém neste caso a mesma não apresen-

tava a capacidade de auto-aprendizagem, e o número de fixações satisfatórias foi medido.

Nesta verificação, foi possível observar que a rede melhora seu desempenho, a partir da

avaliação progressiva de cada estado intermediário da rede, o que significa que a adição de

formas aos padrões e seqüente retreinamento da rede melhora a capacidade da mesma, não

somente em relação àquelas formas adicionadas, mas também em relação a outros objetos, para

os quais a rede inicial não era capaz de determinar uma fixação adequada. Este comportamento

foi verificado para todos os casos, fixação 2D ou 3D, por dois ou três pontos de contato.

Ainda sobre a primeira simulação, foi demonstrado que é possível aprender novas fixações

e melhorar o desempenho da rede. Contudo, em uma situação de uso qualquer, a rede não pode

ser retreinada indefinidamente, pois cada nova forma adicionada aos padrões ocupa espaço em

memória ou em disco rígido, e ainda, a adição de novos padrões aumenta o tempo de retreina-

mento e de execução da rede neural. Desta forma, deve-se estabelecer um critério de parada

de retreinamento, e desta forma, pode-se dizer que existe auto-aprendizagem, pois, o sistema é

9.3 Conclusões e propostas para o algoritmo deauto-aprendizagem 217

capaz de aprender e também de determinar quando a aprendizagem deve ser finalizada.

A avaliação de cada estado da rede na primeira simulação é realizada pela contagem de

fixações satisfatória dentre as respostas de todos os objetos da base. Este tipo de verificação não

pode ser realizada em uma situação prática, pois a mesma demanda tempo de processamento

(cerca de duas horas), sendo que o sistema deve avaliar o desempenho da rede por outra medida

que deve ser realizada em tempo de execução.

Se a rede é capaz de aprender novas fixações, então espera-se que, a medida que novas

formas são adicionadas aos padrões e o retreinamento é executado, ocorra aumento do número

de objetos apresentados à rede entre cada retreinamento.

Assim, na segunda simulação, os objetos foram apresentados aleatoriamente à rede, e o

número de objetos apresentados à mesma entre os retreinamentos foi medido. Os resultados

obtidos mostram que há aumento significatvo do número de objetos apresentados entre retreina-

mentos no início dos testes, e que existe um valor limite, que após ser atingido, não há mais

melhoria no desempenho. Por outro lado, os tempos de execução e de retreinamento da rede

aumentam linearmente a cada retreinamento1.

Com base nestas observações, foi proposto um critério de parada da aprendizagem a partir

do tempo de execução e de retreinamento da rede, contudo, outros critérios podem ser mais

adequados para determinar qual o melhor momento de parada. Assim, é proposto um estudo

sobre qual o melhor critério para finalização da auto-aprendizagem.

Por fim, pode-se concluir a partir destes primeiros resultados que o sistema proposto é

capaz de aprender novas fixações e determinar o melhor instante de parada. Contudo, novas

simulações devem ser realizadas e novas métricas de capacidade de aprendizagem e de limite

de retreinamento devem ser estudadas e propostas, a fim de melhor avaliar as capacidades e

limitações do algoritmo de auto-aprendizagem proposto.

1Este comportamento foi verificado para as cinco repetições da segunda simulação.

219

Referências Bibliográficas

ABEL, J.; HOLZMANN, W.; MCCARTHY, J. On grasping planar objects with twoarticulated fingers. IEEE Journal of Robotics and Automation, v. 1, n. 4, p. 211–214, dez,

1985.

ADE, F.; RUTISHAUSER, M.; TROBINA, M. Grasping unknown objects. Modelling and

Planning for Sensor Based Intelligent Robot Systems, World Scientific, p. 445–459, 1994.

ALLEN, P. K. et al. Integration of vision and force sensors for grasping. Proceedings

of the IEEE/SICE/RSJ International Conference on Multisensor, Fusion and Integration for

Intelligent Systems, p. 349–356, 1996.

ANSARI, N.; HUANG, K. Non-parametric dominant point detection. Pattern Recogn,

Elsevier Science Inc., New York, NY, USA, v. 24, n. 9, p. 849–862, 1991.

ARAúJO, A. F. R.; TANAKA, J. S. Variação de um modelo de rede neural competitiva dehopfield para aproximação poligonal. Proceedings of the Brazilian Symposium on Neural

Networks, p. 193–198, 1995.

AROCA, R. V. Análise de Sistemas Operacionais de Tempo Real para Aplicações deRobótica e Automação. Dissertação (Mestrado) — Escola de Engenharia de São Carlos,

Universidade de São Paulo, São Carlos, 2008.

BACKER, B. S.; FORTUNE, S.; GROSSE, E. Stable prehension with three fingers.

Proceedings of the ACM Symposium on Theory of Computing, p. 114–120, 1985.

BALLESTER, G. R. Visual determination, tracking and execution of 2D grasping using abehavior-inspired approach. Tese (Doutorado) — Departament d’Enginyeria I Ciènces dels

Computadors, Universitat Juame I, Castelló, Espanha, 2003.

BARBER, C. B.; DOBKIN, D. P.; HUHDANPAA, H. T. The quickhull algorithm for convexhulls. ACM Transactions on Mathematical Software, v. 22, n. 4, p. 469–483, set 1996.

BENANTE, R. C. et al. A self-organizing state trajectory planner applied to ananthropomorphic robot hand. Proceedings of the IEEE/RSJ International Conference on

Intelligent Robots and Systems, p. 3082–3087, 2007.

BENDIKSEN, A.; HAGER, G. D. A vision-based grasping system for unfamiliar planarobjects. Proceedings of the IEEE International Conference on Robotics and Automation, p.

2844–2849, 1994.

BICCHI, A.; KUMAR, V. Robotic grasping and manipulation. Springer-Verlag, Berlin

Heidelberg, Germany, v. 270, p. 55–74, 2001.

220 Referências Bibliográficas

BLEY, F.; SCHMIRGEL, V.; KRAISS, K.-F. Mobile manipulation based on generic objectknowledge. Proceeding of the IEEE International Symposium on Robot and Human Interactive

Communication, p. 411–416, set 2006.

BOISSONNAT, J.-D. Stable matching between a hand structure and an object silhouette.

IEEE Transactions on Pattern Analysis and machine intelligence, v. 1, n. 6, p. 603–612, nov,

1982.

BORST, C.; FISCHER, M.; HIRZINGER, G. A fast and robust grasp planner for arbitrary3d objects. Proceedings of the IEEE Internetional Conference on Robotics and automation, p.

1890–1896, mai, 1999.

CHEN, I.-M.; BURDICK, J. W. Fiding antipodal point grasps on irregularly shapedobjects. IEEE Transactions on Robotics and Automation, v. 9, n. 4, p. 507–512, 1992.

CHUNG, P.-C. et al. Polygonal approximation using a competitive hopfield neuralnetwork. Pattern Recognition, v. 27, n. 11, p. 1505–1512, 1994.

CIAMPALINI, A. et al. Multiresolution decimation based on global error. The Visual

Computer, v. 13, n. 5, p. 228–246, 1997.

CIGNONI, P.; MONTANI, C.; SCOPIGNO, R. A comparison of mesh simplificationalgorithms. Computers and Graphics, v. 22, n. 1, p. 37–54, 1998a.

CIGNONI, P.; ROCCHINI, C.; SCOPIGNO, R. Metro: Measuring error on simplifiedsurfaces. Computer Graphics Forum, v. 17, n. 2, p. 167–174, 1998b.

COHEN, J. et al. Simplification envelopes. ACM, New York, NY, USA, p. 119–128, 1996.

CORNIC, P. Another look at the dominant point detection of digital curves. Pattern

Recognition Letters, Elsevier Science Inc., New York, NY, USA, v. 18, n. 1, p. 13–25, 1997.

CORNIN, T. M. A boundary concavity code to support dominant point detection. Pattern

Recognition Letters, v. 20, p. 617–634, 1999.

CRAIG, J. J. Introduction to Robotics: Mechanics and Control. Boston, MA, USA:

Addison-Wesley Longman Publishing Co., Inc., 2005.

CUTKOSKY, M. R. Robotic Grasping and Fine Manipulation. Hingham, MA, USA:

Kluwer Academic Publishers, 1985.

DAMIAN, E. L.; SIDOBRE, D.; ALAMI, R. A grasp planner based on inertial properties.

Proceedings of the IEEE International Conference on Robotics and Automation, p. 754–759,

apr, 2005.

DENAVIT, J.; HARTEMBERG, R. S. Kinematic notation for lower-pair mechanisms basedon matrices. Transactions of the ASME, Journal of Applied Mechanics, v. 23, p. 215–221,

1955.

ETTLIN, A.; BUCHLER, P.; BLEULER, H. A simulation environment for robot motionplanning. Proceedings of the IEEE International Workshop on Robot Motion and Control, p.

277–282, jun 2005.


FERNANDES, L. A. F. Estudo de métodos para extração de formas e realização demedidas a partir de imagens. Relatório técnico - Universidade Federal do Rio Grande do Sul,

2005.

FERRARI, C.; CANNY, J. Planning optimal grasps. Proceedings of the EEE International

Conference on Robotics and Automation, v. 3, p. 2290–2295, mai 1992.

FISCHER, M.; HIRZINGER, G. Fast planning of precision grasps for 3d objects.

Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, p.

120–126, 1997.

GARLAND, M.; HECKBERT, P. S. Surface simplification using quadric error metrics.

ACM Press/Addison-Wesley Publishing Co., New York, NY, USA, p. 209–216, 1997.

GOIS, J. P. Reconstrução de superfícies a partir de nuvens de pontos. Dissertação

(Mestrado) — Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo,

São Carlos, 2004.

HAIDACHER, S. Estimating Finger Contact and Object Pose from ContactMeasurements in 3-D Grasping. Tese (Doutorado) — Institut für Robotik und Mechatronik,

2004.

HANAFUSA, H.; ASADA, M. Stable prehension by a robot hand with elastic fingers.

Proceedings of the Symposiun on Industrial Robots, p. 361–368, 1977.

HAUCK, A. et al. Visual determination of 3d grasping points on unknown objects witha binocular camera system. Proceedings of the IEEE/RSJ International Conference on

Intelligent Robots and Systems, v. 1, p. 272–278, 1999.

HIGDON, A. et al. Mecânica. 2. ed. [S.l.]: Prentice-Hall do Brasil, 1984.

HOPFIELD, J. J. Neural network and physical systems with emergent collectivecomputational abilities. Proceedings of the National Academy of Science, n. 79, p.

2554–2558, 1982.

HOPPE, H. Progressive meshes. ACM, New York, NY, USA, p. 99–108, 1996.

HOPPE, H. et al. Mesh optimization. ACM, New York, NY, USA, p. 19–26, 1993.

HUANG, S. C.; SUN, Y. N. Polygonal approximation using genetic algorithms. Pattern

Recognition, v. 32, n. 8, p. 1409–1420, Ago 1999.

IFR. World Robotics 2007, 2007. Disponível em: <http://www.worldrobotics.org>. Acesso

em: 31 mai. 2008.

KAMON, I.; FLASH, T.; EDELMAN, S. Learning to Grasp Using Visual Information.

Jerusalem, Israel, 1994.

KIRKPATRIC, D. G.; MISHRA, B.; YAP, C. K. Quantitative steinitz’s theorems withapplications to multifingered granping. Proceedings of the ACM Symposium on Theory of

Computing, p. 17–29, mai 1990.


KRAGIC, D.; MILLER, A. T.; ALLEN, P. K. Real-time tracking meets online graspplanning. Proceedings of the IEEE International Conference on Robotics and Automation, p.

2460–2465, 2001.

LAKSHMINARAYANA, K. Mechanics of form closure. ASME Techinical Report, p. 1–8,

1978.

LEE, H.-K.; KIM, M.-H.; LEE, S.-R. Determination of 3d grasping points using stereomatching and neural network. Proceedings of SPIE Optomechatronic Systems III, v. 4902,

p. 285–294, 2002.

LEE, H.-K.; LEE, S.-R. 3d optimal determination of grasping points with wholegeometrical modeling for unknown objects. Sensors and Actuators A: Physical, v. 107, p.

146–151, oct 2003.

MARJI, M.; SIY, P. A new algorithm for dominant points detection and polygonization ofdigital curves. Pattern Recognition, v. 36, n. 10, p. 2239–2251, 2003.

MARJI, M.; SIY, P. Polygonal representation of digital planar curves through dominantpoint detection - a nonparametric algorithm. Pattern Recognition, v. 37, n. 11, p.

2113–2130, 2004.

MARKENSKOFF, X.; PAPADIMITRIOU, C. H. Optimum grip of a polygon. The

International Journal of Robotics Research, v. 8, n. 2, p. 17–29, abr 1989.

MARQUES, M. H. D. Algoritmo de auxílio de percepção de objetos para robôs de serviço: uso de hipóteses de contato entre o objeto e mão robótica. Dissertação (Mestrado) —

Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2008.

MASON, M. T. Mechanics of robotic manipulation. Cambridge, MA, USA: MIT Press,

2001.

MASSARO, L. C. Implementação de Técnicas de Controle Robusto Multiváriavel aoPosicionamento de uma Mão Robótica Artificial. São Paulo: EESC-USP, 2006. 103 p.

(Relatório técnico, Processo FAPESP 2006/06453-2).

MILLER, A. T.; ALLEN, P. K. Examples of 3d grasp quality computations. Proceedings of

the IEEE International Conference on Robotics and Automation, p. 1240–1246, 1999.

MILLER, A. T.; ALLEN, P. K. Graspit! a versatile simulator for robotic grasping. IEEE

Robotics & Automation Magazine, v. 11, n. 4, p. 110–122, dez 2004.

MILLER, A. T. et al. Automatic grasp planning using shape primitives. Proceedings of the

IEEE International Conference on Robotics and Automation, p. 1824–1829, 2003.

MORALES, A. et al. Integrated grasp planning and visual object localization for ahumanoid robot with five-fingered hands. International Conference on Intelligent Robots

and Systems, p. 5663–5668, 2006b.

MORALES, A. et al. Heuristic vision-based computation of planar antipodal graspson unknown objects. Proceedings of the IEEE International Conference on Robotics and

Automation, p. 583–588, 2001.


MORALES, A. et al. Vision-based three-finger grasp synthesis constrained by handgeometry. Journal of Robotics and Autonomous Systems, v. 54, n. 6, p. 496–512, 2006.

MURRAY, R. M.; SASTRY, S. S.; ZEXIANG, L. A Mathematical Introduction to RoboticManipulation. Boca Raton, FL, USA: CRC Press, Inc., 1994.

NGUYEN, V.-D. Constructing force-closure grasps. International Journal of Robotics

Research, Sage Publications, Inc., Thousand Oaks, CA, USA, v. 7, n. 3, p. 3–16, 1988. ISSN

0278-3649.

OKABE, A. et al. Spatial Tessellations Concepts and Applications of Voronoi Diagrams.

Second. [S.l.]: John Wiley & Son, 2000.

PEDRO, L. M.; CAURIN, G. A. P. Algoritmo de rápido processamento baseado em redesneurais artificiais para fixação de objetos desconhecidos por garras robóticas. Revista

Minerva, v. 4, n. 2, p. 189–200, jan 2008.

PFEIFFER, F. Grasping with hidraulic fingers - an example of mecatronics. IEEE/ASME

Transaction on mechatronics, v. 1, n. 2, p. 158–167, 1996.

POLIZZELI, V. Métodos implícitos para a reconstrução de superfícies a partir de nuvensde pontos. Dissertação (Mestrado) — Instituto de Ciências Matemáticas e de Computação,


PONCE, J. et al. On characterizing and computing three- and four-finger force-closuregrasps of polyhedral objects. Proceedings og the IEEE International Conference on roboticas

and Automation, v. 2, p. 821–827, 1993.

RAY, B. K.; RAY, K. S. An algorithm for detection of dominant points and polygonalapproximation of digitized curves. Pattern Recognition Letters, Elsevier Science Inc., New

York, NY, USA, v. 12, p. 849–856, 1992a.

RAY, B. K.; RAY, K. S. Detection of significant points and polygonal approximation ofdigitized curves. Pattern Recognition Letters, Elsevier Science Inc., New York, NY, USA,

v. 13, n. 6, p. 443–452, 1992b.

REULEAUX, F. The Kinematics of Machinery: Outlines of a Theory of Machines. New

York, USA: Dover Publications, 1986.

ROSENFELD, A.; WESZKA, J. S. An improved method of angle detection on digitalcurves. IEEE Trans. Computers, v. 24, n. 9, p. 940–941, 1975.

SALISBURY, J. K. Kinematic and force analysis of articulated hands. Tese (Doutorado)

— Stanford University, 1982a.

SANZ, P. et al. Grasping the not-so-obvious: vision-based object handling for industrialapplications. IEEE Robotics and Automation Magazine, v. 12, n. 3, p. 44–52, sep 2005.

SANZ, P. J. et al. Vision-guided grasping of unknown objects for service robots.Proceedings of IEEE International Conference on Robotics and Automation, p. 3018–3025,

1998.


SARKAR, D. A simple algorithm for detection of significant vertices for polygonalapproximation of chain-coded curves. Pattern Recognition Letters, Elsevier Science Inc.,

New York, NY, USA, v. 14, n. 12, p. 959–964, 1993. ISSN 0167-8655.

SAXENA. Fotos de objetos do cotidiano, 2006. Disponível em:

<http://ai.stanford.edu/ asaxena/learninggrasp/data.html>. Acesso em: 23 mai. 2008.

SAXENA, A. et al. Learning to grasp novel objects using vision. Proceedings of the

International Symposium of Experimental Robotics, 2006.

SCHROEDER, W. J.; ZARGE, J. A.; LORENSEN, W. E. Decimation of triangle meshes.

SIGGRAPH Computer Graphics, ACM, New York, NY, USA, v. 26, n. 2, p. 65–70, 1992.

ISSN 0097-8930.

SOUZA, C. E. T. Simplificação de Superfícies Utilizando Redes Neurais Artificiais. São

Paulo: EESC-USP, 2007. 88 p. (Relatório técnico, Processo FAPESP 2006/01016-4).

TAYLOR, M.; BLAKE, A.; COX, A. Visually guided grasping in 3d. Proceedings of the

IEEE International Conference on Robotics and Automation, p. 761–766, may, 1994.

TEH, C. H.; CHIN, R. T. On the detection of dominant points on digital curves. IEEE

Trans. Pattern Anal. Mach. Intell., IEEE Computer Society, Washington, DC, USA, v. 11, n. 8,

p. 859–872, 1989.

VALENTE, C. M. O. Fixação de objetos de formato geométrico desconhecido utilizandoredes neurais artificiais. Dissertação (Mestrado) — Escola de Engenharia de São Carlos,


VISCHER, D. Cooperating robot with visual and tactile skills. Proceedings of the IEEE

International Conference on Robotics and Automation, v. 3, p. 2018–2025, 1992.

WANG, B. et al. Grasping unknown objects based on 3d model reconstruction. Proceedings

of the IEEE/ASME International Conference on Advanced Intelligent Mechatronics, 2005.

WU, W. Y. An adaptive method for detecting dominant points. v. 36, n. 10, p. 2231–2237,

out, 2003.

XU, G.; SCHERRER, H.; SCHWEITZER, G. Application of neural networks on robotgrippers. Proceedings of the IEEE International Joint Conference on Neural Networks, v. 3,

n. 4, jun, 1990.

YAMAZAKI, K. et al. A grasp planning for picking up an unknown object for a mobilemanipulator. Proceedings of the IEEE International Conference on Robotics and Automation,

p. 2143–2148, mai 2006.

225

APÊNDICE A -- Processamento de imagens

A.1 Justificativa e descrição do método

Para que um sistema robótico seja capaz de fixar um objeto desconhecido, é necessário

que as principais características do objeto sejam adquiridas de alguma maneira pelo sistema.

Conforme discutido no texto desta Dissertação, a melhor forma de se fixar um objeto é determi-

nada a partir da geometria tridimensional, dentre outras características geométricas do objeto.

Entretanto, os sistemas de visão tridimensionais ainda apresentam alto custo de instalação e

não permitem processamento da informação em velocidade adequadas para as aplicações de

fixação.

Por outro lado, a extração da forma do objeto a partir de imagens adquiridas por câmeras

apresenta-se como uma solução satisfatória quanto ao custo de instalação e manutenção, quanto

à velocidade de processamento, e quanto à capacidade de se trabalhar com uma grande var-

iedade de objetos.

A extração da forma do objeto, e de outras características geométricas, a partir de uma

imagem adquirida por uma câmera, é realizada pela utilização de técnicas de processamento

de imagens sobre uma matriz bidimensional de pixels, que representa a cena, capturada pela

câmera, na qual está localizado o objeto.

Diferentes técnicas e algoritmos podem ser utilizados a fim de se extrair estas caracterís-

ticas específicas. Muitos pesquisadores dedicam-se à pesquisa destes algoritmos, e diversos e

diferentes algoritmos podem ser utilizados com a finalidade de se extrair a forma do objeto,

para a determinação de uma fixação ou para a manipulação dos mesmos.

Dentre as diferentes técnicas de processamento de imagens desenvolvidas e propostas pelos

autores, desta área específica da ciência ou não, interessa-se por aquelas capazes de extrair o

contorno de um objeto presente em uma cena. O método de procesamento da imagem adotado

neste trabalho baseia-se nos resultados obtidos por Valente (1999) e Sanz et al. (2005).

O método consiste em duas etapas distintas: a primeira etapa é a localização do objeto na

226 A

imagem e sua segmentação, ou seja, separação da região do objeto do restante da imagem, e a

segunda etapa é a extração da forma do objeto representada pelo contorno da região segmentada

na etapa anterior.

A primeira etapa do processamento da imagem consiste na segmentação da imagem em

duas regiões, uma região representa o fundo da imagem e outra região representa o objeto.

Uma das maneiras de se segmentar imagens é dada segundo o algoritmo de Otsu. Este algo-

ritmo divide a imagem em duas regiões, a partir de uma análise estatística do histograma da

imagem da cena em tons de cinza. O algoritmo calcula um limiar que define a divisão da ima-

gem da seguinte maneira: os pixels que apresentarem tom de cinza abaixo do limiar calculado

pertencem ao objeto e recebem o valor binário 0, os demais pertencem ao fundo da imagem e

recebem o valor binário 1. Desta maneira, o algoritmo de Otsu por vezes é chamado de binariza-

ção de Otsu. O algoritmo apresenta bons resultados para imagens que apresentam histograma

com regiões distintas entre o objeto e o fundo da imagem. A Figura A.1 mostra o histograma

de duas imagens de objetos.

Figura A.1: Histograma de imagens.

A.2 Resultados obtidos 227

Após a etapa de segmentação, ou binarização, da imagem, a borda do objeto, que representa

sua forma, deve ser extraída. Valente (1999) estuda diversos métodos de detecção de borda, e

aponta como o mais adequado para a aplicação o método do vizinho mais próximo. Os resul-

tados apresentados por Valente (1999), mostram que outros métodos são capazes de extrair a

borda do objeto, contudo, muitos apresentam resultados com ruídos e não extraem uma borda

fechada do objeto. Pela necesidade de se extrair somente uma borda fechada da área segmen-

tada, sem ruídos e com espessura de um único pixel, o método apontado, como o único que

atendeu os requisitos, foi o método do vizinho mais próximo.

Desta maneira, de uma forma resumida, a processamento da imagem consiste em uma etapa

de segmentação do objeto, e outra de extração do contorno do objeto.

A.2 Resultados obtidos

O método adotado neste trabalho, composto pelo algoritmo de binarização por Otsu e pela

extração do contorno do objeto pelo método do vizinho mais próximo, foi implementado no

ambiente de desenvolvimento Matlab e testes foram realizados com as imagens utilizadas nas

simulações dos algoritmos de fixação 2D do Capítulo 5. As Figuras A.2, A.3 e A.4 mostram a

imagem original, a imagem segmentada e a borda extraída.

(a)

(b)

Figura A.2: Resultado do processamento da imagem. Da esquerda para a direita: imagem

original, imagem binarizada e o contorno extraído (parte 1 de 3).

228 A

(a)

(b)

(c)

(d)

(e)



A.2 Resultados obtidos 229

(a)

(b)

(c)

(d)

(e)



230 A

Os tempos de processamento das imagens foram medidos e estão sumarizados na Tabela

A.1.

Tabela A.1: Tabela dos tempos da etapa de processamento das imagems utilizadas nas simula-

ções do algoritmo de fixação 2D proposto no Capítulo 5.

Tempo de processamento [s]Figura A.2(a) 0,074725

Figura A.2(b) 0,092710

Figura A.3(a) 0,091121

Figura A.3(b) 0,119825

Figura A.3(c) 0,104295

Figura A.3(d) 0,110208

Figura A.3(e) 0,102121

Figura A.4(a) 0,080964

Figura A.4(b) 0,106727

Figura A.4(c) 0,078304

Figura A.4(d) 0,101178

Figura A.4(e) 0,144116

A.3 Considerações sobre o método de processamento de ima-gens adotado

Foram satisfatórios os resultados obtidos com o método de processamento de imagens ado-

tado. Quanto ao tempo de processamento, as medições nas simulações com imagens reais

mostram que os tempos são adequados para aplicações em robótica. Quanto à qualidade das

respostas, verificou-se que para as imagens com contraste entre o fundo o objeto, o algoritmo

foi eficiente, ou seja, a segmentação e a extração da borda do objeto foram bem sucedidas.

Apesar dos resultdos satisfatórios obtidos, algumas ressalvas devem ser consideradas. O

principal ponto negativo do método refere-se a etapa de segmentação da imagem. O algoritmo

é ineficiente nos casos em que não existe no histograma da imagem uma divisão bem definida

entre o fundo da imagem e o objeto, ou seja, o tom do objeto, ou sua textura, é semelhante

ao fundo da imagem. Como solução pode-se adotar outros algoritmos de segmentação, utilizar

métodos de pré-processamento a fim de ajustar o brilho e o contraste da imagem.

Ainda quanto à etapa de segmentação da imagem, existem ambientes onde não há controle

de iluminação, principalmente nos ambientes fabrís, podendo haver sombras indesejadas e até

iluminação insuficiente. Nestes casos a segmentação pode também ocorrer de forma indesejada,

e a utilização de fontes de luz auxiliares, como lanternas e luz polarizada, podem promover

melhores resultados.

231

APÊNDICE B -- Tabelas do Capítulo 4

As Tabelas B.1 e B.2 mostram os resultados obtidos pelos autores Rosenfeld e Weszka

(1975), Teh e Chin (1989), Ansari e Huang (1991), Chung et al. (1994), Ray e Ray (1992a),

Ray e Ray (1992b), Cornic (1997), Wu (2003), Marji e Siy (2003), Marji e Siy (2004), Sarkar

(1993) e Huang e Sun (1999), na aproximação poligonal das formas Leaf Shape, Chromossome

Shape e Semi-circle Shape da Figura 4.6.

Tabela B.1: Tabela de resultados de algoritmos de aproximação poligonal (parte 1 de 2).

Curva Método m TC EQ EM EQp EMp

Leaf Rosenfeld e Weszka (1975) 18 6,667 30,570 1,530 4,586 0,230

n=120 pontos Teh e Chin (1989)(k-cosine) 29 4,138 14,960 0,990 3,615 0,239

Teh e Chin (1989)(k-curvature) 28 4,286 15,430 0,990 3,600 0,231

Ansari e Huang (1991) 30 4,000 25,570 2,130 6,393 0,533

Chung et al. (1994) 28 4,286 12,310 0,960 2,872 0,224

Ray e Ray (1992a) 32 3,750 14,718 0,996 3,925 0,266

Ray e Ray (1992b) 32 3,750 14,180 0,990 3,781 0,264

Cornic (1997) - - - - - -

Wu (2003) 23 5,217 20,340 1,000 3,899 0,192

Marji e Siy (2003) 22 5,455 13,210 0,780 2,422 0,143

Marji e Siy (2003)(suppressed) 21 5,714 14,150 0,780 2,476 0,137

Sarkar (1993) 23 5,217 13,170 0,780 2,524 0,150

Cornin (1999) 28 4,286 7,300 0,740 1,703 0,173

Huang e Sun (1999) 24 5,000 14,030 0,340 2,806 0,068

Araújo e Tanaka (1995) 28 4,286 10,940 1,000 2,553 0,233

232 Apêndice B -- Tabelas do Capítulo 4

Tabela B.2: Tabela de resultados de algoritmos de aproximação poligonal (parte 2 de 2).

Curva Método m TC EQ EM EQp EMp

Chromosome Rosenfeld e Weszka (1975) 14 4,286 59,120 1,560 13,795 0,364



Ansari e Huang (1991) 28 2,143 17,830 1,260 8,321 0,588

Chung et al. (1994) 22 2,727 12,360 1,060 4,532 0,389

Ray e Ray (1992a) 18 3,333 5,566 0,707 1,670 0,212

Ray e Ray (1992b) 18 3,333 4,810 0,650 1,443 0,195

Cornic (1997) 17 3,529 5,540 0,860 1,570 0,244

Wu (2003) 17 3,529 5,010 0,640 1,420 0,181

Marji e Siy (2003) 12 5,000 8,080 0,895 1,616 0,179


Sarkar (1993) 19 3,158 3,857 0,550 1,221 0,174

Cornin (1999) 17 3,529 3,180 0,630 0,901 0,179

Huang e Sun (1999) 15 4,000 4,520 0,350 1,130 0,088

Araújo e Tanaka (1995) 22 2,727 2,720 0,510 0,997 0,187

Semicircle Rosenfeld e Weszka (1975) 12 8,500 22,610 1,580 2,660 0,186



Ansari e Huang (1991) 16 6,375 20,250 2,000 3,176 0,314

Chung et al. (1994) 16 6,375 7,710 1,150 1,209 0,180

Ray e Ray (1992a) 29 3,517 11,820 0,833 3,361 0,237

Ray e Ray (1992b) 27 3,778 11,500 0,880 3,044 0,233

Cornic (1997) 30 3,400 9,190 0,880 2,703 0,259

Wu (2003) 27 3,778 9,010 0,830 2,385 0,220

Marji e Siy (2003) 26 3,923 9,010 0,740 2,297 0,189


Sarkar (1993) 19 5,368 17,370 1,450 3,236 0,270

Cornin (1999) 30 3,400 2,910 0,490 0,856 0,144

Huang e Sun (1999) 18 5,667 12,520 0,740 2,209 0,131

Araújo e Tanaka (1995) 19 5,368 17,950 1,360 3,344 0,253

Apêndice B -- Tabelas do Capítulo 4 233

As aproximações realizadas pelos autores das Tabelas B.1 e B.2 acima foram realizadas

com o algoritmo proposto de aproximação poligonal do Capítulo 4, os resultados obtidos estão

na Tabela B.3 a seguir.

Tabela B.3: Tabela de resultados do algoritmo proposto para a aproximação poligonal.

Curva m TC EQ EM EQp EMp

Leaf shape 18 6,666 33,580 2,680 5,037 0,402

120 pontos 21 5,714 25,950 2,360 4,541 0,413

22 5,454 24,590 2,360 4,508 0,432

23 5,217 11,080 0,970 2,123 0,185

24 5,000 11,190 0,970 2,238 0,194

28 4,285 8,790 1,000 2,051 0,233

29 4,137 7,660 1,000 1,851 0,241

30 4,000 6,820 1,000 1,705 0,250

32 3,750 6,800 1,000 1,813 0,266

Chromosome shape 11 5,454 11,570 1,480 2,121 0,271

60 pontos 12 5,000 8,020 0,930 1,604 0,186

14 4,285 5,690 0,810 1,327 0,189

15 4,000 5,320 0,813 1,330 0,203

17 3,529 4,970 0,930 1,408 0,263

18 3,333 3,960 0,930 1,188 0,279

19 3,157 3,600 0,930 1,140 0,294

22 2,727 2,390 0,510 0,876 0,187

28 2,142 1,980 0,550 0,924 0,256

Semi-circle shape 12 8,500 31,510 1,360 3,707 0,160

102 pontos 15 6,800 27,580 1,360 4,055 0,200

16 6,375 25,220 1,360 3,956 0,213

18 5,666 16,190 1,360 2,960 0,240

19 5,368 16,190 1,360 3,020 0,250

26 3,923 8,110 1,000 2,067 0,254

27 3,777 7,270 1,000 1,924 0,264

29 3,517 6,870 1,000 1,953 0,284

30 3,400 6,870 1,000 2,020 0,294

234 Apêndice B -- Tabelas do Capítulo 4

235

APÊNDICE C -- Tabelas do Capítulo 6

No Capítulo 6 duas simulações são realizadas para avaliar o comportamento da rede na

simplificação dos modelos Bunny e Fandisk.

No primeiro experimento verifica-se o desempenho da rede em função do limiar de mínima

energia Umin utilizado na etapa iterativa da rede. Diferentes porcentagens de simplificação são

realizadas para ambos os modelos, para cada porcentagem de simplificação, o valor de Umin é

variado de 0 a 2.5.

Para cada simplificação, foram medidos o erro máximo Emax e o erro médio quadrático,

assim como o tempo de processamento. Os valores obtidos encontram-se nas Tabelas a seguir.

236 Apêndice C -- Tabelas do Capítulo 6T

abel

aC

.1:

Val

ore

sd

os

erro

sd

esi

lpli

fica

ção

Em

axe

Em

ede

do

tem

po

de

pro

cess

amen

top

ara

dif

eren

tes

po

rcen

tag

ens

de

sim

pli

fica

ção

eli

mia

rd

e

ener

gia

Um

inp

ara

om

od

elo

Bun

ny. A

pro

xim

ação

de

50

%A

pro

xim

ação

de

25

%A

pro

xim

ação

de

10

%

Um

inE

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)

00

,16

72

0,0

01

23

47

,13

30

,38

76

0,0

03

94

83

,83

60

,42

19

0,0

10

15

65

,72

30

0,2

0,5

40

40

,00

39

77

,45

13

0,3

76

70

,00

95

12

8,8

55

0,3

82

20

,01

68

17

3,5

10

4

0,4

0,5

40

40

,00

45

67

,49

74

0,3

75

70

,01

15

10

8,7

56

0,3

87

50

,02

30

14

8,9

83

3

0,6

0,3

81

20

,00

46

64

,09

83

0,7

71

90

,01

36

10

0,0

62

0,7

63

80

,02

82

13

4,3

02

2

0,8

0,3

81

20

,00

47

60

,26

55

0,7

71

90

,01

43

94

,09

24

0,3

90

30

,02

90

12

5,1

76

5

10

,38

12

0,0

04

75

8,2

90

90

,38

76

0,0

13

79

0,8

52

50

,82

45

0,0

32

61

19

,81

43

1,2

0,3

81

20

,00

47

58

,29

09

0,3

87

60

,01

37

90

,85

25

0,8

24

50

,03

26

11

9,8

14

3

1,4

0,3

81

20

,00

47

56

,59

45

0,3

87

60

,01

47

87

,79

36

0,6

70

80

,03

58

11

4,6

06

9

1,6

0,3

81

20

,00

47

56

,36

89

0,3

87

60

,01

50

87

,17

79

0,3

84

10

,03

70

11

2,8

85

1

1,8

0,3

81

20

,00

47

56

,32

55

0,3

87

60

,01

53

86

,82

28

0,3

81

00

,03

78

11

1,7

60

3

20

,38

12

0,0

04

75

6,3

62

00

,38

76

0,0

15

48

6,6

01

40

,38

90

0,0

38

71

10

,45

62

2,2

0,3

81

20

,00

48

56

,22

78

0,3

87

60

,01

55

86

,25

16

0,7

30

50

,04

06

10

9,8

47

5

2,4

0,3

81

20

,00

48

56

,28

64

0,3

76

70

,01

56

86

,17

27

0,4

20

90

,03

97

10

9,1

24

8


Tab

ela

de

dad

os

de

sim

pli

fica

ção

par

ao

mo

del

oB

unny

.

Tab

ela

C.2

:C

on

tin

uaç

ãod

aT

abel

aC

.1.

Ap

rox

imaç

ãod

e5

%A

pro

xim

ação

de

1%

Ap

rox

imaç

ãod

e0

.5%

Um

inE

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)

00

,74

22

0,0

20

95

91

,56

94

1,1

46

10

,08

08

61

3,4

74

81

,81

85

0,1

64

36

16

,44

67

0,2

0,6

23

20

,02

47

19

3,8

97

01

,70

85

0,1

04

52

15

,76

42

1,8

77

60

,16

78

21

8,5

70

3

0,4

0,3

84

40

,03

19

16

7,4

33

62

,65

41

0,1

07

71

87

,90

55

2,1

43

70

,17

82

19

0,7

20

9

0,6

0,7

72

30

,03

85

15

1,8

72

31

,97

88

0,1

12

41

71

,29

91

1,9

53

70

,19

37

17

4,4

18

9

0,8

0,7

26

50

,04

19

14

1,7

76

41

,14

02

0,1

19

41

60

,51

78

2,0

41

00

,18

84

16

3,4

58

7

10

,65

00

0,0

48

51

35

,02

00

1,3

54

90

,10

86

15

3,4

92

61

,47

65

0,1

72

01

56

,40

62

1,2

0,6

50

00

,04

85

13

5,0

20

01

,35

49

0,1

08

61

53

,49

26

1,4

76

50

,17

20

15

6,4

06

2

1,4

0,7

00

20

,05

41

12

8,4

32

42

,55

70

0,1

27

91

45

,90

08

1,0

32

70

,16

06

14

8,9

37

9

1,6

0,8

82

90

,05

50

12

6,5

21

60

,62

55

0,1

18

41

42

,61

41

1,5

82

70

,17

69

14

6,1

57

9

1,8

0,6

32

40

,05

53

12

4,5

94

80

,96

56

0,1

23

71

40

,98

97

1,0

58

50

,16

83

14

4,1

55

1

20

,47

26

0,0

59

01

22

,71

52

1,8

02

80

,13

03

13

8,4

12

41

,00

40

0,1

85

01

41

,91

64

2,2

0,6

70

30

,06

11

12

1,7

78

90

,95

47

0,1

27

31

37

,55

33

1,0

77

80

,19

00

14

0,9

41

7

2,4

0,6

84

80

,06

17

12

0,9

53

32

,48

19

0,1

22

41

37

,17

50

1,8

50

60

,17

49

13

8,5

06

8

238 Apêndice C -- Tabelas do Capítulo 6T

abel

ad

ed

ado

sd

esi

mp

lifi

caçã

op

ara

om

od

elo

Fand

isk.

Tab

ela

C.3

:V

alo

res

do

ser

ros

de

silp

lifi

caçã

oE

max

eE

med

ed

ote

mp

od

ep

roce

ssam

ento

par

ad

ifer

ente

sp

orc

enta

gen

sd

esi

mp

lifi

caçã

oe

lim

iar

de

ener

gia

Um

inp

ara

om

od

elo

Fand

isk. Ap

rox

imaç

ãod

e5

0%

Ap

rox

imaç

ãod

e2

5%

Ap

rox

imaç

ãod

e1

0%

Um

inE

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)

00

,32

44

0,0

01

42

5,6

09

10

,20

01

0,0

03

33

8,0

61

20

,24

90

0,0

13

74

6,0

75

9

0,2

0,3

20

70

,00

15

19

,75

36

0,2

89

50

,00

45

35

,94

95

0,3

24

60

,01

44

43

,81

41

0,4

0,5

72

00

,00

34

15

,48

86

0,1

99

10

,00

41

24

,28

01

0,2

41

30

,01

48

32

,25

75

0,6

0,2

75

10

,00

41

14

,37

57

0,2

94

70

,00

66

22

,62

97

0,2

82

80

,01

65

29

,23

46

0,8

0,2

94

10

,00

43

14

,52

31

0,1

72

00

,00

68

22

,43

15

0,1

74

70

,01

55

29

,70

90

10

,58

19

0,0

05

91

4,4

00

20

,25

35

0,0

08

02

2,4

10

40

,21

91

0,0

16

72

8,9

22

7

1,2

0,1

45

40

,00

48

14

,00

44

0,1

40

30

,00

79

21

,40

99

0,1

98

50

,01

56

28

,12

43

1,4

0,4

48

80

,00

59

14

,06

60

0,2

09

40

,00

91

21

,22

50

0,2

19

10

,01

42

28

,71

85

1,6

0,4

38

60

,00

64

14

,03

07

0,4

38

60

,01

03

21

,75

41

0,3

23

60

,01

51

28

,28

23

1,8

0,3

34

30

,00

67

13

,72

04

0,1

98

40

,00

78

21

,53

72

0,2

42

30

,01

50

28

,35

40

20

,26

24

0,0

06

91

3,4

53

00

,17

92

0,0

10

12

1,1

58

80

,30

58

0,0

16

52

7,3

02

1

2,2

0,3

18

00

,00

66

13

,68

26

0,3

09

90

,00

98

21

,40

38

0,2

32

70

,01

46

27

,90

37

2,4

0,3

10

90

,00

74

13

,24

43

0,2

98

80

,01

11

21

,03

47

0,3

95

80

,01

67

26

,76

54

2,6

0,3

31

00

,00

74

13

,35

50

0,2

79

60

,01

19

21

,28

56

0,2

18

80

,01

67

26

,44

23


Tab

ela

de

dad

os

de

sim

pli

fica

ção

par

ao

mo

del

oFa

ndis

k.

Tab

ela

C.4

:C

on

tin

uaç

ãod

aT

abel

aC

.3.

Ap

rox

imaç

ãod

e5

%A

pro

xim

ação

de

1%

Um

inE

max

Em

edte

mp

o(s

)E

max

Em

edte

mp

o(s

)

00

,26

13

0,0

32

24

8,9

57

50

,49

40

0,0

93

15

1,2

13

0

0,2

0,2

85

80

,02

98

46

,89

66

0,5

21

40

,10

74

49

,00

50

0,4

0,3

22

10

,03

28

35

,04

76

0,5

36

40

,09

84

37

,31

04

0,6

0,2

93

10

,03

32

32

,12

59

0,5

26

20

,09

62

35

,44

79

0,8

0,2

97

40

,03

13

31

,77

93

0,5

08

60

,09

37

34

,17

10

10

,28

82

0,0

31

43

1,8

89

90

,54

97

0,0

94

23

5,1

33

0

1,2

0,2

45

50

,03

19

30

,95

57

0,5

58

90

,09

53

33

,29

99

1,4

0,3

09

30

,03

49

30

,39

07

0,5

57

60

,08

51

34

,47

21

1,6

0,3

57

00

,02

80

31

,36

72

0,4

85

80

,08

88

33

,84

76

1,8

0,2

94

60

,03

04

31

,66

31

0,5

10

30

,09

40

34

,25

75

20

,34

99

0,0

29

73

0,8

25

60

,55

03

0,0

86

03

3,6

05

1

2,2

0,2

61

90

,02

94

31

,30

37

0,4

21

00

,08

11

33

,83

95

2,4

0,3

11

20

,02

91

30

,50

95

0,5

18

70

,09

95

33

,20

71

2,6

0,2

84

60

,03

09

30

,17

10

0,5

47

10

,09

61

33

,15

13

240 Apêndice C -- Tabelas do Capítulo 6

Tabela C.5: Resultados obtidos na simplificação do Modelo Bunny (34834 vertices, 69451

triângulos) para o método proposto, e para os outros métodos (parte 1 de 2).

Hopfield Mesh Simplification (Proposto)

Nvert Ntriang Emax Emed

17417(50%) 34726 0,167200 0,001200

8709(25%) 17360 0,387600 0,003900

3483(10%) 6947 0,421900 0,010100

1742(5%) 3480 0,742200 0,020900

(2%) - - -

348(1%) 690 1,141600 0,080800

Mesh Decimation (SCHROEDER et al., 1992)


17566(50%) 34965 0,161400 0,007350

8705(25%) 17267 0,258600 0,019470

3505(10%) 6900 0,521200 0,057910

1775(5%) 3451 1,200000 0,162000

701(2%) 1389 2,072100 0,342300

344(1%) 678 3,311700 0,646300

Simplification envelopes (COHEN et al., 1996)


17418(50%) 34643 0,020890 0,004140

8709(25%) 17252 0,041540 0,011740

3472(10%) 6801 0,088130 0,031170

1763(5%) 3395 0,162900 0,060660

678(2%) 1301 0,380200 0,142300

355(1%) 672 0,759900 0,283800

Multiresolution decimation (CIAMPALINI et al., 1997)


17417(50%) 34679 0,022400 0,003600

8708(25%) 17289 0,043800 0,009700

3483(10%) 6874 0,094800 0,024200

1741(5%) 3408 0,169700 0,045900

696(2%) 1358 0,351900 0,099700

348(1%) 674 0,614100 0,181000

Mesh optimization (HOPPE et al., 1993)


17410(50%) 34643 0,296800 0,009960

8699(25%) 17279 0,036680 0,010640

3501(10%) 6956 0,296400 0,015540

1758(5%) 3491 0,366600 0,024150

686(2%) 1347 0,426200 0,048460

349(1%) 676 0,840700 0,082650


Tabela C.6: Resultados obtidos na simplificação do Modelo Bunny (34834 vertices, 69451


Progressive meshes (HOPPE, 1996)


17417(50%) 34667 0,133900 0,007810

8708(25%) 17252 0,158500 0,011000

3483(10%) 6821 0,206500 0,018510

1741(5%) 3367 0,281700 0,032730

696(2%) 1359 0,529000 0,068970

348(1%) 673 0,812200 0,124600

Quadric error metrics (GARLAND; HECKBERT, 1997)


17417(50%) 34666 1,024000 0,004860

8708(25%) 17293 1,676900 0,011350

3483(10%) 6888 1,707000 0,023630

1741(5%) 3434 2,425600 0,042790

696(2%) 1360 4,270000 0,103100

171(1%) 675 4,661400 0,167200


Tabela C.7: Resultados obtidos na simplificação do Modelo Fandisk (6475 vertices, 12946


Hopfield Mesh Simplification (Proposto)


3238(50%) 6470 0,324400 0,001400

1619(25%) 3230 0,200100 0,003300

648(10%) 1297 0,249000 0,013700

324(5%) 650 0,261300 0,032200

(2%) - - -

65(1%) 132 0,494000 0,093100

Mesh Decimation (SCHROEDER et al., 1992)


3224(50%) 6444 0,004120 4,50.10−5

1616(25%) 3228 0,074520 0,003980

639(10%) 1274 0,247100 0,015390

325(5%) 646 1,170800 0,058000

131(2%) 258 2,156600 0,152300

66(1%) 128 3,512800 0,352700

Simplification envelopes (COHEN et al., 1996)


3216(50%) 6428 0,003170 0,000158

1633(25%) 3262 0,022270 0,002505

654(10%) 1304 0,059580 0,009646

317(5%) 630 0,146800 0,024520

129(2%) 244 0,972600 0,182700

77(1%) 150 8,737000 0,940600

Multiresolution decimation (CIAMPALINI et al., 1997)


3149(50%) 6294 0,002480 4,84.10−5

1615(25%) 3226 0,004270 0,000210

645(10%) 1286 0,026570 0,002800

323(5%) 642 0,067780 0,009440

129(2%) 254 0,343700 0,047670

64(1%) 124 1,259800 0,180600

Mesh optimization (HOPPE et al., 1993)


3287(50%) 6570 0,529700 0,002776

1611(25%) 3218 0,502100 0,002901

655(10%) 1306 0,245200 0,003614

333(5%) 662 0,291000 0,005877

123(2%) 220 0,375900 0,021800

62(1%) 120 0,873400 0,066800


Tabela C.8: Resultados obtidos na simplificação do Modelo Fandisk (6475 vertices, 12946


Progressive meshes (HOPPE, 1996)


3237(50%) 6470 0,136600 0,003451

1618(25%) 3232 0,167400 0,004139

647(10%) 1290 0,237700 0,006077

323(5%) 642 0,247000 0,011860

123(2%) 254 1,277700 0,065760

64(1%) 124 3,261000 0,225900

Quadric error metrics (GARLAND; HECKBERT, 1997)


3237(50%) 6470 0,000670 8,62.10−5

1618(25%) 3232 0,004420 0,000210

647(10%) 1290 0,037460 0,001830

323(5%) 642 0,092530 0,005810

129(2%) 254 0,332100 0,025520

64(1%) 124 1,237300 0,098790

245

APÊNDICE D -- Cálculo dos momentos principaisde inércia

Dada uma forma, por exemplo uma figura binária, contendo uma forma geométrica qual-

quer, os momentos principais de inércia da forma geométrica são definidos como:

Ixx =N

∑x=1

M

∑y=1

m · x2 (D.1)

Iyy =N

∑x=1

M

∑y=1

m · y2 (D.2)

Ixy = Iyx =N

∑x=1

M

∑y=1

m · x · y (D.3)

em que M é a largura da imagem em pixels, e N é a sua altura, também em pixels.

Onde x e y são as coordenadas de cada pixel e m é a massa do pixel analizado, se o pixel

pertencer ao fundo da imagem, é considerado que a sua massa é igual a zero (m = 0), se o pixel

pertencer ao obejto sua massa é unitária (m = 1).

Figura D.1: Definição da massa do pixel pertencente a figura, e do pixel pertencente ao fundo

da imagem, necessária para o cálculo dos momentos de inércia Ixx Iyy e Ixy.

246 Apêndice D -- Cálculo dos momentos principais de inércia

A partir dos momentos de inércia Ixx, Iyy e Ixy os momentos principais de inércia podem ser

calculados.

Para o caso estudado, deseja-se obter a direção do segundo momento principal de inércia

I2. Dada uma forma expressa em uma figura binária, a direção do momento principal de inércia,

α , é dado pela equação D.4.

tg(2 ·α) =2 · Ixy

Ixx · Iyy(D.4)

247

APÊNDICE E -- Cálculo do centro de um fixaçãorealizada por três pontos decontato

Dados três pontos quaisquer PA, PB e PC de fixação de uma garra de três dedos, deseja-se

determinar o ponto Cf cujas retas Cf PA, Cf PB e Cf PC formam entre si 120o conforme ilustra a

Figura E.1.

Figura E.1: Pontos de contato PA, PB e PC de fixação de uma garra de três dedos e o centro de

fixção Cf .

248 E

E.1 Definição do problema

E.1.1 Arco capaz de 120o

Dados dois pontos quaisquer PA, PB define-se como arco capaz de 120o a região geométrica

do ponto C f ′ que forma com o segmento de reta PAPB um triângulo com ângulo de 120o no

vértice C′f , conforme mostra a Figura E.2.

Figura E.2: Arco capaz de 120o.

Para se determinar o arco capaz deve-se traçar a mediana do segmento de reta PAPB na qual

esté localizado o centro do arco capaz, o ponto O, que é eqüidistante dos pontos PA e PB em

uma distância r, que é definida pela equação a seguir.

r =|PAPB|

2

cos(30o)(E.1)

E.1.2 Cálculo do Cf

Para o cálculo do centro de fixação para três pontos de contato, deve-se traçar o arco capaz

de 120o para os segmentos de reta PAPB e PBPC.

No cálculo do arco capaz de cada segmento, existem duas regiões geométricas distintas,

cada solução apresenta um centro do arco capaz, O e O′. Para a resolução do problema estudado

E.1 Definição do problema 249

selecionado o arco capaz cujo centro é mais distante ao centro geométrico do conjunto de pontos

PA, PB e PC. O mesmo procedimento é realizado para o segmento PBPC.

Os arcos capazes de 120o dos segmentos de reta PAPB e PBPC cruzam-se em dois pontos, um

deles é o próprio ponto PB o outro é o centro de fixação, o ponto Cf , conforme ilustra a Figura

E.3.

Figura E.3: Cálculo do ponbto Cf .

E.1.3 Solução analítica

As equações das circunferências que representam os arcos capazes dos segmentos PAPB e

PBPC são definidos por E.2 e E.4.

r21 = (x− x1)2 +(y− y1)2 (E.2)

r22 = (x− x2)2 +(y− y2)2 (E.3)

Onde x1 e y1 são as coordenadas do ponto O1, centro do primeiro arco capaz, e x2 e y2 são as

coordenadas do ponto O2, centro do segundo arco capaz. O sistema 2x2 é não linear e pode ser

resolvido pelo método numérico apropriado.

250 E

E.1.4 Solução geométrica

Uma solução mais simples é a resolução geométrica do sistema. A partir do triângulo

formado pelos centros dos arcos capazes O1 e O2, e do centro de fixação Cf , ilustrado na Figura

E.4, pode-se obter a relação da equação E.4 atravéz da lei dos cossenos.

Figura E.4: Solução geométrica para o cálculo do centro de fixação.

r22 = r2

1 + r2O1O2

−2 · r1 ·dO1O2· cos(γ) (E.4)

Isolando γ obtem-se:

γ = acos

(d2

2 +d2O1O2

−d22

2 ·d1 ·dO1O2

)(E.5)

Onde dO1O2é a distância entre os pontos O1 e O2.

Calcula-se então a inclinação do semento de reta O1)2 pela equação E.6.

α = arc tag(

y2 − y1

x2 − x1

)(E.6)

O ponto CF é então determinado pela equação do vetor−−−→O1Cf .

E.1 Definição do problema 251

−−−→O1Cf = Cf −O1 =

[r1 · cos(α + γ)

r1 · sen(α + γ)

](E.7)

Cf =

[r1 · cos(α + γ)

r1 · sen(α + γ)

]+

[x1

y1

], onde O1 =

[x1

y1

](E.8)

Como a equação E.8 permite duas soluções, α1 = α e α1 = α +180o, o ponto Cf deve ser

calculado para os dois casos, sendo então selecionado o Cf cálculado mais próximo ao centróide

dos ponto PA, PB e PC.

253

APÊNDICE F -- Figuras das respostas dassimulações do algoritmo deauto-aprendizagem do Capítulo 8

No Capítulo 8, foram realizadas duas diferentes simulações para avaliação do comporta-

mento do algoritmo de auto aprendizagem proposto.

No segundo tipo de simulação apresentado, os objetos foram apresentados à rede em uma

ordem aleatória, e de acordo com as respostas obtidas, algumas conclusões puderam ser reali-

zadas. Contudo, como a ordem de apresentação dos objetos é aleatória, é necessário repetir a

mesma simulção diversas vezes a fim de verificar se o comportamento observado repete-se.

Com este objetivo, o segundo tipo de simulação apresentado foi repetido quatro vezes, e as

próximas Figuras apresentam as respostas obtidas. Pode-se observar que o mesmo comporta-

mento foi apresentado em cada uma das simulações.

254 F

F.1 Gráficos da segunda simulação

Figura F.1: Objetos apresentados à rede entre retreinamentos. Os valores mostrados represen-

tam a média entre cada 250 retreinamentos. Resultados para a segunda simulação de apresen-


F.1 Gráficos da segunda simulação 255

Figura F.2: Tempo de execução da rede. Média entre cada 250 retreinamentos. Resultados para

a segunda simulação de apresentação de objetos à rede, em ordem randômica.

Figura F.3: Tempo de retreinamento da rede. Média entre cada 250 retreinamentos. Resultados

para a segunda simulação de apresentação de objetos à rede, em ordem randômica.

256 F

F.2 Gráficos da terceira simulação


tam a média entre cada 250 retreinamentos. Resultados para a terceira simulação de apresen-


F.2 Gráficos da terceira simulação 257


a terceira simulação de apresentação de objetos à rede, em ordem randômica.


para a terceira simulação de apresentação de objetos à rede, em ordem randômica.

258 F

F.3 Gráficos da quarta simulação


tam a média entre cada 250 retreinamentos. Resultados para a quarta simulação de apresentação

de objetos à rede, em ordem randômica.

F.3 Gráficos da quarta simulação 259


a quarta simulação de apresentação de objetos à rede, em ordem randômica.


para a quarta simulação de apresentação de objetos à rede, em ordem randômica.

260 F

F.4 Gráficos da quinta simulação


tam a média entre cada 250 retreinamentos. Resultados para a quinta simulação de apresentação

de objetos à rede, em ordem randômica.

F.4 Gráficos da quinta simulação 261

Figura F.11: Tempo de execução da rede. Média entre cada 250 retreinamentos. Resultados

para a quinta simulação de apresentação de objetos à rede, em ordem randômica.


para a quinta simulação de apresentação de objetos à rede, em ordem randômica.

263

ANEXO A -- Adição de Minkowski

A adição de Minkowisk é uma operação de conjunto. Dados dois conjuntos A e B, tal que

cada conjunto é formado por um número de vetores, então a adição de Minkowisk consiste em

um conjunto de vetores C, sendo que cada vetor c ∈C é obtido pela soma vetorial:

c = a+b (A.1)

com a ∈ A e b ∈ B.

Desta maneira tem-se que:

A⊕B = {a+b | a ∈ A,b ∈ B}. (A.2)

A soma pode ser extendida para um número n de conjunto de vetores, assim:

S = A1 ⊕·· ·⊕An = {a1 + · · ·+an | a1 ∈ A1, · · · ,an ∈ An}. (A.3)

A Equação A.3 pode ser ainda escrita na forma suprimida:

S =n⊕

i=1

{Ai}. (A.4)

264 Anexo A -- Adição de Minkowski

266 Anexo A -- Adição de Minkowski

fixação de objetos por garras de robôs: aplicações de ... · dias, real, bruno, belini,...

Documents