utilização de redes neuronais artificiais para a modelação ... · obrigado, ainda, a todos...
TRANSCRIPT
www
Utilização de Redes Neuronais Artificiais para a Modelação da Degradação de Sistemas de Distribuição de Água
José Pedro Gamito de Saldanha Calado Matos
Dissertação
Presidente: Prof. António Pinheiro
Orientador: Prof. António Jorge Monteiro
Vogais: Prof. António Bento Franco
Prof. Joaquim Luís Dias
Utilização de Redes Neuronais Artificiais para a Modelação da Degradação de Sistemas de Distribuição de Água
José Pedro Gamito de Saldanha Calado Matos
Dissertação para obtenção do Grau de Mestre em
Engenharia Civil
Jurí
Prof. António Pinheiro
Prof. António Jorge Monteiro
Prof. António Bento Franco
Prof. Joaquim Luís Dias
Novembro 2008
Utilização de Redes Neuronais Artificiais para a Modelação da Degradação de Sistemas de Distribuição de Água
José Pedro Gamito de Saldanha Calado Matos
para obtenção do Grau de Mestre em
i
Agradecimentos
A realização deste trabalho foi apenas possível graças à disponibilidade, ao apoio, à dedicação, à
amizade e, por vezes, à paciência de muitas pessoas. A todas elas expresso o meu sincero
agradecimento.
Em especial, é imprescindível agradecer:
Ao Professor António Jorge Monteiro, orientador científico desta dissertação, pelas ideias com que
soube sempre enriquecer o trabalho e pela confiança, consideração e disponibilidade ímpares que
demonstrou.
À EPAL, cujo apoio foi fundamental para a concretização do trabalho, não só através dos dados
disponibilizados, mas também da atenção e do tempo dos seus colaboradores.
Ao Doutor Andrew Donnely e a todo o Grupo de Monitorização e Controlo, pela consideração e
empenho demonstrados na fase inicial do trabalho.
Ao Engenheiro Sérgio Rodrigues, pelos experientes conselhos e pelo interesse revelado.
Ao Professor Miguel Ayala Botto, que prescindiu do seu tempo para encaminhar o meu estudo das
redes neuronais artificiais.
Ao meu pai, cuja exigência me motivou a ir mais além e cujos sábios conselhos me ajudaram a,
inúmeras vezes, aperfeiçoar o trabalho.
À minha mãe, que com o seu carinho e preocupação me acompanhou constantemente.
Aos meus colegas de trabalho, tanto, na Hidra, como, posteriormente, na AGS, que me apoiaram
da melhor forma possível.
E, finalmente, à Natércia, que esteve sempre comigo, de alma e coração, e sem a qual teria sido
impossível levar a cabo esta empresa.
Obrigado, ainda, a todos aqueles que não tive a clarividência de nomear, mas contribuíram
positivamente para este projecto.
iii
Resumo
Nos últimos anos, tem-se verificado, por parte das entidades gestoras de sistemas de
abastecimento de água, um aumento da preocupação com o desempenho das infra-estruturas e,
particularmente, com os níveis de perdas.
Um dos desafios que se apresentam a estas entidades é a definição de estratégias de intervenção
optimizadas a longo prazo, objectivo para o qual é importante produzir boas estimativas do
desempenho futuro dos sistemas.
Como forma de responder a esse desafio, analisou-se, neste trabalho, a adequação da aplicação
de modelos baseados em redes neuronais artificiais a esta problemática, tendo-se desenvolvido
uma metodologia para a aplicação tais modelos à da degradação de sistemas de distribuição de
água.
Como caso de estudo, a metodologia foi aplicada, com bons resultados, à rede de distribuição de
água da Cidade de Lisboa, cujos dados, fornecidos pela EPAL contêm informação referente a
mais de 1 400 km de tubagens.
Apesar de se terem verificado algumas limitações aos modelos de degradação baseados em
redes neuronais artificiais, conclui-se que o seu desempenho é bastante bom em previsões de
médio e curto prazo.
Considera-se que este é um tema de investigação promissor, fornecendo uma boa base para o
desenvolvimento de um modelo económico-financeiro que, aplicado conjuntamente com o modelo
de degradação, permita, de forma integrada, optimizar as estratégias de intervenção nos
sistemas.
Palavras-chave: degradação de sistemas de distribuição; distribuição de água;
gestão de activos; perceptrão multicamada; redes neuronais artificiais; roturas.
v
Abstract
In the past few years there has been a tendency among water services companies to acknowledge
the performance of their infrastructures as a main concern, particularly, in what concerns water
losses.
One of the challenges these companies face relies on the definition of intervention strategies in the
long run, a goal that in order to be fulfilled requires good projections of the systems future
performance.
As an answer to this challenge, this work sought to analyze the potential of artificial neural
networks based applications to this problem. As a result, a methodology has been developed to
guide the usage of such applications to model the degradation of water distribution systems.
As a case study, the methodology has been applied, with good results, to the city of Lisbon water
distribution network, whose data, given by EPAL, contains information relative to more than
1 400 km of mains.
Although some limitations have been identified in artificial neural networks based degradation
models, their performance has proven to be rather good in the short and medium term.
Overall, this investigation theme is considered promising, providing a strong base for the
development of a financial-economical model, which applied with the degradation model, may be
capable of providing an integrated approach for optimizing intervention strategies in water
distribution systems.
Keywords: artificial neural networks; infrastructure asset management; multilayer
perception ; ruptures; water distribution systems; water distribution systems degradation.
vii
Índice do texto
1. INTRODUÇÃO ........................................................................................................................... 1
1.1 ENQUADRAMENTO ................................................................................................................. 1
1.2 OBJECTIVOS .......................................................................................................................... 1
1.3 DESCRIÇÃO SUMÁRIA DO ESTUDO ........................................................................................... 3
2. A EVOLUÇÃO DO ABASTECIMENTO DE ÁGUA EM PORTUGAL ....................................... 5
2.1 ASPECTOS HISTÓRICOS GERAIS .............................................................................................. 5
2.2 A CIDADE DE LISBOA .............................................................................................................. 5
2.3 SITUAÇÃO ACTUAL E PERSPECTIVAS FUTURAS EM PORTUGAL. ................................................. 6
3. A AVALIAÇÃO DE ROTURAS EM SISTEMAS DE ABASTECIMENTO DE ÁGUA..............11
3.1 O DESAFIO DO CONTROLO DE PERDAS ..................................................................................11
3.2 CAMPOS DE ACÇÃO NA REDUÇÃO DE PERDAS ........................................................................14
3.3 ÁREAS DE INTERESSE PRIORITÁRIO NA REDUÇÃO DE PERDAS .................................................15
3.4 ENQUADRAMENTO DO PRESENTE TRABALHO .........................................................................16
3.5 CAMPOS DE APLICAÇÃO – GESTÃO ESTRATÉGICA DE ACTIVOS E IDENTIFICAÇÃO DE ZONAS DE
INTERVENÇÃO PRIORITÁRIA ..............................................................................................................18
3.6 PERSPECTIVAS E DESAFIOS ..................................................................................................19
4. REDES NEURONAIS ARTIFICIAIS E ALGORITMOS GENÉTICOS .....................................21
4.1 ASPECTOS GERAIS ...............................................................................................................21
4.2 RAZÕES DA APLICAÇÃO ........................................................................................................21
4.2.1 Redes neuronais artificiais ........................................................................................21
4.2.2 Algoritmos genéticos .................................................................................................23
4.3 EVOLUÇÃO HISTÓRICA ..........................................................................................................24
4.3.1 Redes neuronais artificiais ........................................................................................24
4.3.2 Algoritmos genéticos .................................................................................................25
4.4 PRINCÍPIOS E DESCRIÇÃO DAS REDES NEURONAIS ARTIFICIAIS ................................................26
4.4.1 Princípios de funcionamento e convenções ..............................................................26
4.4.2 Paralelismo com os sistemas biológicos ...................................................................31
4.4.3 Modelos de redes neuronais artificiais ......................................................................33
4.4.4 Treino do PMC ..........................................................................................................39
viii
5. METODOLOGIA PROPOSTA PARA A MODELAÇÃO DA DEGRADAÇÃO DE CONDUTAS
DE ÁGUA ..........................................................................................................................................47
5.1 INTRODUÇÃO .......................................................................................................................47
5.2 SELECÇÃO E TRATAMENTO DE INFORMAÇÃO ..........................................................................47
5.2.1 Análise dos dados e definição de objectivos ............................................................47
5.2.2 Preparação dos dados ..............................................................................................48
5.3 PROCEDIMENTOS DE MODELAÇÃO.........................................................................................49
5.3.1 Considerações prévias ..............................................................................................49
5.3.2 Definição da arquitectura da rede .............................................................................49
5.3.3 Escolha do algoritmo de treino ..................................................................................55
5.3.4 Escolha da dimensão dos grupos de validação e teste ............................................56
5.4 VALIDAÇÃO DOS RESULTADOS ..............................................................................................56
5.5 OUTRAS FERRAMENTAS DESENVOLVIDAS ..............................................................................57
5.6 SÍNTESE DO MÉTODO ...........................................................................................................59
6. CASO DE ESTUDO – A REDE DE DISTRIBUIÇÃO DE ÁGUA DA CIDADE DE LISBOA ...61
6.1 INTRODUÇÃO .......................................................................................................................61
6.2 DADOS DISPONIBILIZADOS ....................................................................................................63
6.2.1 Considerações gerais ................................................................................................63
6.2.2 Dados de tubagens ...................................................................................................64
6.2.3 Dados de ordens de trabalhos ..................................................................................66
6.2.4 Considerações adicionais .........................................................................................67
6.3 CARACTERIZAÇÃO E ANÁLISE PRELIMINAR DO SISTEMA ESTUDADO ..........................................67
6.3.1 A rede de abastecimento ..........................................................................................67
6.3.2 Registos de roturas ...................................................................................................75
6.4 PREPARAÇÃO DO MODELO DE DEGRADAÇÃO DA REDE DE ABASTECIMENTO .............................80
6.4.1 Considerações prévias ..............................................................................................80
6.4.2 Preparação dos dados ..............................................................................................81
6.4.3 Definição da arquitectura da rede .............................................................................82
6.4.4 Selecção do algoritmo de treino ................................................................................90
6.4.5 Treino da rede ...........................................................................................................92
6.4.6 Validação ...................................................................................................................95
ix
6.5 ANÁLISE DOS RESULTADOS ..................................................................................................97
6.6 CONSIDERAÇÕES ADICIONAIS SOBRE AS VARIÁVEIS EXPLICATIVAS ........................................102
6.7 A DISPERSÃO DO FENÓMENO ..............................................................................................103
7. NOTAS CONCLUSIVAS E RECOMENDAÇÕES PARA ESTUDOS SUBSEQUENTES .....107
8. REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................................110
ANEXO I – TEOREMA DA APROXIMAÇÃO UNIVERSAL ................................................................ I
ANEXO II – DEMONSTRAÇÃO DO ALGORITMO DA RETROPROPAGAÇÃO DOS ERROS ...... III
ANEXO III – EXEMPLOS DE DIFERENTES PMC TREINADOS ................................................... VII
ANEXO IV – COMPARAÇÃO DE DIFERENTES ALGORITMOS DE TREINO .............................. IX
ANEXO V – SISTEMA DA EPAL ..................................................................................................... XI
ANEXO VI – DADOS DE TUBAGENS – DISTRIBUIÇÃO ............................................................. XIII
ANEXO VII – DADOS DE TUBAGENS – ADUÇÃO ....................................................................... XV
ANEXO VIII – DADOS DE ORDENS DE TRABALHOS (OT) ...................................................... XVII
ANEXO IX – EXTENSÃO DA REDE POR FREGUESIA ............................................................... XXI
ANEXO X – ÍNDICE MENSAL DE ROTURAS ............................................................................. XXIII
ANEXO XI – ÍNDICE MÉDIO ANUAL DE ROTURAS POR FREGUESIA................................... XXV
ANEXO XII – RESULTADOS DOS TESTES EFECTUADOS PARA DEFINIR A ARQUITECTURA
DO PMC ...................................................................................................................................... XXVII
ANEXO XIII – EQM VERSUS CORRELAÇÃO PARA VÁRIAS TOPOLOGIAS DE PMCS....... XXIX
ANEXO XIV – CÓDIGO DA APLICAÇÃO DE AG DESENVOLVIDA PARA DETERMINAÇÃO DA
TOPOLOGIA ÓPTIMA DO PMC ................................................................................................. XXXI
ANEXO XV – PARÂMETROS UTILIZADOS NO AG UTILIZADO PARA DETERMINAÇÃO DA
TOPOLOGIA ÓPTIMA DO PMC ............................................................................................... XXXIX
ANEXO XVI – RESULTADOS DA COMPARAÇÃO DE ALGORITMOS DE TREINO .................. XLI
ANEXO XVII – RELAÇÃO ENTRE DIÂMETROS E ÍNDICE OT/(100KM.ANO) NO CONJUNTO
DE DADOS E NA RNA ................................................................................................................. XLIII
ANEXO XVIII – PROCESSO DE GERAÇÃO DE PADRÕES FICTÍCIOS PARA ANÁLISE DE
RESULTADOS ...............................................................................................................................XLV
ANEXO XIX – RELAÇÃO ENTRE IDADE, ÍNDICE OT/(100KM.ANO) PRÉVIAS E ÍNDICE DE
OT/(100KM.ANO) APREENDIDA PELA RNA TREINADA .........................................................XLIX
x
Índice de quadros e figuras do texto
QUADRO 3.1 – BALANÇO HÍDRICO EM SISTEMAS DE ABASTECIMENTO DE ÁGUA. ADAPTADO DE ALEGRE ET
AL, 2006. ................................................................................................................................... 14
QUADRO 3.2 – BALANÇO HÍDRICO EM SISTEMAS DE ABASTECIMENTO DE ÁGUA. ADAPTADO DE ALEGRE ET
AL, 2004. ÁREAS DE APLICAÇÃO DO PRESENTE ESTUDO. .............................................................. 17
QUADRO 3.3 – VARIÁVEIS RELACIONADAS COM O APARECIMENTO DE ROTURAS EM SISTEMAS DE
DISTRIBUIÇÃO DE ÁGUA............................................................................................................... 17
QUADRO 6.1 – EFEITO DA SUBSTITUIÇÃO DE REDE NAS ROTURAS, RECLAMAÇÕES E PERDA EM LISBOA.
ADAPTADO DE LUÍS, 2008. ......................................................................................................... 61
QUADRO 6.2 – REGISTO DA PRIMEIRA FILTRAGEM APLICADA AOS DADOS DAS TUBAGENS DE DISTRIBUIÇÃO.
................................................................................................................................................. 65
QUADRO 6.3 – REGISTO DA SEGUNDA FILTRAGEM APLICADA AOS DADOS DAS TUBAGENS DE DISTRIBUIÇÃO.
................................................................................................................................................. 65
QUADRO 6.4 – DATAS ADMITIDAS NO ESTUDO PARA O INÍCIO E O FIM DA APLICAÇÃO DE MATERIAIS. ......... 65
QUADRO 6.5 – REGISTO DA PRIMEIRA FILTRAGEM APLICADA AOS DADOS DAS TUBAGENS DE ADUÇÃO...... 66
QUADRO 6.6 – REGISTO DA SEGUNDA FILTRAGEM APLICADA AOS DADOS DAS TUBAGENS DE ADUÇÃO. .... 66
QUADRO 6.7 – REGISTO DA FILTRAGEM APLICADA AOS DADOS DE OT. .................................................. 67
QUADRO 6.8 – REGISTO DA VALIDAÇÃO EFECTUADA AOS DADOS DE OT. ............................................... 67
QUADRO 6.9 – AVALIAÇÃO DA IMPORTÂNCIA DOS VÁRIOS PARÂMETROS PARA O MODELO. ...................... 83
QUADRO 6.10 – ANÁLISE À SENSIBILIDADE DE CADA PARÂMETRO NO RESULTADO DA SIMULAÇÃO DA REDE
NET20X1_5. ............................................................................................................................ 103
FIGURA 2.1 – AQUEDUTO DAS ÁGUAS LIVRES, LISBOA............................................................................ 6
FIGURA 2.2 – POPULAÇÃO SERVIDA POR SISTEMA PÚBLICO DE DISTRIBUIÇÃO DE ÁGUA, POR CONCELHO, EM
2002 (ESQUERDA) E 2006 (DIREITA). ADAPTADO DE INSAAR, 2008. ............................................. 7
FIGURA 2.3 – PRESENÇA DA ADP EM PORTUGAL – SISTEMAS DE ABASTECIMENTO E DRENAGEM.
ADAPTADO DE ADP, 2008. ........................................................................................................... 8
FIGURA 2.4 – POPULAÇÃO ABRANGIDA PELAS DIFERENTES MODELOS DE GESTÃO DO SERVIÇO DE
ABASTECIMENTO PÚBLICO DE ÁGUA EM “BAIXA”. ADAPTADO DE IRAR, 2006.................................... 8
FIGURA 3.1 – MOTIVOS AMBIENTAIS E DE ESCASSEZ APRESENTADOS EM 2006 PARA JUSTIFICAR A
ADOPÇÃO DE MEDIDAS EM SERVIÇOS DE ABASTECIMENTO DE ÁGUA. ADAPTADO DE INSAAR, 2008.
................................................................................................................................................. 11
FIGURA 3.2 – TARIFA MÉDIA DE ABASTECIMENTO [€/M3] POR CONCELHO, EM 2004, PARA UM CONSUMO
ANUAL DE 120 M3. ADAPTADO DE IRAR, 2006. ............................................................................ 12
xi
FIGURA 3.3 – MEDIDAS ADOPTADAS EM 2006 POR MOTIVOS AMBIENTAIS E DE ESCASSEZ EM SERVIÇOS DE
ABASTECIMENTO DE ÁGUA. ADAPTADO DE INSAAR, 2008. .......................................................... 13
FIGURA 3.4 – INVESTIMENTO REALIZADO (EXCEPTO EM BARRAGENS). ABASTECIMENTO DE ÁGUA –
CONTINENTE – 1987 A 2006. ADAPTADO DE INSAAR, 2008. ...................................................... 14
FIGURA 4.1 – APLICAÇÃO DE DIFERENTES MÉTODOS DEPENDENDO DA DISPONIBILIDADE DE DADOS E
CONHECIMENTO (TEORIA). ADAPTADO DE (KASABOV, 1996). ........................................................ 23
FIGURA 4.2 – ILUSTRAÇÃO DE UM PERCEPTÃO MULTICAMADA. .............................................................. 27
FIGURA 4.3 – MODELO DE UM NÓ DE UMA RNA. ................................................................................... 28
FIGURA 4.4 – CONVENÇÕES ADOPTADAS PARA DESCREVER AS REDES (EXEMPLO DE UM PMC). ............. 29
FIGURA 4.5 – DIAGRAMA DE UM NEURÓNIO (FONTE: WIKIPEDIA, POR MARIANA RUIZ VILLARREAL) .......... 31
FIGURA 4.6 – CONTRASTE ENTRE REDES NEURONAIS ARTIFICIAIS E BIOLÓGICAS. À ESQUERDA, UM
PORMENOR MICROSCÓPICO DO SISTEMA NERVOSO DE UM RATO E, À DIREITA, UMA RNA UTILIZADA
NO JET PROPULSION LABORATORY, NASA. ................................................................................ 33
FIGURA 4.7 – REPRESENTAÇÃO ESQUEMÁTICA DO PERCEPTRÃO. .......................................................... 33
FIGURA 4.8 – SEPARAÇÃO LINEAR DE CLASSES. ................................................................................... 35
FIGURA 4.9 – ESQUEMA DAS LIGAÇÕES E ELEMENTOS PRESENTES NUM PMC. ...................................... 37
FIGURA 4.10 – ILSTRAÇÃO DE UM PMC APÓS A FASE DE TREINO, COM PESOS SINÁPTICOS POSITIVOS
EVIDENCIADOS A AZUL E PESOS SINÁPTICOS NEGATIVOS MARCADOS A VERMELHO. A COLORAÇÃO
NOS NÓS REPRESENTA O VALOR DA CONSTANTE ASSOCIADA. ....................................................... 38
FIGURA 4.11 – FUNÇÃO DE ACTIVAÇÃO LINEAR. ................................................................................... 40
FIGURA 4.12 – FUNÇÃO DE ACTIVAÇÃO SIGMOIDAL. .............................................................................. 40
FIGURA 4.13 – FUNÇÃO DE ACTIVAÇÃO TANGENTE HIPERBÓLICA. .......................................................... 40
FIGURA 4.14 – FUNÇÃO DE ACTIVAÇÃO ARCO-TANGENTE. ..................................................................... 41
FIGURA 4.15 – PROCESSO DE TREINO EM QUE A REDE PERDEU A CAPACIDADE DE GENERALIZAÇÃO. ....... 44
FIGURA 5.1 – EQM MÉDIO APÓS VALIDAÇÃO CRUZADA PARA PMC DE UMA E DUAS CAMADAS, COM
INTERVALOS DE CONFIANÇA DE 95% OBTIDOS RECORRENDO À DISTRIBUIÇÃO DE T-STUDENT......... 54
FIGURA 5.2 – MODO DE TREINO E SIMULAÇÃO DA FERRAMENTA DE TESTE DE REDES E SEPARADOR DE
OPÇÕES. .................................................................................................................................... 58
FIGURA 5.3 – OPERAÇÃO DO MODO DE TESTE, QUE POSSIBILITA A IMPORTAÇÃO DE VALORES DE EQM,
CORRELAÇÃO E TEMPO DE TREINO PARA O EXCEL EM TREINOS SEGUIDOS, PERMITINDO OBTER
AMOSTRAGENS ESTATÍSTICAS DA CAPACIDADE DE CADA REDE. ..................................................... 59
FIGURA 5.4 – FLUXOGRAMA REPRESENTATIVO DO MÉTODO PROPOSTO. ................................................ 60
FIGURA 6.1 – DIAGRAMA ALTIMÉTRICO DA REDE DE ABASTECIMENTO DE ÁGUA DE LISBOA. ADAPTADO DE
FRANCO, 2006. ......................................................................................................................... 62
xii
FIGURA 6.2 – ESQUEMA DA REDE DE DISTRIBUIÇÃO DE ÁGUA DE LISBOA. ............................................... 62
FIGURA 6.3 – REDE DE DISTRIBUIÇÃO DE ÁGUA, POR ZONA ALTIMÉTRICA , NA CIDADE DE LISBOA.
ADAPTADO DE LUÍS, 2004. ......................................................................................................... 63
FIGURA 6.4 – COMPOSIÇÃO, POR EXTENSÃO DE MATERIAL, DA REDE DE DISTRIBUIÇÃO. .......................... 68
FIGURA 6.5 – COMPOSIÇÃO, POR EXTENSÃO DE MATERIAL, DA REDE DE ADUÇÃO. .................................. 69
FIGURA 6.6 – IDADE DA REDE. CURVA DE EXTENSÃO ACUMULADA DE ACORDO COM O ANO DE INSTALAÇÃO
PARA A REDE DE DISTRIBUIÇÃO. .................................................................................................. 69
FIGURA 6.7 – IDADE DA REDE. CURVA DE EXTENSÃO ACUMULADA DE ACORDO COM O ANO DE INSTALAÇÃO
PARA A REDE DE ADUÇÃO. .......................................................................................................... 70
FIGURA 6.8 – CARACTERIZAÇÃO DA REDE DE DISTRIBUIÇÃO POR ANO DE INSTALAÇÃO E MATERIAL
(CONSIDERANDO FF, FC, FFD E PEAD). .................................................................................... 71
FIGURA 6.9 – EVOLUÇÃO DA EXTENSÃO DA REDE, A PARTIR DA INFORMAÇÃO DISPONÍVEL, NO PERÍODO EM
ANÁLISE. .................................................................................................................................... 72
FIGURA 6.10 – DISPOSIÇÃO DA REDE DE DISTRIBUIÇÃO POR DIÂMETRO DAS TUBAGENS. ......................... 73
FIGURA 6.11 – DISPOSIÇÃO DA REDE DE ADUÇÃO POR DIÂMETRO DAS TUBAGENS. ................................. 73
FIGURA 6.12 – CARACTERIZAÇÃO DA REDE DE DISTRIBUIÇÃO POR ANO DE INSTALAÇÃO E DIÂMETRO
(CONSIDERANDO FF, FC, FFD E PEAD). .................................................................................... 74
FIGURA 6.13 – DISPOSIÇÃO DA REDE DE DISTRIBUIÇÃO POR SUBSISTEMAS. ........................................... 74
FIGURA 6.14 – DISPOSIÇÃO DA REDE DE ADUÇÃO POR SUBSISTEMAS. ................................................... 75
FIGURA 6.15 – REGISTO DO ÍNDICE DE ROTURAS PARA OS ANOS EM ANÁLISE. ........................................ 75
FIGURA 6.16 – REGISTO DO ÍNDICE DE ROTURAS MÉDIO POR MATERIAL. ................................................ 76
FIGURA 6.17 – REGISTO DO ÍNDICE DE ROTURAS MENSAL MÉDIO PARA OS ANOS EM ANÁLISE. ................. 76
FIGURA 6.18 – ÍNDICE DE ROTURAS MENSAL MÉDIO PARA OS ANOS EM ANÁLISE, OBTIDO PARA CADA UMA
DAS CAUSAS REGISTADAS. .......................................................................................................... 77
FIGURA 6.19 – ÍNDICE DE ROTURAS MENSAL MÉDIO PARA OS ANOS EM ANÁLISE, OBTIDO PARA CADA UM
DOS MATERIAIS ESTUDADOS [ROT/(100 KM.ANO)]. ........................................................................ 78
FIGURA 6.20 – DISTRIBUIÇÃO PERCENTUAL ACUMULADA DAS CAUSAS DE INTERVENÇÃO EM ROTURAS, POR
TIPO DE MATERIAL. ..................................................................................................................... 78
FIGURA 6.21 – ÍNDICE DE ROTURAS PARA OS PRINCIPAIS SUBSISTEMAS DA REDE. .................................. 79
FIGURA 6.22 – NÚMERO DE ROTURAS ANUAL, EM TUBAGENS VALIDADAS, PARA AS DIVISÕES OCIDENTAL E
ORIENTAL. ................................................................................................................................. 80
FIGURA 6.23 – ESQUEMAS DOS PMC TREINADOS PARA 6 VARIÁVEIS. .................................................... 83
FIGURA 6.24 – ESQUEMAS DOS PMC TREINADOS PARA 5 VARIÁVEIS. .................................................... 83
xiii
FIGURA 6.25 – EQM MÉDIO, APÓS VALIDAÇÃO K-FOLD, PARA PMC DE UMA E DUAS CAMADAS, COM
INTERVALOS DE CONFIANÇA DE 95% OBTIDOS RECORRENDO À DISTRIBUIÇÃO DE T-STUDENT
(NÚMERO DE LIGAÇÕES SINÁPTICAS; 90% DOS TESTES). .............................................................. 85
FIGURA 6.26 – EQM MÉDIO, APÓS VALIDAÇÃO K-FOLD, PARA PMC DE UMA E DUAS CAMADAS, COM
INTERVALOS DE CONFIANÇA DE 95% OBTIDOS RECORRENDO À DISTRIBUIÇÃO DE T-STUDENT
(NÚMERO DE NÓS; 90% DOS TESTES). ......................................................................................... 85
FIGURA 6.27 – CORRELAÇÃO MÉDIA, APÓS VALIDAÇÃO K-FOLD, PARA PMC DE UMA E DUAS CAMADAS,
COM INTERVALOS DE CONFIANÇA DE 95% OBTIDOS RECORRENDO À DISTRIBUIÇÃO DE T-STUDENT. 86
FIGURA 6.28 – TEMPO DE TREINO MÉDIO, APÓS VALIDAÇÃO K-FOLD, PARA PMC DE UMA E DUAS CAMADAS,
COM INTERVALOS DE CONFIANÇA DE 95% OBTIDOS RECORRENDO À DISTRIBUIÇÃO DE T-STUDENT. 86
FIGURA 6.29 – CONSTITUIÇÃO DO CROMOSSOMA DO AG UTILIZADO PARA DETERMINAR A MELHOR
TOPOLOGIA DE PMC. ................................................................................................................. 87
FIGURA 6.30 – RESULTADO DO CRUZAMENTO DE DOIS PMC (PMC 1 E PMC 2) NO ÂMBITO DA APLICAÇÃO
DE AG DESENVOLVIDA (NÚMERO DE NÓS NAS CAMADAS OCULTAS). .............................................. 89
FIGURA 6.31 – RESULTADO DO EQM DE TREINO ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS ALGORITMOS DE
TREINO, PARA A REDE NET20X1_5, COM VALIDAÇÃO K-FOLD, DE SUBCONJUNTOS DE VALIDAÇÃO A
CONTABILIZAR 20% DO TOTAL DE DADOS. .................................................................................... 91
FIGURA 6.32 – RESULTADO DA CORRELAÇÃO DE TREINO ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS ALGORITMOS
DE TREINO, PARA A REDE NET20X1_5, COM VALIDAÇÃO K-FOLD, DE SUBCONJUNTOS DE VALIDAÇÃO A
CONTABILIZAR 20% DO TOTAL DE DADOS. .................................................................................... 91
FIGURA 6.33 – RESULTADO DO TEMPO MÉDIO DE TREINO ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS ALGORITMOS
DE TREINO, PARA A REDE NET20X1_5, COM VALIDAÇÃO K-FOLD, DE SUBCONJUNTOS DE VALIDAÇÃO A
CONTABILIZAR 20% DO TOTAL DE DADOS. .................................................................................... 92
FIGURA 6.34 – RESULTADO DA SIMULAÇÃO DO ÍNDICE OT/(100KM.ANO) PARA O CONJUNTO DE TUBAGENS
VALIDADO, NUM GRÁFICO COM A IDADE DOS ELEMENTOS DE TUBAGEM EM ABCISSA E O ÍNDICE
OT/(100KM.ANO) MÉDIO PARA TUBAGENS DE DETERMINADA IDADE EM ORDENADA. ....................... 94
FIGURA 6.35 – REPRESENTAÇÃO DA RNA ESCOLHIDA. A COR AZUL DENOTA PESOS SINÁPTICOS POSITIVOS
E A COR VERMELHA NEGATIVOS, SENDO A INTENSIDADE DAS CORES PROPORCIONAL AO MÓDULO DO
VALOR. ...................................................................................................................................... 94
FIGURA 6.36 – CORRESPONDÊNCIA ENTRE OS DADOS E AS PREVISÕES DA REDE ESCOLHIDA. ÍNDICE DE
OT/100KM/ANO EM ORDEM À IDADE DAS TUBAGENS, POR MATERIAL. ............................................ 95
FIGURA 6.37 – CORRESPONDÊNCIA ENTRE OS DADOS E AS PREVISÕES DA REDE ESCOLHIDA. ÍNDICE DE
OT/100KM/ANO EM ORDEM À IDADE DAS TUBAGENS, POR MATERIAL. ............................................ 96
FIGURA 6.38 – CORRESPONDÊNCIA ENTRE OS DADOS E AS PREVISÕES DA REDE ESCOLHIDA. ÍNDICE DE
OT/100KM/ANO EM ORDEM AO DIÂMETRO NOMINAL DAS TUBAGENS. ............................................. 96
xiv
FIGURA 6.39 – CORRESPONDÊNCIA ENTRE OS DADOS E AS PREVISÕES DA REDE ESCOLHIDA. ÍNDICE DE
OT/100KM/ANO EM ORDEM AO SUBSISTEMA DE ABASTECIMENTO. ................................................. 97
FIGURA 6.40 – RELAÇÃO ENTRE ÍNDICES DE ROTURA PRÉVIOS (OT/(100KM.ANO) PRÉVIAS) E PREVISTOS
(OT/(100KM.ANO)). ................................................................................................................... 98
FIGURA 6.41 – RESULTADO DA SIMULAÇÃO DO ÍNDICE OT/(100KM.ANO), NUM GRÁFICO COM A IDADE DOS
ELEMENTOS DE TUBAGEM EM ABCISSA E O ÍNDICE OT/(100KM.ANO) MÉDIO EM ORDENADA............. 99
FIGURA 6.42 – RESULTADO DA SIMULAÇÃO DO ÍNDICE OT/(100KM.ANO), NUM GRÁFICO COM A IDADE DOS
ELEMENTOS DE TUBAGEM EM ABCISSA E O ÍNDICE OT/(100KM.ANO) MÉDIO PARA TUBAGENS DE
DETERMINADA IDADE EM ORDENADA. POR MATERIAL; COM 37,5 OT/(100KM.ANO) PRÉVIAS. ........ 100
FIGURA 6.43 – RESULTADO DA SIMULAÇÃO DO ÍNDICE OT/(100KM.ANO), NUM GRÁFICO COM A IDADE DOS
ELEMENTOS DE TUBAGEM EM ABCISSA E O ÍNDICE OT/(100KM.ANO) MÉDIO PARA TUBAGENS DE
DETERMINADA IDADE EM ORDENADA. POR MATERIAL; COM 550 OT/(100KM.ANO) PRÉVIAS. ......... 101
FIGURA 6.44 – RELAÇÃO ENTRE OBSERVAÇÕES E PREVISÕES DE OT/(100KM.ANO) MÉDIAS PARA AS
CLASSES DE DIÂMETRO NOMINAL (37,5 OT(100KM.ANO) PRÉVIAS). ............................................ 101
FIGURA 6.45 – RELAÇÃO ENTRE OBSERVAÇÕES E PREVISÕES DE OT/(100KM.ANO) MÉDIAS NOS
SUBSISTEMAS DE DISTRIBUIÇÃO (37,5 OT(100KM.ANO) PRÉVIAS). .............................................. 102
FIGURA 6.46 – DISTRIBUIÇÃO DO NÚMERO DE ROTURAS NUM ÚNICO TECHO DE TUBAGEM, PARA A REDE DE
DISTRIBUIÇÃO DA ÁGUA DE LISBOA (ESCALA LOGARÍTMICA). ........................................................ 104
Índice de quadros e figuras do anexo
QUADRO A1 – CAMPOS DE DADOS DE TUBAGENS DE DISTRIBUIÇÃO. ...................................................... XIII
QUADRO A2 – CAMPOS DE DADOS DE TUBAGENS DE ADUÇÃO. .............................................................. XV
QUADRO A3 – CAMPOS DE DADOS DAS ORDENS DE TRABALHOS. ........................................................ XVII
QUADRO A4 – REGISTO DO NÚMERO DE RESULTADOS ADMITIDOS COMO VÁLIDOS EM CADA CAMPO DE
DADOS, PARA AS OT. ............................................................................................................... XVIII
QUADRO A5 – REGISTO DAS OPÇÕES TOMADAS PARA VALIDAÇÃO DOS DADOS DE OT. .......................... XIX
QUADRO A 6 – RESULTADOS DO EQM, OBTIDOS EM REDES COM UMA CAMADA OCULTA (90% DOS DADOS).
.............................................................................................................................................. XXVII
QUADRO A 7 – RESULTADOS DE CORRELAÇÃO, OBTIDOS EM REDES COM UMA CAMADA OCULTA (100%
DOS DADOS). .......................................................................................................................... XXVII
QUADRO A 8 – RESULTADOS DE TEMPOS DE TREINO, OBTIDOS EM REDES COM UMA CAMADA OCULTA
(100% DOS DADOS). ............................................................................................................... XXVII
QUADRO A 9 – RESULTADOS DO EQM, OBTIDOS EM REDES COM DUAS CAMADAS OCULTAS (90% DOS
DADOS). ................................................................................................................................ XXVIII
xv
QUADRO A 10 – RESULTADOS DE CORRELAÇÃO, OBTIDOS EM REDES COM DUAS CAMADAS OCULTAS
(100% DOS DADOS). .............................................................................................................. XXVIII
QUADRO A 11 – RESULTADOS DE TEMPOS DE TREINO [S], OBTIDOS EM REDES COM DUAS CAMADAS
OCULTAS (100% DOS DADOS). ................................................................................................ XXVIII
QUADRO A 12 – SÍNTESE DOS PARÂMETROS UTILIZADOS NO AG. ..................................................... XXXIX
QUADRO A 13 – RESULTADOS DO EQM OBTIDOS ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS ALGORITMOS DE
TREINO, PARA A REDE NET20X1_5 (100% DOS DADOS). .............................................................. XLI
QUADRO A 14 – RESULTADOS DA CORRELAÇÃO OBTIDOS ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS ALGORITMOS
DE TREINO, PARA A REDE NET20X1_5 (100% DOS DADOS). .......................................................... XLI
QUADRO A 15 – RESULTADOS TEMPO DE TREINO [S] OBTIDOS ATRAVÉS DA UTILIZAÇÃO DE VÁRIOS
ALGORITMOS DE TREINO, PARA A REDE NET20X1_5 (100% DOS DADOS). ..................................... XLI
QUADRO A 16 – PONTOS AMOSTRAIS ADMITIDOS PARA O PARÂMETRO SUBSISTEMA DE DISTRIBUIÇÃO... XLV
QUADRO A 17 – PONTOS AMOSTRAIS ADMITIDOS PARA O PARÂMETRO MATERIAL. ................................ XLVI
QUADRO A 18 – PONTOS AMOSTRAIS ADMITIDOS PARA O PARÂMETRO IDADE DA TUBAGEM. .................. XLVI
QUADRO A 19 – PONTOS AMOSTRAIS ADMITIDOS PARA O PARÂMETRO DIÂMETRO NOMINAL. ................ XLVII
QUADRO A 20 – PONTOS AMOSTRAIS ADMITIDOS PARA O PARÂMETRO OT/(100KM.ANO) PRÉVIAS. ...... XLVII
FIGURA A 1 – REPRESENTAÇÃO DE UM PMC TREINADO SEM CAMADA OCULTA....................................... VII
FIGURA A 2 – REPRESENTAÇÃO DE UM PMC TREINADO COM UMA CAMADA OCULTA DE 20 NÓS. ............. VII
FIGURA A 3 – REPRESENTAÇÃO DE UM PMC TREINADO COM UMA CAMADA OCULTA DE 40 NÓS. ............. VII
FIGURA A 4 – COMPARAÇÃO ENTRE DIFERENTES ALGORITMOS DE TREINO PARA O CASO DE ESTUDO. ...... IX
FIGURA A 5 – SISTEMA DA EPAL. ADAPTADO DE FRANCO, 2006. .......................................................... XI
FIGURA A6 – EXTENSÃO DA REDE POR FREGUESIA .............................................................................. XXI
FIGURA A7 – ÍNDICES MÉDIOS MENSAIS DE ROTURAS. ......................................................................... XXIII
FIGURA A8 – ÍNDICE MENSAL MÉDIO DE ROTURAS COM DESVIO-PADRÃO. ............................................. XXIII
FIGURA A9 – ÍNDICES MÉDIOS ANUAIS DE ROTURAS POR FREGUESIA. .................................................. XXV
FIGURA A 10 – EQM VERSUS CORRELAÇÃO PARA VÁRIAS TOPOLOGIAS DE PMC ................................ XXIX
FIGURA A 11 – DIÂMETRO NOMINAL VERSUS OT/(100KM.ANO), PARA A RNA TREINADA E PARA O
CONJUNTO DE DADOS. .............................................................................................................. XLIII
FIGURA A 12 – RELAÇÃO ENTRE IDADE, ÍNDICE OT/(100KM.ANO) PRÉVIAS E ÍNDICE DE OT/(100KM.ANO)
APREENDIDA PELA RNA TREINADA. ........................................................................................... XLIX
xvii
Lista de abreviações
AG Algoritmos genéticos
EPAL Empresa Portuguesa de Águas de Livres
EQM Erro quadrático médio
FC Fibrocimento
FF Ferro fundido (cinzento)
FFD Ferro fundido dúctil
GA Gestão de activos
INAG Instituto Nacional da Água
INSAAR Inventário Nacional de Sistemas de Abastecimento de Água e de Águas Residuais
IRAR Instituto Regulador de Águas e Resíduos
NASA North American Space Agency
OT Ordem de trabalho
PEAASAR Plano Estratégico de Abastecimento de Água e Saneamento de Águas Residuais
PEAD Polietileno de alta densidade
PMC Perceptrão multicamada
RBR Rede de base radial
RNA Rede neuronal artificial
SIG Sistema de informação geográfica
ZMC Zona de medição e controlo
1
1. Introdução
1.1 Enquadramento Nos últimos anos, a importância dada aos recursos naturais e à sua adequada utilização tem
aumentado, a par de uma maior compreensão e aceitação de conceitos como o desenvolvimento
sustentável e a necessidade de internalização de custos, outrora considerados marginais.
Embora esta tendência se verifique na quase totalidade dos domínios de acção humana, o
abastecimento de água constitui uma actividade em que a sustentabilidade assume importância
especial, dado o seu carácter vital para a sobrevivência.
Com o aumento da população nos aglomerados urbanos, muitas vezes acompanhado por um
aumento dos consumos, a pressão exercida sobre os aquíferos e outras origens de água potável
tem vindo a crescer, por vezes causando efeitos negativos persistentes nas zonas de
exploração.
Por outro lado, tem-se assistido a uma maior responsabilização das entidades gestoras pelos
constrangimentos causados pelo mau desempenho das infra-estruturas. Numa óptica de
internalização de custos sociais, não será totalmente inesperado que as entidades gestoras
possam ter que responder financeiramente pela ocupação da via pública ou por falhas ou
interrupções de abastecimento.
Estas razões, incluindo também recentes desenvolvimentos tecnológicos, têm levado as
entidades gestoras de sistemas de abastecimento de água a investir em programas de controlo e
redução de perdas, renovação das redes e, em geral, no melhoramento do desempenho das
infra-estruturas. No entanto, embora estas medidas melhorem o desempenho dos sistemas, por
vezes de forma significativa, não correspondem, necessariamente, a um procedimento de
exploração óptimo, sustentável a longo prazo. As, tecnologias de telemetria e telegestão, a
utilização de materiais mais duráveis, métodos construtivos mais eficientes, sistemas de
informação mais potentes e ferramentas de cálculo superiores constituem instrumentos da maior
importância mas, em regra, não permitem inferir directamente a evolução temporal do
comportamento dos sistemas nem definir estratégias de actuação.
É numa óptica de contribuição para uma base fiável de previsão dos desempenhos dos sistemas
de abastecimento de água que é desenvolvido o presente trabalho.
1.2 Objectivos No passado, face à falta de informação detalhada sobre o comportamento de cada tubagem e
enfrentando-se grandes dificuldades para relacionar perdas com partes localizadas dos sistemas
de abastecimento, utilizaram-se frequentemente métodos estatísticos e a experiência dos
2
responsáveis para definir as zonas em que seria mais proveitoso proceder a campanhas de
renovação das redes.
Presentemente, podem ser implementados instrumentos que, para além de permitirem analisar o
estado actual dos sistemas, facilitam a tarefa do decisor. Como exemplo deste tipo de
instrumentos, podem ser referidas as zonas de medição e controlo (ZMC) que permitem, numa
área limitada da rede, efectuar balanços hídricos de forma simples e controlar, em tempo real, o
estado do sistema, pelo que se revelam bastante superiores, do ponto de vista de resultados, às
abordagens tradicionais.
Independentemente da mais-valia que constituem estas inovações, continuam a existir
dificuldades associadas ao estabelecimento de estratégias de ampliação de redes ou à definição
de taxas de renovação anual. Assim, os objectivos do presente estudo podem ser sintetizados
nos seguintes quatro aspectos principais:
1. A análise da adequação da aplicação de redes neuronais artificiais à modelação da
degradação de sistemas de abastecimento de água;
2. O estabelecimento de um método coerente para aplicação das redes neuronais artificiais
a sistemas com características gerais análogas às do presente caso de estudo;
3. O estudo e percepção das principais variáveis responsáveis pela degradação das redes
de distribuição de água, estabelecendo uma hierarquização entre estas;
4. A elaboração de um modelo de simulação da degradação da rede, orientado para apoiar
decisões das entidades gestoras.
No que se refere ao primeiro aspecto, pretende-se fornecer, neste documento, uma base para a
compreensão e utilização de Redes Neuronais Artificiais (RNA), discutindo-se a diversidade, as
propriedades e as aplicações destes modelos e analisando as mais-valias e possibilidades que a
sua aplicação poderá trazer em termos de previsão de fugas de água.
Não obstante as RNA serem modelos de grande potencialidade, a profusão das variantes
possíveis leva a que o utilizador acabe normalmente por recorrer a regras heurísticas baseadas
em experiências obtidas a partir de casos específicos, podendo adoptar-se um modelo que não
se adapte perfeitamente ao problema em questão. Assim, procurou-se identificar e justificar as
opções tomadas na construção das redes neuronais artificiais, aplicando e desenvolvendo
metodologias de optimização, pesquisando caminho para estudos futuros e cumprindo o
segundo objectivo deste trabalho.
O terceiro aspecto referido tem aplicação mais orientada para o planeamento. Devido à carência
de dados ou, simplesmente, à carência de ferramentas adequadas ao seu tratamento,
desconhece-se, em profundidade, qual a relação entre o número de roturas registado nas
tubagens e as variáveis com ele relacionadas. Sabe-se, por exemplo, que a tendência geral dos
sistemas de abastecimento é que a probabilidade de roturas cresça com a idade das tubagens e
que o material tenha bastante influência no comportamento do sistema. No entanto, devido à
3
quantidade de variáveis intervenientes, a análise estatística tradicional resulta num grau de
complexidade excessivo, sendo ainda que, por vezes, se define o próprio comportamento do
sistema antes do estudo (quando, por exemplo, se define que a lei que rege a variação das
roturas com a idade é exponencial) imputando-se, desde logo, possíveis limitações ao modelo.
1.3 Descrição sumária do estudo Desde 2001, a Empresa Portuguesa de Águas de Lisboa (EPAL) implementou um sistema de
informação geográfica (SIG) para a gestão da rede, sendo este trabalho baseado na extensa
matriz de dados acumulada até ao início de 2008.
Focando-se em particular no sistema de abastecimento da cidade de Lisboa, actualmente com
cerca de 1 400 km de tubagens em funcionamento, o presente estudo incidiu nas tubagens com
diâmetro nominal até 315 mm.
Com a grande quantidade de dados disponível, treinaram-se vários modelos de redes neuronais
artificiais (RNA ou artificial neural networks (ANN), segundo a designação anglo-saxónica),
pretendendo simular o comportamento da rede de abastecimento da cidade de Lisboa.
Não obstante os modelos conexionistas, como as RNA, serem poderosos, para obter um modelo
fiável e robusto, e dado que as RNA são um tema que se reveste de alguma complexidade,
foram desenvolvidos vários mecanismos de análise e melhoramento dos resultados. Seguiu-se
esta óptica, recorrendo à optimização dos modelos aplicando algoritmos genéticos (AG).
Tendo-se treinado modelos com qualidade, adequados aos dados disponíveis e com boa
capacidade de generalização, procedeu-se à análise e interpretação dos resultados obtidos
seguindo-se, posteriormente, a aplicação dos modelos à previsão da degradação da rede no
futuro, em função do estado actual e diversos parâmetros normalmente fixados pela entidade
gestora.
Para o desenvolvimento dos cálculos deste trabalho utilizaram-se unicamente os programas
Microsoft Excel™ e Matlab™ (com Neural Network Toolbox™ e Genetic Algoríthms Toolbox™).
A programação foi executada, tanto em Visual Basic for Applications (VBA), como no ambiente
do Matlab™, incluindo várias ferramentas que promovem o interface entre os vários programas.
Pretendeu-se, assim, compilar uma série de ferramentas e procedimentos, que aplicadas numa
ordem lógica facilitassem e estruturassem o tratamento de dados e o treino de RNA,
inclusivamente aplicando AG, não só para problemas semelhantes aos tratados, mas cobrindo
um âmbito mais geral. Em síntese, pretende-se que o trabalho exigido ao utilizador se concentre
nas áreas que mais interessam: o tratamento e preparação dos dados e a análise de resultados.
No capítulo 2 são introduzidos conceitos sobre as RNA e os AG, justificando-se a utilização
destas ferramentas. Inclui-se, também, a apresentação de aspectos da evolução histórica,
sobretudo das RNA, uma vez que o seu peso neste trabalho o justifica.
4
No capítulo 3 é levada a cabo uma síntese da actividade de avaliação de roturas em sistemas de
abastecimento de água, incluindo referências às metodologias seguidas e tendências actuais.
Após a introdução às RNA e aos AG feita no capítulo 3, o capítulo 4 é dedicado a uma descrição
mais prática dos problemas identificados, das soluções encontradas e das metodologias
propostas de utilização destas ferramentas, em problemas semelhantes aos estudados.
O caso de estudo da rede de distribuição de Lisboa é apresentado no capítulo 5. No mesmo
capítulo são analisados os dados disponibilizados pela EPAL, caracterizando-se o sistema e
procedendo-se uma análise preliminar do respectivo comportamento. Seguidamente, é descrita a
preparação do modelo de degradação da rede de distribuição, tanto na vertente do
comportamento médio, como na da distribuição probabilística do fenómeno. A análise dos
resultados obtidos é então explanada, terminando-se o capítulo com algumas considerações
sobre as variáveis explicativas.
Finalmente, no capítulo 6, são apresentadas conclusões do trabalho e desenvolvidas
recomendações para eventuais estudos subsequentes.
5
2. A evolução do abastecimento de água em Portugal
2.1 Aspectos históricos gerais Enquanto elemento essencial para a vida, a água determinou desde o início da civilização, a
localização e o desenvolvimento de importantes aglomerados populacionais.
Por exemplo, o sistema de abastecimento a Roma incluía onze aquedutos principais, construídos
entre 312 A.C. (AquaAppia) e 226 D.C. (Aqua Alexandrina), tendo o maior destes aquedutos
(Anio Novus) cerca de 95 km. Na era imperial, quando se pensa que a população de Roma era
superior a 1 milhão de habitantes, estima-se que o sistema pudesse abastecer a cidade com
mais de 1 m3/dia por habitante (Inf08). Em Roma estavam também generalizados os sistemas de
água canalizada em chumbo, de onde deriva o termo britânico para canalização, plumbing (de
chumbo, plumb).
Nos séculos mais recentes, nomeadamente a partir da era industrial, os sistemas existentes,
maioritariamente com escoamento em superfície livre, foram sendo substituídos por sistemas em
pressão. Em Portugal, esta revolução teve lugar no séc. XIX, com a introdução dos sistemas de
adução e distribuição de água domiciliária construídos com tubagens de ferro fundido
funcionando sob pressão (Matos, 2000).
No séc. XX assistiu-se à continuação da evolução dos sistemas de distribuição de água em
diversos campos. Foram aplicados novos materiais, tais como o fibrocimento, o ferro fundido
dúctil, o aço, o betão e os plásticos, foi generalizada a preocupação com a qualidade da água e
foi ampliado a grande parte da população o acesso a sistemas públicos de abastecimento.
No início do séc. XXI, enquanto se estendem os predicados de ampliação dos sistemas do
séc. XX e tendo sido ultrapassados os problemas críticos de carência de água, assiste-se a um
aumento substancial da preocupação com a qualidade e com o uso eficiente da água, conceitos
cada vez mais profundamente enraizados na sociedade.
2.2 A cidade de Lisboa O abastecimento de água na cidade de Lisboa foi, até ao séc. XVIII, levado a cabo
principalmente por bicas e nascentes, sem um sistema de distribuição estruturado. O Aqueduto
das Águas Livres, construído durante o reinado de D. João V e progressivamente reforçado e
ampliado até ao séc. XIX veio alterar este panorama. Esta infra-estrutura, pensada desde 1728,
foi mandada construir em 1731 por proposta de Cláudio Gorgel do Amaral (Palácio Galveias,
1990) para solucionar o problema de falta de água em Lisboa (Figura 2.1).
6
Figura 2.1 – Aqueduto das Águas Livres, Lisboa.
Foi a partir da construção do aqueduto e de toda a infra-estrutura de apoio que evoluiu o sistema
de abastecimento de Lisboa. Em 2 de Abril de 1868, o abastecimento de água a Lisboa foi
concessionado à CAL, Companhia das Águas de Lisboa (EPAL, 2004) e, em meados do século
passado, depois de um período de carência de água nos anos 20, Lisboa já era abastecida
através do aqueduto, do canal do Alviela (1880) e do canal do Tejo (1940). O crescimento da
capital continuava a impor à CAL o planeamento e execução de obras e infra-estruturas. Assim,
nos anos 50 e 60, as origens de água foram melhoradas e reforçadas para saturar as infra-
estruturas de adução existentes (Quintela, et al., 2004).
A 30 de Outubro de 1974 terminava o longo período de concessão à CAL, tendo a gestão do
sistema de abastecimento da cidade passado para a responsabilidade da EPAL, Empresa
Pública de Águas de Lisboa, cuja designação se alterou em 1981 para Empresa Pública das
Águas Livres e, finalmente, para Empresa Portuguesa das Águas Livres, S.A., em 1991 (EPAL,
2004).
Em 4 de Junho de 1987 foi concluído o sistema de Castelo do Bode, pondo fim a novo período
de carência durante os anos 80, quando a população da cidade chegou a mais de 900 000
habitantes. Esta infra-estrutura, considerada a principal componente do sistema de
abastecimento da EPAL, foi ampliada em 1996 e tem uma capacidade de produção na ordem
dos 625 000 m3/dia, assegurando sem problemas a demanda, não só da capital, mas de
dezenas de concelhos (EPAL, 2004).
Actualmente, a rede de distribuição de Lisboa, sectorizada em 5 patamares de pressão
principais, tem cerca de 1 400 km de tubagens, um total de 15 reservatórios e 9 estações
elevatórias, responsáveis pelo abastecimento a 93 000 ramais de ligação predial distribuídos
numa área de 83 km2 (EPAL, 2004).
2.3 Situação actual e perspectivas futuras em Portugal. A situação precisa do abastecimento de água em Portugal é difícil de aferir, no entanto,
iniciativas como o INSAAR (Inventário Nacional de Sistemas de Abastecimento de Água e de
Águas Residuais), levado a cabo pelo INAG (Instituto Nacional da Água), ou a informação
7
disponibilizada pelo IRAR (Instituto Regulador de Águas e Resíduos), permitem ter uma
panorâmica geral da evolução do país.
No último meio século, a expansão das redes de distribuição pública foi notável e, em 2006,
cerca de 91% da população em Portugal Continental era já coberta (INSAAR, 2008), como se
pode observar através Figura 2.2.
Figura 2.2 – População servida por sistema público de distribuição de água, por concelho,
em 2002 (esquerda) e 2006 (direita). Adaptado de INSAAR, 2008.
Até 1993, a responsabilidade da exploração dos serviços de água e de águas residuais era um
exclusivo da administração local (municípios). O Decreto-Lei nº. 372/93, de 5 de Novembro, veio
permitir o acesso de capitais privados ao sector (Marques, 2006), tendo sido nesse mesmo ano
formada a empresa AdP (Águas de Portugal), que tem, tal como se pode observar na Figura 2.3,
presença em grande parte do território nacional.
Com a abertura do mercado, os modelos de gestão do abastecimento em baixa multiplicaram-se
(Figura 2.4), tendo o IRAR sido criado em 1997 para suprir as necessidades de regulação no
sector. No abastecimento em alta, esta reforma teve ainda profundas implicações a vários níveis,
designadamente, na beneficiação e na construção de infra-estruturas, na melhoria da qualidade
geral da água e, consequentemente, no aumento substancial dos custos por m3, que se verificou
em muitos sistemas.
8
Figura 2.3 – Presença da AdP em Portugal – Sistemas de abastecimento e drenagem.
Adaptado de AdP, 2008.
Figura 2.4 – População abrangida pelas diferentes modelos de gestão do serviço de
abastecimento público de água em “baixa”. Adaptado de IRAR, 2006.
9
Com o PEAASAR II (segunda versão do Plano Estratégico de Abastecimento de Água e
Saneamento de Águas Residuais, de 2007 a 2013), definem-se as linhas orientadoras para o
sector da água até 2013. Embora este documento tenha sido bastante criticado por alguns
grupos de opinião, contém aquelas que serão as premissas do futuro próximo, designadamente
(Ministério do Ambiente, do Ordenamento do Território e do Desenvolvimento Regional, 2006):
• A universalidade, a continuidade e a qualidade do serviço;
• A sustentabilidade do sector; e
• A protecção dos valores ambientais.
Estas premissas serão suportadas nos seguintes objectivos operacionais:
• Servir cerca de 95% da população total do País com sistemas públicos de
abastecimento de água;
• Servir cerca de 90% da população total do País com sistemas públicos de saneamento
de águas residuais urbanas, sendo que em cada sistema integrado o nível de
atendimento desejável deve ser de, pelo menos, 70% da população abrangida;
• Garantir a recuperação integral dos custos incorridos dos serviços;
• Contribuir para a dinamização do tecido empresarial privado nacional e local; e
• Cumprir os objectivos decorrentes do normativo nacional e comunitário de protecção do
ambiente e saúde pública.
11
3. A avaliação de roturas em sistemas de abastecimento de água
3.1 O desafio do controlo de perdas Face às alterações verificadas nos últimos anos tanto na gestão do sector das águas, como na
percepção social do custo da água, as perdas assumem uma relevância maior que nunca, pelo
que cada vez mais as entidades gestoras investem no seu controlo e diminuição. Vários factores
podem contribuir para esta posição, no entanto, daqueles que se poderiam referir, destacam-se
os seguintes:
• O custo elevado de produção e/ou aquisição da água;
• A escassez dos recursos hídricos, que se reflecte em questões de quantidade e
qualidade da água captada;
• A taxa de recursos hídricos;
• A pressão social no sentido da sustentabilidade e uso racional dos recursos;
• Requisitos legais.
Na Figura 3.1 apresenta-se um gráfico, compilado no âmbito do INSAAR, que ilustra algumas
preocupações de entidades gestoras (EG) em Portugal.
Figura 3.1 – Motivos ambientais e de escassez apresentados em 2006 para justificar a
adopção de medidas em serviços de abastecimento de água. Adaptado de INSAAR, 2008.
12
Por um lado, as políticas definidas pelo Governo as orientações do Regulador (IRAR) exigem
cada vez mais e melhor serviço de abastecimento de água, designadamente, através de critérios
mais exigentes de qualidade da água e de serviço, que acarretam custos adicionais que só
parcialmente poderão ser compensados por ganhos de eficiência. Por outro, para garantir a
qualidade da água e a continuidade do serviço, muitos dos sistemas de abastecimento em
“baixa” tiveram que aderir a sistemas em “alta”, cuja respectiva sustentabilidade económica exige
elevadas tarifas para aquisição de água em “alta”, que passaram a constituir uma parcela muito
significativa dos custos da actividade, quando comparada com aquela que constituíam os custos
de utilização de captações próprias.O reforço na competitividade no sector, também fomentada
pelos PEAASAR, contribui, por sua vez, para que as entidades gestoras privadas reduzam as
margens de lucro. De facto, a revisão das tarifas praticadas que está a ter lugar terá que ser
continuada no futuro, designadamente convergindo para uma situação em que a tarifa assegure
a integral cobertura dos custos de produção e tenha em conta custos de escassez e ambientais
(Serra, 2006). O aumento das tarifas de água praticadas em “alta”, que subiu em média mais de
20% nos últimos quatro anos, assim como os dados disponibilizados pelo IRAR (ver Figura 3.2),
mostram que o processo de revisão dos tarifários está longe de estabilizar.
Figura 3.2 – Tarifa média de abastecimento [€/m3] por concelho, em 2004, para um
consumo anual de 120 m3. Adaptado de IRAR, 2006.
13
À medida que a tensão sobre os recursos hídricos aumenta devido a múltiplos factores, as
entidades gestoras podem ser obrigadas a actuar não apenas por razões económicas, mas para
assegurar níveis adequados de serviço às populações, sendo a redução de perdas uma das
medidas preferidas (Figura 3.3) e, possivelmente, uma das mais sustentáveis a médio prazo.
Paralelamente, medidas de controlo de perdas, no sentido lato, podem ser adoptadas por razões
da própria imagem e consciência ambiental da entidade gestora e/ou por imposição regulatória.
Figura 3.3 – Medidas adoptadas em 2006 por motivos ambientais e de escassez em
serviços de abastecimento de água. Adaptado de INSAAR, 2008.
Finalmente, é comummente reconhecido que as perdas estão relacionadas com a degradação
dos sistemas. Assim, no futuro, não só é de esperar um aumento da pressão económica, social,
ambiental e legislativa sobre as entidades gestoras, mas os próprios sistemas, na sua maior
parte com idade inferior a meio século, terão tendência para se apresentarem cada vez mais
degradados, exigindo mais intervenções de beneficiação e reparação. Na Figura 3.4 ilustra-se a
evidência deste fenómeno, na medida em que o investimento no abastecimento de água está
bastante concentrado no passado recente e, portanto, a maior parte dos sistemas ainda não
atingiu pontos críticos de degradação.
14
Figura 3.4 – Investimento realizado (excepto em barragens). Abastecimento de água –
Continente – 1987 a 2006. Adaptado de INSAAR, 2008.
3.2 Campos de acção na redução de perdas As perdas, definidas como a diferença entre a água entrada no sistema e o consumo autorizado
(Alegre, et al., 2004), podem ser devidas a várias causas, como se pode observar através do
esquema do balanço hídrico num sistema de abastecimento apresentado no Quadro 3.1.
Quadro 3.1 – Balanço hídrico em sistemas de abastecimento de água. Adaptado de Alegre et al, 2006.
Água entrada no sistema
Consumo autorizado
Consumo autorizado facturado
Consumo facturado medido (incluindo água exportada Água facturada
Consumo facturado não medido
Consumo autorizado não
facturado
Consumo não facturado medido
Água não facturada (Perdas Comerciais)
Consumo não facturado não medido
Perdas de água
Perdas aparentes Uso não autorizado
Erros de medição
Perdas reais
Fugas nas condutas de adução e /ou distribuição
Fugas e extravasamentos nos reservatórios de adução e /ou
distribuição
Fugas nos ramais (a montante do ponto de medição)
Para interpretar correctamente este quadro é conveniente definir os conceitos de perdas reais e
aparentes. Assim, segundo Alegre et al., 2004:
15
• Perdas reais correspondem a perdas físicas de água do sistema em pressão, até ao
contador do cliente, durante o período de referência. O volume de perdas através de
todos os tipos de fissuras, roturas e extravasamentos depende da frequência, do caudal
e da duração média de cada fuga.
• O conceito de perdas aparentes contabiliza todos os tipos de imprecisões associadas às
medições da água produzida e da água consumida, e ainda o consumo não-autorizado
(por furto ou uso ilícito).
De acordo com estas definições fica claro que o volume efectivo de perdas totais (diferentes das
perdas comerciais, uma vez que não incluem nenhuma parcela de consumos autorizados) deve
ser encarado em dois planos bastante diferentes. Apesar de, para as entidades gestoras, fazer
sentido reduzir, tanto perdas reais, como perdas comerciais, as estratégias para o conseguir são,
regra geral, independentes.
As perdas comerciais são vulgarmente controladas através da expansão, substituição e
calibração dos parques de contadores e da monitorização de caudais para procura de
consumidores ilícitos. As perdas reais são perdas “físicas”, podendo ocorrer por todo o sistema
de abastecimento, desde a captação até ao utilizador final. Na generalidade dos sistemas, é nas
condutas de distribuição e nos ramais que os volumes perdidos são maiores, tanto devido à
extensão como à dificuldade de monitorização destas infra-estruturas.
Na prevenção das perdas reais seguem-se metodologias activas e metodologias reactivas. As
metodologias reactivas respondem a fugas na rede, incidindo na sua detecção e correcção,
podendo ter resultados bastante rápidos, pelo que são naturalmente apelativas para as entidades
gestoras. As metodologias activas prevêem uma actuação orientada para a prevenção das
roturas ao nível do planeamento e da renovação das infra-estruturas, sendo tradicionalmente
levadas a cabo em períodos alargados.
A primeira metodologia baseia-se na detecção de pontos de perda existentes nas redes,
designadamente roturas, sendo apoiada em várias tecnologias tais como a monitorização de
caudais em tempo real em ZMC (Zonas de Medição e Controlo) e equipamentos de detecção
activa de fugas como pré-localizadores, correladores acústicos e geófonos. A segunda
metodologia actua numa vertente de prevenção das fugas antes de estas terem lugar e engloba
a substituição de tubagens degradadas e o controlo de pressão nas redes.
3.3 Áreas de interesse prioritário na redução de perdas Tal como foi referido no ponto anterior, as perdas podem ser aparentes ou reais. No campo das
perdas aparentes, especialmente quando se trata de usos ilícitos ou roubos, a entidade gestora
só pode ir até certo ponto, sendo um processo difícil e moroso, na prática inviável de realizar,
procurar todos os pontos de consumo não autorizado. Uma tecnologia que poderá contribuir para
a diminuição deste problema é a telemedição de caudais junto dos pontos de consumo, que
apesar de hoje ser uma tecnologia cara, poderá ser mais acessível no futuro.
16
As perdas reais, representando vulgarmente a maior fatia das perdas em termos de volume, são
um tema mais promissor. Por um lado, a evolução de tecnologias para acções reactivas tem sido
uma constante, sendo que os equipamentos utilizados para detecção activa de fugas são cada
vez mais acessíveis, eficazes e de fácil utilização. Da mesma forma, também ferramentas da
maior utilidade, tais como sistemas com caudalímetros ligados por via remota a centrais de
monitorização e controlo são mais fiáveis e baratos. O recurso a ferramentas de modelação em
conjunto com equipamentos que possibilitem o controlo de pressões sem afectar a qualidade de
serviço é outra abordagem a ter em conta. Não obstante, como se refere no primeiro capítulo,
embora os efeitos da degradação das redes possam ser mitigados, não podem ser impedidos e,
como tal, mais tarde ou mais cedo, faz sentido do ponto de vista económico, social e ambiental
proceder à renovação das infra-estruturas mais degradadas.
Em virtude das avultadas somas envolvidas na renovação das redes de distribuição, este é um
processo que merece grande planeamento e reflexão, o que por muitas vezes não acontece.
Sendo um fenómeno que se estende no tempo, muitas vezes não é percepcionado pelos
decisores quão importante é a delineação adequada da estratégia de renovação. O IRAR indica
1,0 a 2,0% ao ano como intervalo de referência para a taxa de reabilitação das condutas
correspondente a um bom desempenho (IRAR, 2006), no entanto, a taxa optimizada poderá não
se situar neste intervalo, dependendo do caso específico, e continuam por definir quais os
critérios para a selecção das tubagens a beneficiar. Esta problemática, tema central da Gestão
de Activos (GA, também designada gestão patrimonial de infra-estruturas), tem sido alvo de
interesse por parte da comunidade científica, de que são exemplo os casos do projecto
comunitário CARE-W (Computer Aided REhabilitation of Water Networks) ou a plataforma
WSSTP (Water Supply and Sanitation Technology Platform).
3.4 Enquadramento do presente trabalho Este trabalho, cujo objectivo passa por relacionar algumas variáveis explicativas com a
degradação dos sistemas de distribuição, pode auxiliar a tarefa de diagnóstico de áreas para
implementação de estratégias reactivas quando a medição directa não é possível e, para além
disso, prever o desempenho futuro da rede, auxiliando o planeamento de intervenções activas.
Numa perspectiva mais geral, regista-se que um enquadramento adequado deste fenómeno
constitui uma ferramenta bastante útil no âmbito da GA, permitindo prever níveis de serviço,
avaliar riscos e fazer projecções de custos futuros de forma acessível, fiável e, sobretudo,
próxima da realidade.
Fugas e roturas são duas faces da degradação dos sistemas de distribuição de água e, embora
estejam intrinsecamente relacionadas, não correspondem ao mesmo fenómeno. Não obstante,
ao aumento da magnitude e do número das roturas corresponde normalmente um aumento das
fugas, pelo que ambas constituem bons indicadores do estado de conservação dos sistemas de
distribuição. Como tal, entende-se que o esforço que se desenvolve para a modelação de roturas
se poderá reflectir directamente na redução dos volumes de fugas.
17
Quanto ao balanço hídrico, a metodologia desenvolvida para modelação de fugas em condutas
de distribuição pode ser aplicada sem alterações substanciais à modelação das fugas nas
condutas de adução e nos ramais (Quadro 3.2).
Quadro 3.2 – Balanço hídrico em sistemas de abastecimento de água. Adaptado de Alegre
et al, 2004. Áreas de aplicação do presente estudo.
Água entrada no sistema
Consumo autorizado
Consumo autorizado facturado
Consumo facturado medido (incluindo água exportada Água facturada
Consumo facturado não medido
Consumo autorizado não
facturado
Consumo não facturado medido
Água não facturada (Perdas Comerciais)
Consumo não facturado não medido
Perdas de água
Perdas aparentes Uso não autorizado
Erros de medição
Perdas reais
Fugas nas condutas de adução e /ou distribuição
Fugas e extravasamentos nos reservatórios de adução e /ou
distribuição
Fugas nos ramais (a montante do ponto de medição)
As variáveis que normalmente se considera terem influência no fenómeno das roturas são
múltiplas e de naturezas diferentes. Podem ser relacionadas com a tubagem utilizada, com a
instalação e a concepção dos sistemas, com a operação e, finalmente, podem corresponder a
variáveis externas e de mais difícil controlo. No Quadro 3.3 faz-se uma síntese das variáveis
mais importantes.
Quadro 3.3 – Variáveis relacionadas com o aparecimento de roturas em sistemas de distribuição de água.
Tubagem Instalação Operação Externas
Idade Material
Classe de pressão Diâmetro Extensão
Qualidade de execução da obra
Número de acessórios
Número de ramais
Pressão média Variações de pressão
Turbulência e velocidade média do escoamento
Tipo de solo Propriedades
bioquímicas da água Nível freático
Temperatura média Variações térmicas
Cargas externas Acidentes naturais
Acidentes provocados
Muitas das ferramentas utilizadas para fazer este tipo de análise são criticadas por demasiada
complexidade e dificuldades de implementação em situações práticas. Por necessitar de dados
de que as entidades gestoras não dispõem e limitando a análise a determinado conjunto de
18
variáveis explicativas, o processo de GA acaba muitas vezes por não ser levado do início ao fim
sem uma componente empírica demasiado “pesada”. Assim, é importante que o método
proposto seja versátil, permitindo a obtenção de resultados aceitáveis com diferentes conjuntos
de variáveis.
Neste sentido, o presente trabalho explora a utilização das RNA para o modelação da
degradação dos sistemas de distribuição devido à facilidade de implementação, à robustez e à
plasticidade desta ferramenta computacional.
3.5 Campos de aplicação – Gestão estratégica de activos e identificação de zonas de intervenção prioritária
Como já foi referido, antevêem-se duas aplicações potenciais para a metodologia utilizada no
presente estudo. Um será a integração em modelos de GA, o outro1 a selecção de zonas das
redes em que são mais produtivas intervenções imediatas, tanto ao nível de beneficiação, como
ao nível de detecção activa de fugas.
Segundo Alegre, 2007, a GA pode ser definida como:
Gestão patrimonial de infra-estruturas2 é o conjunto da estratégia da organização e das
actividades e das práticas sistemáticas e coordenadas correspondentes, através das quais a
organização gere as suas infra-estruturas de modo racional, garantindo o equilíbrio entre o
desempenho, o custo e o risco que lhes estão associados durante o ciclo de vida dos activos que
a compõem.
Este equilíbrio requer a existência de competências em três pilares fundamentais: gestão,
engenharia e informação.
A gestão patrimonial de infra-estruturas deve ser planeada a um nível estratégico, a um nível
táctico e a um nível operacional.
Desta definição resulta que a GA, aplicada ao sector do abastecimento de água, é um campo
vasto, que explícita ou implicitamente engloba quase na totalidade as várias vertentes da
actividade. Assim, estabelecer um programa de GA é bastante complexo, mas uma vez que,
para que esse programa tenha efeitos positivos, a actuação da entidade competente deve
manter-se coerente no médio e longo prazo, é crítico que, de início, os problemas sejam
correctamente definidos e as estratégias bem delineadas. Caso isso não aconteça, poderá
1 Embora as intervenções imediatas, de um nível táctico, também possam ser inseridas no âmbito da GA, aqui optou-se por as destacar, pois são frequentemente levadas a cabo mesmo na ausência de um programa de GA. 2 Neste documento utilizam-se os termos GA (Gestão de Activos) e gestão patrimonial de infra-estruturas como sinónimos. Não obstante se utilize principalmente o termo GA, neste caso específico optou-se pela designação alternativa porque a autora da citação defende essa terminologia.
19
suceder que, vítima de mudanças de rumo recorrentes, o programa de GA seja descaracterizado
e os resultados operacionais se fiquem aquém dos esperados.
Nesse sentido, embora seja recomendado que uma organização não espere por ter informação
credível sobre todos os aspectos envolvidos para pôr em prática uma abordagem de GA (Alegre,
2007), é aconselhável que, tão cedo quanto possível, essa abordagem evolua.
A gestão, e especialmente gestão a médio e longo prazo, como deverá necessariamente ser a
gestão de infra-estruturas cujos componentes principais têm uma vida útil de 50 ou 100 anos,
exige planeamento e, consequentemente, projecção do futuro. O processo de projecção pode ser
mais ou menos detalhado, tendo ambas as abordagens vantagens e inconvenientes. Uma
projecção pouco detalhada, geralmente apoiada na experiência e no bom senso dos decisores,
apresenta geralmente resultados aceitáveis, embora limitados. Pelo outro lado, uma projecção
muito detalhada pode ser difícil e cara de conseguir, podendo, no entanto, dar resultados com
grande fiabilidade quando adequadamente aplicada.
A utilização das RNA visa atingir um equilíbrio adequado na projecção da evolução das redes,
sendo o número e o tipo de parâmetros facilmente alterado sem ser necessário modificar a
estrutura do modelo, de acordo com a informação disponível.
Uma implementação correcta de um modelo de RNA pode contribuir para a avaliação de riscos,
para a determinação da manutenção necessária e para a determinação das prioridades de
reabilitação, respondendo paralelamente a algumas questões-chave da GA em sistemas de
abastecimento:
• Em que circunstâncias ocorrem falhas?
• Qual a probabilidade de falha?
Para além desta utilização, de um nível estratégico, pode considerar-se a utilização ao nível mais
táctico, de selecção das zonas das redes em que são mais produtivas intervenções imediatas,
quer ao nível de beneficiação, quer ao nível de detecção activa de fugas. Este tipo de decisão,
apoiada na análise indirecta da rede (por via das RNA), fará mais sentido quando equipamentos
de medição de caudais forem poucos ou inexistentes, pese o facto de que, tendo o fenómeno
das roturas uma forte componente aleatória, medições actuais podem não ser representativas de
comportamentos futuros.
3.6 Perspectivas e desafios Sendo o abastecimento de água um sector com grandes desafios de mudança, pensa-se, pelas
razões já expostas, que o combate às perdas será, cada vez mais, uma preocupação das
entidades gestoras. Dado que este combate é levado a cabo em várias frentes, estratégicas
tácticas e operacionais, é possível vislumbrar várias linhas de investigação com grande potencial.
Uma vez que a detecção activa de fugas é um campo bastante técnico, em que as evoluções se
prendem principalmente com melhorias no equipamento disponível, o contributo que um
20
engenheiro civil pode dar para novos desenvolvimentos é algo limitado. Por outro lado, no campo
das medidas activas de planeamento estratégico e táctico, o conhecimento da engenharia civil
pode ser aproveitado com grande utilidade.
Nos encontros nacionais da especialidade, destacam-se comunicações com ênfase em
campanhas de detecção activa de fugas, regulação de pressões na rede como medida de
redução de perdas (Araujo, et al., 2006) (Dias, et al., 2006) (Gomes, et al., 2008) e aplicação de
modelos de GA, tais como o CARE-W ou o modelo integrado da EPAL (Alegre, et al., 2004)
(Marques, et al., 2004) (Franco, et al., 2008) (Luís, et al., 2004). Em plataformas internacionais,
tais como a WSSTP, dá-se bastante relevância à GA, sendo analisados variados vectores de
melhoria, incluindo as ferramentas de análise e tratamento de dados (Water Supply and
Sanitation Technology Platform, 2008).
Em Alegre, 2007, é apresentada uma lista extensa de áreas de estudo relacionadas com a GA,
sendo, para cada área, classificado o grau de conhecimento actualmente detido e a relevância
para o LNEC (Laboratório Nacional de Engenharia Civil). Nesta lista destacam-se vários temas
com interesse para investigação. De entre estes, o desenvolvimento de ferramentas de previsão
do desempenho (“Develop predictive tools for performance prediction”) aparece como tendo a
maior relevância no panorama nacional.
Modelos integrados desenvolvidos no passado, de que é exemplo o CARE-W, apresentam
algumas lacunas. No caso da análise da degradação dos sistemas efectuada segundo a
metodologia do CARE-W, o número de parâmetros a introduzir no modelo é limitado, sendo que
grande parte destes são indispensáveis, o que inviabiliza a utilização de todas as potencialidades
do modelo por parte de entidades gestoras que não disponham de informação adequada. Por
outro lado, a análise estatística que é feita baseia-se num modelo de regressão de Poisson, o
que constitui uma assumpção a priori que não corresponde necessariamente à realidade.
Paralelamente, a ferramenta desenvolvida é apenas aplicável a redes de distribuição de águas,
não sendo fácil ao utilizador final utilizar a mesma metodologia para drenagem, por exemplo.
Alternativas à análise estatística, tais como algoritmos genéticos ou a lógica difusa, apresentam
frequentemente bons resultados. No entanto, não sendo modelos de aproximação de funções
per si, acabam por necessitar de um trabalho de preparação exigente, tanto em tempo como em
conhecimentos técnicos.
Não sofrendo estas limitações, pensa-se que o potencial de modelos baseados em RNA, do
género do desenvolvido no presente trabalho é vasto, podendo estes contribuir grandemente
para a melhoria das metodologias de GA.
21
4. Redes neuronais artificiais e algoritmos genéticos
4.1 Aspectos gerais As Redes Neuronais Artificiais, ou RNA, também designadas Redes Neuronais, Modelos
Conexionistas, Processadores Distribuídos em Paralelo ou Neurocomputadores, surgiram em
1943, pelo trabalho de McCulloch e Pitts (Lingireddy, et al., 2005), inspiradas no funcionamento
do cérebro humano. Hoje constituem uma área de interesse da Inteligência Artificial, a par de
métodos como os Algorítmos Genéticos (AG), a Lógica Difusa, Sistemas Simbólicos e outros.
Em linhas gerais, as RNA são modelos computacionais inspirados na biologia, constituídos por
unidades de processamento (nós ou neurónios), ligações entre estas, algoritmos de treino e
algoritmos de activação (Kasabov, 1996).
De acordo com (Haykin, 1999), as RNA podem ser definidas da seguinte forma:
Uma rede neuronal artificial é um processador massivamente distribuído em paralelo constituído
por unidades de processamento simples, que tem a propensão natural para armazenar
conhecimento experimental e torná-lo disponível para ser utilizado. Assemelha-se ao cérebro em
dois aspectos:
1. O conhecimento é adquirido pela rede a partir do meio envolvente através de um
processo de aprendizagem;
2. As intensidades das ligações entre neurónios, conhecidas como pesos sinápticos, são
usadas para armazenar o conhecimento adquirido.
Os AG são um tipo de ferramenta computacional inspirada na selecção natural e na genética.
Sendo quase universais enquanto ferramentas de optimização, oferecem sobre outros métodos a
vantagem de permitirem a análise simultânea de vários vectores durante o processo de busca de
solução óptima. Esta classe de algoritmos de optimização também se destaca pela utilização de
regras probabilísticas, em detrimento de regras determinísticas, o que assegura a robustez da
metodologia (Lingireddy, et al., 2005).
4.2 Razões da aplicação
4.2.1 Redes neuronais artificiais
A degradação dos sistemas de distribuição de água é um fenómeno complexo, em que intervêm
muitas variáveis e cujas inter-relações não são conhecidas em profundidade. Os modelos de
métodos estatísticos, tradicionalmente usados para o estudar, para além de complexos, não têm
atingido o grau de precisão e generalização que seria desejável para a implementação em
22
sistemas de apoio à decisão. Assim, justifica-se a necessidade de procurar novas ferramentas
que possibilitem o estudo integrado e mais eficiente deste problema.
As RNA têm vindo a ser desenvolvidas e aplicadas nos mais diversos campos da ciência para
responder a desafios tão distintos como o processamento de linguagem e imagens, o
reconhecimento de padrões, a classificação de dados, aproximação de funções, optimização,
predição, planeamento, monitorização, diagnóstico e controlo. No que toca à engenharia
hidráulica, as RNA estão também bastante difundidas, tendo sido empregues na previsão de
hidrogramas de cheia, (Pasculescu, 2004), na modelação da qualidade da água (Lingireddy, et
al., 2005) e modelação da degradação estrutural de sistemas de distribuição de água (Jafar, et
al., 2006).
As razões da crescente utilização das RNA em todos estes campos prendem-se, sem dúvida,
com os benefícios que lhes estão associados:
• Aprendizagem – Uma RNA pode ser iniciada “sem conhecimento” e treinada com um
dado conjunto de exemplos (inputs e outputs, no caso de treino supervisionado ou
apenas inputs, no caso de treino não supervisionado); através do treino, as intensidades
das ligações entre neurónios alteram-se de tal forma que a rede aprende a produzir o
resultado desejado para os dados introduzidos;
• Generalização – Se um novo conjunto de dados diferir dos exemplos conhecidos for
introduzido na rede, esta produz o melhor resultado possível com base nos exemplos
usados;
• Paralelismo massivo potencial – No decurso do processamento da informação, vários
neurónios “disparam” simultaneamente;
• Robustez – Se alguns neurónios “falharem”, o sistema pode ainda ter um bom
desempenho;
• Correspondência parcial – Na maior parte dos casos uma correspondência total ao casos
.de exemplo não é necessária.
Estes benefícios, na prática traduzem-se em que as RNA consigam encontrar boas soluções
mesmo com dados sujeitos a ruído, falhas, informações imprecisas ou corrompidas (Kasabov,
1996).
Não obstante os benefícios da aplicação das RNA sejam interessantes, é importante manter
presente que outros métodos também apresentam vantagens e cada um tem uma área de
aplicação preferencial. Na Figura 4.1 apresenta-se um esquema que racionaliza a adopção de
vários métodos de acordo com o conhecimento teórico dos problemas e a quantidade de dados
disponíveis.
Face à quantidade de dados que pode ser armazenada, hoje em dia, graças à evolução dos
Sistemas de Informação Geográfica, ou SIG, entende-se que as RNA podem ser aplicadas com
bastante sucesso à modelação da degradação de sistemas de distribuição de água. Porém,
23
também o poderão ser os métodos estatísticos. Face a estes, as RNA apresentam uma
vantagem substancial que reside no facto de ser desnecessário conhecer qual a relação
funcional entre as variáveis que regem o fenómeno a modelar3 (Lingireddy, et al., 2005) e
(Kasabov, 1996).
Figura 4.1 – Aplicação de diferentes métodos dependendo da disponibilidade de dados e
conhecimento (teoria). Adaptado de (Kasabov, 1996).
4.2.2 Algoritmos genéticos
Vários autores referem as complementaridades entre os AG e as RNA (Mitchell, 1999)
(Lingireddy, et al., 2005). No presente estudo optou-se por introduzir os AG, não como
alternativa, mas como complemento às RNA, procurando optimizar o seu funcionamento,
designadamente ao nível do treino.
Uma vez que os AG, ao contrário das RNA, permitem o processamento de vários vectores de
solução em paralelo, efectuam uma busca bastante mais transversal ao espaço de soluções e,
dessa forma, permitem ultrapassar algumas limitações dos métodos de treino normalmente
associados às RNA. Por outro lado, o carácter geral dos AG permite que sejam utilizados para
orientar a definição da arquitectura das RNA, um processo que normalmente é realizado através
de um procedimento de tentativa e erro.
3 Em alternativa a modelos de regressão convencionais poderão também ser aplicados modelos estatísticos não paramétricos que, tal como as RNA, não implicam o conhecimento prévio de relações funcionais.
24
4.3 Evolução histórica
4.3.1 Redes neuronais artificiais
Pode dizer-se que a história das RNA começou em 1943, pelo trabalho de McCulloch e Pitts, que
conceberam neurónios artificiais como modelos simplificados de neurónios biológicos, tendo
deduzido que, com um número suficiente de unidades, pesos sinápticos correctamente ajustados
e a operar em paralelo, a sua concepção teria capacidade para aproximar qualquer função. No
entanto, o modelo desenvolvido carecia da habilidade de aprender. Em 1949, surgia o livro A
organização do comportamento, em que Donald Hebb estabeleceu o seu famoso postulado em
que afirma que a eficiência de uma sinapse variável entre dois neurónios é aumentada pela
activação repetida de um pelo outro através dessa sinapse. Este resultado, tendo constituído a
primeira tentativa de apresentar uma regra explícita de modificação sináptica, foi bastante
importante nos desenvolvimentos subsequentes das RNA4.
Na sequência da crescente actividade científica em torno desta nova disciplina, Rosenblatt
concebeu o perceptrão, um filtro linear com capacidade de adaptação. Tal como foi estabelecido
no teorema da convergência do perceptrão, esta rede tem a capacidade de encontrar sempre
solução, num número de passos finito, desde que os dados correspondessem a um conjunto
linearmente separável. Mais tarde, Widrow e Hoff, desenvolveram um algoritmo de treino
baseado no erro quadrático médio (EQM) que implementaram na Adaline (Adaptative Linear
Element). Dois anos depois, era proposta por Widrow a Madaline (Multiple-adaline), uma das
primeiras redes neuronais com vários componentes adaptáveis que tinha a capacidade de
aprender. Em 1963, a utilização de estruturas com vários elementos foi reforçada por Winograd e
Cowan, que demonstraram em que medida um número elevado de elementos pode representar
colectivamente um conceito único, com um aumento correspondente de robustez e paralelismo.
Na sequencia destes sucessos, durante a década de sessenta, o progresso das RNA parecia
nada menos que auspicioso e o seu campo de aplicação virtualmente ilimitado. No entanto, em
1969, Minsky e Papert demonstraram matematicamente que há limites fundamentais nas
operações que perceptrões de camada única podem executar e declararam que não havia
razões para assumir que qualquer desses limites pudesse vir a ser ultrapassado na versão
multilinear. Para além disso, as redes multilineares tinham alguns problemas próprios, como o
problema da atribuição de crédito5, abordado por Minsky em 1961.
Assim, durante a década de 70, o estudo e desenvolvimento das RNA foi posto de lado por
muitos investigadores e, não obstante a maior parte dos conceitos e ideias necessários para
4 Em 1956, inspirados neste postulado, Rochester, Holland, Haibt e Duda acabaram por concluir que a inibição é também necessária. 5 “Credit Assignment Problem for Reinforcement Learning Systems”. Face ao elevado número de variáveis, torna-se complicado quantificar a contribuição que cada neurónio que tem para o resultado final. Neste sentido, é difícil seleccionar eficientemente que ligações modificar e em que medida o fazer.
25
ultrapassar os problemas levantados na década de 60 já tivesse sido desenvolvida, as soluções
tardaram em aparecer devido a dificuldades na experimentação e ao efeito desencorajador que
teve a constatação de severas limitações nas redes neuronais, após um período de tão profícuo
desenvolvimento.
No decorrer deste hiato, vários trabalhos contribuíram para o avanço e, finalmente, o “renascer”
das RNA. Destacam-se os mapas topológicos de von der Malsburg (1973), A ART (Adaptive
resonance Theory) de Gossberg (1980), os mapas de Kohonen (1982), a máquina de Boltzmann,
por Ackley, Hinton e Sejnowski (1985) e, especialmente, as redes de Hopfield (1980) que,
embora não constituam modelos realistas dos sistemas neurobiológicos, vieram despertar
implicações profundas na compreensão das RNA (Haykin, 1999). Por outro lado, a utilização de
redes neuronais de camadas múltiplas (perceptrões multicamada ou PMC), implementando
funções de activação não lineares (por exemplo sigmóides ou logísticas, introduzidas em 1967
por Cohen), o modelo aditivo de Grossberg (1967/68) e Amari (1972) e, finalmente, o algoritmo
de retropropagação, publicado em 1986 por Rumelhart, Hinton e Williams6 permitiu ultrapassar
as limitações assinaladas por Minsky.
Apesar dos PMC serem, ainda hoje, a RNA mais utilizada devido à sua eficiência e concepção
simples, a partir da década de oitenta grandes progressos têm sido feitos no campo da
inteligência artificial e, em particular, das RNA. Em 1988 Broomhead e Lowe introduziram as
RBR (Redes de base radial ou, em inglês, Radial Basis Functions), que constituem uma
alternativa aos PMC e, no início dos anos noventa, Vapnik e diversos colaboradores inventaram
as máquinas de apoio vectorial.
4.3.2 Algoritmos genéticos
Pode dizer-se que o desenvolvimento dos algoritmos genéticos teve início das décadas de 50 e
60, quando os processos evolutivos que se verificam na natureza serviram de inspiração à
criação de métodos de optimização.
Apesar de se terem desenvolvido vários trabalhos baseados nas teorias evolutivas a partir de
1954, foi só com as estratégias evolutivas, implementadas por Rechenberg (1965, 1973) para
optimizar parâmetros de mecanismos como aerofólios7, que a evolução artificial ganhou
notoriedade.
Fogel, Owens e Walsh (1966), desenvolveram uma abordagem alternativa conhecida como
programação evolucionária, em que soluções candidatas para determinadas tarefas são
6 Não obstante a importantíssima contribuição de Rumelhart, Hinton e Williamns, a autoria do algoritmo deve ser partilhada com Werbos (1974), Bryson e Ho (1969), Parker (1985) e LeCun (1985) (Haykin, 1999). 7 Um aerofólio (ou fólio) é uma secção bidimensional, projectada para provocar variação na direcção da velocidade de um fluido. No caso de Rechenberg, a asa de um avião.
26
representadas como máquinas de estados finitos que evoluem através de mutações e processos
de selecção das que demonstram maior aptidão.
Os Algoritmos Genéticos, AG, propriamente ditos foram concebidos por John Holland na
Universidade do Michigan nas décadas de 60 e 70. Ao contrário das estratégias evolutivas e da
programação evolucionária, os AG não foram desenvolvidos para encontrar soluções para
problemas reais, mas como um método formal para estudar os fenómenos da adaptação e tentar
reproduzi-los em sistemas informáticos. O trabalho de Holland, que se destacou dos anteriores
por incorporar, não só a mutação, mas também o cruzamento entre indivíduos e a inversão8, foi,
para além disso, o primeiro a ser enquadrado numa base teórica firme.
Com o desenvolvimento das várias teorias evolutivas, motivado pela capacidade que
demonstram como ferramentas de optimização e o aumento dramático da capacidade do
hardware disponível, as diferenças entre as estratégias evolutivas, a programação evolucionária,
e os AG foram-se esbatendo e, actualmente, é comum designar a generalidade das teorias
evolutivas por Algoritmos Genéticos.
4.4 Princípios e descrição das redes neuronais artificiais
4.4.1 Princípios de funcionamento e convenções
As RNA são processadores paralelos constituídos por unidades de processamento denominadas
neurónios ou nós, ligações entre estes, constantes (bias), funções de aptidão (fitness functions) e
algoritmos de treino. Na prática, as RNA são redes de nós e respectivas ligações, que
armazenam informação de forma implícita na topologia e nos pesos das ligações e têm a
capacidade de se ajustar.
Dependendo da sua configuração, as RNA podem ter a capacidade de aproximar funções
dinâmicas, reconhecendo tanto padrões espaciais (feed-forward nets) como espaciais e
temporais (redes recorrentes ou feedback nets), aprender sem qualquer tipo de supervisão (por
exemplo, mapas auto-organizáveis), ou funcionar como aproximadores universais (PMC e RBF).
Uma vez definida a topologia (numero de camadas e distribuição de nós e ligações), uma matriz
de dados (ℝ�) é utilizada para treinar a RNA. No caso de o treino ser supervisionado, os pesos
das ligações da rede são alterados no sentido de minorar a diferença entre os outputs da rede e
os alvos (ℝ�) através de um algoritmo de treino. Para modificar uma rede previamente treinada
podem ser utilizados algoritmos de adaptação, bastante semelhantes às de treino.
Na Figura 4.2 ilustra-se um exemplo de uma RNA simples – PMC, ℝ� → ℝ. Como se pode
observar para o caso do PMC, as RNA são constituídas por uma camada de inputs que tem a
8 Baseada na inversão cromossómica; processo pelo qual um segmento de um cromossoma se “desliga” e sofre uma inversão de 180º antes de se voltar a “ligar” à cadeia.
27
dimensão do vector de dados e cujos nós, na prática, assumem os valores desses dados.
Seguem-se as camadas ocultas (hidden layers), denominadas assim porque os seus nós não
têm contacto directo com o “exterior”. Finalmente, após determinado número de camadas
ocultas, coloca-se a camada de outputs. Os valores dos nós desta última camada são a resposta
da RNA aos dados introduzidos.
Figura 4.2 – Ilustração de um perceptão multicamada.
As ligações têm como única propriedade o seu “peso”, o qual é multiplicado pelo nível de
activação do nó a montante para produzir a contribuição para o nó a jusante. No caso de o peso
ser um valor positivo, a ligação é denominada excitatória, sendo, no caso oposto, considerada
inibitória. Apesar de tal não estar representado na Figura 4.2, é comum ligar um nó fictício com
nível da activação sempre igual a um a cada nó da rede (exceptuando os da camada de inputs).
Na prática, estes nós adicionais funcionam como constantes, pois os pesos das suas ligações
são também sujeitos ao processo de treino.
O nó é a unidade base de uma RNA. Como tal, é necessário conhece-lo para compreender o
funcionamento da totalidade da rede. Na Figura 4.3 sintetiza-se o funcionamento de um nó
genérico em que fi, fa, e fo correspondem às funções de transformação que podem ocorrer no
interior. O nó apresentado recebe ligações de três nós a montante e está ligado a três nós para
jusante.
28
Figura 4.3 – Modelo de um nó de uma RNA.
Tal como referido anteriormente, as operações que se realizam dentro do nó de uma RNA
podem ser três:
• Função de input (fi) – No caso mais comum corresponde ao somatório dos inputs num
único valor real, mas outras concepções, tais como o piatório, também podem ser
aplicadas;
• Função de activação (fa) – Esta função faz corresponder o resultado da função de inputs
a um nível de activação do nó, variando normalmente entre -1 e 1 ou entre 0 e 1;
• Função de output (fo) – Aplica-se a função de output para produzir um sinal a partir do
nível de activação do nó. Na maioria dos casos esta função não é utilizada, pois o que é
transmitido é simplesmente o nível de activação.
Para clarificar as análises feitas, é conveniente estabelecer algumas convenções.
Nomeadamente, é necessário identificar o significado dos índices aplicados a nós, constantes e
ligações. Na Figura 4.4 criou-se um esquema ilustrativo para o caso do PMC, escolhido por ser a
rede eleita para este trabalho e devido ao seu carácter simples.
29
Figura 4.4 – Convenções adoptadas para descrever as redes (exemplo de um PMC).
A rede apresentada tem uma camada de inputs com 3 nós, ��, a que se segue uma camada
oculta, j, e uma camada de output, j+1. Ao contrário dos nós da camada de inputs, os nós das
camadas seguintes são identificados através de dois índices ���, o superior indicando a
designação da camada em que se inserem e o inferior indicando a ordem do nó. As ligações, por
seu turno, têm que ser identificadas através de três índices, �� , em que o índice superior se
refere à camada para que se dirigem e os índices inferiores à ordem do nó de partida e do nó de
chegada, respectivamente. Finalmente, as constantes, ���, por se associarem individualmente a
cada nó (excluindo os de input), são identificadas tal como estes.
Tendo em consideração que a RNA pode ter um número arbitrário de camadas, que cada
camada pode ter um número arbitrário de nós e que as ligações são feitas num único sentido,
esta convenção retrata bem um PMC. Caso se queira alargar estas convenções para outras
redes podem utilizar-se os mesmos princípios mas adicionando mais um índice para identificar
ligações pois, no caso geral, estas podem existir no interior da mesma camada, para uma
camada “anterior” ou qualquer outra. Nas restantes representações, omitem-se as setas
indicadoras da direcção do fluxo, admitindo-se que este se processa da camada de inputs para a
camada de outputs, tal como se omite a representação das constantes.
O treino é porventura o tópico mais complexo da utilização das RNA. Apesar desta complexidade
variar bastante de acordo com o tipo de rede e também, em alguma medida, com o problema em
estudo, utilizar o processo de treino adequado pode fazer grande diferença nos resultados finais.
Embora nalguns modelos de redes, tais como o Perceptrão e a generalidade dos filtros lineares,
o processo de treino seja relativamente directo uma vez que os parâmetros dos algoritmos de
30
treino são poucos, em grande parte das concepções de redes e especialmente nas não lineares,
os processos de treino são mais complexos.
Quanto ao modo de treino, as RNA dividem-se, como já referido, em supervisionadas e não
supervisionadas, referindo-se este termo à necessidade de registos de valores reais. É na
primeira categoria que se insere o PMC, objecto deste trabalho. No caso particular desta rede, o
processo de minimização do erro mais utilizado é a retropropagação (e respectivas adaptações).
A retropropagação pode ser aplicada de duas formas, a determinística (batch learning) e a
estocástica (incremental learning). Para clarificar estes conceitos é conveniente introduzir as
noções de padrão de treino e de época. Para este efeito, atenda-se a que as RNA são, no fundo,
funções ℝ� → ℝ�, ou seja, introduzindo-se na rede um vector � = ��� … ���, esta produz um
vector � = ��� … ���. Seja o objectivo classificar os vectores ou aproximar uma função, o
treino por supervisão consiste em fornecer à rede uma série de � padrões (�) e respectivas
observações (�), a partir dos quais a rede se ajusta para diminuir uma determinada função de
custo [1].
���� ⋯ ���⋮ ⋱ ⋮��� ⋯ ���� ��� �� �!"#$$$$$$$$% & ��� ⋯ ���⋮ ⋱ ⋮��� ⋯ ���' ≈ & )�� ⋯ )��⋮ ⋱ ⋮)�� ⋯ )��' [1]
No caso do modo estocástico, fornece-se à rede um padrão, comparando-se o resultado obtido
com o resultado desejado. De acordo com a função custo, os pesos da rede são reajustados no
sentido da diminuição do erro. Seguidamente, apresenta-se o próximo padrão à rede, repetindo-
se o processo.
Na generalidade dos casos, o número de padrões que constituem o grupo de treino é limitado,
pelo que é comum apresente o grupo de treino à rede mais de uma vez para que a rede se
adapte convenientemente. A uma passagem de todos os vectores do grupo de treino dá-se o
nome de época. O modo determinístico consiste em apresentar uma época de padrões à rede
promovendo-se apenas alterações nos pesos sinápticos entre épocas a partir do erro global
calculado ao invés de o fazer entre padrões.
Independentemente do modo de treino, existem limitações na retropropagação, pelo que devem
ser seguidas “boas práticas” para obter resultados consistentes e suficientemente aproximados
da solução ideal.
Seguidamente aborda-se o paralelismo com o funcionamento dos sistemas neuronais biológicos
e descrevem-se vários modelos de RNA, partindo dos mais simples para os mais complexos de
forma a possibilitar ao leitor uma melhor compreensão do tema.
31
4.4.2 Paralelismo com os sistemas biológicos
As RNA não são apenas uma ferramenta inspirada num modelo natural, são, para além disso,
uma ferramenta orientada para auxiliar o estudo do cérebro ao nível subsimbólico. Assim, esta é
uma temática pluridisciplinar, em que psicólogos, neurologistas, matemáticos, informáticos e
engenheiros tomam parte activa. Neste enquadramento, pensa-se que conhecer, ainda que
superficialmente, a relação de paralelismo entre as redes neuronais artificiais e biológicas é uma
valência importante para o utilizador das RNA.
Os neurónios, tal como estabeleceu Santiago Ramón y Cajal, são as células que constituem a
unidade base do sistema nervoso. São compostos pelo corpo celular (ou soma), árvore
dendrítica e axónio. Na Figura 4.5 apresenta-se o diagrama completo de um neurónio9.
Figura 4.5 – Diagrama de um neurónio (fonte: Wikipedia, por Mariana Ruiz Villarreal)
O sistema nervoso humano é composto por cerca de dez mil milhões de neurónios, podendo
cada neurónio estabelecer ligações sinápticas com cerca de 10 000 outras células (Haykin,
1999).
9 Note-se que existem tipos diferentes de neurónios. Não obstante, o diagrama contém as características gerais destas células.
32
No caso mais comum, os estímulos nervosos são recebidos através das dendritres e do corpo
celular, enquanto a emissão de sinais é predominantemente feita através dos axónios. Uma vez
que cada neurónio é envolvido por uma membrana que o isola dos restantes, a comunicação
processa-se por via eléctrica e por via química por intermédio de substâncias denominadas
neurotransmissores. Face ao estímulo, a membrana polarizada no neurónio pode propagar sinais
eléctricos que resultam na segregação dos neurotransmissores, que atravessam a ligação
sináptica e se ligam à célula seguinte da cadeia.
Quando, em 1943, McCulloch e Pitts conceberam o seu modelo computacional e lançaram as
fundações das RNA pretendiam construir um modelo digital do neurónio biológico. Na primeira
vaga de interesse pelas RNA, os resultados obtidos, não só por McCulloch e Pitts, mas também
por outros cientistas, acompanhados por progressos na área da neurologia, estimularam a
percepção das RNA como objectos de estudo para compreensão do sistema nervoso.
Paralelamente, alguns pioneiros no desenvolvimento da inteligência artificial depositaram
esperanças nas RNA, razões pelas quais a biologia acabou por ter uma grande influência no seu
desenvolvimento. Só posteriormente, quando se comprovou o interesse prático destes modelos
para a resolução de problemas concretos, se vislumbraram aplicações à engenharia.
Assim, as RNA retêm muitas características dos sistemas biológicos. Tal como nestes, o
processamento de informação é conseguido através de múltiplas unidades básicas funcionando
em paralelo, cada unidade recebendo e efectuando várias ligações, com as unidades de
processamento a realizar apenas operações simples, armazenando o “conhecimento” na
estrutura da própria rede e os processos de reforço e inibição do “peso” das ligações a obedecer
a lógicas semelhantes.
Apesar das RNA demonstrarem potencialidades interessantes, o sistema nervoso é uma rede de
complexidade admirável, incomparavelmente superior às RNA modernas sob todos os pontos de
vista. As construções mentais derivam do processamento de informação a vários níveis, desde
interacções moleculares até circuitos inter-regionais e ao próprio sistema nervoso central. Tal
como os neurónios artificiais são básicos quando comparados com os biológicos, também as
RNA são básicas quando comparadas com os circuitos locais encontrados no cérebro (Haykin,
1999). Na Figura 4.6 são apreciáveis as diferenças.
33
Figura 4.6 – Contraste entre redes neuronais artificiais e biológicas. À esquerda, um
pormenor microscópico do sistema nervoso de um rato e, à direita, uma RNA utilizada no
Jet Propulsion Laboratory, NASA.
4.4.3 Modelos de redes neuronais artificiais
Perceptrão
O perceptrão é a forma mais simples de RNA utilizada para a classificação de padrões
considerados linearmente separáveis (padrões que residem em lados opostos de um hiperplano)
(Haykin, 1999).
Esta RNA, apresentada na Figura 4.7, é constituída por um único nó com pesos sinápticos (ou
ligações) e constantes ajustáveis. A computação do valor introduzido no nó de output é realizada
multiplicado o valor de cada input, ��, pelo peso da respectiva ligação ao nó de output, ��� , o que
resulta na expressão [2], em que ν representa o valor do campo local induzido (número real que
é transformado em ���). O esquema do nó utilizado por Rosenblatt foi o proposto por McCulloch e
Pitts.
Figura 4.7 – Representação esquemática do perceptrão.
34
*�� = , � ����-� ∙ �� [2]
Devido às propriedade do perceptrão, o resultado fornecido pela rede, y, é binário, assumindo o
valor +1 ou -1 consoante o valor do campo local induzido seja superior ou inferior a zero.
O algoritmo de convergência desenvolvido para o perceptrão é do tipo supervisionado, ou seja,
para efectuar o treino é necessário deter a classificação desejada para cada um vectores que
fazem parte dos dados. Assumindo [3] e [4], em que que ��� representa a constante, podem
utilizar-se operações matriciais para calcular o campo local induzido [5] na iteração i.
/0123 = �1, ��123, �6123, … , ��123�78 = ����, ��� , 6�� , … , ��� �7 9 [3]
0 = �0113, 0123, … , 01;3� [4]
*��123 = 870123 [5]
Se as classes forem linearmente separáveis, existe um conjunto de pesos 8 com o qual *�� é
positivo para todos os conjuntos 0123 pertencentes a uma das classes e negativo no caso
contrário.
As operações são efectuadas a cada vector introduzido na rede. Deste modo, caso 0123 seja
correctamente classificado, 812 + 13 = 8123, ou seja, não há alterações nos pesos sinápticos.
Se o vector não for classificado com sucesso, os pesos são actualizados de acordo com a regra
[6]:
/812 + 13 = 8123 − >1230123 ?@ 871230123 > 0 @ 0123 ∈ DE)??@ F812 + 13 = 8123 + >1230123 ?@ 871230123 ≤ 0 @ 0123 ∈ DE)??@ H9 [6]
Em que > representa o parâmetro da taxa de aprendizagem.
Pelo teorema da convergência do perceptrão, Rosenblatt estabeleceu que caso os padrões
utilizados no treino do perceptão pertençam a duas classes linearmente separáveis, o algoritmo
do perceptrão converge a posiciona a superfície de decisão no hiperplano entre essas classes.
Mais tarde, provou-se que aumentando o número de nós, aumenta também o número de classes
que o perceptrão permite separar (Haykin, 1999).
Não obstante tenha constituído uma importante inovação, o perceptrão apresenta limitações
associadas ao comportamento linear, as limitações que Minsky e Pappert formalizaram em 1969.
Na Figura 4.8 ilustra-se este aspecto.
35
Figura 4.8 – Separação linear de classes.
O perceptrão foi paradigmático e é interessante na introdução a redes mais complexas, em
particular ao PMC que, como o nome indica, é nele inspirado.
Filtros lineares adaptativos
Os filtros lineares adaptativos surgem como redes que, tal como o perceptrão, separam
linearmente classes. São também interessantes pois, tendo estruturas semelhantes à do
perceptrão, incorporam algoritmos de treino e conceitos que são adoptados no PMC.
As principais necessidades que levaram ao desenvolvimento dos filtros lineares adaptativos
foram a dificuldade que o perceptrão apresentava na adaptação contínua (por exemplo a um
sinal) e a imposição de que as classes fossem totalmente separáveis. De facto, a estrutura geral
dos filtros lineares é semelhante à do perceptrão, registando-se as principais diferenças ao nível
dos nós de output e do processo de treino.
A operação destas RNA pode ser sintetizada da seguinte forma (Haykin, 1999)10:
1. Processo de filtragem, que envolve a computação de dois sinais:
a. Um output, representado por I�, que é produzido em resposta aos J elementos
do padrão11 0123, designadamente ��123, �6123, … , ��123.
b. Um sinal de erro, representado por @123r, que é obtido comparando o output I��123
com o correspondente output �123, produzido pelo sistema desconhecido. De
facto, �123 actua como uma resposta desejada ou um sinal alvo.
2. Processo adaptativo, que envolve o ajustamento automático dos pesos sinápticos da
rede em concordância com o sinal de erro @123.
A diferença ao nível do nó reside no facto deste ter um comportamento linear, pois o valor que
devolve é igual ao do campo local induzido [7].
10 A demonstração é feita, sem perda de generalidade, para o caso de um neurónio único na camada de output. 11 No original utiliza-se o termo vector de estímulo. No entanto, entendeu-se que a utilização do termo padrão, na medida em que é unificadora, é preferível no presente contexto.
36
I�� = *�� = , � ����-� ∙ �� [7]
Ao nível do treino as alterações são mais profundas, designadamente devido à quantificação do
erro [8]. Com este passo, a adaptação da rede assemelha-se a um processo de optimização.
Assim sendo, passa a ser possível aplicar métodos como o do gradiente, de Newton ou de
Gauss-Newton.
@123 = �123 − I123 [8]
Neste contexto surgiu o algoritmo dos mínimos quadrados. Neste processo, define-se uma
função custo [9], que é minimizada durante o treino. Derivando a equação da função custo em
ordem aos pesos sinápticos, 8, é possível obter uma estimativa do gradiente (em [10]) que se
utiliza para formular a equação de actualização da rede [11].
K183 = 12 @6123 [9]
LMNOK183123O8123 = @123 O@123O8
@123 = �123 − 0781239 P OK183O8 = −078123 [10]
812 + 13 = 8123 + >0123@123 [11]
Nesta fórmula, > representa a taxa de aprendizagem.
Uma vez que o método se baseia numa estimativa do gradiente, a trajectória que percorre o
vector 8 é aleatória, o que representa um inconveniente face ao método do gradiente. No
entanto, não requer o conhecimento prévio da estatística do problema e é aplicável a várias
tipologias de RNA (Haykin, 1999).
Face ao perceptrão, este algoritmo é inovador na medida em que incorpora uma função de custo
baseada no erro, utilizando um nó linear. Para além disto, a computação é executada em
contínuo, após cada padrão.
Perceptrão multicamada
A retropropagação aplicada ao perceptrão multicamada (PMC), desenvolvida por Rumelhart
(1986), veio resolver o problema da atribuição de crédito que descredibilizou as RNA nas
décadas de setenta e oitenta.
37
Um PMC é uma rede neuronal do tipo feed-forward, constituída por uma camada de input, um
número arbitrário de camadas ocultas e uma camada de output, organizadas sequencialmente,
em que cada nó está ligado a todos os neurónios da camada seguinte. Na Figura 4.9 apresenta-
se um esquema de um PMC com uma camada oculta.
Figura 4.9 – Esquema das ligações e elementos presentes num PMC.
Como já referido, os PMC são úteis por constituírem aproximadores universais, tendo o potencial
para aproximar qualquer função contínua com nível de erro abaixo de qualquer superior a 0, tal
como é estabelecido pelo teorema do aproximador universal (Anexo I). Não obstante, a prática
demonstra que tal resultado não é muitas vezes aplicável, uma vez que a quantidade de nós e
dados necessária para o atingir aumenta consideravelmente com a complexidade da função e a
diminuição do erro.
Embora sendo um aproximador universal bastante aquém dessa definição na implementação a
problemas reais, o PMC apresenta vantagens em relação a soluções de aproximação
tradicionais (polinomiais ou trigonométricas), pois a degradação da qualidade da aproximação
com o aumento de dimensões do problema é bastante menor (Haykin, 1999).
A complexidade que os PMC podem adquirir é substancial e as operações que ocorrem no
interior da rede praticamente imperscrutáveis, pelo que o treino, assumindo o papel de pedra de
toque no sucesso da aplicação destas redes, deve seguir procedimentos que evitem, tanto
quanto possível, problemas na solução final. A título de exemplo ilustra-se na Figura 4.10 um
PMC treinado, com pesos sinápticos positivos evidenciados a azul e pesos sinápticos negativos
a vermelho, cujas cores são tanto mais fortes quanto maior a intensidade da ligação. As cores
nos nós dizem respeito ao valor do sinal das constantes a eles associadas, sendo a simbologia
idêntica.
38
Figura 4.10 – Ilstração de um PMC após a fase de treino, com pesos sinápticos positivos
evidenciados a azul e pesos sinápticos negativos marcados a vermelho. A coloração nos
nós representa o valor da constante associada.
Como tal, e uma vez que o PMC é a rede eleita para este trabalho, dedica-se o ponto 4.4.4 ao
seu treino.
Sobre outros modelos
À parte das redes feed-forward apresentadas, existem muitas outras concepções de RNA. Umas
têm mais interesse teórico, pois representam conceitos inteiramente novos, outras têm interesse
prático em várias aplicações.
Modelos como as máquinas de Boltzmann ou as redes de Hopfield constituíram marcos
importantes na área das RNA e são exemplos do primeiro grupo. As primeiras destacam-se por
implementarem nós estocásticos. As segundas são redes recursivas, em que cada nó é ligado a
todos os restantes e a convergência é atingida quando os sinais de activação tendem para um
estado de equilíbrio, correspondente a um estado de energia mínima.
Em aplicações práticas, estas redes são, na generalidade dos casos, suplantadas por
concepções alternativas. Estas concepções, em que se incluem, naturalmente, os filtros lineares
e o PMC, contêm um grupo mais vasto de RNA.
Em particular, as Redes de Base Radial (RBR), partilham com os PMC o título de aproximadores
universais. Havendo diferenças marcantes ao nível da arquitectura destas redes e do processo
de treino, na prática os modelos destacam-se pois os PMC constituem aproximações globais,
enquanto as RBR constituem aproximações locais da função alvo, o que significa que o PMC
poderá requerer um menor número de parâmetros que a RBR para o mesmo grau de
aproximação (Haykin, 1999).
39
A introdução de ligações recorrentes numa RNA pode conferir-lhe a capacidade de
reconhecimento de padrões temporais, para além do reconhecimento de padrões espaciais
realizado pelas redes feed-forward. Assim, este tipo de modelos pode ser aplicado na modelação
de sistemas dinâmicos, em que o estado do sistema depende dos estados anteriores, o que é
uma potencialidade significativa em campos como a robótica, ou a composição de música.
Exemplos destas redes são as redes de Elmann (Pasculescu, 2004), ou as Long Short-Term
Memory Networks (Schmidhuber, 2008). No entanto, segundo Kasabov, 1994, tal capacidade é
conseguida à custa de perda de capacidade no processo de treino em relação às redes feed-
forward, resultado da complexidade superior da rede, pelo que só se deverá optar por este tipo
de solução quando o problema o exigir.
Um tipo de redes inteiramente diferente são os mapas auto-organizáveis que, como o nome
indica, organizam os pesos sinápticos de forma a classificar os padrões introduzidos de acordo
com características distintivas. Estas redes têm a particularidade de não necessitarem de “alvos”.
Estes modelos são aplicados, por exemplo, para descobrir características desconhecidas em
conjuntos de dados.
4.4.4 Treino do PMC
Introdução
Por ser a RNA eleita para este trabalho, o PMC deve ser analisado em pormenor. Neste ponto
faz-se essa análise. Identificam-se as principais funções de activação utilizadas, apresenta-se a
formulação teórica do algoritmo da retropropagação, abordam-se os temas da generalização e
da validação cruzada.
Funções de activação
As funções de activação a introduzir nos nós de um PMC devem ser contínuas e diferenciáveis
para que se consiga aplicar o algoritmo da retropropagação. Por outro lado, pelo menos algumas
devem ser não-lineares, ou a rede será incapaz de aproximar funções não-lineares, como alertou
Minsky (1969).
As funções de activação mais importantes e normalmente referidas na bibliografia são quatro:
• a linear, ilustrada na Figura 4.11 e representada pela equação [12];
• a sigmoidal ou logística, ilustrada na Figura 4.12 e representada pela equação [13];
• a tangente hiperbólica, ilustrada na Figura 4.13 e representada pela equação [14];
• a arco-tangente, ilustrada na Figura 4.14 e representada pela equação [15].
40
Figura 4.11 – Função de activação linear.
Q1R3 = R [12]
Figura 4.12 – Função de activação sigmoidal.
Q1R3 = 11 + @ST [13]
Figura 4.13 – Função de activação tangente hiperbólica.
Q1R3 = 2 ∙ 11 + @ST − 1 [14]
41
Figura 4.14 – Função de activação arco-tangente.
Q1R3 = 2U ∙ arctan [U2 ∙ R\ [15]
Não sendo necessário que entre camadas as funções de activação sejam idênticas, é prática
corrente que todos os nós da mesma camada partilhem a mesma função de activação. Assim, os
PMC incluem normalmente funções de activação não lineares nas camadas ocultas, do tipo
sigmoidal ou tangente hiperbólica, sendo que na camada de output é comum adoptar também a
função de activação linear que, ao contrário das restantes não converge assimptoticamente e,
como tal, não limita os resultados possíveis.
No presente caso de estudo optou-se por utilizar apenas funções de activação não-lineares, do
tipo tangente hiperbólica nas camadas ocultas e sigmoidal na camada de outputs. Procedeu-se
desta forma porque, enquanto a função tangente hiperbólica tem um espaço de soluções definido
entre -1 e 1, a função sigmoidal está limitada a resultados entre 0 e 1, pelo que proporciona
resultados da rede sempre positivos como faz sentido quando se trata de probabilidade de
roturas. Não obstante, por ser assimptoticamente convergente para 1, a função sigmoidal
apresenta também um inconveniente quando é utilizada na camada de output. Como os valores
introduzidos na RNA são normalizados, há que voltar dar escala aos outputs no final do treino.
Ora, se a normalização dos resultados utilizados para treino foi de 0 para o menor e de 1 para o
maior, uma vez que os resultados gerados são assimptoticamente convergentes para 1, a RNA
nunca terá capacidade para prever valores superiores aos registados no grupo de treino. Por
forma a contornar este problema, a normalização dos dados foi feita ente 0 e 0.8, proporcionando
à rede a capacidade para prever resultados cerca de 20% superiores aos disponíveis.
A retropropagação
O algoritmo da retropropagação, pela importância que assumiu e continua a assumir no campo
das RNA, merece atenção detalhada. É utilizado para actualizar pesos sinápticos no interior dos
PMC e, sendo bastante semelhante ao método dos mínimos quadrados, apresenta como
principal inovação a capacidade de generalizar a imputação de erros em redes de camadas
múltiplas.
42
A demonstração seguinte é baseada em Haykin (1999). Será primeiro descrito o método para
actualização de pesos sinápticos em ligações a nós da camada de ouput. Estes são diferentes
dos restantes uma vez que o erro pode ser aferido directamente através de [16]:
@�123 = ��123 − I�123 [16]
Em que:
expoente ] indica a camada de output; � representa um nó específico da camada 123 representa o padrão ou a época de cálculo, conforme o treino seja estocástico ou
determinístico; @ é o sinal de erro; � é o objectivo do cálculo; I representa o sinal no nó. No caso da camada de output, a resposta da rede ao padrão.
Uma vez que cada camada pode ter mais que um nó, a energia instantânea de erro, K123, não é
definida por [16], mas por [17], expressão em que se somam os erros de todos os nós da
camada de output. Desta grandeza, normalizada para a totalidade do grupo de treino, resulta o
erro instantâneo médio, K�é_123, definido por [18], em que ` é o número total de padrões de
teste.
K123 = 12 ,a@�b6123� [17]
K�é_ = 1̀ , K123c�-� [18]
Conforme o modo de treino seja estocástico ou determinístico, o erro instantâneo a considerar
será K123 ou K�é_ . No Anexo II apresenta-se o algoritmo da retropropagação, deduzido para o
primeiro caso, sem perda de generalidade.
Como se pode inferir através da demonstração apresentada no Anexo II, a retropropagação é um
algoritmo que funciona em duas fases.
• Na primeira, o padrão é apresentado à rede e o “sinal” é propagado para jusante, sendo
no fim deste processo calculada a energia instantânea de erro.
• Na segunda, em que a rede é actualizada, é calculado o gradiente local dos nós de
output e são adaptados os pesos sinápticos das respectivas ligações. Seguidamente
são calculados gradientes locais e actualizados pesos sinápticos para montante até se
atingir a camada de input.
43
Quando o processo de adaptação acaba, é apresentado um novo padrão à rede, continuando-se
o processo até que K atinja o valor desejado ou se interrompa o treino por outro motivo.
Como se referiu anteriormente, este processo pode ser executado, de forma semelhante, no
treino determinístico, substituindo-se para o efeito K por K�é_ . Todavia, ao invés de se efectuar a
retropropagação entre padrões, apenas se efectuam alterações aos pesos sinápticos entre
épocas (apresentação de todos os padrões de treino à rede).
Na sua concepção original, este algoritmo baseia-se no método do gradiente, no entanto, tal
como acontece no caso dos filtros lineares, é possível modificar o método para utilizar métodos
mais sofisticados, tais como métodos quasi-Newton ou métodos conjugados. Em particular
aponta-se o método de Levenberg-Marquardt, com o qual se obtém resultados bastante bons em
redes de tamanho pequeno e médio, tanto ao nível do erro instantâneo final, como ao nível de
tempos de treino.
Várias modificações, tais como a introdução de um parâmetro de inércia, e parâmetros de
aprendizagem variáveis têm sido desenvolvidos para melhorar o desempenho da
retropropagação. No entanto, como se verá, o método de Levenberg-Marquardt em particular,
sendo mais sofisticado que os métodos de gradiente por utilizar a segunda derivada, provou ser
bastante superior no caso em estudo, tal como em outros casos citados na bibliografia, pelo que
referências a estes parâmetros, não obstante sejam conceptualmente interessantes, têm pouco
interesse prático e não serão desenvolvidas.
Generalização
A generalização é uma competência essencial das RNA. Segundo Haykin (1999), um PMC
generaliza bem quando o mapeamento de inputs e outputs realizado é correcto (ou praticamente
correcto) para dados de teste, nunca utilizados na criação ou no treino da rede.
Devido à capacidade dos PMC, quando o número de nós é elevado, dispõe-se de capacidade
para “armazenar” informação relativa a muitos aspectos do grupo de treino. Ora, se o número de
nós não se ajustar à quantidade de padrões disponibilizada e a complexidade da função que se
pretende mapear, há o risco de a rede assimilar ruído, ajustando-se bastante bem aos padrões
de treino, mas degradando previsões para padrões não conhecidos, mesmo quando apenas
ligeiramente diferentes dos utilizados no treino (Haykin, 1999). Quando isto acontece diz-se que
a rede está sobretreinada.
Ao utilizar RNA, garantir que o ponto em que as redes ficam sobretreinadas é evitado é essencial
para que os resultados tenham fiabilidade. A título de exemplo, ilustra-se na Figura 4.15, um
caso em que o erro quadrático médio do grupo de teste se degrada grandemente enquanto o do
grupo de treino diminui à medida que o processo de retropropagação de desenvolve.
44
Figura 4.15 – Processo de treino em que a rede perdeu a capacidade de generalização.
Para evitar que isto aconteça, existem várias abordagens. Uma, proposta por Poggio e Girosi
(1990) citados em Haykin (1999), recomenda que se utilize a função mais suavizada que
aproxime os dados de treino, o que se traduz por redes simples, com “poucos” nós. Também
segundo Haykin (1999), este ponto é apoiado por Wieland e Leighton (1987).
A generalização depende essencialmente de três factores:
• o tamanho e a representatividade do grupo de treino;
• a arquitectura da rede;
• a complexidade do problema, ou seja, da função a aproximar.
Uma vez que em problemas análogos ao tratado neste trabalho, o primeiro e o terceiro pontos
não variam, resta actuar sobre a arquitectura da rede, ou seja, sobre o número de nós e a sua
distribuição. Embora existam algumas fórmulas teóricas, que indicam o número mínimo de
padrões de treino a fornecer a uma RNA para que uma boa generalização seja assegurada,
verifica-se que acabam por ser bastante pessimistas e apontam para valores bastante elevados.
No que à aproximação de funções diz respeito, o teorema do aproximador universal (Anexo I)
fornece uma base teórica para a pretensão de que os PMCs podem aproximar quaisquer funções
contínuas. No entanto, o número de nós e, consequentemente, o número de padrões disponíveis
para treino necessários não é facilmente definido, pelo que a arquitectura da rede tem de
balançar duas tendências opostas:
• Por um lado, deve existir um número mínimo de nós para que a função seja
convenientemente aproximada.
45
• Por outro, um número demasiado elevado de nós pode levar à degradação da
capacidade de generalização.
Em termos práticos, é comum experimentar várias redes, analisando a capacidade de
generalização com o objectivo de seleccionar a melhor arquitectura. Tal pode ser feito pelo
método da validação cruzada.
Alternativamente, pode iniciar-se o treino com uma arquitectura relativamente complexa,
eliminando posteriormente as ligações com pesos sinápticos mais “fracos” que, potencialmente,
armazenam bastante ruído.
Validação cruzada
A validação cruzada (cross-validation) é um processo pelo qual o conjunto de dados é dividido
em vários conjuntos, uns actuando directamente no treino da rede e outros sendo utilizados para
avaliar a capacidade de generalização, cuja utilização é facilitada no modo de treino
determinístico. Para a implementar, o conjunto de dados é dividido aleatoriamente em três
subconjuntos: treino, validação e teste.
Neste contexto, o conjunto de treino é utilizado para estimar os parâmetros livres da rede (pesos
sinápticos), sendo o grupo de validação utilizado para averiguar a capacidade de generalização,
uma vez que não intervém directamente no treino, o que possibilita a escolha da melhor
arquitectura. O grupo de teste é incluído como garante de que a rede escolhida não ficou
sobretreinada também para os padrões do grupo de validação.
Numa variante da validação cruzada, a paragem antecipada (early stopping) adopta-se um
processo pelo qual o treino é interrompido quando a capacidade de generalização se começa a
degradar. Nesta modalidade, adoptada no presente trabalho, o conjunto de dados é também
dividido em subconjuntos de treino, validação e teste. No entanto, ao contrário do que acontece
na concepção original da validação cruzada, o erro vai sendo estimado também para o
subconjunto de validação, sendo processo de treino terminado quando esse erro começar a
aumentar. O subconjunto de teste, não intervindo directa ou indirectamente no treino, serve, mais
uma vez, de garante dos resultados obtidos.
Segundo Haykin (1999), com base em resultados obtidos por Kearns (1996), a percentagem do
conjunto de dados a adoptar para subconjunto de validação deve variar com a relação entre a
complexidade da função a aproximar e o número de padrões disponível. No entanto, o mesmo
autor sugere que 20% é um valor que funciona uma vasta gama de casos.
Outras variantes são mencionadas na bibliografia (Haykin, 1999), (Lingireddy, et al., 2005).
Designadamente os métodos designados na terminologia anglo-saxónica por K-fold cross-
validation (validação cruzada K-fold) e leave one out cross-validation. O primeiro consiste em
dividir o conjunto de dados em K subconjuntos, repetindo-se o treino com paragem antecipada K
vezes. Em cada uma destas, o subconjunto de validação é composto por um dos K fragmentos
do conjunto de dados, sendo que o subconjunto de treino é constituído pelos restantes K – 1. O
46
erro de treino considerado é a média dos K erros calculados. No segundo método, bastante
semelhante, apenas um padrão é deixado à parte em cada processo de treino, ou seja, K é igual
ao número de padrões de dados.
Embora repetir o treino para todos os padrões disponíveis possa constituir um processo
extremamente moroso, a validação cruzada K-fold, é interessante em termos práticos, pois
assegura que, mesmo que um dos subconjuntos de validação seja constituído em grande parte
por padrões contidos no conjunto de treino, o erro médio estimado para a rede não é
subestimado.
47
5. Metodologia proposta para a modelação da degradação de condutas de água
5.1 Introdução Os fenómenos que levam à degradação das condutas de água são numerosos e difíceis de
quantificar. Assim, apesar de na prática se comprovarem relações entre o número de roturas e
diversos parâmetros, é delicado quantificar com a precisão desejável a influência que cada um
destes parâmetros tem no cômputo final das roturas. Esta dificuldade está essencialmente
associada a dois factores: a ocorrência de roturas é um fenómeno com uma forte componente
aleatória e, num sistema real de distribuição de água, é comum a conjugação de múltiplos
factores que podem influenciar a probabilidade de ocorrência de roturas.
Enquanto a primeira dificuldade à análise, a componente aleatória, pode ser ultrapassada
através do estudo de um número conveniente de dados, a sobreposição de variáveis requer uma
abordagem diferente, uma vez que é difícil obter, em quantidade, dados que contenham
informação relativa a todas as variáveis que seria desejável analisar. Sabendo que, quanto mais
variáveis se incluem, de mais casos se necessita para obter resultados com nível de confiança
aceitável, há que escolher a priori quais os parâmetros mais importantes. Por outro lado, as
relações entre parâmetros podem não ser lineares e as distribuições estatísticas são muitas
vezes desconhecidas, pelo que, mesmo num cenário de abundância de dados, os processos de
tratamento e análise dos dados não são triviais.
Como já foi referido, as RNA, surgem como ferramentas com potencial de aplicação em
problemas desta natureza devido a diversos factores. Não obstante, são ferramentas que surgem
em diversas concepções e requerem a definição de vários parâmetros da sua arquitectura e
processo de treino.
O presente trabalho tem intuito de, com base nas RNA, ultrapassar as dificuldades apontadas,
não só para o caso da degradação de condutas de água, mas também em problemas análogos.
Pretende-se desenvolver um modelo que, de forma estruturada e lógica, permita definir e treinar
redes neuronais adequadas à resolução de problemas reais.
5.2 Selecção e tratamento de informação
5.2.1 Análise dos dados e definição de objectivos
A selecção e o tratamento de informação são a base de qualquer aplicação de redes neuronais.
Embora esteja provado pelo teorema da aproximação universal que os Perceptrões Multicamada
(PMC) podem aproximar, a qualquer grau, qualquer função contínua (Kasabov, 1996), na prática
verifica-se que o processo de preparação dos dados é crucial para o sucesso da aplicação
48
(Lingireddy, et al., 2005). Assim, a primeira fase da metodologia proposta prevê uma análise
criteriosa dos dados disponíveis, identificando-se claramente quais os objectivos a alcançar.
Em função dos dados disponíveis e dos objectivos taçados, deverá ser examinada a adequação
e aplicabilidade das RNA ao problema. Caso estas sejam aplicáveis com vantagens sobre outros
métodos, deverá proceder-se à escolha de um grupo relativamente reduzido de RNA que tenham
potencial para o caso em análise.
No vasto campo de aplicação das RNA enquadram-se, como já foi exposto, muitos tipos de rede.
Assim, como regra geral, desaconselha-se uma abordagem que implique a experimentação de
redes diversas sem uma séria análise prévia, propondo-se, pelo contrário, que se estudem em
pormenor as redes que, à partida, têm mais afinidade com o problema, investindo no
melhoramento do seu desempenho.
Seguindo este raciocínio e no âmbito deste trabalho, analisaram-se em maior profundidade os
PMC, visto serem o tipo de rede mais utilizado, terem uma concepção simples e serem
adequados à captação dos parâmetros estatísticos de conjuntos de dados (Kasabov, 1996), tal
como é necessário para a modelação da degradação das condutas de água.
Paralelamente, a selecção das variáveis mais importantes para a caracterização do fenómeno
deve ter em conta que, quanto maior o número de variáveis e mais complexas as suas relações,
de mais dados necessitará a RNA escolhida para ser correctamente treinada.
5.2.2 Preparação dos dados
Uma vez escolhidas as variáveis, é boa prática preparar os dados utilizados no treino das redes
para que o treino da rede neuronal seja mais eficiente (Lingireddy, et al., 2005).
Uma etapa em que se sintetizem as variáveis a partir de conhecimentos já adquiridos, tornando
mais explícita a informação que contêm é, quando possível, bastante produtiva. Outras
operações podem ser aplicadas com sucesso, tais como a adimensionalização, a logaritmização
ou a utilização de médias móveis.
A experiência tem demonstrado que a filtração do ruído da amostra e normalização dos dados
(geométrica ou logarítmica) são medidas que beneficiam a qualidade final da rede neuronal, não
devendo ser esquecidas.
No âmbito deste trabalho propõe-se as seguintes medidas:
• No caso de variáveis não numéricas (tais como o material da tubagem, por exemplo),
cada classe deverá ser convertida num número real, sendo os intervalos entre classes
iguais. Para melhorar o desempenho da RNA, se for possível, a ordem deverá
corresponder à relação com os resultados. Utilizando de novo o exemplo do material da
tubagem, poder-se-ia atribuir o número 1 ao ferro fundido dúctil, o número 2 ao
polietileno de alta densidade, o número 3 ao ferro fundido e o número 4 ao fibrocimento,
por ordem crescente de roturas registadas.
49
• Para cada variável, os dados devem ser normalizados. No caso desenvolvido, uma vez
que é utilizada uma função de activação assimptótica (como se verá), a normalização
das ordens de trabalhos por 100 km por ano foi feita ente 0 e 0,8 por forma a ficar
assegurada a capacidade de generalização da RNA.
• Dividir trechos de tubagem com comprimentos elevados em trechos mais pequenos com
características idênticas. É importante proceder deste modo porque a RNA capta
informação dando a cada padrão a mesma importância, o que não se adequa ao
problema em estudo, em que elementos de maior comprimento são mais significativos
para a análise. No âmbito deste trabalho recomenda-se a divisão em trechos de
aproximadamente 50 m. Registos com menos de 25 m de comprimento são ignorados e
registos com mais de 75 são divididos em duas ou mais parcelas.
5.3 Procedimentos de modelação
5.3.1 Considerações prévias
As RNA, são versáteis, podendo ser utilizadas para um vasto conjunto de aplicações. No
entanto, esta versatilidade é conseguida através da plasticidade das próprias redes. Assim,
escolher a rede certa para o problema em mãos pode tornar-se um desafio.
Face a esta dificuldade, alguns utilizadores acabam por considerar um grupo vasto de redes e
algoritmos de treino e proceder à comparação entre estes, seleccionando o melhor. Outra
abordagem corrente é fazer certas escolhas empíricas baseadas em trabalhos precedentes.
Apesar da segunda abordagem ser frequentemente utilizada, uma vez que corresponde a um
atalho tentador, os resultados obtidos por essa via poderão não ser os melhores. De facto, em
casos de aplicações de RNA, constata-se que diferentes autores propõem frequentemente a
adopção de medidas distintas e por vezes contraditórias, isto porque cada problema induz
comportamentos específicos nas RNA, por vezes inesperados face a referências passadas.
Deste modo, pensa-se que é produtivo investir numa comparação de soluções sólida, mesmo
que esse procedimento demore algum tempo12.
No caso do PMC e redes afins, estas escolhas podem consistir na utilização de uma ou mais
camadas ocultas, ou na adopção de um algoritmo de treino específico.
5.3.2 Definição da arquitectura da rede
Embora se pretenda introduzir alguma ordem na tomada de decisões sobre a constituição das
RNA, na realidade estes modelos funcionam como um conjunto completo. Assim, propõe-se que
12 Principalmente tempo computacional, uma vez que os processos de treino podem ser algo demorados.
50
as decisões com mais impacto sobre o desempenho da rede sejam definidas inicialmente,
caminhando-se progressivamente para as opções menos decisivas.
Como será intuitivo, tomam-se os aspectos estruturais como os mais importantes, pelo que as
primeiras características da rede a definir devem ser o número de inputs, o número de outputs, o
tipo de ligações entre nós, o número de camadas ocultas, o número de nós e as funções de
transferência a utilizar.
Inputs e outputs
A escolha do número de inputs deve obedecer às considerações tecidas no ponto 5.3.1, mas
está essencialmente condicionada pela especificidade do problema que se pretende resolver, tal
como acontece com o número de outputs.
Quando os fenómenos em estudo são razoavelmente conhecidos, o número de inputs é fixo. No
entanto, com o aumento de dimensões o treino torna-se mais exigente, sendo necessários cada
vez mais padrões de dados.
No caso da degradação de redes de distribuição de água, os parâmetros que é possível
considerar são muitos (uma síntese é feita no Quadro 3.3). Contudo, na prática não é viável
armazenar dados relativos a todos estes parâmetros, pelo que o grupo a considerar é restrito.
Dependendo do número de dados disponível, a viabilidade de inserção de mais parâmetros no
modelo varia. Diversos trabalhos têm sido desenvolvidos no sentido de quantificar o número de
dados necessário para obter resultados com margens de erro definidas em problemas de
dimensão conhecida, no entanto, tais estudos não são facilmente aplicáveis ao caso da
degradação de tubagens devido a dois factores principais: na sua maior parte dizem respeito a
problemas de classificação de padrões e não de aproximação de funções e, na generalidade,
pecam por ser excessivamente conservativos, indicando quantidades de dados bastante
superiores às que se verifica serem necessárias para obter bons resultados em casos práticos
(Haykin, 1999).
Assim, propõe-se que a determinação do número óptimo de inputs seja feita em dois passos:
1. Treinar um PMC muito simples, sem camada oculta, com a totalidade dos inputs
disponíveis. Avaliando-se seguidamente o módulo do peso das ligações sinápticas à
camada de output. Os parâmetros que apresentarem as ligações mais fortes são mais
importantes, enquanto aqueles que gerarem os pesos sinápticos mais ténues poderão
ser retirados do modelo;
2. Executar o treino (com validação cruzada) para um PMC de características que se
estima assemelharem-se às finais, reduzindo progressivamente o número de inputs.
Utilizar demasiados parâmetros pode levar ao sobretreino da rede. Desta forma, quando
a rede perde demasiado rápido a capacidade de generalização, produzindo piores
resultados nos subconjuntos de validação, o treino é interrompido antes de se atingir o
51
estado óptimo. Assim, quando o desempenho da rede atingir o melhor valor, dever-se-á
ter atingido o ponto ideal de variáveis de input face ao número de dados disponível.
Para execução do segundo passo, a RNA poderá ter a seguinte configuração:
• PMC com uma camada oculta de 20 a 30 nós;
• Funções de activação não-lineares na camada oculta e funções de activação lineares na
camada de output;
• Subconjuntos de validação e teste correspondentes, cada um, a 20% do total de dados;
• Treino efectuado utilizando a retropropagação modificada com o algoritmo de
Levenberg-Marquardt.
Tendo-se utilizado o programa Matlab para executar as operações com RNA e AG, notou-se
alguma dificuldade na avaliação das redes treinadas, uma vez que os pesos sinápticos são
armazenados em “estruturas” com uma ou mais matrizes. Assim desenvolveu-se uma ferramenta
que possibilita a observação dos PMC treinados em AutoCAD, numa representação gráfica cujas
cores indicam os valores de pesos sinápticos. Com esta ferramenta, o passo 1 para a
determinação do número óptimo de inputs fica facilitado.
Partindo da premissa de que, com o aumento de dimensão do PMC, será atingido um ponto
óptimo e, a partir desse ponto, haverá ligações sinápticas supérfluas, analisando graficamente as
redes é possível observar o ponto em que se começa a registar um número crescente de
ligações com pesos sinápticos de módulo reduzido.
No Anexo III apresentam-se graficamente três redes: uma rede sem camada oculta, uma rede
com 20 nós na camada oculta e, finalmente, uma rede com 40 nós na camada oculta.
Tipo de ligações entre nós
O tipo de ligações entre nós é geralmente associado ao tipo da rede escolhida, numa rede do
tipo PMC, as ligações são integrais entre camadas adjacentes, pelo que a questão não se
coloca. No entanto, alguns autores argumentam que os resultados obtidos com redes que
contenham conjuntos agregados (clusters) de nós especializados, com capacidade de assimilar
melhor características particulares do espaço de dados, são superiores aos obtidos com recurso
a redes feed-forward integralmente conectadas.
Neste trabalho, considerou-se que a construção de conjuntos agregados não traria benefícios
que compensassem o acréscimo de complexidade que daí adviria.
52
Funções de activação
Normalmente, num PMC, as funções de activação são escolhidas para cada uma das camadas
ocultas13 e para a camada de output. Estando provado que, se todas as funções forem lineares,
o PMC não tem capacidade de reproduzir funções não lineares (Haykin, 1999), recomenda-se
que sejam sempre incluídas funções de activação não lineares.
A opção mais comum parece ser a adopção de funções não lineares, do tipo sigmoidal, tangente
hiperbólica e arco tangente, nas camadas ocultas e, na camada de output, funções lineares. Esta
escolha permite que a rede seja não linear e possibilite uma generalização alargada a resultados
fora do intervalo do conjunto de dados original14. Por outro lado, em alguns problemas, não faz
sentido que se obtenham valores negativos. Quando é este o caso, podem seguir-se três
alternativas:
• Utilizar funções de activação lineares e igualar quaisquer valores negativos a 0;
• Utilizar funções de activação lineares modificadas, que tenham como mínimo o valor 0;
• Utilizar a função de activação sigmoidal, sempre positiva.
A primeira alternativa tem o inconveniente de obrigar à introdução do passo de transformar
valores negativos em zero em todas as aplicações do modelo. Já a segunda é de difícil
aplicação, já que a retropropagação implica que as funções de activação sejam contínuas. A
terceira opção apresenta o inconveniente de limitar o espaço de resultados ao do intervalo de
dados original.
Neste trabalho foi adoptada a terceira alternativa, não só pela mais fácil aplicação mas também
porque a introdução de funções de activação não lineares na última camada poderá contribuir
para a apreensão de características adicionais contidas no conjunto de dados. Para contornar a
limitação apontada a este procedimento, a normalização dos dados foi efectuada de forma que
ao valor máximo contido no conjunto correspondesse o valor 0.8, ao invés do valor 1,
reservando-se desta forma um intervalo de 20% para extrapolação.
Número de nós
Conceptualmente, quanto mais neurónios tem uma RNA, mais potencial tem para apreender a
informação contida nos dados, incluído ruído. A escolha do número de neurónios ideal depende
intrinsecamente do problema a resolver.
Redes com um número reduzido de ligações são treinadas rapidamente, generalizam com bons
resultados (comparativamente aos resultados obtidos para o conjunto de treino) e captam as
13 Na realidade, as funções de transferência poderiam ser especificadas para cada neurónio, independentemente da camada. No entanto, as vantagens dessa abordagem são difíceis de avaliar e a resposta da rede mais difícil de estudar. 14 A função de activação linear é a única, do grupo apresentado, que não converge assimptoticamente.
53
características essenciais dos dados. Com o aumento de ligações, os processos de treino ficam
mais “pesados”, sendo que número de operações necessárias por época cresce
exponencialmente (Lingireddy, et al., 2005). Para além disso, a facilidade com que ocorrem
casos de sobretreino (overfitting) aumenta.
Não havendo uma regra empírica que “acerte” na previsão do número ideal de nós para um
PMC, a melhor alternativa é proceder à experimentação com diversos números, por forma a
obter uma amostra com significado estatístico e, a partir dos resultados, escolher o número de
nós adequado. Neste procedimento, recomenda-se a utilização da validação cruzada ou K-fold e
a retropropagação modificada com o algoritmo de Levenberg-Marquardt.
Adoptando esta metodologia há que ter em atenção dois aspectos importantes. Por um lado,
verificou-se que durante o treino um número reduzido de casos não chega a convergir, gerando
Erros Quadráticos Médios (EQM) elevados relativamente aos de redes que atingem um nível
aceitável de treino. Isto faz com que a média dos resultados fique excessivamente afectada, pelo
que se propõe a utilização do conjunto dos melhores 90% dos resultados.
Por outro lado, notou-se que a variância dos resultados obtidos aumenta em função do número
de nós15, pelo que, quanto maior a rede, de mais treinos se precisará para obter uma estimativa
aceitável da média do EQM. Assim, preconiza-se a aplicação da distribuição de t-Student16 para
gerar intervalos de confiança que permitam a comparação dos valores. Nota-se que, na
generalidade dos problemas, para amostras com mais de 40 treinos se poderá utilizar a
distribuição normal (Montgomery, et al., 2003).
Na Figura 5.1 ilustra-se um exemplo deste procedimento, em que foram testadas redes com uma
e duas camadas e um total de nós na camada oculta variável entre 0 e 40.
15 Este efeito deve-se, possivelmente, à maior instabilidade causada pelo ruído, que leva a que o treino seja interrompido devido ao aumento do erro no subconjunto de validação. 16 A utilização desta distribuição baseia-se no resultado do Teorema do Limite Central, que estabelece que, quando uma experiência aleatória é repetida, a variável aleatória que representa o resultado médio (ou total) das repetições tende para ter uma distribuição normal quando o número de repetições é grande (Montgomery, et al., 2003). Quando o número de repetições é limitado, a distribuição de t-Student é mais adequada.
54
Figura 5.1 – EQM médio após validação cruzada para PMC de uma e duas camadas, com
intervalos de confiança de 95% obtidos recorrendo à distribuição de t-Student.
Número de camadas ocultas
O número de camadas ocultas pode ser optimizado por intermédio de algumas considerações
teóricas. Segundo (Kasabov, 1996), a capacidade de aproximação de uma RNA é função do
número de ligações entre nós no seu interior. Assim, fará sentido aumentar o número de nós
numa única camada oculta para obter redes mais complexas e potentes mas, a partir de certo
ponto, verifica-se que é mais eficiente distribuir esse número por várias camadas ocultas, tanto
ao nível da capacidade final da rede, como ao nível do tempo de treino.
Com o objectivo de quantificar com precisão a partir de que ponto seria conveniente aumentar o
número de camadas ocultas, deduziu-se uma expressão que indica, para uma rede PMC
genérica, a partir de que número de nós fará sentido optar por duas camadas ocultas17.
O número de ligações num PMC com uma camada oculta pode ser obtido através de [19].
d ∙ �̀ + �̀ ∙ e [19]
Em que,
d – representa o número de nós de input;
�̀ – representa o número de nós na camada oculta;
17 Assumindo que a capacidade da rede é proporcional ao número de ligações entre nós e que todas as ligações apresentam o mesmo potencial. Na dedução seguinte não se consideram as ligações correspondentes a constantes nos nós. Estas ligações, no entanto, têm pouco peso, uma vez que a sua contabilização corresponde apenas à soma do número de nós, sendo independente do número de camadas.
7.70E-04
8.20E-04
8.70E-04
9.20E-04
9.70E-04
1.02E-03
0 5 10 15 20 25 30 35 40 45
EQM
Número de nós na rede
1 camada
2 camadas
55
e – representa o número de nós de output.
Generalizando para J camadas ocultas resulta a expressão [20]:
d ∙ �̀ + , �̀ ∙ �̀f��S��-� + �̀ ∙ e [20]
Para duas ou mais camadas ocultas, o número de ligações passa a variar com a distribuição dos
nós. Não obstante, particularizando para J = 2, é possível determinar a dimensão óptima da cada
camada aplicando a mudança de variável �̀ = `` − 6̀ à expressão anterior, obtendo-se [21].
Derivando em ordem a 6̀ e igualando a 0 tem-se a equação desejada, [22].
d ∙ 1`` − 6̀3 + 1`` − 6̀3 ∙ 6̀ + 6̀ ∙ e [21]
�� 6̀ �d ∙ 1`` − 6̀3 + 1`` − 6̀3 ∙ 6̀ + 6̀ ∙ e� = 0 P
P 6̀ = `` + e − d2
[22]
Igualando o número de ligações com uma e duas camadas ocultas, para o mesmo número de
nós, ``, e aplicando a equação [22], obtém-se [23].
1`` + d − e36 − 4`` ∙ d = 0 [23]
De acordo com a dedução, quando o número de nós é suficiente para que o primeiro membro da
equação anterior seja superior a 0, é vantajoso distribuir esses nós por mais de uma camada
intermédia.
Tendo-se efectuado simulações com recurso a Algoritmos Genéticos (AG), cujo cromossoma
reproduzia a constituição de PMC com distribuições arbitrárias dos nós por até 4 camadas
ocultas, verificou-se que as arquitecturas para que tendiam as simulações eram bastante
semelhantes às obtidas através da aplicação das fórmulas anteriores. Esta experiência é tratada
com algum pormenor no capítulo referente ao caso de estudo.
5.3.3 Escolha do algoritmo de treino
A escolha do algoritmo de treino depende do problema em estudo e da quantidade de dados,
sendo difícil generalizar quaisquer recomendações.
Para o treino de PMC é normalmente utilizada a retropropagação, no entanto, não na forma
original (gradiente), mas principalmente em versões modificadas. Como regra geral, quando a
dimensão das redes é bastante grande, os métodos de gradiente modificados são mais
56
utilizados, pois minimizam o tempo de treino. Contudo, para as aplicações na degradação de
sistemas de distribuição, as redes não devem atingir tais dimensões, pelo que algoritmos de
segunda ordem, do tipo conjugado ou Gauss-Newton são preferíveis. Destes, destaca-se o de
Levenberg-Marquardt, que, para o caso de estudo, revelou ser superior aos restantes algoritmos
a todos os níveis (desempenho da rede final, tempo de treino e correlação entre previsões e
dados) excepto, porventura, na quantidade de memória volátil (random access memory ou RAM)
exigida no processo de cálculo. Com base nestes resultados e em outros casos de estudo
apresentados na literatura (Demuth, et al., 2008), pensa-se que será pertinente afirmar que, em
problemas semelhantes ao estudado, a opção por este tipo de treino levará a resultados bastante
bons.
No Anexo IV apresenta-se uma comparação dos vários algoritmos disponíveis no software
utilizado (Matlab Neural Networks Toolbox 4), EQM versus correlação. Para efectuar os treinos
foi utilizada validação cruzada com conjuntos de validação de dimensão igual a 20% do total de
dados disponíveis, seleccionados aleatoriamente.
5.3.4 Escolha da dimensão dos grupos de validação e teste
A escolha da dimensão dos grupos de validação e teste, para implementação da validação
cruzada ou K-fold é também dependente do problema em estudo. Como já referido no capítulo 4,
com base em resultados obtidos por Kearns (1996), a percentagem do conjunto de dados a
adoptar para subconjunto de validação deve variar com a relação entre a complexidade da
função a aproximar e o número de padrões disponível.
Este autor afirma que, após dado número de padrões de treino, a dimensão dos grupos de
validação e teste deixa de ter grande influência no resultado final, sugerindo que 20% é um valor
que funciona numa vasta gama de casos.
Assim, quando os dados disponíveis forem bastantes – e devem sê-lo para que se considere um
número adequado de variáveis e a RNA tenha bom desempenho – propõe-se a utilização de
subconjuntos de validação e teste com cerca de 20% do total de padrões de dados disponíveis.
5.4 Validação dos resultados Admitindo que as RNA são aplicáveis ao problema em estudo, que os dados são suficientes e
que os procedimentos utilizados treinam um PMC adequado, em princípio, serão produzidos
resultados aceitáveis. Há, no entanto, que proceder à validação dos mesmos, não no sentido de
EQM ou correlação, pois essa é uma etapa do treino, mas aplicando espírito crítico aos
resultados obtidos.
Uma vez que as RNA são modelos “cinzentos” em que os cálculos a ocorrer no interior do
modelo são difíceis de acompanhar, um procedimento para verificar a qualidade dos resultados
obtidos passa por analisar pontos amostrais do espaço de resultados. No entanto, identificou-se
57
um factor que dificulta este tipo de análise: o espaço de input é um hipercubo com número de
dimensões variável (cinco no caso de estudo – idade, material, diâmetro, subsistemas e
OT/(100km.ano) prévias18), o que faz com que a divisão dos resultados observados, por um
número de pontos amostrais finito, não seja directa.
Para obviar esta dificuldade, foi criada uma ferramenta que selecciona pontos pré-definidos de
cada uma das variáveis consideradas, criando padrões de dados correspondentes à totalidade
das combinações possíveis. Simulando estes padrões na RNA treinada, é possível observar na
totalidade a correspondência entre os espaços de inputs e outputs. Por forma possibilitar a
comparação entre os resultados reais e os previstos, a ferramenta contabiliza a totalidade de
comprimento de rede de distribuição que tem as características de cada um dos padrões
gerados, e calculando o resultado esperado de acordo com a média ponderada dos valores
reais.
Finalmente, notou-se que pode existir um EQM mínimo teórico inerente ao próprio conjunto de
dados, que pode ser superior a zero e constitui o limite do treino das RNAs. O facto que está
subjacente a este efeito é que podem existir dois trechos de tubagem com características
exactamente idênticas (diâmetro, material, idade, subsistema e OT/(100km.ano) prévias) e
registos de OT/(100km.ano) diferentes. No sentido de aferir este valor, foi construída uma função
em VBA com o objectivo de calcular o EQM mínimo inerente ao conjunto de dados.
A operação desta função implica a catalogação de todos os padrões distintos contidos nos dados
e a determinação da média de OT/(100km.ano) para cada um. Seguidamente, é calculado o
EQM entre os dados e o conjunto de padrões gerado.
5.5 Outras ferramentas desenvolvidas Para além da programação desenvolvida para criar representações gráficas dos PMC e para a
utilização de AG, que voltará a ser referida no âmbito do caso de estudo, foram desenvolvidas
ferramentas para facilitar e automatizar a execução do trabalho. Estas ferramentas incluem:
• Módulo para separar os padrões de dados aleatoriamente, dividindo-os, caso desejado,
em elementos com comprimento aproximado de um valor especificado;
• Módulo para preencher a folha de cálculo com valores calculados a partir de fórmulas
especificadas apenas numa linha. Este módulo provou ser essencial, pois o cálculo
repetido de fórmulas em folhas de cálculo com extensões que chegam a 600 000 linhas
induziu no Microsoft Excel erros demasiado frequentes e ficheiros com tamanhos
incomportáveis;
18 Ordens de trabalhos por 100 km por ano registadas entre 2002 e 2004. Para alvos foram adoptados os valores registados de 2005 a 2007, daí a nomenclatura “prévias” para identificar o primeiro conjunto. No capítulo referente ao caso de estudo o significado destas variáveis é aprofundado.
58
• Módulo para teste, treino e simulação de RNA, que faz o interface entre o Microsoft Excel
e o Matlab.
Esta ferramenta permite a simulação de RNA, disponibilizando um leque variado de
opções permitem praticamente dispensar a utilização directa do programa Matlab.
Utilizando-a, a exportação de resultados para o Excel é automática, sendo possível,
inclusivamente, fazer simulações de matrizes de dimensões superiores às suportadas
pelo Matlab (o que, de facto, foi necessário). Na Figura 5.2 é ilustrado o interface do
modo de treino e simulação. A Figura 5.3 reporta-se ao funcionamento em modo de
teste.
• Módulo para geração de padrões representativos do espaço de soluções da RNA
utilizado para validação dos resultados.
Figura 5.2 – Modo de treino e simulação da ferramenta de teste de redes e separador de
opções.
59
Figura 5.3 – Operação do modo de teste, que possibilita a importação de valores de EQM,
correlação e tempo de treino para o Excel em treinos seguidos, permitindo obter
amostragens estatísticas da capacidade de cada rede.
5.6 Síntese do método Apesar de se terem ordenado as várias fases do método por forma a torná-lo o mais directo
possível, o processo de escolha e treino das RNA deveria ser iterativo.
Na Figura 5.4 apresenta-se um fluxograma que pretende clarificar a metodologia proposta. As
actividades principais são realçadas a azul, os vários passos compreendidos na definição da
arquitectura da rede são apresentados a preto e, finalmente, a avaliação do desempenho da rede
está destacada a vermelho, pois deverá ser uma constante durante o treino.
60
Figura 5.4 – Fluxograma representativo do método proposto.
Análise dos dados e
definição de objectivos
Preparação dos dados
Definição da arquitectura
da rede
Escolha de inputs e outputs
Escolha do tipo de ligações entre nós
Escolha de funções de activação
Escolha do número de nós
Escolha do número de camadas
Escolha do algoritmo de
treino
Escolha da dimensão dos
grupos de validação e teste
Validação dos resultados
Avaliação do desempenho da rede
61
6. Caso de estudo – A rede de distribuição de água da cidade de Lisboa
6.1 Introdução O caso de estudo consiste na modelação da degradação das condutas do sistema de
distribuição de água de Lisboa com base em dados disponibilizados pela EPAL, referentes ao
período compreendido entre 24 de Janeiro de 2002 e 28 de Agosto de 2007.
Fazem parte do objecto de estudo todas as tubagens afectas a distribuição (em oposição a
adução), com diâmetros inferiores a 315 mm. Por motivos práticos relacionados com o treino das
RNA o estudo restringiu-se a tubagens de Ferro Fundido cinzento (FF), Fibrocimento (FC), Ferro
Fundido Dúctil (FFD) e Polietileno de Alta Densidade (PEAD), os materiais com maior presença
na rede.
O sistema de abastecimento de Lisboa foi já introduzido no capítulo 2, no entanto, complementa-
se essa informação com elementos gráficos e alguns números mais relevantes.
No Anexo V é ilustrado o sistema da EPAL, incluindo as infra-estruturas principais. A rede de
distribuição é alimentada preferencialmente pelo Aqueduto Tejo, à cota 17,0 m, pelo Aqueduto
Alviela, à cota 27,7 m, e pelo Adutor de Vila Franca de Xira – Telheiras, à cota 126,0 m (Luís, et
al., 2004).
A partir dos pontos de chegada, a água é elevada e a sua distribuição é feita por zonas
altimétricas independentes que abastecem a rede em patamares de 30 m cada, que se
desenvolvem entre as cotas 0 e 150 m (Luís, et al., 2004).
Na Figura 6.1 apresenta-se o diagrama altimétrico da rede, onde são identificados os principais
subsistemas. . A rede de distribuição de Lisboa é esquematizada na Figura 6.2. Na Figura 6.3 é
ilustrada a rede de distribuição de água, por zona altimétrica
Até 2002, o índice de roturas por 100 km por ano chegou a 112,0, para o FC, e 143,4, para o FF.
(Luís, et al., 2008). Desde 2002, tem vindo a ser desenvolvido um programa de renovação da
rede de distribuição de Lisboa, complementado com a sectorização da rede em zonas de
medição e controlo, investimento na detecção de fugas e medidas de controlo de fraudes e
contadores. Os resultados têm sido expressivos, e apresentam-se, para a totalidade da rede, no
Quadro 6.1.
Quadro 6.1 – Efeito da substituição de rede nas roturas, reclamações e perda em Lisboa. Adaptado de Luís, 2008.
2002 2003 2004 2005 2006 2007Substituição da rede (km) 54.1 74.4 56.1 85.3 65.2 20.2
Média de roturas (rot./(100km.ano)) 92 64 51 48 43 44
Reclamações de abastecimento 20 048 20 286 17 045 17 462 13 042 11 205
Volume anual de perdas (x106 m3) 32.0 30.5 30.4 26.9 23.4 19.4
62
Figura 6.1 – Diagrama altimétrico da rede de abastecimento de água de Lisboa. Adaptado de Franco, 2006.
Seguidamente descreve-se o processo de tratamento e análise de dados, bem como a aplicação
da metodologia proposta no capítulo 1. Procede-se também à análise das RNA treinadas e à
utilização dos resultados obtidos para estimativa da distribuição de roturas na rede.
Figura 6.2 – Esquema da rede de distribuição de água de Lisboa.
63
Figura 6.3 – Rede de distribuição de água, por zona altimétrica , na cidade de Lisboa.
Adaptado de Luís, 2004.
6.2 Dados disponibilizados
6.2.1 Considerações gerais
Os dados utilizados no presente estudo foram obtidos a partir de informação armazenada na
base de dados do SIG da EPAL, o G-Interaqua. Podem identificar-se duas matrizes principais,
uma referente às tubagens que constituem o sistema e outra correspondente às ordens de
trabalhos (OT), ou seja, intervenções registadas.
Presentemente, a base de dados utilizada pela EPAL foi adoptada por outras entidades gestoras,
sendo que cada uma tem as suas necessidades previstas no interface do G-Interaqua. Desta
forma, analisando as tabelas de dados, é possível encontrar campos que, para a EPAL, são
redundantes e outros que não são sequer utilizados. Isto contribui para que a informação “bruta”
seja, não só mais difícil de analisar, como imprópria para aplicar directamente no treino de RNA.
Nos pontos seguintes indicam-se os procedimentos utilizados no tratamento da informação,
filtrando campos irrelevantes com demasiadas falhas de registo ou, simplesmente, fora do âmbito
do estudo.
Tendo em conta a utilização que se pretende dar aos dados, assim como a sua quantidade,
adoptou-se um critério que privilegia a qualidade da informação. Neste sentido, face a campos
com informação em falta, optou-se por descartar o registo da entidade de forma a não introduzir
64
desvios no modelo. Por outro lado, dado que esta filtragem não segue nenhuma regra
discriminatória, sendo apenas regida pela qualidade da informação, não se espera que a
omissão de registos se traduza em enviesamento da amostra.
Seguidamente enumeram-se os campos de dados disponíveis, sendo analisada tanto a validade
como a relevância da informação para efeitos do presente estudo. Descrevem-se, igualmente, os
critérios adoptados.
6.2.2 Dados de tubagens
A informação referente a tubagens disponível é dividida em dois grupos, de acordo com a função
cumprida pelo trecho considerado no sistema: distribuição ou adução. Não obstante, o conjunto
de informações registadas para estes tipos de entidades é bastante semelhante.
Tubagens de distribuição
O Anexo VI indica quais os campos que contêm a totalidade da informação disponibilizada sobre
tubagens usadas na distribuição. Destes, alguns destacam-se como bastante relevantes para o
estudo das roturas, outros, apesar de poderem não ser directamente relacionados com esta
temática, são úteis na validação da informação.
De um universo de 1 271 km de rede distribuídos por 33 763 registos removeram-se tubagens
cuja informação, nos campos chave, se apresentava incompleta. Neste sentido foram
executadas duas filtragens, seguidas por uma etapa de validação.
O Quadro 6.2 reporta-se à primeira etapa da filtragem, em que foi descartada 16,1% da extensão
de rede disponível. Na segunda filtragem, foram removidos os registos que não correspondiam a
tubagens com diâmetros iguais ou inferiores a 315 mm ou cujo material não se inseria no grupo
dos quatro materiais com maior presença na rede (FF, FC, FFD e PEAD). No Quadro 6.3 é
apresentado o balanço deste processo, no final do qual resta 81,4% do comprimento inicial da
rede.
Findo este processo, notou-se que algumas tubagens apresentavam relações entre ano de
instalação e material incoerentes (por exemplo, um troço em PEAD com data de instalação de
1937). Analisando a rede, foram aferidas as datas em que seria mais provável o início e o
término da aplicação de cada um dos materiais e, estando estas disponíveis, foi possível efectuar
a validação de cada registo. O Quadro 6.4 traduz o critério adoptado, tendo-se assinalado 6,1 km
de rede com inválidos.
Concluído o processo, classificaram-se 26 970 registos como válidos, correspondendo a 1 029
km de rede, ou seja, 81% da extensão inicial.
65
Quadro 6.2 – Registo da primeira filtragem aplicada aos dados das tubagens de
distribuição.
Quadro 6.3 – Registo da segunda filtragem aplicada aos dados das tubagens de
distribuição.
Quadro 6.4 – Datas admitidas no estudo para o início e o fim da aplicação de materiais.
Tubagens de adução
Os dados referentes a tubagens utilizadas na adução são registados de forma muito semelhante
à dos dados das tubagens da distribuição. No Quadro A2 Anexo VII são descritos os campos em
que se sintetiza a informação disponível para estes elementos.
Uma vez que as tubagens afectas à distribuição perfazem um grupo bastante maior (mais de 5
vezes superior) que as que cumprem funções de adução, a filtragem aplicada aos dados seguiu
os critérios estabelecidos para as primeiras que, por serem mais numerosas, devem ter um peso
acrescido do estudo.
No Quadro 6.5 podem observar-se os resultados do primeiro passo da filtragem, que excluiu os
registos cuja informação, nos campos chave, se apresentava incompleta. Nesta etapa, dos 2 272
registos iniciais, totalizando 232 km de tubagem, foi excluída uma parte significativa, cerca de
56,5%, restando 1 196 registos totalizando 101 km de condutas.
No segundo passo de filtração, excluíram-se diâmetros superiores a 315 mm e materiais não
pertencentes ao grupo seleccionado para estudo (FF, FC, FFD e PEAD). Essencialmente devido
a uma parte significativa destas tubagens apresentar diâmetros superiores aos estudados mas
também porque, na adução, o material mais utilizado é o betão armado (cerca de 47,1% da
extensão total da rede, contra apenas 0,3% na distribuição), os registos utilizáveis ficaram
Designação Número de registos Comprimento total
Código universal 33 763 1 271 268
Ano de instalação 30 404 1 202 378
Comprimento (m) 30 401 1 202 378
Diâmetro (mm) 30 103 1 201 373
Estado de ciclo de vida 29 828 1 193 033
Material 29 808 1 192 880
Freguesia 27 210 1 073 388
Subsistema 27 205 1 073 361
Observações 27 167 1 071 535
Função 27 014 1 066 113
Designação Número de registos Comprimento total
Código universal 27 014 1 066 113
Diâmetro (mm) 26 418 1 041 526
Material 26 299 1 035 434
FC FF PEAD FFD
Ano Inicial 1950 1933 1999 1977
Ano final 1995 1981 - -
66
reduzidos a apenas 102, que totalizam pouco mais de 5 km de rede (2,3% da extensão inicial),
tal como se pode observar a partir do Quadro 6.6.
Ponderando que, ao incluir a adução no estudo, seriam apenas adicionados 5 km de rede aos
1 029 km obtidos através da análise de tubagens de distribuição e sabendo que existem
diferenças inerentes à função que desempenham os dois tipos de tubagem, concluiu-se que
seria mais adequado limitar o estudo ao maior grupo.
Quadro 6.5 – Registo da primeira filtragem aplicada aos dados das tubagens de adução.
Quadro 6.6 – Registo da segunda filtragem aplicada aos dados das tubagens de adução.
6.2.3 Dados de ordens de trabalhos
Os dados registados para as ordens de trabalhos, ou OT, contêm mais informação que os seus
congéneres referentes às tubagens. Parte desta informação não é aplicável ao estudo, pelo que
é necessário clarificar quais os campos classificados como relevantes. No Quadro A3 do Anexo
VIII são descritos os campos, dos quais aparecem destacados os de maior relevância.
Tal como para as tubagens, foi necessário filtrar os dados previamente à sua utilização no treino
das RNA. Uma vez que as OT são registadas para quaisquer intervenções na rede da EPAL, e
não só para roturas ocorridas em tubagens, deve-se, para além de excluir registos com
informações incompletas, eliminar as OT que não correspondem a roturas na rede principal ou
cujas causas sejam provocadas. Este passo é sintetizado no Quadro 6.7, em que se indicam os
campos que foram analisados, assim como o número de registos remanescentes após a
filtragem. No Anexo VIII são igualmente descritos os critérios adoptados.
O processo de validação que se seguiu, resumido no Quadro 6.8, limitou as OT que passaram na
primeira triagem àquelas que estavam associadas a tubagens identificadas, também elas, como
válidas. Todavia, à semelhança do que aconteceu para a informação de tubagens, também se
notaram nas OT inconsistências, nomeadamente encontrando-se registos com datas
Designação Número de registos Comprimento total
Código universal 2 272 232 234
Ano de instalação 1 858 168 455
Comprimento (m) 1 858 168 455
Diâmetro (mm) 1 716 166 888
Estado de ciclo de vida 1 497 132 104
Material 1 486 131 724
Subsistema 1 472 130 937
Observações 1 440 128 208
Regime de escoamento 1 215 104 478
Tipo de assentamento 1 200 101 114
Tipo de secção 1 196 101 098
Designação Número de registos Comprimento total
Código universal 1 196 101 098
Diâmetro (mm) 112 5 846
Material 102 5 382
67
precedentes ao ano de instalação da tubagem. Desta forma, também estes registos foram
eliminados.
Na sequência deste processo, do universo de 4 735 registos, foram assinalados como válidos
para o presente estudo 1 763, cerca de 37,2% do total.
Quadro 6.7 – Registo da filtragem aplicada aos dados de OT.
Quadro 6.8 – Registo da validação efectuada aos dados de OT.
6.2.4 Considerações adicionais
Os dados disponibilizados pela EPAL são muitos e correspondentes a uma rede de dimensão
apreciável, todavia, embora a lista de campos, tanto em tubagens como em OT, seja extensa,
não contém informação suficiente para equacionar a totalidade dos parâmetros que podem
influenciar roturas em sistemas de abastecimento de água (indicados no Quadro 3.3).
De facto, verifica-se que a ausência de campos com informação sobre a classe de pressão das
tubagens, o número de ramais associados ou a exposição da tubagem a cargas excepcionais
(tais como vias de tráfego intenso), para designar apenas alguns, limita a qualidade dos modelos
desenvolvidos.
6.3 Caracterização e análise preliminar do sistema estudado
6.3.1 A rede de abastecimento
Acompanhando a filtragem dos dados, foi indispensável proceder à análise e à caracterização da
rede de abastecimento. Não só porque é conveniente conhecer os dados a usar, mas porque, no
Designação Número de registos
Código universal 4 735
Causa de intervenção 4 453
Comunicado por 4 453
Data da comunicação 4 150
Natureza da intervenção 4 115
Tipo de intervenção 3 940
Tipo de trabalho executado 3 493
Localização 3 399
Localização da intervenção 3 396
Proprietário do local de intervenção 3 350
Responsabilidade 3 280
Observações de abertura 3 256
Observações de execução 3 253
Observações de inspecção 3 246
Designação Número de registos
Filtragem1 OT 3 246
Tubagens válidas 2 059
OT mais recente que a instalação da tubagem 1 763
68
caso das RNA, é da maior importância escolher para o grupo de treino conjuntos de dados
equilibrados.
Num ponto anterior, refere-se que a análise se restringe a apenas quatro materiais, o que
constitui um exemplo do tipo de actuação necessária. Ao purgar os restantes 10 materiais, está-
se, na realidade, a “perder” informação correspondente a apenas 0,72% da extensão total da
rede enquanto, por outro lado, se ganha substancialmente na fiabilidade dos resultados. Se, em
alternativa, este princípio fosse descurado, o comportamento dos materiais com maior
representação, tal como o FC ou o PEAD, condicionariam a resposta das tubagens constituídas
noutros materiais, pois a distinção feita pela RNA não é explícita, ou seja, a RNA não “sabe” que
materiais diferentes podem ter comportamentos distintos, pois trata a variável material como trata
a variável diâmetro ou a variável idade, de forma contínua.
As figuras apresentadas, em que se caracteriza a rede de abastecimento nos parâmetros
estudados, retratam os dados após a primeira etapa de validação. A primeira análise diz respeito
ao material, sendo a Figura 6.4 referente à rede de distribuição e a Figura 6.5 à rede de adução.
Figura 6.4 – Composição, por extensão de material, da rede de distribuição.
0.10%
0.30%
0.00%
13.94%
26.39%
30.58%
0.31%
28.36%
0.00%
0.72%
Aço
Betão armado
Europipe
Ferro fundido
Ferro fundido dúctil
Ferro galvanizado
Fibrocimento
Plástico
Polietileno de alta densidade
Polietileno de baixa densidade
69
Figura 6.5 – Composição, por extensão de material, da rede de adução.
Como se pode observar, as composições de ambos os sistemas são bastante distintas,
nomeadamente nas percentagens de tubagens em betão armado e PEAD.
Outro gráfico relevante é aquele que ilustra a idade da rede. Para este efeito, optou-se por uma
curva de extensão acumulada. Na Figura 6.6, para a distribuição, tal como na Figura 6.7, para a
adução, as abcissas correspondem ao ano de instalação das tubagens e as ordenadas à
extensão acumulada das tubagens instaladas até um dado ano.
Figura 6.6 – Idade da rede. Curva de extensão acumulada de acordo com o ano de
instalação para a rede de distribuição.
1.16%
47.13%
0.97%0.26%
32.01%
14.30%
1.56%
2.60%
0.01%
6.56%
Aço
Betão armado
Betão Armado (Rocla)
Europipe
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Poliester reforçado a fibra de vidro
Polietileno de alta densidade
-
200
400
600
800
1 000
1 200
1920 1930 1940 1950 1960 1970 1980 1990 2000 2010
Ex
ten
são
da
re
de
cu
jo a
no
de
inst
ala
ção
é
igu
al
ou
in
feri
or
[km
]
Ano de instalação
70
Figura 6.7 – Idade da rede. Curva de extensão acumulada de acordo com o ano de
instalação para a rede de adução.
Observando a Figura 6.6, nota-se claramente o efeito da campanha de renovação da rede posta
em prática em 2002 pela EPAL, uma vez que a curva, sensivelmente a partir desse ano,
aumenta bastante de declive. A partir da Figura 6.7, tem-se a percepção que os investimentos na
adução não têm sido tão relevantes, depreendendo-se até uma redução da taxa de instalação
face ao período anterior a 1985.
Um dos objectivos deste trabalho é que, com o auxílio das RNA, se consigam captar as relações,
por vezes complexas, que existem entre os vários parâmetros estudados. Por outras palavras,
não se procura obter a relação funcional entre a idade e o número de roturas, ou entre o
diâmetro e o número de roturas, mas relações que integrem a informação contida nos vários
parâmetros. Pretende-se, por exemplo, que o modelo seja sensível a ocorrências tais como o
aumento da correlação entre o diâmetro e a probabilidade de roturas com a idade, para tubagens
de um material específico. Assim, é útil conhecer a rede, não somente numa perspectiva
unidimensional, observando cada parâmetro de cada vez, mas também bidimensional. Neste
sentido, apresenta-se, na Figura 6.8, um gráfico que ilustra a composição da rede de distribuição
por idade e material.
-
20
40
60
80
100
120
1920 1930 1940 1950 1960 1970 1980 1990 2000 2010
Ex
ten
são
da
re
de
cu
jo a
no
de
inst
ala
ção
é
igu
al
ou
in
feri
ror
[km
]
Ano de instalação
71
Figura 6.8 – Caracterização da rede de distribuição por ano de instalação e material
(considerando FF, FC, FFD e PEAD).
Mais uma vez, é evidenciado o elevado investimento na renovação da rede efectuado desde
2002. No entanto, deve ter-se em conta que, uma vez que fica indisponível a maior parte da
informação referente às tubagens desactivadas ou substituídas, a renovação da rede contribui
não só para o aumento da extensão dos novos materiais, mas também para o decréscimo da
extensão dos antigos. Com esta observação, pretende-se salientar que as quantidades
apresentadas no gráfico não correspondem à totalidade das tubagens instaladas em cada ano,
mas apenas às que, até à data da obtenção da informação, se mantinham na rede.
Para clarificar este aspecto, recorre-se à Figura 6.9, que apresenta a evolução das extensões
das tubagens de cada material na rede, do início de 2002 até Agosto de 2007. Enquanto para o
FFD e, em especial, o PEAD, se verifica um aumento de extensão na rede a partir de 2002, as
extensões de FF e FC mantêm-se constantes. Esta observação, tal como se pode depreender,
não corresponde exactamente à realidade, pois a extensão total da rede de distribuição não
aumentou apreciavelmente nos últimos anos e têm sido substituídas extensões significativas dos
materiais mais antigos.
Na informação referente às tubagens são registados campos de ano de instalação e de estado
de ciclo de vida, não é registado, porém, o ano de desactivação ou substituição. Assim, não
obstante se consiga seguir com exactidão o aumento da extensão de qualquer material, não se
-
10
20
30
40
50
60
70
80
90
100
19
26
19
34
19
40
19
46
19
52
19
58
19
64
19
70
19
76
19
82
19
88
19
94
20
00
20
06
Exte
nsã
o n
a re
de
[km
]
Ano de instalação
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Polietileno de alta densidade
72
consegue distribuir a diminuição no tempo da extensão dos materiais que estão a ser postos fora
de serviço.
Os cálculos efectuados, nomeadamente valores de roturas por comprimento e por ano, são
afectados por esta limitação. Para cada período, as operações efectuadas deveriam dizer
respeito à extensão da rede à data, mas tal não é possível pois a informação sobre as tubagens
substituídas e desactivadas é perdida. Assim, como o índice de roturas por comprimento por ano,
para os períodos passados, só pode ser obtido a partir dos dados registados nas tubagens ainda
em operação, é provável que seja estimado por defeito, pois são as tubagens com pior
desempenho as mais substituídas.
Figura 6.9 – Evolução da extensão da rede, a partir da informação disponível, no período
em análise.
Outro parâmetro do modelo é o diâmetro da tubagem, proporcional ao perímetro e, como tal,
relacionável com área em que podem ocorrer roturas. Na Figura 6.10 pode observar-se a
presença de cada classe de diâmetro na rede de distribuição, sendo a Figura 6.11 referente às
tubagens de adução.
0
1
1
2
2
3
3
4
2002 2003 2004 2005 2006 2007
Ex
ten
são
da
re
de
[1
00
km
]
Ano
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Polietileno de alta densidade
73
Figura 6.10 – Disposição da rede de distribuição por diâmetro das tubagens.
Figura 6.11 – Disposição da rede de adução por diâmetro das tubagens.
Tal como para o ano de instalação e o material, também para o diâmetro se efectuou uma
análise bidimensional da rede de distribuição. A partir da Figura 6.12, que se reporta a essa
mesma análise, pode concluir-se que não existem variações extremas de material para material,
no que respeita à disposição dos diâmetros.
Não obstante, para o PEAD e o FFD, algumas classes assumirem relevância face às restantes,
pode considerar-se que as tubagens do grupo de materiais seleccionados para treino das RNA
apresentam uma boa representatividade de diâmetros até aos 315 mm.
-
50
100
150
200
250
25
38
40
50
60
63
76
80
90
10
0
10
2
10
8
11
0
12
5
13
0
15
0
16
0
18
0
20
0
22
0
22
5
25
0
30
0
31
5
35
0
40
0
45
0
50
0
60
0
75
0
80
0
Ex
ten
são
na
re
de
[k
m]
Diâmetro [mm]
-
5
10
15
20
25
30
50
80
10
0
20
0
30
0
35
0
40
0
50
0
56
0
60
0
70
0
75
0
80
0
82
0
10
00
12
00
12
50
15
00
Ex
ten
são
na
re
de
[k
m]
Diâmtro [mm]
74
Figura 6.12 – Caracterização da rede de distribuição por ano de instalação e diâmetro
(considerando FF, FC, FFD e PEAD).
Quanto à disposição da rede por subsistema, apresentam-se, na Figura 6.13 e na Figura 6.14,
gráficos ilustrativos, respectivamente para a distribuição e a adução.
Figura 6.13 – Disposição da rede de distribuição por subsistemas.
-
50
100
150
200
Ext
en
são
na
re
de
[k
m]
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Polietileno de alta densidade
47.85%
1.37%17.59%
0.01%
17.39%
1.17%
0.02%
9.46%
3.99%
1.15%
3.72%
Zona Alta
Zona Alta Redutora
Zona Baixa
Zona Baixa Redutora
Zona Média
Zona Sobrepressora
Zona Superior
Zona Superior Charneca
Zona Superior do Monsanto
Zona Superior Redutora
75
Figura 6.14 – Disposição da rede de adução por subsistemas.
Uma análise semelhante é apresentada, para a rede de distribuição, ao nível da freguesia. No
entanto, devido ao elevado número de freguesias e, como se verá, à menor relevância no
resultado final do modelo, opta-se por remeter para o Anexo IX esta informação.
6.3.2 Registos de roturas
Os registos de roturas validados foram, tal como as tubagens, analisados sob vários prismas. A
primeira análise efectuada foi ao índice anual de roturas por 100 km por ano, entre os anos de
2002 e 2007, apresentada na Figura 6.15.
Figura 6.15 – Registo do índice de roturas para os anos em análise.
38.46%
33.78%
16.51%
6.82%
4.43%
Zona Alta
Zona Baixa
Zona Média
Zona Superior Charneca
Zona Superior do Monsanto
25.57
45.83
37.3639.70
37.40
27.87
0
5
10
15
20
25
30
35
40
45
50
2002 2003 2004 2005 2006 2007
Ro
tura
s/(1
00
km
.an
o)
Ano
76
Para estimar correctamente os índices foi tido em conta o efeito de perda do “histórico de
tubagens”, referido no ponto anterior, e valores obtidos para 2002 e 2007, em que os dados não
respeitam à totalidade do ano, foram corrigidos para, proporcionalmente, corresponderem a um
ano de registos. Este cuidado foi aplicado às restantes análises efectuadas.
Da mesma forma, apresenta-se, na Figura 6.16, o índice médio de OT/(100km.ano) por cada um
dos materiais analisados.
Figura 6.16 – Registo do índice de roturas médio por material.
O índice médio mensal de roturas por 100 km por ano foi igualmente calculado, apresentando-se
o gráfico resultante na Figura 6.17. Observando este gráfico foi possível notar que as médias
mensais de roturas apresentavam um padrão inesperado, com roturas a crescer nos meses de
verão, até Setembro, e um pico nos meses de Janeiro e Dezembro.
Figura 6.17 – Registo do índice de roturas mensal médio para os anos em análise.
56.63
7.74
62.38
10.26
0
10
20
30
40
50
60
70
OT
/(1
00
km
.an
o)
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Polietileno de alta densidade
42.58
30.3428.54
33.0334.47
36.58 37.2939.59 40.46
37.41
29.69
44.12
0
5
10
15
20
25
30
35
40
45
50
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Ro
tura
s/(1
00
km
.an
o)
me
nsa
is m
éd
ias
Mês
77
No Anexo X é apresentado o histograma do índice médio mensal de roturas para todos os meses
do período estudado, sendo também apresentado o gráfico da Figura 6.17 com indicação do
desvio-padrão. Embora o período analisado seja insuficiente para demonstrar estatisticamente
que há influência sazonal no número de roturas, procuraram-se mais evidências que
suportassem ou refutassem esta hipótese.
Com este intuito, analisou-se a distribuição anual do tipo de roturas e das roturas em cada tipo
de material. Na Figura 6.18 apresenta-se o índice de roturas mensal médio de acordo com o tipo
de rotura, notando-se que os tipos de avarias mais comuns, tubo rachado e tubo seccionado,
apresentam a mesma tendência sazonal. As roturas do tipo “tubo rachado” são mais comuns nos
meses quentes e, pelo contrário, roturas do tipo “tubo seccionado” são mais concentradas nos
meses de Dezembro, Janeiro e Fevereiro.
Figura 6.18 – Índice de roturas mensal médio para os anos em análise, obtido para cada
uma das causas registadas.
Na Figura 6.19, que se reporta ao índice de roturas mensais médias por material da tubagem,
verifica-se um efeito semelhante. Tubagens em FF apresentam, em média, mais tendência para
romper nos meses de Dezembro, Janeiro e Fevereiro, enquanto para as tubagens de FC a
tendência é oposta, sendo apreciável uma preponderância de roturas em meses mais quentes
(Agosto apresenta o máximo).
0
5
10
15
20
25Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez
Tubo rachado
Tubo furado
Tubo seccionado
Avaria de juntas
Uniões desvedadas
78
Figura 6.19 – Índice de roturas mensal médio para os anos em análise, obtido para cada
um dos materiais estudados [rot/(100 km.ano)].
Completando a análise, foram estimados os tipos de rotura por material tal como se apresenta na
Figura 6.20. Tal como esperado a partir dos gráficos anteriores, o FF apresenta uma
percentagem superior de roturas devido a tubos seccionados, enquanto nas tubagens em FC
não se passa o mesmo, sendo os casos de tubos rachados mais de 70% do total.
Figura 6.20 – Distribuição percentual acumulada das causas de intervenção em roturas,
por tipo de material.
0
20
40
60
80
100
120Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez
Ferro fundido
Ferro fundido dúctil
Fibrocimento
Polietileno de alta densidade
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Ferro fundido Ferro fundido dúctil
Fibrocimento Polietileno de alta densidade
Dis
trib
uiç
ão
pe
rce
ntu
al
acu
mu
lad
a
do
tip
o d
e r
otu
ras
Material
Uniões desvedadas
Avaria de juntas
Tubo seccionado
Tubo furado
Tubo rachado
79
Face a estes indícios de que haveria influência sazonal a afectar a ocorrência de roturas em
Lisboa, procurou-se uma explicação física para o fenómeno a partir dos dados.
O FF parece sofrer mais roturas durante os meses mais frios, quando as tubagens são
longitudinalmente traccionadas, o que poderá explicar que os tubos sejam maioritariamente
seccionados. Pelo contrário, o FC é mais afectado nos meses mais quentes, aumentando
inclusivamente o índice de roturas com o aumento de temperatura, atingindo um pico em Agosto.
Justamente, estando devido à temperatura as tubagens sujeitas a forças longitudinais de
compressão, os tubos aparecem rachados.
Sendo esta apenas uma hipótese, sabe-se que a influência sazonal pode dever-se a outros
factores, tais como variações no nível freático. Por outro lado, é sabido que as variações
térmicas à superfície são atenuadas no subsolo e, para além disso, a água é uma substância
com capacidade calorífica considerável. Não obstante, há alguma coerência nos dados
observados podendo justificar-se um estudo mais profundo sobre este tema.
Foram analisados mais três parâmetros potencialmente relacionados com as roturas:
subsistemas de distribuição, freguesias e as divisões ocidental e oriental. A Figura 6.21 reporta-
se ao índice de roturas nos subsistemas com mais representatividade na rede de distribuição. No
Anexo XI é apresentado um gráfico com o índice de roturas calculado para as freguesias de
Lisboa.
Figura 6.21 – índice de roturas para os principais subsistemas da rede.
Na Figura 6.22, ilustra-se o resultado da avaliação do número de roturas nas duas divisões
territoriais de Lisboa.
46.26 45.32
19.79
14.65
51.22
28.16
40.0836.88
0
10
20
30
40
50
60
Zona Alta Zona Alta Redutora
Zona Baixa Zona Média Zona Sobrepressora
Zona Superior Charneca
Zona Superior do Monsanto
Zona Superior Redutora
Ro
tura
s/(1
00
km
.an
o)
mé
dia
s
80
Figura 6.22 – Número de roturas anual, em tubagens validadas, para as divisões ocidental
e oriental.
Finalmente, estudou-se qual a relação que teria o histórico de roturas nas roturas futuras. Com
este objectivo dividiram-se os dados de acordo com dois períodos, de 2002 a 2004 e de 2005 a
2007. Em cada período contabilizou-se o número de elementos com, pelo menos, uma rotura
registada.
De um total de 26 070 elementos de tubagem validados, 669 (2,57%) apresentaram roturas no
período entre 2002 e 2004 e 706 (2,71%) apresentaram roturas no período entre 2005 e 2007.
Destes, 160 (0,61%) apresentaram roturas tanto no primeiro como no segundo período.
Calculando a probabilidade condicionada resulta que, em tubagens que apresentaram uma ou
mais roturas no primeiro período, a probabilidade de se registar uma ou mais roturas no segundo
período não é 2,71%, mas 23,9% (160/669). Isto significa que, no período de 2005 a 2007, a
probabilidade de rotura das tubagens que sofreram roturas de 2002 a 2004 é 8,83 vezes superior
à das restantes.
6.4 Preparação do modelo de degradação da rede de abastecimento
6.4.1 Considerações prévias
O estudo da degradação do sistema de distribuição de água de Lisboa pode ser encarado como
um problema de aproximação de uma função ℝ� → ℝ, em que J é o número de variáveis
explicativas considerado. Desta forma, podem aplicar-se RNA, particularmente do tipo PMC ou
RBR. Destas, escolheu-se o PMC pelas razões expostas nos capítulos anteriores.
0
50
100
150
200
250
2002 2003 2004 2005 2006 2007
Nú
me
ro d
e r
otu
ras
em
tu
ba
ge
ns
va
lid
ad
as
Ano
Ocidental Oriental
81
Todas as redes PMC são designadas de acordo com a forma netAxBxC_D_E;
A indica o número de nós na primeira camada oculta;
B, caso exista, indica o número de nós na segunda camada oculta;
C, representa o número de nós na camada de output (no presente trabalho assume sempre o
valor 1);
D representa o número de inputs considerado;
E, caso exista, fornece informação adicional (é utilizado o sufixo lin quando a função de
activação na última camada é linear.
6.4.2 Preparação dos dados
Os dados seleccionados utilizados para o treino das redes, foram:
• Comprimento;
• Material;
• Idade (em 2008);
• Diâmetro;
• Subsistema;
• Freguesia;
• OT/(100km.ano) prévias (registos de 2002 a 2004);
• OT/(100km.ano) (registos de 2005 a 2007).
Destes, definiu-se que o índice OT/(100km.ano) registado entre 2005 e 2007, doravante
denominado simplesmente índice OT/(100km.ano), seria utilizado como alvo, enquanto as
restantes variáveis poderiam fazer parte dos padrões de treino. O padrão corresponde a um
vector em que o valor de cada entrada corresponde a uma variável. O conjunto de todos os
padrões define a matriz utilizada no treino.
Antes de iniciar o processo executaram-se ainda alguns passos. O primeiro consistiu na “mistura”
aleatória dos vários padrões, para não se enviesar o treino19.
Seguidamente, uma vez que cada padrão tem peso idêntico para a RNA, optou-se por dividir
padrões correspondentes a elementos de tubagem extensos em vários padrões mais pequenos,
por forma a que todos os padrões apresentados correspondessem a trechos de tubagem com
comprimento semelhante.
19 Esta medida é apenas relevante no modo de treino estocástico, não utilizado, porém, mesmo no modo determinístico pode ter interesse, uma vez que facilita a definição de subconjuntos de validação e teste.
82
Considerando-se que a extensão óptima seria a de 50 m, padrões de elementos com
comprimento inferior a metade desse valor foram retirados, enquanto padrões com mais de 75 m
foram divididos em dois, padrões com mais de 125 m, divididos em três e assim sucessivamente.
Idealmente, seria desejável utilizar a totalidade dos dados, no entanto, 1 029 km de rede
validados implicariam mais de um milhão de padrões, o que tornaria extremamente pesada
qualquer tentativa de treino de PMC. Por outro lado, não sendo um valor muito diferente da
média dos registos (39,5 m), o valor adoptado garante que se analisam 903 km de rede (87,7%
do total). Finalmente, foram executados testes com comprimentos de 10 e 20 m, não sendo os
resultados preliminares bastante parecidos.
Após a separação em padrões com representatividade semelhante, os dados não numéricos
foram convertidos em valores reais, com cada classe igualmente distanciada. Sendo cada
variável normalizada entre 0 e 1 entre a totalidade dos dados. Exceptuam-se os índices de
roturas, em que a normalização foi feita entre 0 e 0,8 prevendo a utilização da função de
activação sigmoidal no nó final da rede.
6.4.3 Definição da arquitectura da rede
Escolha de inputs
Com base na metodologia proposta, foram analisados vários conjuntos de parâmetros. O
comprimento do elemento, não estando relacionado com o comprimento físico dos trechos de
tubagem, não foi contabilizado em nenhum.
No Quadro 6.9 resumem-se os resultados obtidos. Na análise efectuada através de redes de
pequena dimensão (T1 a T13), pode depreender-se que os parâmetros mais importantes são,
por ordem decrescente: OT/(100km.ano) prévias, idade, material, subsistema e diâmetro.
O que se percepciona dos esquemas das redes treinadas é coerente com a informação obtida
através de EQM e correlação. As OT/(100km.ano) prévias têm muita importância, seguidas pela
idade. Com menos importância aparecem o diâmetro, o subsistema, o material e a freguesia.
Através da análise do comportamento de redes de maior dimensão (net20x1), pode observar-se
que a introdução de dados relativos à freguesia perturba o modelo, sendo que através da
utilização de diâmetros, idades, materiais, subsistemas e OT/(100.ano) prévias a qualidade da
aproximação é maximizada, tanto a nível de EQM como de correlação.
Embora estes resultados sejam inesperados no que toca ao material, pode encontrar-se uma
explicação para o reduzido peso deste parâmetro na Figura 6.8, onde se pode ver que cada
material tem uma época de aplicação bem marcada e sobreposições são raras. Assim, a RNA
evidencia dificuldade em separar claramente qual a influência do material e da idade.
Atendendo aos resultados obtidos, optou-se por utilizar padrões de 5 variáveis, deixando de fora
apenas a freguesia.
83
Quadro 6.9 – Avaliação da importância dos vários parâmetros para o modelo.
A partir dos esquemas as redes de menor dimensão (net0x1_6 e nt0x1_5),
net0x1_6_lin net0x1_6
Figura 6.23 – Esquemas dos PMC treinados para 6 variáveis.
net0x1_5_lin net0x1_5
Figura 6.24 – Esquemas dos PMC treinados para 5 variáveis.
Teste Diâmetro Idade Material Subsistema FreguesiaOT/
(100km.ano)PMC EQM Correlação
T1 net0x1_6_lin 8.89E-04 30.0%
T2 net0x1_6 8.99E-04 28.4%
T3 net0x1_5_lin 8.90E-04 30.0%
T4 net0x1_5 9.00E-04 28.3%
T5 net0x1_3_lin 8.91E-04 29.8%
T6 net0x1_3 9.15E-04 25.8%
T7 net0x1_3_lin 9.47E-04 17.8%
T8 net0x1_3 9.53E-04 15.9%
T9 net0x1_1_lin 9.75E-04 4.9%
T10 net0x1_1_lin 9.48E-04 17.4%
T11 net0x1_1_lin 9.58E-04 14.3%
T12 net0x1_1_lin 9.69E-04 9.2%
T13 net0x1_1_lin 9.07E-04 26.9%
T14* net20x1_6 8.84E-04 39.7%
T15* net20x1_5 8.64E-04 42.7%
T15* net20x1_5_lin 9.13E-04 39.1%
T16* net20x1_3 9.62E-04 33.0%
*Valores obtidos a partir da média de 10 treinos em que foi aplicada validação K-fold com cada um dos
subconjuntos de validação e teste a contabilizar 20% dos dados
Incluído
Não incluído
Freguesia
OT/(100km.ano) prévias
Subsistema
Material
Idade
Diâmetro
Freguesia
OT/(100km.ano) prévias
Subsistema
Material
Idade
Diâmetro
OT/(100km.ano) prévias
Subsistema
Material
Idade
Diâmetro
OT/(100km.ano) prévias
Subsistema
Material
Idade
Diâmetro
84
Escolha das funções de activação
As funções de activação na camada oculta devem ser não lineares para que o PMC tenha
capacidade de aproximar funções também não lineares, como é o caso. Sendo que é possível
aplicar qualquer função diferenciável a monotonamente crescente, há um grupo de funções que
se destaca, sendo adoptado na maioria dos trabalhos com PMC. Este grupo é composto pelas
funções tangente hiperbólica, sigmoidal e arco-tangente.
O software utilizado não disponibiliza de origem a função de activação arco-tangente e, sendo
esta bastante semelhante à função tangente hiperbólica, optou-se por não desenvolver uma
rotina para a incluir como opção no processo de retropropagação.
Face à função sigmoidal, a função tangente hiperbólica é preferível, pois não é estritamente
positiva (Veelenturf, 1995). Deste modo, a função de activação nos nós das camadas ocultas foi
sempre a tangente hiperbólica.
Na camada de output é comum a utilização de funções de activação lineares. No entanto, pelas
razões já expostas e face aos resultados obtidos, optou-se por utilizar a função sigmoidal.
Escolha do número de camadas e nós
A escolha do número óptimo de camadas e nós é porventura a parte mais importante da
definição da arquitectura do PMC. A escolha de poucos nós pode produzir resultados
insatisfatórios pela simplicidade da aproximação, enquanto a escolha de muitos nós pode
resultar numa aproximação excelente no treino e aproximações totalmente desadequadas na
validação.
Na realidade, embora se fale correntemente no número de nós, o parâmetro mais importante
consiste no número de ligações sinápticas entre estes (Kasabov, 1996), sendo que a relação
entre as grandezas varia com o número de camadas adoptado.
A determinação do número de nós e camadas contemplou dois procedimentos distintos. Por um
lado, procedeu-se experimentação de redes com diferentes topologias, com recurso a validação
K-fold e utilizando a retropropagação modificada com o algoritmo de Levenberg-Marquardt. Por
outro, foi preparada uma simulação de AG que, no fundo, automatiza e orienta a
experimentação.
Os resultados do processo de experimentação de várias topologias de PMC incluindo EQM,
correlação e tempo de treino, são apresentados da Figura 6.25 à Figura 6.28, em ordem ao
número de ligações sinápticas e ao número de nós. Tabelas, contendo os resultados obtidos,
assim como informação adicional, são apresentadas Anexo XII Note-se que, quanto ao EQM,
tanto as figuras como os quadros do anexo contêm valores referentes ao grupo de melhores
resultados (90% do total), pelas razões apresentadas no capítulo 1.
85
Figura 6.25 – EQM médio, após validação K-fold, para PMC de uma e duas camadas, com
intervalos de confiança de 95% obtidos recorrendo à distribuição de t-Student (número de
ligações sinápticas; 90% dos testes).
Figura 6.26 – EQM médio, após validação K-fold, para PMC de uma e duas camadas, com
intervalos de confiança de 95% obtidos recorrendo à distribuição de t-Student (número de
nós; 90% dos testes).
7.70E-04
8.20E-04
8.70E-04
9.20E-04
9.70E-04
1.02E-03
0 100 200 300 400 500 600
EQ
M
Número de ligações sinápticas na rede
1 camada
2 camadas
7.70E-04
8.20E-04
8.70E-04
9.20E-04
9.70E-04
1.02E-03
0 5 10 15 20 25 30 35 40 45
EQ
M
Número de nós na rede
1 camada
2 camadas
86
Figura 6.27 – Correlação média, após validação K-fold, para PMC de uma e duas camadas,
com intervalos de confiança de 95% obtidos recorrendo à distribuição de t-Student.
Figura 6.28 – Tempo de treino médio, após validação K-fold, para PMC de uma e duas
camadas, com intervalos de confiança de 95% obtidos recorrendo à distribuição de t-
Student.
Analisando os elementos obtidos, nota-se que a correlação é semelhante para todas as
topologias a partir de 10 nós na camada oculta, no entanto, ao nível de EQM (o parâmetro mais
importante), notam-se diferenças mais substanciais. Embora não seja a rede que alcançou o
melhor desempenho (net19x16x1_5), a rede net20x1_5 apresenta, em média, os melhores
resultados em relação ao EQM, sendo que, no que diz respeito à correlação, não se afasta
demasiado da rede com o melhor resultado (net17x13x1_5), razões pelas quais se admitiu ser a
que melhores condições tem para prever a degradação da rede de distribuição de Lisboa.
Num gráfico que relaciona o EQM e a correlação, remetido para o Anexo XIII, pode ver-se que a
relação entre as duas grandezas é, no espaço de resultados, aproximadamente linear para cada
topologia de rede, mas há uma tendência de translação da correlação entre redes.
Quanto ao número de camadas, o que se verifica é que as redes com duas camadas apresentam
os melhores resultados (em absoluto) porém, na média, o desempenho não é tão bom. Pensa-se
que os bons desempenhos se devem à maior capacidade que têm estas redes (em virtude do
maior número de ligações sinápticas), por outro lado, em média, os resultados não reflectem
esse aspecto, provavelmente devido à paragem antecipada do treino em virtude da degradação
do desempenho para o subconjunto de validação.
0%
10%
20%
30%
40%
50%
0 100 200 300 400 500 600
Co
rre
laçã
o
Número de ligações sinápticas na rede
1 camada
2 camadas
0%
10%
20%
30%
40%
50%
0 10 20 30 40 50
Co
rre
laçã
o
Número de nós na rede
1 camada
2 camadas
0
50
100
150
200
250
300
350
400
0 100 200 300 400 500 600
Tem
po
mé
dio
de
tre
ino
[s]
Número de ligações sinápticas na rede
1 camada
2 camadas
0
50
100
150
200
250
300
350
400
0 10 20 30 40 50
Tem
po
mé
dio
de
tre
ino
[s]
Número de nós na rede
1 camada
2 camadas
87
Quanto à relação do desempenho da rede (baseado no EQM) com o índice OT/(100km.ano),
verifica-se que, na média, a rede net20x1_5 tem um erro médio (8.53x10-04) equivalente a +-
122,4 OT/(100km.ano) o que, à primeira vista, é alarmante. No entanto, utilizando a função
criada para determinar o EQM mínimo intrínseco à amostra, foi possível aferir que esse valor
(5,62x10-4) corresponde a +- 99,3 OT/(100km.ano).
Uma vez que a média de OT/(100km.ano), para as tubagens que constituem dados, é de 32,7,
tanto o EQM mínimo como o EQM médio do PMC escolhido parecem excessivos. No entanto, é
importante lembrar que o índice é calculado para cada elemento de tubagem individualmente.
Por exemplo, um elemento com 50 m de comprimento que registe duas roturas por ano, terá um
índice de 4000 OT/(100km.ano). Se esta for um elemento, por exemplo, em FFD, esperar-se-ia
um valor muito inferior, na ordem de 7 ou 8. Assim, por cada tubagem que apresenta roturas, o
desempenho da rede de acordo com o EQM é fortemente afectado, o que explica valores tão
elevados. Não obstante, no treino das redes, como se verá, tal efeito não constitui um problema.
Os AG foram utilizados, como já referido, para automatizar o processo de procura da melhor
topologia para a RNA. Fazendo-o seguindo princípios da evolução natural, partiam de uma
população de topologias de RNA (cromossomas) variadas, geradas aleatoriamente, por meio de
operações de mutação e cruzamento de indivíduos na procura da topologia com melhores
desempenhos.
A aplicação desenvolvida incorpora o treino de RNA, com validação cruzada, no AG, sendo o
desempenho médio das redes o parâmetro de comparação dos cromossomas. O cromossoma
adoptado incorpora toda a informação necessária à definição de PMC. Sendo limitado, por
razões práticas, a redes com quatro camadas ocultas, a estrutura do cromossoma apresenta-se
na Figura 6.29.
Número de
camadas ocultas
Número total
de nós
Nós na 1ª
camada oculta
Nós na 2ª
camada oculta
Nós na 3ª
camada oculta
Nós na 4ª
camada oculta
Figura 6.29 – Constituição do cromossoma do AG utilizado para determinar a melhor topologia de PMC.
Na implementação deste AG surgiram algumas dificuldades. A primeira resulta de não se poder
cruzar informação de dois cromossomas distintos com facilidade, pois os “valores” do
cromossoma não são independentes entre si (o número de nós nas camadas ocultas tem que ser
igual ao número total de nós e só podem haver nós em camadas que “existam” de acordo com a
primeiro valor do vector). Seguidamente sintetiza-se o processo utilizado para solucionar este
problema, ilustrando-se, na Figura 6.30, um exemplo.
88
Como cruzar informação entre dois PMCs (PMC 1 e PMC 2) distintos?
PMC 1 4 10 4 2 2 2
PMC 2 2 20 15 5 0 0
Número de camadas ocultas
Número total de nós
Número de nós em cada camada
231
3 15
2 13
Valores médios para número de camadas ocultas e número de nós.
A que se adicionam valores aleatórios segundo uma distribuição normal com a média obtida e desvio padrão escolhido no início do processo.
e1 2
+ componentealeatória
Adimensionalização PMC 1 0.4 0.2 0.2 0.2
PMC 2 0.75 0.25 0 0
Soma 0.575 0.225 0.1 0.1
Dimensionalização
2 13 9 4
2 13 10 3
Componente aleatória
A introdução de componente aleatória, tal como nos passos 1 e 2, é feita de acordo com a distribuição normal. A média é igual ao resultado da dimensionalização da soma da distribuição de nós pelas camadas de PMC 1 e PMC 2 e o desvio-padrão é escolhido no início do processo.
O processo de dimensionalização deve redistribuir os restos da operação por forma a que o número de nós e camadas seja respeitado.
A obtenção da distribuição de nós pelas camadas ocultas é feita em quatro passos:
3
+ componentealeatória
89
Figura 6.30 – Resultado do cruzamento de dois PMC (PMC 1 e PMC 2) no âmbito da
aplicação de AG desenvolvida (número de nós nas camadas ocultas).
A segunda dificuldade, surge pelo facto de se estar a executar um programa dentro de outro,
tornando-se a simulação muito lenta20.
Uma terceira dificuldade, mais determinante, surge devido ao facto de o treino dos PMC ser um
processo intrinsecamente estocástico (não em função do modo de treino, que é determinístico,
mas em função do estado inicial das redes21, que é aleatório, e do processo de selecção dos
subconjuntos de validação, também aleatório). Uma vez que o resultado, para dada topologia de
rede, não é sempre igual, o AG oscila indefinidamente, pois uma rede que tem melhor
desempenho numa época pode não ter na seguinte.
Há várias formas de lidar com este aspecto. A mais simples será efectuar apenas um treino para
cada rede e utilizar o valor obtido nas épocas seguintes. Este procedimento, no entanto, não é
adequado, pois pode levar à adopção de topologias inadequadas, uma vez que um treino não é
amostra suficiente. Outra hipótese, a formalmente mais adequada, consiste em, em cada época,
realizar um número de treinos com significado estatístico suficiente para comparar valores
médios. Esta alternativa, porém, não é exequível, uma vez que elevaria o tempo de computação
para valores demasiado altos.
Propôs-se então uma solução de compromisso. Nesta solução prevê-se que cada cromossoma
seja treinado, em cada época em que esteja presente, determinado número de vezes (por
exemplo, 10 vezes), armazenando-se a média de EQM obtida e o número de treinos
acumulados. A partir da época em que o número de treinos acumulado excede um valor limite
20 Para redes com 40 nós pode exceder os 2 dois dias de computação num computador Intel Core 2 Duo com 2,00 GHz e 2 GB de RAM. 21 Para iniciar o processo de retropropagação é necessário arbitrar valores para as ligações sinápticas da RNA.
0
2
4
6
8
10
12
14
1 2 3 4
Nú
me
ro d
e n
ós
Identificação da camada oculta
PMC 1
PMC 2
PMC final
90
(por exemplo, 40 treinos), tendo-se já compilado uma amostra razoável, o PMC passa a ser
treinado uma única vez por época, poupando tempo computacional. Desta forma, investe-se na
avaliação mais precisa das topologias que apresentam os melhores resultados.
Para implementar este tipo de rotina, é necessário armazenar, no mínimo, valores médios e o
número total de testes. No entanto, para todas as combinações de topologias (incluindo número
total de nós variável22) é fácil constatar que a matriz necessária facilmente toma dimensões
apreciáveis, excedendo a capacidade do Matlab.
Assim, reduziu-se o âmbito do AG à determinação da topologia óptima com número de nós fixo a
priori, ou seja, à determinação do número de camadas ocultas e da distribuição de nós entre
estas.
Os resultados obtidos vieram confirmar a adequação das equações [22] e [23] quanto à
estimativa de distribuição de nós por camadas ocultas.
No Anexo XIV é apresentado o código desenvolvido, em Matlab, no âmbito do AG. Os
parâmetros utilizados são sintetizados no Anexo XV.
6.4.4 Selecção do algoritmo de treino
A selecção do algoritmo de treino passou, tal como é proposto no capítulo 1, pela
experimentação dos vários algoritmos disponibilizados na Neural Networks Toolbox do Matlab23.
O processo de treino utilizado apoia-se no módulo para teste, treino e simulação de RNA
desenvolvido. Com esta ferramenta foi possível treinar uma rede repetidas vezes, recorrendo à
validação K-fold, sendo que, em cada ciclo de treino (treino de todos os algoritmos), o estado
inicial da rede e os subgrupos de validação são estritamente iguais, tornando-se possível a
comparação objectiva dos algoritmos.
A informação devolvida pela ferramenta, a cada ciclo e para cada algoritmo, inclui o EQM, a
correlação e o tempo de treino.
Os testes foram efectuados para a rede net20x1_5, anteriormente seleccionada como a rede
com mais potencial para a modelação da degradação do sistema de distribuição de água de
Lisboa. Da Figura 6.31 à Figura 6.33 são apresentados os resultados obtidos, incluindo barras de
erro indicadoras do desvio-padrão de cada amostra. Em todos os testes, o subconjunto de
validação foi composto por 20% dos dados.
Analisando os resultados obtidos, é patente que a retropropagação de Levenberg-Marquardt
(trainlm) se destaca, tanto a nível de EQM, bastante abaixo de qualquer um dos restantes
algoritmos, mas também a nível da correlação, cuja média é a única a exceder os 40%.
22 Dentro de um intervalo previamente definido. 23 Uma lista das abreviaturas dos algoritmos de treino é apresentada no Anexo IV.
91
Apenas em tempo de treino este algoritmo é superado, pela retropropagação resiliente (trainrp),
no entanto, para efeitos do presente estudo, o tempo de treino tem uma importância mínima, pelo
que se considera que a suposição inicial de que o retropropagação modificada com o algoritmo
de Levenberg-Marquardt é válida e, portanto, a rede net20x1_5 é, de facto, a mais adequada
para levar a cabo a modelação pretendida neste trabalho.
No Anexo IV é apresentado um gráfico de EQM versus correlação, ilustrativo do desempenho
atingido através de cada um dos diferentes algoritmos.
Figura 6.31 – Resultado do EQM de treino através da utilização de vários algoritmos de
treino, para a rede net20x1_5, com validação K-fold, de subconjuntos de validação a
contabilizar 20% do total de dados.
Figura 6.32 – Resultado da correlação de treino através da utilização de vários algoritmos
de treino, para a rede net20x1_5, com validação K-fold, de subconjuntos de validação a
contabilizar 20% do total de dados.
8.00E-04
8.50E-04
9.00E-04
9.50E-04
1.00E-03
1.05E-03
traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
EQ
M
Algoritmo de treino
0%
10%
20%
30%
40%
50%
60%
traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
Co
rre
laçã
o
Algoritmo de treino
92
Figura 6.33 – Resultado do tempo médio de treino através da utilização de vários
algoritmos de treino, para a rede net20x1_5, com validação K-fold, de subconjuntos de
validação a contabilizar 20% do total de dados.
6.4.5 Treino da rede
Uma vez definida a arquitectura do PMC, o treino da rede definitiva aparece como uma etapa
trivial, pois já foram executadas dezenas (no presente caso centenas) de treinos. No entanto,
algumas considerações adicionais justificam-se.
Na metodologia anterior deu-se primazia à validação K-fold, no entanto, neste tipo de treino, a
rede é treinada para cada uma das combinações de subconjuntos de treino e validação à vez,
até que a totalidade dos dados tenha pertencido ao subgrupo de validação. Deste modo, o EQM
pode ser obtido sem dificuldade, porém, uma vez que a rede é inicializada para cada combinação
de subconjuntos (os pesos sinápticos são gerados aleatoriamente), na prática são treinadas não
uma, mas K redes, não resultando uma rede “treinada” do processo.
Alguns problemas que podem ser resolvidos com recurso a RNA necessitam de uma grande
eficiência por parte das redes, ou seja, o treino tem que produzir bons resultados num espaço de
tempo curto e, nesse sentido, a validação K-fold é bastante interessante.
Neste trabalho procura-se modelar a degradação de sistemas de distribuição de água, pelo que é
mais importante que a rede tenha o melhor desempenho possível do que o tempo que demora a
ser treinada ou quantos treinos são necessários até se obter uma rede que seja satisfatória24.
Assim, talvez a validação K-fold não seja a melhor opção.
24 Como se pode observar através dos resultados anteriormente expostos, o processo de treino (até com validação K-fold) está sujeito alguma aleatoriedade, podendo até não convergir para um EQM minimamente
0
50
100
150
200
250
300
traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
Te
mp
o d
e t
rein
o [
s]
Algoritmo de treino
93
A validação cruzada, é também concebida para assegurar boas capacidades de generalização,
no entanto, ao contrário da validação K-fold, a cada processo de treino corresponde uma única
rede “treinada”. A desvantagem deste método é que o treino fica mais sensível à componente
estocástica do treino que advém do estado inicial do PMC e da selecção dos subgrupos de
treino, validação e teste.
Assim, corre-se o risco de que um bom desempenho através de validação cruzada se deva ao
facto de os padrões de dados contidos no subconjunto de validação serem muito semelhantes
aos contidos no subconjunto de treino e não à capacidade da rede propriamente dita. Foi
exactamente devido a este facto que o processo de escolha da rede adequada (net20x1_5) foi
exigente.
Uma vez se tomaram as precauções necessárias para que a rede a treinar tenha a capacidade
de fazer boas generalizações, o processo que se propõe para treino da rede definitiva consiste
na execução de vários treinos da rede net20x1_5, recorrendo a validação cruzada, sendo
guardada a matriz de pesos sinápticos correspondente ao melhor desempenho (menor EQM).
Para levar a cabo este tipo de treino recorreu-se, mais uma vez, ao módulo para teste, treino e
simulação de RNA, que permite executar um número arbitrário de treinos, sendo “guardada” a
matriz de pesos que os melhores resultados produziu.
A rede definitiva foi obtida através do teste de 50 PMC com a arquitectura adoptada, tendo sido o
EQM final de (8.33x10-4), correspondente a 120,97 OT/(100km.ano), um resultado 48,2%
superior ao do EQM mínimo intrínseco do conjunto de dados.
Na Figura 6.34 apresenta-se um gráfico particularmente elucidativo da adequação das RNA para
o efeito pretendido neste trabalho, com a idade das tubagens25 em abcissas e o índice médio de
OT/(100km.ano) para as tubagens de determinada idade. Na Figura 6.35 ilustra-se uma
representação gráfica da RNA escolhida.
Note-se como o resultado da simulação se ajusta aos dados que, ademais, não apresentam uma
evolução exponencial do índice de roturas em função da idade, como seria de esperar, mas uma
relação funcional mais complexa, em virtude da grande campanha de renovação da rede levada
a cabo em Lisboa desde 2002.
aceitável. Assim, é concebível que o treino seja repetido algumas vezes até que uma rede com desempenho acima da média seja produzida. 25 Idades relativas ao ano de 2008.
94
Figura 6.34 – Resultado da simulação do índice OT/(100km.ano) para o conjunto de
tubagens validado, num gráfico com a idade dos elementos de tubagem em abcissa e o
índice OT/(100km.ano) médio para tubagens de determinada idade em ordenada.
Figura 6.35 – Representação da RNA escolhida. A cor azul denota pesos sinápticos
positivos e a cor vermelha negativos, sendo a intensidade das cores proporcional ao
módulo do valor.
0
50
100
150
200
250
300
350
400
0 10 20 30 40 50 60 70 80
OT
/(1
00
km
.an
o)
Idade da tubagem
Dados
net20x1_5
95
6.4.6 Validação
A validação dos dados foi efectuada, tal como referido no capítulo 1, recorrendo à analise gráfica
dos resultados obtidos através da simulação de OT/(100km.ano) para os elementos validados da
rede de distribuição de Lisboa.
O gráfico mais expressivo é, porventura, aquele a que se reporta a Figura 6.34 (acima). No
entanto, a análise deve ser, como já foi referido, multidimensional. Assim, complementou-se este
elemento com os gráficos apresentados na Figura 6.36, que fazem uma análise semelhante, por
material da tubagem, e com o gráfico de OT(100km.ano) acumuladas com a idade das tubagens
(Figura 6.37).
Seguidamente, faz-se a análise das simulações da rede na óptica dos diâmetros (Figura 6.38) e
dos subsistemas (Figura 6.39). Para o Anexo XVII remete-se a relação entre diâmetros e
materiais.
Figura 6.36 – Correspondência entre os dados e as previsões da rede escolhida. Índice de
OT/100km/ano em ordem à idade das tubagens, por material.
0
20
40
60
80
100
120
140
160
180
0 10 20 30 40 50 60 70 80
OT/
(10
0k
m.a
no
)
Idade
FF
FF sim.
0
50
100
150
200
250
300
350
400
0 10 20 30 40 50 60 70 80
OT/
(10
0k
m.a
no
)
Idade
FC
FC sim.
0
10
20
30
40
50
60
70
80
0 10 20 30 40 50 60 70 80
OT/
(10
0k
m.a
no
)
Idade
FFD
FFD sim.
0
2
4
6
8
10
12
14
0 10 20 30 40 50 60 70 80
OT/
(10
0k
m.a
no
)
Idade
PEAD
PEAD sim.
96
Figura 6.37 – Correspondência entre os dados e as previsões da rede escolhida. Índice de
OT/100km/ano em ordem à idade das tubagens, por material.
Figura 6.38 – Correspondência entre os dados e as previsões da rede escolhida. Índice de
OT/100km/ano em ordem ao diâmetro nominal das tubagens.
0
1000
2000
3000
4000
5000
1 3 5 7 911131517192123252729313335 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 6971
73
OT
/(1
00
km
.an
o)
acu
mu
lad
as
Idade da tubagemDados OT/(100km.ano) acum.
Simul. OT/(100km.ano) acum.
0
20
40
60
80
100
120
140
160
38 40 50 60 63 80 100 108 110 125 130 150 160 180 200 220 225 250 300 315
OT
/(1
00
km
.an
o)
Diâmetro nominal da tubagem [mm]
Dados
net1x20_5
97
Figura 6.39 – Correspondência entre os dados e as previsões da rede escolhida. Índice de
OT/100km/ano em ordem ao subsistema de abastecimento.
Como se pode observar através dos elementos obtidos, o PMC net20x1_5, treinado pela
metodologia proposta, parece adequar-se bem à simulação da degradação da rede de
distribuição de água de Lisboa, até ao nível de diâmetros e subsistemas, variáveis que
apresentam uma relação relativamente fraca com as roturas. Note-se que os dados utilizados
nos elementos gráficos compreendem a totalidade das tubagens validadas (subconjuntos de
treino, validação e teste).
A validação poderia ser levada a cabo apenas com dados do subconjunto de teste, o único que
não intervém, directa ou indirectamente, no treino. No entanto, tal procedimento não traria
grandes ganhos, uma vez os processos de determinação da arquitectura da rede e,
posteriormente, de treino, tiveram em consideração a importância de os conjuntos de treino,
validação e teste originarem desempenhos semelhantes.
Assim, conclui-se que, na vizinhança dos dados disponíveis, a rede net20x1_5 tem um bom
desempenho. No entanto, tal pode não ser verdade para todo espaço de padrões possível (por
exemplo, tubagens em PEAD com mais de 30 anos, ou FF recentemente instalado).
6.5 Análise dos resultados Para analisar os resultados para a totalidade dos padrões concebíveis, recorreu-se a um módulo
em VBA, descrito sumáriamente no capítulo 1, que gera pontos amostrais do espaço de
resultados. Dado que o espaço de padrões possíveis é um hipercubo com 5 dimensões
(diâmetro, material, idade, subsistema e OT/(100km.ano) prévias), o processo é
computacionalmente exigente e, para se obter uma amostra representativa, facilmente se têm de
considerar mais de 300 000 combinações de padrões.
0 10 20 30 40 50 60
Zona Sobrepressora
Zona Alta
Zona Alta Redutora
Zona Superior do Monsanto
Zona Superior Redutora
Zona Superior Charneca
Zona Baixa
Zona Média
Zona Baixa Redutora
Zona Superior
OT/(100km.ano)
Su
bsi
ste
ma
de
dis
trib
uiç
ão
net20x1_5
Dados
98
Os padrões fictícios gerados são, então, simulados na RNA treinada, obtendo-se como resultado
uma amostra homogénea do espaço de resultados. No Anexo VIII explica-se em maior detalhe o
processo e indicam-se quais os pontos amostrais seleccionados para o caso do presente estudo.
Passando aos resultados, devem ser interpretados da seguinte forma:
• A informação correspondente aos dados é composta por valores reais, contidos nos
dados da fornecidos pela EPAL.
• A informação simulada corresponde a uma fatia homogénea do espaço de resultados,
transversal aos parâmetros que se analisam em cada gráfico. Assim, num gráfico de
idade versus OT(100km.ano), está na realidade a reflectir-se a resposta média da rede
para pontos com essas características, mas com diâmetros variáveis, OT/(100km.ano)
prévias variáveis, materiais variáveis e subsistemas variáveis.
Embora analisar informação relativa ao “diâmetro médio” ou ao “subsistema médio” não
tenha implicações demasiado grandes nas respostas da RNA, o parâmetro
OT/(100km.ano) prévias tem. Assim, os gráficos seguintes, à excepção do primeiro, são
referentes a um índice de OT/(100km.ano) prévias específico.
• Tal como as previsões, os dados são influenciados por este efeito, em que parâmetros
que não são incluídos no gráfico exercem influência no resultado do mesmo. Ao
comparar previsões e dados há que ter este factor em conta.
A Figura 6.40 reporta-se à relação entre índices de rotura prévios e índices de rotura registados
(dados) ou simulados (rede net20x1_5). Como se pode observar, a relação é aproximadamente
linear, mas valores muito elevados tendem à redução no futuro.
Figura 6.40 – Relação entre índices de rotura prévios (OT/(100km.ano) prévias) e previstos
(OT/(100km.ano)).
0
500
1000
1500
2000
2500
3000
0 500 1000 1500 2000 2500 3000 3500 4000
OT
/(1
00
km
.an
o)
OT/(100km.ano) prévias
Dados
net20x1_5
99
Na Figura 6.41 ilustra-se a resposta da RNA face à idade da tubagem, para diferentes casos de
OT(100km.ano) prévias. Comparando os gráficos com o da Figura 6.34, nota-se imediatamente a
influência do efeito relatado anteriormente. Se com caracetrísticas idênticas às da rede existente
os resultados se assemelham aos reais, com a média homogénea de pontos amostrais obtém-se
uma curva bastante suave. Note-se, igualmente, a influência do parâmetreo OT/(100km.ano).
Caso de 0 OT/(100km.ano) prévias Caso de 37,5 OT/(100km.ano) prévias
Caso de 850 OT/(100km.ano) prévias Caso de 2750 OT/(100km.ano) prévias
Figura 6.41 – Resultado da simulação do índice OT/(100km.ano), num gráfico com a idade
dos elementos de tubagem em abcissa e o índice OT/(100km.ano) médio em ordenada.
Nas duas figuras seguintes, é feita uma análise equivalente, discretizada por material.
Observando os resultados obtidos pode antever-se aquela que é possivelmente a maior limitação
do modelo. Os materiais têm um comportamento bastante diferente do que é esperado, e
verificado, na realidade, especialmente para idades de tubagem não presentes na rede.
Este efeito deve-se ao facto de que, para cada um dos materiais, não existem dados em todo o
intervalo de idades considerado, o que leva o PMC a reduzir a inportância do material como
parâmetro (note-se o fraco peso sináptico das ligações a partir do nó de input do material, no
caso dos PMC sem camada oculta).
Particularmente, note-se o mau resultado obtido para o FFD. Tendo o menor valor de índice de
roturas para idades reduzidas da tubagem, passa ao pior para tubagens mais velhas. A função
que descreve este comportamento faz lembrar a função de activação utilizada, a tangente
0
50
100
150
200
250
300
0 20 40 60 80 100
OT/
(10
0k
m.a
no
)
Idade da tubagem
Dados
net20x1_5
0
50
100
150
200
250
300
0 20 40 60 80 100
OT/
(10
0k
m.a
no
)
Idade da tubagem
Dados
net20x1_5
0
100
200
300
400
500
600
0 20 40 60 80 100
OT/
(10
0k
m.a
no
)
Idade da tubagem
Dados
net20x1_5
0
200
400
600
800
1000
1200
1400
1600
0 20 40 60 80 100
OT/
(10
0k
m.a
no
)
Idade da tubagem
Dados
net20x1_5
100
hiperbólica. Desta forma, pensa-se que o modelo desenvolvido, embora tendo um ajuste
bastante bom à rede real, não pode ser aplicado com sucesso a redes muito diferentes. De facto,
as RNA (em particular o PMC) não têm, tal como se vê, uma capacidade de generalização que
permita este tipo de utilização.
Há, no entanto, procedimentos, não adoptados no âmbito deste trabalho, que podem melhorar os
resultados, designadamente treinar o RNA com um conjunto de dados fictício, correspondente ao
comportamento esperado, numa etapa anterior ao treino definitivo, com dados reais.
Não obstante, pensa-se que a utilização do presente modelo numa projecção de 5 a 10 anos não
incorre num erro substancial devido a este efeito.
Figura 6.42 – Resultado da simulação do índice OT/(100km.ano), num gráfico com a idade
dos elementos de tubagem em abcissa e o índice OT/(100km.ano) médio para tubagens de
determinada idade em ordenada. Por material; com 37,5 OT/(100km.ano) prévias.
A relação de diâmetros nominais e índice OT(100km.ano) previsto é apresentada na Figura 6.44,
sendo que a Figura 6.45 se reporta a uma análise semelhante, por subsistema de distribuição.
Da análise destes elementos nota-se que a resposta média da rede é bastante suave, como
esperado.
Embora, no que se refere ao diâmetro, os resultados sejam razoavelmente ajustados, para os
subsistemas nota-se uma desadequação grande, porventura devido à composição das tubagens
existentes nos mesmos, que não sendo homogénea como a dos pontos amostrais simulados,
interfere na análise. Não obstante, será de reconsiderar a inclusão do subsistema como
parâmetro em modelos futuros.
0
50
100
150
200
250
300
350
400
0 10 20 30 40 50 60 70 80 90
OT
/(1
00
km
.an
o)
Idade da tubagem
FF FC
PEAD FFD
FF sim. FC sim.
PEAD sim. FFD sim.
101
No caso do diâmetro, sendo os intervalos considerados para o diâmetro bastante “largos”, é
possível a distribuição dos dados tenha sido repartida desigualmente, contribuindo para o
agravamento da interferência observada.
Figura 6.43 – Resultado da simulação do índice OT/(100km.ano), num gráfico com a idade
dos elementos de tubagem em abcissa e o índice OT/(100km.ano) médio para tubagens de
determinada idade em ordenada. Por material; com 550 OT/(100km.ano) prévias.
Figura 6.44 – Relação entre observações e previsões de OT/(100km.ano) médias para as
classes de diâmetro nominal (37,5 OT(100km.ano) prévias).
0
100
200
300
400
500
600
700
800
0 10 20 30 40 50 60 70 80 90
OT
/(1
00
km
.an
o)
Idade da tubagem
FF FC
PEAD FFD
FF sim. FC sim.
PEAD sim. FFD sim.
0
20
40
60
80
100
120
25 75 125 175 225 282.5
OT
/(1
00
km
.an
o)
Classe de diâmetro nomial [mm]
Dados
net20x1_5
102
Figura 6.45 – Relação entre observações e previsões de OT/(100km.ano) médias nos
subsistemas de distribuição (37,5 OT(100km.ano) prévias).
No Anexo XIX figura um gráfico tri-dimensional que pretende ilustrar a relação entre Idade,
OT/(100km.ano) prévias e OT/(100km.ano). Da sua análise, é possível verificar que, para
efectuar previsões, a rede treinada se baseia sobretudo na idade da tubagem quando o índice de
OT/(100km.ano) prévias é baixo, sendo que, quando este valor aumenta, ganha uma relevância
muito grande.
6.6 Considerações adicionais sobre as variáveis explicativas Das variáveis explicativas estudadas, pensa-se que a que mais influência tem é o número prévio
roturas, que como resultado da análise directa dos dados, quer a partir da análise do
comportamento dos PMC treinados.
Seguidamente, destaca-se a idade, que pode ser facilmente correlacionada com as roturas, o
que é também observado no comportamento dos PMC treinados.
O material, cuja influência não foi inteiramente captada pela rede net20x1_5, é totalmente
indissociável do desempenho das redes de distribuição de água. Embora do ponto de vista
matemático fique “obscurecido” pela idade das condutas, como foi já referido, pensa-se que será
o terceiro parâmetro de maior importância.
O diâmetro aparece como o quarto parâmetro quanto à influência no número de roturas. E, a
partir da Figura 6.38, nota-se uma clara diminuição do índice de roturas com o aumento do
diâmetro. De facto, este resultado não seria o inicialmente esperado, pois com o aumento de
diâmetro aumenta também o perímetro da tubagem e, consequentemente, a área em que podem
haver falhas no material. Hipóteses que explicam este comportamento podem residir num maior
0 25 50 75 100 125 150
Zona Sobrepressora
Zona Alta
Zona Alta Redutora
Zona Superior do …
Zona Superior Redutora
Zona Superior Charneca
Zona Baixa
Zona Média
Zona Baixa Redutora
Zona Superior
OT/(100km.ano)
Su
bsi
ste
ma
de
dis
trib
uiç
ão
103
cuidado na colocação de condutas de maior diâmetro, ou até na menor sujeição a flutuações de
pressão provocadas por sobpressoras em edifícios.
Finalmente, o subsistema de distribuição revelou-se a variável que menos influência tem no
número de roturas. Essencialmente, a sua inclusão pretendeu, na medida do possível, incluir
implicitamente no modelo condições de exploração, características geotécnicas do solo e outras
variáveis que não é fácil contabilizar directamente. Da análise dos resultados pode constatar-se
que, caso esse objectivo tenha sido cumprido, foi-o tenuemente. Tal como já foi referido, a
inclusão deste parâmetro em trabalhos subsequentes merece reconsideração.
Um procedimento descrito em Lingireddy, et al., 2005, propõe que, para aferir a importância de
um parâmetro, o mesmo deverá ser substituido pelo valor médio da amostra em todos os
padrões de dados, sendo, seguidamente, efectuada a simulação dos novos padrões, na RNA
(previamente treinada). O cálculo do erro entre previsões e dados será indicativo dessa
importância.
Tendo-se levado a cabo este procedimento para os padrões considerados no presente estudo,
foi elaborado o Quadro 6.10, em que se apresentam os resultados obtidos ao substituir um
parâmetro pelo seu valor médio na totalidade dos padrões de dados. Tal como se pode avaliar,
os resultados obtidos corroboram inteiramente a análise efectuada.
Quadro 6.10 – Análise à sensibilidade de cada parâmetro no resultado da simulação da rede net20x1_5.
6.7 A dispersão do fenómeno A grande parte do estudo desenvolvido foi orientada para obter um modelo, baseado em RNA,
que tenha capacidade de prever o índice de roturas em elementos de tubagem do sistema de
distribuição de água de Lisboa. No entanto, o índice corresponde à média do número de roturas
esperado, não contendo qualquer tipo informação quanto à dispersão inerente à ocorrência de
roturas.
No âmbito da GA, particularmente em modelos de simulação da rede, é interessante contabilizar
a dispersão, pois a partir desta pode ser compreendido qual o risco que corre a entidade gestora
de que num dado ano, por obra do acaso, o número de roturas seja superior ao esperado.
Desta forma, com base nos valores médios estimados pela rede net20x1_5, foi aplicada a
distribuição estatística de Poisson, comparando os resultados obtidos, elemento a elemento de
tubagem, com os que, de facto, ocorreram de 2002 a 2007 na rede de distribuição de água
cidade de Lisboa.
Parâmetro em "falta" Diâmetro Idade Material Subsistema OT/(100km.ano)
EQM 8.66E-04 9.18E-04 8.90E-04 8.59E-04 9.21E-04
Correlação 34.0% 28.1% 32.5% 35.0% 25.2%
EQM/EQM mínimo 154.03% 163.44% 158.35% 152.92% 163.81%
104
Escolheu-se esta distribuição por dois motivos. O primeiro diz respeito à própria definição da
distribuição de Poisson, aplicável a fenómenos em que o número médio de falhas é
independente das falhas que já ocorreram26, podendo ser utilizada em fenómenos espaciais e/ou
temporais, como é o caso. O segundo, motivo prende-se à simplicidade desta distribuição, em
que o único parâmetro é a média, justamente o resultado produzido pela RNA treinada.
Para cada elemento de tubagem foi estimado o índice médio de roturas, por 100 km, por ano.
Seguidamente, com base na distribuição de Poisson, foi calculada a probabilidade do elemento
apresentar de 1 a 13 roturas no período que vai de 2005 a 2007.
Somando as probabilidades de ocorrer determinado número de roturas em cada um dos
elementos considerados, obteve-se a previsão do número total de elementos de tubagem com
esse registo. Comparando os resultados estimados com aqueles que foram registados em
Lisboa, foi elaborada a Figura 6.46.
Figura 6.46 – Distribuição do número de roturas num único techo de tubagem, para a rede
de distribuição da água de Lisboa (escala logarítmica).
Como se pode observar, apesar de o fenómeno apresentar, tal como esperado, uma dispersão
superior à da distribuição de Poisson, a estimativa obtida é muito próxima da realidade. Note-se
26 O que constitui uma hipótese razoável num sistema de distribuição de água, pois uma rotura, localizada no espaço, deixa a maior parte do sistema intacto.
Na prática, por diversas razões, sabe-se que não é assim, devido a flutuações de pressão na conduta, tensões induzidas durante a reparação e ainda outros factores. Não obstante, a hipótese admitida é, como se infere a partir dos resultados obtidos, próxima da realidade.
0.1
1
10
100
1000
10000
100000
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Nú
me
ro d
e t
rech
os
de
tu
ba
ge
m c
om
x r
otu
ras
Número de roturas no trecho de tubagem, no período em análise
Somatório dos casos registados
Somatório das ocorrências previstas
105
que, em virtude do gráfico estar reproduzido em escala logarítmica, erros pequenos (à direita)
são ampliados.
No cômputo dos 26 070 elementos, que contabilizaram 1 082 roturas no período estudado, a
previsão obtida através da aplicação de RNA e distribuição de Poisson subestimou o número de
roturas total em cerca de 12,5%, possivelmente devido à menor dispersão da distribuição
utilizada.
Não obstante, a correlação entre valores reais e estimados é de 100,0%, se considerados os
trechos de tubagem que contabilizam 0 roturas, e de 96,3% se se contabilizarem somente
trechos com uma ou mais roturas. Quanto ao parâmetro r2, estes valores são de 100,0 e 92,7%.
107
7. Notas conclusivas e recomendações para estudos subsequentes A modelação da degradação dos sistemas de distribuição de água é uma temática com interesse
em vários planos, sendo desejável económica, social e ambientalmente. É, no entanto, um
fenómeno complexo, em que se deparam ao investigador problemas nem sempre fáceis de
ultrapassar. Neste trabalho, explorou-se a aplicação de redes neuronais artificiais, do tipo
perceptrão multicamada, para efeitos da degradação de redes de distribuição de água.
Em virtude de várias razões conjunturais, assiste-se a um esforço, por parte das entidades
gestoras de sistemas de abastecimento de água portuguesas, no sentido da melhoria do
desempenho das suas infra-estruturas. Neste sentido, o combate às perdas tem vindo a ganhar
cada vez mais importância no panorama nacional.
Sendo uma actividade desenvolvida em várias frentes, a redução de perdas assenta em meios
reactivos, tais como equipamento de detecção de fugas ou de telemetria, e meios activos, de que
são exemplo a reabilitação e renovação das redes. Ao contrário dos meios reactivos, que actuam
no imediato, com o objectivo de reduzir perdas existentes, os meios activos actuam num plano
preventivo, demorando períodos mais alargados até surtir efeito.
Face aos avultados investimentos inerentes à reabilitação ou à renovação das infra-estruturas de
abastecimento de água, as opções tomadas devem ser criteriosamente ponderadas, sob
diversos pontos de vista, sendo essa uma das matérias da gestão de activos.
Não sendo o desempenho da generalidade dos processos de modelação da degradação dos
sistemas de distribuição de água, desenvolvidos até à data, plenamente satisfatório, com este
trabalho pretendeu-se explorar algumas potencialidades inerentes às redes neuronais artificiais
e, possivelmente, contribuir para a evolução deste tema em Portugal.
No presente trabalho, foi desenvolvida uma metodologia para levar a cabo a criação de modelos
de degradação de sistemas de distribuição de água baseados no perceptrão multicamada (tipo
de rede neuronal artificial). Da experiência adquirida, importa salientar algumas vantagens, e
também inconvenientes, da utilização de redes neuronais artificiais para o efeito pretendido. No
primeiro grupo destacam-se os seguintes aspectos:
• a conceptualização acessível do processo;
• a qualidade das previsões conseguidas, superior à alcançada por via de regressão estatística;
• o impacto, relativamente reduzido, das parametrizações na qualidade final das previsões;
• a boa capacidade de adaptação do modelo a novos dados;
• a facilidade de integração de novas variáveis no modelo;
• a generalidade da metodologia que, uma vez dominada, pode ser utilizada para fins bastante diversificados, com resultados interessantes.
108
No segundo grupo, é necessário referir que:
• o treino inicial das redes neuronais artificiais pode ser um processo moroso e necessita de alguma experiência por parte de quem o executa;
• os cálculos efectuados internamente são complexos, pelo que os modelos baseados em redes neuronais artificiais são mais orientados para obter resultados do que contribuir para a compreensão teórica dos fenómenos;
• ao contrário do que alguns autores defendem, as redes neuronais artificiais têm uma capacidade de generalização limitada e, para definir os intervalos em que são válidas, é necessário um extensivo trabalho de análise de resultados.
A metodologia desenvolvida foi aplicada ao sistema de distribuição de água da cidade de Lisboa,
para diâmetros nominais de tubagem inferiores a 315 mm. Os dados foram fornecidos pela
EPAL, e são referentes ao período de 24 de Janeiro de 2002 a 28 de Agosto de 2007.
Numa etapa de análise prévia dos dados foi possível verificar a importância do histórico de
roturas. Constatou-se, por exemplo, que, em média, uma conduta que tenha tido, pelo menos,
uma rotura num intervalo de três anos, tem uma probabilidade de apresentar roturas, nos três
anos seguintes, mais de oito vezes superior à observada nas restantes condutas do sistema.
Para além deste aspecto, foram procuradas explicações para a sazonalidade da ocorrência de
roturas que, aparentemente, se faz sentir no sistema de distribuição de água de Lisboa. Da
análise efectuada, concluiu-se que as variações de temperatura podem ter alguma influência no
fenómeno.
Das variáveis consideradas pertinentes para a modelação da degradação de sistemas de
distribuição de água foram, no âmbito do caso de estudo, testadas seis. A partir do estudo
efectuado foi possível ordenar, por ordem de importância, a relação entre cada variável e o
fenómeno das roturas. De acordo com os resultados obtidos, a variável que mais influência teve
foi o número prévio de roturas registado, sendo seguido pela idade das tubagens. Com um grau
de importância um pouco menor, foram identificados o material e o diâmetro nominal das
tubagens. O subsistema de distribuição e a freguesia provaram ter uma relação reduzida com o
número de roturas.
Não tendo sido possível, naturalmente, estudar todas as variáveis explicativas, pensa-se que
pode ser interessante, no futuro, aplicar a metodologia incorporando elementos adicionais como,
por exemplo, o índice de ramais por metro linear de conduta, o tipo de solo, a classe de pressão
da conduta e a proximidade de vias de tráfego intenso.
Como complemento às redes neuronais artificiais, foram explorados algoritmos genéticos com o
objectivo de definir parâmetros do modelo, não se tendo verificado ganhos significativos de
produtividade.
Da análise dos resultados obtidos para o caso de estudo, conclui-se que a metodologia proposta
permitiu obter um bom ajustamento aos dados reais, para o período compreendido entre 2005 e
2007. Não obstante, observou-se que as previsões obtidas com recurso à rede neuronal artificial
109
treinada não são fiáveis em condições muito diferentes daquelas que, actualmente, caracterizam
o sistema de distribuição de água de Lisboa, razão pela qual não se propõe a utilização do
modelo para previsões superiores a 10 anos.
Embora a rede neuronal desenvolvida se tenha provado inadequada para a modelação do
fenómeno das roturas a longo prazo, os resultados obtidos para o curto prazo são bastante bons.
Neste sentido, o estudo de um modelo híbrido, apoiado em sistemas de lógica difusa ou análises
estatísticas, para efectuar estimativas a longo prazo, e redes neuronais para efectuar estimativas
a curto prazo, parece promissor. Com efeito, numa óptica económico-financeira, devido à taxa de
actualização do capital, os primeiros anos da análise são os que mais importância têm e, por
essa razão, é significativa a relevância que assume a estimativa das roturas nos períodos
iniciais.
Com vista à elaboração de um modelo de simulação da degradação de sistemas de distribuição
de água, não apenas baseado em valores médios, mas incluindo a dispersão do fenómeno,
testou-se a adequação da distribuição de Poisson. Embora os resultados obtidos tenham sido
encorajadores, constatou-se que a ocorrência de roturas não é independente no número de
roturas precedente e, como tal, a distribuição real do fenómeno tem maior dispersão que a que
resulta da distribuição de Poisson.
Em síntese, crê-se que a utilização de redes neuronais artificiais para modelação da degradação
de sistemas de distribuição de água constitui uma temática promissora. De facto, face ao
aumento da preocupação das entidades gestoras com o desempenho das infra-estruturas,
haverá cada vez mais dados disponíveis para o treino de modelos baseados em redes neuronais
artificiais e, consequentemente, o desempenho destes modelos terá tendência a melhorar no
futuro.
Como trabalho a desenvolver, recomenda-se a inclusão, no modelo proposto nesta dissertação,
de dados relativos a tubagens de policloreto de vinilo (PVC), muito comuns em grande parte das
cidades em Portugal. Recomenda-se, igualmente, a comparação dos resultados obtidos através
da metodologia proposta com outros métodos, designadamente de regressão estatística.
Finalmente, encara-se como uma ampliação do presente trabalho a concepção de um modelo
económico-financeiro que, aplicado conjuntamente com o modelo de degradação, permita, de
forma integrada, optimizar as estratégias de intervenção nos sistemas.
Como nota final, considera-se justo fazer uma apreciação muito positiva do desempenho das
infra-estruturas de distribuição geridas pela EPAL e, especialmente, das estratégias de
intervenção que conduziram às campanhas de renovação que a Empresa tem levado a cabo
desde 2002.
110
8. Referências bibliográficas
Inforoma. [Online] [Citação: 29 de 08 de 2008.]
http://www.inforoma.it/feature.php?lookup=aqueduct.
Alegre, H., 2007. Gestão Patrimonial de Infra-Estruturas de Abastecimento de Água e de
Drenagem e Tratamento de Águas Residuais. Lisboa : Laboratório Nacional de Engenharia Civil,
2007.
Alegre, H.; Duarte, P.; Volta, M., 2004. Resultados do Projecto Europeu CARE-W para Apoio à
Reabilitação de Redes de Água. Faro : APESB, 11º ENaSB, 2004.
Alegre, H., et al., 2004. Indicadores de Desempenho para Serviços de Abastecimento de Água.
Lisboa : Laboratório Nacional de Engenharia Civil, 2004. ISBN 1 900222 27 2.
Araujo, L. S.; Ramos, H. M., 2006. Utilização Optimizada de Válvulas Redutoras de Pressão em
Redes de Distribuição de Água. Figueira da Foz : XII SILUBESA, 2006.
Demuth, H.; Beale, M.; Hagan, M., 2008. Neural Network Toolbox 6. Natick, Massachusetts :
The MathWorks, Inc., 2008.
Dias, N.; Covas, D.; Ramos, H., 2006. Melhoria do Desempenho Técnico de Sistemas de
Distribuição de Água Através do Controlo da Pressão. Figueira da Foz : XII SILUBESA, 2006.
EPAL, 2008. EPAL. [Online] 2008. [Citação: 27 de 8 de 2008.] www.epal.pt/epal/.
EPAL. 2004. A EPAL. Lisboa : Empresa Portuguesa de Águas Livres, S.A., 2004.
Franco, A. B., 2006. Combate às Perdas e Renovação da Rede, Imperativos de Melhoria do
Desempenho Energético-Ambiental da Rede de Distribuição de Lisboa. Curso de Formação -
Planeamento Urbano e Reabilitação Urbana na Dimensão do Desempenho Energético-Ambiental
da Cidade. Lisboa : Lisboa E-Nova, 2006.
Franco, A. B.; Luís, A. M.; Donnelly, A., 2008. De uma Extensiva, Embora Fragmentada, Busca
por um Aumento de Eficiência, ao Desenvolvimento de um Modelo Integrado de Gestão de
Activos - O Caso da EPAL. Cascais : APRH, 9º Congresso da Água, 2008.
Gomes, R.; Marques, A. S.; Sousa, J. ,2008. Estimativa dos Benefícios Resultantes da
Implementação do Controlo de Pressão em Sistemas de Distribuição de Água. Cascais : APRH,
9º Congresso da Água, 2008.
Haykin, S., 1999. Neural Networks - A Comprehensive Foundation. Singapura : Pearson
Education, 1999. ISBN 81-7808-300-0.
INSAAR, 2004. INSAAR. INAG. [Online] FCT, UNL, 2004. [Citação: 10 de 08 de 2008.]
http://insaar.inag.pt.
111
INAG. 2008. Relatório do estado - Abastecimento de Água e Saneamento de Águas Residuais -
Sistemas Públicos Urbanos - Campanha INSAAR 2006. s.l. : INAG, 2008.
IRAR, 2006. Relatório Anual do Sector de Águas e Resíduos em Portugal (2006). Lisboa :
Instituto Regulador de Águas e Resíduos, 2006. ISBN 978-989-95392-3-5.
Jafar, R.; et al., 2006. Use of the artificial neural networks (ANN) for modeling the structural
degradation in water distribution systems. Lille : International Water Association, 2006.
Kasabov, N. K., 1996. Foundations of Neural Networks, Fuzzy Systems, and Knowledge
Engineering. Massachusetts : MIT Press, 1996. ISBN 0-262-11212-4.
Lingireddy, S.; Brion, G. M., 2005. Artificial Neural Networks in Water Supply Engineering.
Reston, Virginia : ASCE, 2005. ISBN 0-7844-0765-7.
Luís, A. A.; et al., 2004. Análise da Estratégia de Investimento na Rede de Distribuição de
Lisboa. Faro : APESB, 11º ENaSB, 2004.
Luis, A. A. A.; et al., 2004. Renovação da Rede de Distribuição de Água de Lisboa - As Causas
e os Efeitos na Redução de Perdas. Faro : APESB, 11º ENaSB, 2004.
Luís, A. A. A.; Figueira, J. F. C.; Santos, M. A. C. S. S., 2008. Renovação da Rede de
Distribuição de Água de Lisboa - Efeitos na Redução de Perdas e Melhoria da Qualidade do
Serviço. Cascais : APRH, 9º Congresso da Água, 2008.
Marques, J.; et al., 2004. Aplicação do CARE-W aos SMAS de Oeiras e Amadora. Faro :
APESB, 11º ENaSB, 2004.
Marques, R. C., 2006. A Concessão dos Sistemas Municipais de Abastecimento de Água e de
Águas Residuais. Um Balanço da Primeira Década. Paço de Arcos : Associação Portuguesa dos
Recursos Hídricos, 2006.
Matos, J. S., 2000. Saneamento Ambiental II. Lisboa : Instituto Superior Técnico, 2000.
Ministério do Ambiente, do Ordenamento do Território e do Desenvolvimento Regional.
2006. Plano Estratégico de Abastecimento de Água e Saneamento de Águas Residuais (2007-
2013). Lisboa : Diário da República, 2006.
Mitchell, M., 1999. An Introduction to Genetic Algorithms. Cambridge, Massachusetts : MIT
Press, 1999. ISBN 0-262-13316-4(HB).
Montgomery, D. C.; Runger, G. C., 2003. Applied Statistics and Probability for Engineers. New
York : John Wiley & Sons, Inc., 2003. ISBN 0-471-20454-4.
Palácio Galveias, 1990. D. João V e o Abastecimento de Água a Lisboa. Lisboa : Câmara
Municipal de Lisboa, Pelouro da Cultura - Museu da Cidade, 1990.
Pasculescu, C. V., 2004. Modeling in urban hydrology and hydraulics using artificial neural
networks. Lisbon : Instituto Superior Técnico, 2004.
112
Quintela, A. C.; Portela, M. M., 2004. Alberto Abecassis Manzanares e a Engenharia Hidráulica
em Portugal. Lisboa : IST, Departamento de Engenharia Civil e Arquitectura, 2004.
Schmidhuber, J., 2008. Jürgen Schmidhuber's Home Page. IDSIA (Istituto Dalle Molle di Studi
sull'Intelligenza Artificiale). [Online] 25 de Ago de 2008. [Citação: 7 de Set de 2008.]
http://www.idsia.ch/~juergen/.
Serra, P., 2006. PEAASAR 2007-2013. Lisboa : 8º Congresso da Água, APRH, 2006.
Veelenturf, L. P. J., 1995. Analysis and Applications of Artificial Neural Networks. Hertfordshire :
Prentice Hall International (UK) Limited, 1995. ISBN 0-13-489832-X (hbk).
Water Supply and Sanitation Technology Platform, 2008. WSSTP - Urban Pilot Theme 2:
Project Proposals - Asset Management for Sustainable Urban Water. 2008.
Anexos i
Anexo I – Teorema da aproximação universal
O teorema da aproximação universal estabelece que um PMC com uma camada oculta tem a
capacidade para aproximar, com qualquer erro desejado, qualquer função contínua.
Segundo Haykin, 1999:
Seja h1∙3 uma função não constante, estritamente crescente e contínua. Seja d�i um hipercubo
unitário com jk dimensões·. O espaço das funções contínuas em d�i é designado Dad�ib.
Então, dada qualquer função Q ∋ Dad�ib e m > 0, existe um inteiro n e conjuntos de constantes
reais o�, �� e p��, em que 2 = 1, … , j� @ ; = 1, … , jk, tais que podemos definir
qaR�, … , R�i b = , o��r�-� h s, p��R� +�i
�-� ��t [24]
Como uma aproximação da função Q1∙3; ou seja,
uqaR�, … , R�i b − QaR�, … , R�i bu < m [25]
Para todos os R�, R6, … , R�i, pertencentes ao padrão de dados.
Anexos iii
Anexo II – Demonstração do algoritmo da retropropagação dos erros
Tendo como objectivo a minimização de K (energia instantânea de erro) por via da alteração dos
parâmetros livres do PMC, os pesos sinápticos a retropropagação recorre ao método do
gradiente para ajustar o PMC no decorrer de várias iterações. Como tal, é através da derivação
de K em ordem ao peso sináptico p que se quantifica a alteração a fazer, ∆p. No entanto, é
importante definir previamente algumas grandezas. A primeira, o campo local induzido, é definida
por [26]:
*�123 = , p�� 123 ∙ I�S�123� [26]
Sendo que: I�S� representa o sinal de activação do nó j, da camada ] − 1; p�� representa o peso sináptico da ligação entre o nó j, da camada ] − 1 e o nó �, da
camada ]; *� representa o campo local induzido do nó �.
A grandeza seguinte, o sinal de activação, é definida através de [27]:
I�123 = fay*�123z [27]
Sendo que: I� representa o sinal de activação do nó �, da camada ]; fa representa a função de activação.
Assim, estão definidas as grandezas necessárias para prosseguir a dedução do algoritmo da
retropopagação. Na expressão [28] racionaliza-se a derivada da energia instantânea de erro em
varias derivadas parciais, que uma fez definidas, permitem o cálculo.
OK123Op�� 123 = OK123O@�123 O@�123OI�123 OI�123O*�123 O*�123Op�� 123 [28]
A primeira derivada parcial do membro direito da equação [28] é, atendendo a [17], definida por
[29] e igual ao erro no nó �.
OK123O@�123 = @�123 [29]
iv Anexos
A segunda derivada parcial – do erro em ordem ao sinal de activação – é dada por [30], resultado
que resulta directamente de [16].
A derivada do sinal de activação em ordem ao campo local induzido é equivalente à derivada da
função de activação [27].
OI�123O*�123 = Ofay*�123zO*�123 = fa′y*�123z [31]
Em que ′ evidencia que se trata de uma derivada em função do argumento.
Finalmente, a partir de [26] constata-se que da última derivada parcial da equação [28] assume o
valor do sinal de activação do nó j, presente na camada ] − 1 e ponto de origem da ligação
sináptica que se pretende actualizar, tal como se indica em [32].
O*�123Op�� 123 = I�S�123 [32]
Introduzindo as equações [29], [30], [31] e [32] em [28], obtém-se a expressão da derivada da
energia instantânea de erro em função do peso sináptico:
OK123Op�� 123 = −@�123 ∙ fa′y*�123z ∙ I�S�123 [33]
Assim, aplicando o método do gradiente, obtém-se na expressão [34], uma forma de actualizar o
peso sináptico da ligação entre os nós ��S� e ��. Esta expressão é normalmente designada por
regra delta.
∆p�� 123 = −> OK123Op�� 123 = > ∙ |� ∙ I�S�123 [34]
Nesta expressão introduzem-se as seguintes grandezas: |� representa o gradiente local da energia instantânea de erro e é definido por [35]; > é o parâmetro de aprendizagem, que controla o passo de actualização. Quanto maior for
mais rápida será a actualização de pesos sinápticos podendo, no entanto, a convergência
não ser alcançada devido a instabilidade no cálculo.
O@�123OI�123 = −1 [30]
Anexos v
|�123 = − OK123O*�123 = −@�123 ∙ fa′y*�123z [35]
A demonstração anterior pouco mais é do que uma generalização do método dos erros
quadráticos mínimos para uma camada de output com vários nós. No entanto, a pedra de toque
da retropropagação consiste em definir a actualização de pesos sinápticos de ligações para e
entre camadas ocultas. De facto, enquanto na camada de output se pode dispor directamente de
uma medição objectiva do erro, nas camadas ocultas tal não é verdade e, desta forma, o
gradiente local não pode ser obtido através da equação [35].
Para evidenciar que as fórmulas seguintes dizem respeito à actualização de pesos sinápticos de
ligações para camadas ocultas e não para a camada de output, utiliza-se o expoente ; para
identificar a camada e o índice j para identificar o nó.
A equação [36] fornece uma definição alternativa do gradiente local.
|�� 123 = − OK123O*�� 123 = − OK123OI�� 123 ∙ fa′y*�� 123z [36]
Recordando [16] e diferenciando [17] em ordem a I�� obtém-se a equação [37]. Desenvolvendo-
a, pode apresentar-se a igualdade sob a forma utilizada em [38].
OK123OI�� 123 = , @�123 O@�123OI�� 123� [37]
Para obter a expressão de cálculo do gradiente local, voltam a utilizar-se as expressões [16], [26]
e [27], referentes ao erro, ao campo local induzido e ao sinal de activação do nó � (camada de
output). A partir destas, é possível obter [39] e [40] e, assim, explicitar [38] na forma apresentada
em [41].
O@�123O*�123 = −fa′y*�123z [39]
O*�123OI�� 123 = p�� 123 [40]
OK123OI�� 123 = , @�123 O@�123O*�123 O*�123OI�� 123� [38]
vi Anexos
OK123OI�� 123 = − , @�123 ∙ fa′�*� 123� ∙ p�� 123 [41]
Atendendo à definição do gradiente local para nós da camada de output presente em [35] resulta
a equação [42].
OK123OI�� 123 = − , |�123 ∙ p�� 123 [42]
Introduzindo [42] em [36] obtém-se em [43] a expressão para o gradiente local num nó da
camada oculta, ;, também designada fórmula da retropropagação.
|�� 123 = fa′y*�� 123z ∙ , |�123 ∙ p�� 123 [43]
Uma vez definido o gradiente local, é possível aplicar a regra delta para actualizar o peso
sináptico da ligação desejada. Dado que a igualdade [43] pode ser generalizada para duas
camadas consecutivas, não sendo necessariamente a segunda de output, é possível actualizar
todos os pesos sinápticos do PMC deste modo.
Anexos vii
Anexo III – Exemplos de diferentes PMC treinados
Nos exemplos seguintes ilustram-se PMC treinados com dados do caso de estudo e seguindo a
metodologia proposta.
Ligações azuis evidenciam pesos sinápticos positivos e ligações vermelhas pesos sinápticos
negativos. O valor da constante, ilustrado no nó, segue a mesma terminologia. Entre cada
camada os pesos sinápticos são normalizados, sendo a que a cor mais intensa é atribuída
àquele que apresenta o maior módulo. Procede-se do mesmo modo relativamente às constantes.
Figura A 1 – Representação de um PMC treinado sem camada oculta.
Figura A 2 – Representação de um PMC treinado com uma camada oculta de 20 nós.
Figura A 3 – Representação de um PMC treinado com uma camada oculta de 40 nós.
Anexos ix
Anexo IV – Comparação de diferentes algoritmos de treino
Abreviações dos algoritmos de treino:
trainbfg BFGS quasi-Newton
backpropagation
trainoss One step secant backpropagation
trainlm Levenberg-Marquardt
backpropagation
traingdx Gradient descent with momentum
and adaptative learning rate
backpropagation
trainrp Resilient backpropagation
traincgp Conjugate gradient backpropagation
with Polak-Ribiere updates
traincgb Conjugate gradient backpropagation
with Powel-Beale restarts
trainscg Scaled conjugate gradient
backpropagation
Figura A 4 – Comparação entre diferentes algoritmos de treino para o caso de estudo.
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
7.00E-04 7.50E-04 8.00E-04 8.50E-04 9.00E-04 9.50E-04 1.00E-03 1.05E-03 1.10E-03 1.15E-03 1.20E-03
Co
rre
laçã
o
EQM
trainbfg trainoss trainlm
traingdx trainrp traincgp
traincgb trainscg
Anexos xiii
Anexo VI – Dados de tubagens – Distribuição
Quadro A1 – Campos de dados de tubagens de distribuição.
Designação Descrição Observações
Dados gerais
Código universal Identificação da tubagem no sistema Irrelevante para o estudo
Ano de instalação Ano de instalação da tubagem
Ano limite inferiorData mínima de instalação (caso se desconheça a data
exacta)
Ano limite superiorData máxima de instalação (caso se desconheça a data
exacta)
Comprimento (m) Comprimento do trecho
Diâmetro (mm) Diâmetro da tubagem [mm]
Estado de ciclo de vida Classificação do estado de operacionalidade da tubagem
Estado operacionalClassificação do estado "actual" do funcionamento da
tubagem - Falta informação -
Material Material de que é composta a tubagem
Responsável pela execução Entidade responsável pela execução da obra de instalação Campo incompleto
Entidade promotora Entidade responsável pela tubagem
Localização
Arruamento Arruamento em que o trecho está inserido Irrelevante para o estudo
Carta Militar Quadrícula da carta militar em que o trecho está inserido Irrelevante para o estudo
Freguesia Freguesia em que a tubagem se insere
Sistema - Sem informação - Sempre 'Distribuição'
Subsistema Subsistema da rede em a que está ligada a tubagem
Outras informações
Classe - Sem informação -
Código da entidade Identificação secundária da entidade no sistema Irrelevante para o estudo
Código da entidade pai - Sem informação -
Entidade agregadora - águas - Sem informação -
Data de actualização (aaaa-
mm-dd)Data de actualização da informação da tubagem Irrelevante para o estudo
Fonte de informação Fonte da informação introduzida no sistema Irrelevante para o estudo
Obs. sobre fonte de
informação - Observações - Irrelevante para o estudo
Observações - Observações - Campo incompleto
Utilizador Utilizador que introduziu a informação no sistema Irrelevante para o estudo
Informação específica para distribuição
Código patrimonial - Sem informação -
FunçãoFunção da tubagem (semelhante ao campo 'Estado de ciclo
de vida')
Localização - Observações - Campo incompleto
Modelação matemática Se a tubagem está incluída na modelação matemática Irrelevante para o estudo
Tipo de junta Informação sobre a aplicação de juntas automáticas Campo incompleto
Campos cujo número de
entradas não justifica a
inclusão no estudo
Anexos xv
Anexo VII – Dados de tubagens – Adução
Quadro A2 – Campos de dados de tubagens de adução.
Designação Descrição Observações
Dados gerais
Código universal Identificação da tubagem no sistema Irrelevante para o estudo
Ano de instalação Ano de instalação da tubagem
Ano limite inferiorData mínima de instalação (caso se desconheça a data
exacta)
Ano limite superiorData máxima de instalação (caso se desconheça a data
exacta)
Comprimento (m) Comprimento do trecho
Diâmetro (mm) Diâmetro da tubagem [mm]
Estado de ciclo de vida Classificação do estado de operacionalidade da tubagem
Estado operacional - Falta informação -
Material Material de que é composta a tubagem
Responsável pela execução Entidade responsável pela execução da obra de instalação Campo incompleto
Entidade promotora Entidade responsável pela tubagem
Localização
Arruamento Arruamento em que o trecho está inserido Irrelevante para o estudo
Carta Militar Quadrícula da carta militar em que o trecho está inserido Irrelevante para o estudo
Freguesia Freguesia em que a tubagem se insere
Sistema - Sem informação - Sempre 'Distribuição'
Subsistema Subsistema da rede em a que está ligada a tubagem
Outras informações
Classe - Sem informação -
Código da entidade Identificação secundária da entidade no sistema Irrelevante para o estudo
Código da entidade pai - Sem informação -
Entidade agregadora - águas - Sem informação -
Data de actualização (aaaa-
mm-dd)Data de actualização da informação da tubagem Irrelevante para o estudo
Fonte de informação Fonte da informação introduzida no sistema Irrelevante para o estudo
Obs. sobre fonte de
informação - Observações - Irrelevante para o estudo
Observações - Observações - Campo incompleto
Utilizador Utilizador que introduziu a informação no sistema Irrelevante para o estudo
Informação específica para adução
Altura (mm) - Sem informação -
Área da secção (m2) - Falta informação - Informação redundante
Capacidade de transporte
(m3)
- Falta informação -
Declive (%) - Sem informação -
Designação de adutor Designação do sistema adutor em que a tubagem se insere
Dimensão da secção (mm) Dimensão da secção (diâmetro para secções circulares) Campo incompleto
Regime de escoamento Regime do escoamento (pressão ou superfície livre)
Tipo de assentamento Tipo de assentamento utilizado no trecho de tubagem Campo incompleto
Tipo de secção Forma da secção
Campos cujo número de
entradas não justifica a
inclusão no estudo
Anexos xvii
Anexo VIII – Dados de ordens de trabalhos (OT)
Quadro A3 – Campos de dados das ordens de trabalhos.
Designação Descrição Observações
Dados gerais
Código universal Identificação da OT no sistema Irrelevante para o estudo
Base de trabalho Classificação em troço de tubagem ou adutor
Causa de intervenção Causa da intervenção
Comunicado por Entidade que comunicou o problema
Data da comunicação Data em que foi comunicado o problema (no caso de não se
Hora da comunicação
Natureza da intervenção Razão da intervenção - caracterização do problema Campo incompleto
Tipo de intervenção Intervenção programada ou não
Tipo de trabalho executado Tipo de trabalho executado na tubagem Campo incompleto
Localização
Arruamento Arruamento em que a OT é programada Irrelevante para o estudo
Carta Militar Quadrícula da carta militar em que a OT foi assinalada Irrelevante para o estudo
Coordenada M Coordenada M em que foi assinalada a OT no SIG Irrelevante para o estudo
Coordenada P Coordenada P em que foi assinalada a OT no SIG Irrelevante para o estudo
Divisão Divisão Oriental ou Ocidental Campo incompleto
Freguesia Freguesia em que a OT é programada
Localização - Observações -
Localização da intervençãoLocalização da intervenção (faixa de rodagem, edifício,
passeio, etc…)Campo incompleto
SistemaSistema em que foi programada a OT (adução ou
distribuição)
Subsistema Sub-sistema em que foi programada a OT
Informações sobre a OT
Corte de abastecimento Ocorrência de corte de abastecimento Campo incompleto
Danos particulares Danos a particulares Campo incompleto
Desinfecção da rede Necessidade de desinfecção da rede Irrelevante para o estudo
Infiltração Ocorrência de infiltrações Campo incompleto
OT da rede recente Sim / Não Campo incompleto
Pavimento danificado Sim / Não Campo incompleto
Perda de água - Sem informação - Campo incompleto
Perigo de contaminação Sim / Não Campo incompleto
Ramal fechado Necessidade de fechar ramais
Suspensão da rede Necessidade de suspensão da rede Irrelevante para o estudo
Tratamento da OT
Código de OT Identificação secundária da entidade no sistema Irrelevante para o estudo
Comunicação nº Número da comunicação Campo incompleto
Data de actualização (aaaa-
mm-dd)Data de actualização da OT Irrelevante para o estudo
Equipa Equipa responsável pela OT Irrelevante para o estudo
Equipa de execução
Estado da OTEstado registado da OT no sistema (executado, fechado ou
histórico)Irrelevante para o estudo
Utilizador Utilizador que introduziu a informação no sistema Irrelevante para o estudo
Proprietário do local de
intervenção
Entidade responsável pelo terreno em que se programou a
OT
Responsabilidade Responsabilidade pela OT Campo incompleto
xviii Anexos
Quadro A3 – Campos de dados das ordens de trabalhos (Cont.).
Quadro A4 – Registo do número de resultados admitidos como válidos em cada campo de
dados, para as OT.
Designação Descrição Observações
Datas
Data de abertura Data de abertura da OT Irrelevante para o estudo
Hora de abertura
Data de fecho (aaaa-mm-dd) Data de fecho da OT (estado da OT) Irrelevante para o estudo
Hora de fecho
Início de inspecção (data) Data de início de inspecção Irrelevante para o estudo
Início de inspecção (hora)
Fim de inspecção (data) Data de fim de inspecção Campo incompleto
Fim de inspecção (hora)
Início previsto de execução
(data)Data de início previsto de execução Irrelevante para o estudo
Início previsto de execução
(hora)
Fim previsto de execução
(data)Fim previsto para a execução da OT Campo incompleto
Fim previsto de execução
(hora)
Estado da previsão de
execuçãoEstado de previsão de execução da OT Irrelevante para o estudo
Data de início de execução
(aaaa-mm-dd)Data de início de execução Irrelevante para o estudo
Hora de início de execução
Data de fim de execução
(aaaa-mm-dd)Data de fim de execução Irrelevante para o estudo
Hora de fim de execução
Informações adicionais
Classe - Sem informação -
Endereço - Observações -
Estado de transmissão 0, 1 ou 2 Irrelevante para o estudo
Local de inspecção - Observações -
Nº da entidade - Sem informação -
Número de polícia - Observações -
Observações de abertura - Observações -
Observações de execução - Observações -
Observações de inspecção - Observações -
Campo Registos válidos Registos não válidos
Causa de intervenção 4 453 282
Comunicado por 4 735 0
Natureza da intervenção 4 691 44
Tipo de intervenção 4 535 200
Tipo de trabalho executado 4 144 591
Localização da intervenção 4 713 22
Proprietário do local de intervenção 4 607 128
Responsabilidade 4 311 424
Anexos xix
Quadro A5 – Registo das opções tomadas para validação dos dados de OT.
Os quadros anteriores (Quadro A4 e Quadro A5) pretendem clarificar o processo de validação
das OT, apresentando os resultados obtidos nos campos que se considerou conterem a
informação mais sensível no que respeita à adequação dos dados ao presente estudo. No
Quadro A5 ilustra-se, para cada um dos parâmetros, a lista das classificações possíveis,
realçando-se a vermelho aquelas que condicionaram a informação quanto à inclusão no modelo
proposto.
Paralelamente, um outro campo, designado Localização, não é incluído no Quadro A5 devido ao
extenso número de classificações que pode conter. Não obstante, foi igualmente analisado,
procedendo-se da mesma forma que nos restantes, ou seja, optando-se por invalidar os dados
que não correspondiam ao tipo desejado – de roturas em condutas de distribuição.
Causa de intervenção Registos Comunicado por Registos
-- Não conhecido -- 638 Particular 3529Acidental 3495 -- Não conhecido -- 462
Indeterminado 312 Câmara Municipal de Lisboa 94
Provocada 266 MCT 246
Tratamento em curso 16 ASL 70
Assentamento de terreno 5 DTF / Vigilante 96Defeito de montagem 3 Regimento Sapadores Bombeiros 145
Polícia Segurança Pública 93
Natureza da intervenção Registos Tipo de intervenção Registos
-- Não conhecido -- 981 -- Não conhecido -- 573
Avaria de órgão 44 Não programada 3962
Tubo rachado 1640 Programada 200
Tubo furado 265Tubo seccionado 728
Avaria de juntas 1065
Uniões desvedadas 12
Tipo de trabalho executado Registos Localização da intervenção Registos
Reparação 4140 -- Não conhecido -- 2779
Reparações diversas 4 Faixa de rodagem 468
Outros (registos excluídos) 591 Passeio 1466
Edifício 22
Proprietário do local de intervenção Registos Responsabilidade Registos
-- Não conhecido -- 1398 -- Não conhecido -- 148
APL - Porto de Lisboa 315 Câmara Municipal de Lisboa 25Recintos EPAL 41 Emp. Portuguesa das Águas Livres SA 4311
Terrenos particulares 38 Particular 247
Via pública 2815 R. S. Bombeiros 4
Zona de obras 128
Anexos xxi
Anexo IX – Extensão da rede por freguesia
Figura A6 – Extensão da rede por freguesia
- 20 40 60 80 100
Ajuda
Alcantara
Alto do Pina
Alvalade
Ameixoeira
Anjos
Beato
Benfica
Campo Grande
Campolide
Carnide
Castelo
Charneca
Coracao de Jesus
Encarnacao
Graca
Lapa
Lumiar
Madalena
Martires
Marvila
Merces
Nossa Senhora de Fatima
Pena
Penha de Franca
Prazeres
Sacramento
Santa Catarina
Santa Engracia
Santa Isabel
Santa Justa
Santa Maria de Belem
Santa Maria dos Olivais
Santiago
Santo Condestavel
Santo Estevao
Santos-o-Velho
Sao Cristovao e Sao Lourenco
Sao Domingos de Benfica
Sao Francisco Xavier
Sao Joao
Sao Joao de Brito
Sao Joao de Deus
Sao Jorge de Arroios
Sao Jose
Sao Mamede
Sao Miguel
Sao Nicolau
Sao Paulo
Sao Sebastiao da Pedreira
Sao Vicente de Fora
Se
Socorro
Extenção da rede [km]
Anexos xxiii
Anexo X – Índice mensal de roturas
Figura A7 – Índices médios mensais de roturas.
Figura A8 – Índice mensal médio de roturas com desvio-padrão.
0
10
20
30
40
50
60
70
80
Jan-
02Fe
v-02
Mar
-02
Abr
-02
Ma
i-02
Jun-
02Ju
l-02
Ago
-02
Set-
02O
ut-0
2N
ov-0
2D
ez-0
2Ja
n-03
Fev-
03M
ar-0
3A
br-0
3M
ai-
03Ju
n-03
Jul-
03A
go-0
3Se
t-03
Out
-03
Nov
-03
Dez
-03
Jan-
04Fe
v-04
Mar
-04
Abr
-04
Ma
i-04
Jun-
04Ju
l-04
Ago
-04
Set-
04O
ut-0
4N
ov-0
4D
ez-0
4Ja
n-05
Fev-
05M
ar-0
5A
br-0
5M
ai-
05Ju
n-05
Jul-
05A
go-0
5Se
t-05
Out
-05
Nov
-05
Dez
-05
Jan-
06Fe
v-06
Mar
-06
Abr
-06
Ma
i-06
Jun-
06Ju
l-06
Ago
-06
Set-
06O
ut-0
6N
ov-0
6D
ez-0
6Ja
n-07
Fev-
07M
ar-0
7A
br-0
7M
ai-
07Ju
n-07
Jul-
07A
go-0
7
Ro
tura
s/(1
00
km
.an
o)
Mês
42.58
30.34 28.5433.03 34.47 36.58 37.29 39.59 40.46
37.41
29.69
44.12
0
10
20
30
40
50
60
70
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Ro
tura
s/(1
00
km
.an
o)
me
nsa
is
mé
dia
s
Mês
Anexos xxv
Anexo XI – Índice médio anual de roturas por freguesia
Figura A9 – Índices médios anuais de roturas por freguesia.
0
20
40
60
80
100
120
Ajuda Alcantara Alto do Pina Alvalade
Ameixoeira Anjos Beato Benfica
Campo Grande Campolide Carnide Coracao de Jesus
Lapa Lumiar Marvila Merces
Nossa Senhora de Fatima Pena Penha de Franca Prazeres
Santa Isabel Santa Maria de Belem Santa Maria dos Olivais Santo Condestavel
Sao Domingos de Benfica Sao Francisco Xavier Sao Joao Sao Joao de Brito
Sao Joao de Deus Sao Jorge de Arroios Sao Mamede Sao Paulo
Anexos xxvii
Anexo XII – Resultados dos testes efectuados para definir a arquitectura do PMC
Quadro A 6 – Resultados do EQM, obtidos em redes com uma camada oculta (90% dos dados).
Quadro A 7 – Resultados de correlação, obtidos em redes com uma camada oculta (100% dos dados).
Quadro A 8 – Resultados de tempos de treino, obtidos em redes com uma camada oculta (100% dos dados).
EQM (90%)Rede net1_5 net5x1_5 net10x1_5 net15x1_5 net20x1_5 net25x1_5 net30x1_5 net35x1_5 net40x1_5
Mínimo 9.83E-04 9.02E-04 8.80E-04 8.04E-04 8.03E-04 8.39E-04 8.48E-04 8.08E-04 8.50E-04Máximo 9.84E-04 9.34E-04 9.28E-04 8.81E-04 8.43E-04 9.24E-04 8.66E-04 8.88E-04 9.73E-04
Média 9.84E-04 9.18E-04 9.09E-04 8.44E-04 8.28E-04 8.65E-04 8.58E-04 8.48E-04 8.91E-04Desvio-padrão 3.63E-08 8.80E-06 1.09E-05 2.62E-05 9.95E-06 2.08E-05 6.25E-06 1.94E-05 3.77E-05
Amostra (90% total) 45 45 66 54 21 28 12 25 12Nós camadas ocultas 0 5 10 15 20 25 30 35 40
Número de ligações 6 36 71 106 141 176 211 246 281
Correlação (100%)Rede net1_5 net5x1_5 net10x1_5 net15x1_5 net20x1_5 net25x1_5 net30x1_5 net35x1_5 net40x1_5
Mínimo 27.2% 30.2% 31.5% 11.5% 31.1% 30.6% 24.5% 11.6% 8.0%Máximo 27.2% 42.0% 46.0% 45.3% 45.6% 45.4% 45.8% 47.0% 46.2%
Média 27.2% 39.5% 42.3% 38.9% 41.6% 40.8% 43.2% 39.7% 39.4%Desvio-padrão 0.0% 2.4% 2.8% 7.2% 2.6% 4.4% 5.4% 7.4% 12.0%
Amostra (90% total) 50 50 74 61 24 32 14 28 14Nós camadas ocultas 0 5 10 15 20 25 30 35 40
Número de ligações 6 36 71 106 141 176 211 246 281
Tempo de treino (100%)Rede net1_5 net5x1_5 net10x1_5 net15x1_5 net20x1_5 net25x1_5 net30x1_5 net35x1_5 net40x1_5
Mínimo 4.16 10.27 15.21 17.95 37.55 37.22 69.35 71.33 85.80Máximo 8.75 29.12 34.85 57.18 64.09 89.99 109.48 148.06 268.79
Média 6.02 16.86 24.37 35.05 50.17 59.53 90.55 106.65 184.03Desvio-padrão 0.52 3.58 4.17 7.49 7.19 13.27 12.98 20.25 54.56
Amostra (90% total) 50 50 74 61 24 32 14 28 14Nós camadas ocultas 0 5 10 15 20 25 30 35 40
Número de ligações 6 36 71 106 141 176 211 246 281
xxviii Anexos
Quadro A 9 – Resultados do EQM, obtidos em redes com duas camadas ocultas (90% dos dados).
Quadro A 10 – Resultados de correlação, obtidos em redes com duas camadas ocultas (100% dos dados).
Quadro A 11 – Resultados de tempos de treino [s], obtidos em redes com duas camadas ocultas (100% dos dados).
Todos os testes foram efectuados recorrendo à validação K-fold, com subconjunto de validação a totalizar 20% do total de dados. O treino foi efectuado com
a retropropagação modificada com o algoritmo de Levenberg-Marquardt (modo determinístico).
EQM (90%)Rede net7x3x1_5 net9x6x1_5 net12x8x1_5 net14x11x1_5 net17x13x1_5 net19x16x1_5 net22x18x1_5
Mínimo 8.53E-04 8.44E-04 8.60E-04 8.24E-04 8.34E-04 7.87E-04 8.65E-04Máximo 9.32E-04 8.84E-04 9.29E-04 9.37E-04 8.83E-04 9.42E-04 9.20E-04
Média 8.99E-04 8.60E-04 8.92E-04 9.08E-04 8.59E-04 8.69E-04 8.83E-04Desvio-padrão 2.44E-05 1.10E-05 1.66E-05 2.34E-05 1.27E-05 3.21E-05 1.79E-05
Amostra (90% total) 23 22 34 28 20 21 8Nós camadas ocultas 10 15 20 25 30 35 40
Número de ligações 70 121 185 261 350 451 565
Correlação (100%)Rede net7x3x1_5 net9x6x1_5 net12x8x1_5 net14x11x1_5 net17x13x1_5 net19x16x1_5 net22x18x1_5
Mínimo 26.5% 29.9% 31.5% 31.6% 34.6% 21.2% 17.7%Máximo 45.6% 45.1% 45.9% 46.5% 47.7% 51.4% 45.1%
Média 38.8% 42.3% 41.1% 42.5% 43.5% 41.5% 38.8%Desvio-padrão 4.7% 3.2% 3.2% 3.4% 3.0% 6.8% 8.5%
Amostra (90% total) 26 25 38 32 23 24 9Nós camadas ocultas 10 15 20 25 30 35 40
Número de ligações 70 121 185 261 350 451 565
Tempo de treino (100%)Rede net7x3x1_5 net9x6x1_5 net12x8x1_5 net14x11x1_5 net17x13x1_5 net19x16x1_5 net22x18x1_5
Mínimo 25.75 27.63 45.63 72.99 104.50 152.29 228.17Máximo 55.77 59.17 108.86 146.82 195.95 382.48 606.75
Média 35.87 37.58 70.96 96.37 151.38 256.12 378.60Desvio-padrão 6.95 6.57 12.36 16.37 24.65 68.10 142.42
Amostra (90% total) 26 25 38 32 23 24 9Nós camadas ocultas 10 15 20 25 30 35 40
Número de ligações 70 121 185 261 350 451 565
Anexos xxix
Anexo XIII – EQM versus correlação para várias topologias de PMCs
Figura A 10 – EQM versus correlação para várias topologias de PMC
20.0%
25.0%
30.0%
35.0%
40.0%
45.0%
50.0%
7.50E-04 8.00E-04 8.50E-04 9.00E-04 9.50E-04 1.00E-03 1.05E-03
Co
rre
laçã
o
EQM
net1_5
net5x1_5
net10x1_5
net15x1_5
net20x1_5
net25x1_5
net30x1_5
net35x1_5
net40x1_5
net7x3x1_5
net9x6x1_5
net12x8x1_5
net14x11x1_5
net17x13x1_5
net19x16x1_5
net22x18x1_5
Anexos xxxi
Anexo XIV – Código da aplicação de AG desenvolvida para determinação da topologia óptima do PMC
Para execução deste código foi utilizada a Genetic Algorithms Toolbox do Matlab, pelo que o
código que se segue não corresponde a um AG completo, mas apenas às funções
personalizadas que foi preciso criar para adaptar a toolbox às necessidades do presente
problema
• Função para geração da população inicial;
• Função para mutação dos cromossomas;
• Função para cruzamento dos cromossomas;
• Função cálculo de desempenhos.
Função para geração da população
inicial
function Population = GA_CreNet(GenomeLength, FitnessFcn, options)
%Número de nós total global NN; NN = [5 10]+ [-0.4999 0.4999]; global VARNN VARNN = NN(2)/10; %Número de nós por camada [min máx] global NNeur NNeur= [5 10] + [-0.4999 0.4999]; global VARNNEUR VARNNEUR = NNeur(2)/8; %Número de camadas ocultas global NLay NLay = [1 3] + [-0.4999 0.4999]; global VARLAY VARLAY = 1; %Probabilidade de mutação no número de
camadas global ProbMLn ProbMLn = 0.50; %Probabilidade de mutação no número de nós global ProbMNn ProbMNn = 0.80; %Probabilidade de mutação em cada camada global ProbMLv ProbMLv = 0.75;
%Probabilidade de obtenção de valores intermédios - cruzamento
global PIntr PIntr = 0.33; %Variáveis para a função objectivo global Show Show = inf; global Epochs Epochs = 100; global Repeat Repeat = 10; global Train_fctn Train_fctn = 'trainlm'; global MemRed MemRed = 1; global Parcial Parcial = .8; global ALTERNATIVO ALTERNATIVO = 1; global MgERRO; MgERRO = 0.000003; global Dimmax; Dimmax = 40; global MATRIZ
MATRIZ=zeros(HipContador(round(NN(2)),round(NLay(2))),3);
%Estado da simulaçao global ESTADO ESTADO = [options.PopulationSize 1 0]; popsize = options.PopulationSize;
xxxii Anexos
Pop1 = zeros(popsize,GenomeLength); rand('state',sum(100*clock)); for a=1:popsize Pop1(a,1) = round(NLay(1) + (NLay(2)-
NLay(1))* rand); Pop1(a,2) = round(NN(1) + (NN(2)-NN(1))*
rand); for b=3:GenomeLength Pop1(a,b) = rand; end end for a=1:popsize aux = 0; aux1 = 0; restos = zeros(Pop1(a,1),2); soma = sum(Pop1(a,3:Pop1(a,1)+2)); for b=3:Pop1(a,1)+2 %escala aux = max(1,floor(Pop1(a,b) / soma *
Pop1(a,2))); restos(b-2,1) = (Pop1(a,b) / soma *
Pop1(a,2))-aux; restos(b-2,2) = b; Pop1(a,b) = aux; aux1 = aux1 + aux; end if aux1 ~= Pop1(a,2) %redistribuição dos
restos aux2 = sortrows(restos); b = (Pop1(a,2)-aux1); while b > 0 Pop1(a,aux2(Pop1(a,1)+1-b,2)) =
Pop1(a,aux2(Pop1(a,1)+1-b,2)) + 1; b= b-1; end c=0; while b < 0 c = max(b,c); while
or(aux2(c+2,1)<=0,Pop1(a,aux2(c+2,2))==1)
c = c+1; while aux2(c+2,2)==0; c=c+1 ; end end Pop1(a,aux2(c+2,2)) =
Pop1(a,aux2(c+2,2)) - 1; b= b+1; end end end for a=1:popsize for b=Pop1(a,1)+3:NLay(2)+2 Pop1(a,b)=0;
end end Pop = round(Pop1) Population = Pop; function Cont = HipContador(NN,NLay) % Forma a matriz de armazenamento dos
resultados vector = zeros(NLay,1); vector(1) = 1; vector(NLay) = -1; a=NLay; b=0; c=0; while vector(1)<= NN vector(NLay) = vector(NLay)+1; for b=NLay:-1:2 if vector(b) > NN vector(b:NLay)=0; vector(b-1)=vector(b-1)+1; end end if sum(vector(1:NLay))==NN b = 0; for a=1:NLay if vector(a) == 0 b=sum(vector(a:NLay)); a = NLay+1; end end if b == 0 c=c+1; end end end Cont = c;
Função para mutação de
cromossomas
function mutationChildren = GA_MutaNet(parents, options, nvars, FitnessFcn, state, thisScore, thisPopulation)
%Probabilidade de mutação no número de
camadas global ProbMLn %Probabilidade de mutação no número de nós global ProbMNn
Anexos xxxiii
%Probabilidade de mutação em cada camada global ProbMLv %Número de nós total global NN global VARNN %Número de nós por camada [min máx] global NNeur global VARNNEUR %Número de camadas ocultas global NLay global VARLAY disp (' --- Mutaçao ---'); parents [a b] = size(thisPopulation); GenLenght = b; [a b] = size(parents); ParentN = b; MutC1= zeros(ParentN,GenLenght); for a=1:ParentN %Construçao do vector de
mutações a partir a populaçao base MutC1(a,1:GenLenght) =
thisPopulation(parents(a),1:GenLenght); end rand('state',sum(100*clock)); for a=1:ParentN rede =
thisPopulation(parents(a),1:GenLenght); for b=3:GenLenght %normalizar os valores rede(b) = rede(b)/rede(2); end aux = rede(1); %número de camadas
prévias if rand <= ProbMLn %Mutaçao no número
de camadas rede(1) =
round(max(NLay(1),min(NLay(2),rede(1) + sqrt(VARLAY)*randn ))); %Altera-se uma camada de cada vez %NLay(1) + (NLay(2)-NLay(1))* rand);
end if rand <= ProbMNn %Alterações no número
total de nós rede(2) =
round(max(NN(1),min(NN(2),rede(2)+sqrt(VARNN)*randn)));
end if aux ~= rede(1) %para não haverem layers
com peso 0 no meio... for b=aux+2:rede(1)+2 rede(b) = rede(b) +
sqrt(VARNNEUR)/NNeur(2)*randn; %A variancia também é normalizada
end end for b=3:GenLenght %Alterações no tamanho
das camadas if rand <= ProbMLv rede(b) = rede(b) +
sqrt(VARNNEUR)/NNeur(2)*randn; %A variância também é normalizada
end end aux = 0; aux1 = 0; restos = zeros(rede(1),2); soma = sum(rede(3:rede(1)+2)); for b=3:rede(1)+2 %escala aux = max(1,floor(rede(b) / soma *
rede(2))); restos(b-2,1) = (rede(b) / soma * rede(2))-
aux; restos(b-2,2) = b; rede(b) = aux; aux1 = aux1 + aux; end if aux1 ~= rede(2) %redistribuição dos
restos aux2 = sortrows(restos); b = (rede(2)-aux1); while b > 0 rede(aux2(rede(1)+1-b,2)) =
rede(aux2(rede(1)+1-b,2)) + 1; b= b-1; end c=0; while b < 0 c = max(b,c); while
or(aux2(c+2,1)<=0,rede(aux2(c+2,2))==1)
c = c+1; while aux2(c+2,2)==0; c=c+1 ; end end rede(aux2(c+2,2)) = rede(aux2(c+2,2)) -
1; b= b+1; end end for b=(rede(1)+3):round(NLay(2)+2) rede(b)=0; end
MutC1(a,1:GenLenght)=round(rede(1:GenLenght));
xxxiv Anexos
for b=3:GenLenght %Para não aparecerem
mais nós por camada que os máximos if MutC1(a,b)>NNeur(2) MutC1(a,b)=NNeur(2); MutC1(a,2)=
sum(MutC1(a,3:GenLenght)); end end for b=MutC1(a,1)+3:GenLenght %Para as
camadas não usadas ficarem sempre 0 MutC1(a,b)=0; end end newpop = thisPopulation; for a=1:ParentN newpop(parents(a),1:GenLenght) =
MutC1(a,1:GenLenght); end round(MutC1) mutationChildren = round(MutC1);
Função para cruzamento de
cromossomas
function xoverKids = GA_xoverNet(parents, options, nvars, FitnessFcn, unused, thisPopulation)
thisPopulation disp (' --- Crossover ---'); parents %Estado global ESTADO ESTADO(2) = 1; ESTADO(3) = ESTADO(3) +1; global PIntr global NNeur global NLay GenLenght = nvars; [a b] = size(parents); ParentN = b; rand('state',sum(100*clock)); xoverC1= zeros(ParentN/2,GenLenght); for a=1:2:ParentN-1 %Número de camadas de cada pai - ordena
por numero de camadas
aux = sortrows([thisPopulation(parents(a),1) parents(a);thisPopulation(parents(a+1),1) parents(a+1)]);
%[Nlayers Pai %Nlayers Pai]; %Normalização dos pais thisPopulation(parents(a),3:GenLenght) =
thisPopulation(parents(a),3:GenLenght)/thisPopulation(parents(a),2);
thisPopulation(parents(a+1),3:GenLenght) = thisPopulation(parents(a+1),3:GenLenght)/thisPopulation(parents(a+1),2);
%Fazer o cruzamento for b=2:GenLenght %aux(1,1) if rand <= PIntr NMin =
min(thisPopulation(aux(1,2),b),thisPopulation(aux(2,2),b));
NMax = max(thisPopulation(aux(1,2),b),thisPopulation(aux(2,2),b));
xoverC1((a+1)/2,b) = NMin + (NMax-NMin)*rand;
else if rand<=0.5 xoverC1((a+1)/2,b)=
thisPopulation(aux(1,2),b); else xoverC1((a+1)/2,b)=
thisPopulation(aux(2,2),b); end end end if rand <= PIntr %Para o novo número de
camadas auxNC = round(aux(1,1)-
0.4999+(aux(2,1)+0.4999-(aux(1,1)-0.4999))*rand);
else if rand<=0.5 auxNC = aux(1,1); else auxNC = aux(2,1); end end xoverC1((a+1)/2,1)=auxNC; %Digita o
numero de camadas xoverC1((a+1)/2,2) =
round(xoverC1((a+1)/2,2)); %Faz o arredondamento do número de NN (já escolhido)
for b=aux(1,1)+1:auxNC %novas camadas xoverC1((a+1)/2,b+2)=
thisPopulation(aux(2,2),b+2); end
Anexos xxxv
aux = 0; aux1 = 0; restos = zeros(xoverC1((a+1)/2,1),2); soma =
sum(xoverC1((a+1)/2,3:xoverC1((a+1)/2,1)+2));
for b=3:xoverC1((a+1)/2,1)+2 %escala aux = max(1,floor(xoverC1((a+1)/2,b) /
soma * xoverC1((a+1)/2,2))); restos(b-2,1) = (xoverC1((a+1)/2,b) /
soma * xoverC1((a+1)/2,2))-aux; restos(b-2,2) = b; xoverC1((a+1)/2,b) = aux; aux1 = aux1 + aux; end if aux1 ~= xoverC1((a+1)/2,2)
%redistribuição dos restos aux2 = sortrows(restos); b = (xoverC1((a+1)/2,2)-aux1); while b > 0
xoverC1((a+1)/2,aux2(xoverC1((a+1)/2,1)+1-b,2)) = xoverC1((a+1)/2,aux2(xoverC1((a+1)/2,1)+1-b,2)) + 1;
b= b-1; end c=0; while b < 0 c = max(b,c); while
or(aux2(c+2,1)<=0,xoverC1((a+1)/2,aux2(c+2,2))==1)
c = c+1; while aux2(c+2,2)==0; c=c+1 ; end end xoverC1((a+1)/2,aux2(c+2,2)) =
xoverC1((a+1)/2,aux2(c+2,2)) - 1; b= b+1; end end for
b=(xoverC1((a+1)/2,1)+3):round(NLay(2)+2)
xoverC1((a+1)/2,b)=0; end end xoverC1 = round(xoverC1); for a=1:ParentN/2 for b=3:GenLenght %Para não aparecerem
mais nós por camada que os máximos
if xoverC1(a,b)>NNeur(2) xoverC1(a,b)=NNeur(2); xoverC1(a,2)=
sum(xoverC1(a,3:GenLenght)); end end end xoverKids = xoverC1
Função cálculo de desempenhos
function y = GAtoolNetComp(Vector) %Para comparar redes de tipologias diferentes %Variáveis global Show global Epochs global Repeat global Parcial global Train_fctn global MemRed global ALTERNATIVO global MgERRO global MATRIZ global NN global NLay global Dimmax %Dados dados = [0 1;0 1;0 1;0 1;0 1]; %Número de camadas ocultas NLays=Vector(1); %Dimensão das camadas ocultas; NNeu = zeros(1,1+NLays); for a=1:NLays NNeu(1,a) = Vector(a+1); end NNeu(1,NLays+1) = 1; %Funçoes de activação aux = 'tansig'; transf = cell(1,NLays+1); for a=1:NLays transf{1,a} = aux; end transf{1,NLays+1}= 'logsig'; net =
newelm(dados,NNeu,transf,Train_fctn,'learngdm','mse');
net.trainParam.show = Show; net.trainParam.epochs = Epochs; if Train_fctn == 'trainlm' net.trainParam.mem_reduc = MemRed; end
xxxvi Anexos
%inicializar a rede net.initFcn = 'initlay'; for a=1:NLays + 1 %Layers net.layers{a}.initFcn = 'initwb'; for b=1:NLays+1%NNeu(a) net.layerWeights{a,b}.initFcn = 'rands'; end end Dinp = net.numinputs; %Inputs e constantes for a=1:NLays+1 for b=1:Dinp net.inputWeights{a,b}.initFcn= 'rands'; end net.biases{a}.initFcn = 'rands'; end if net.numLayers-2 == -1 net.numLayers-2 end Vector %Análise de resultados prévios Id =
Numero(Vector,round(NN(2)),round(NLay(2)));
%Execuçao do código das ANN if Id ~= 0 if MATRIZ(Id,1) <= Dimmax perfact =
performanceNetC(net,evalin('base','dados'),evalin('base','alvos'),struct ('P',evalin('base','d_valida'), 'T', evalin('base','a_valida')), struct ('P',evalin('base','d_teste'), 'T', evalin('base','a_teste')),1)
%Preenchimento da matriz de resultados MATRIZ(Id,2)=
(MATRIZ(Id,2)*MATRIZ(Id,1)+perfact*Repeat*Parcial)/(MATRIZ(Id,1)+Repeat*Parcial);
MATRIZ(Id,1)= MATRIZ(Id,1)+Repeat*Parcial;
else perfact =
performanceNetC(net,evalin('base','dados'),evalin('base','alvos'),struct ('P',evalin('base','d_valida'), 'T', evalin('base','a_valida')), struct ('P',evalin('base','d_teste'), 'T', evalin('base','a_teste')),0)
MATRIZ(Id,2)= (MATRIZ(Id,2)*MATRIZ(Id,1)+perfact)/(MATRIZ(Id,1)+1);
MATRIZ(Id,1)= MATRIZ(Id,1)+1; end
result= MATRIZ(Id,2); disp(strcat('Fitness: ',num2str(result),'
(',num2str(MATRIZ(Id,1)),')')); else result = 1; end y = result; function
y=performanceNetC(rede,dados,alvos,valida,teste,grupo)
%Variáveis global Repeat global ESTADO global Parcial repeats = Repeat; parcials = Parcial; if grupo == 0 repeats=1; parcials=1; end rand('state',sum(100*clock)); [r c]=size(alvos); aux = 0; resultad = zeros(repeats); for a = 1:repeats
disp(strcat(num2str(ESTADO(2)),'/',num2str(ESTADO(1)*Repeat),', ',num2str(ESTADO(3)),'ª geração'));
disp(strcat(num2str(a),'/',num2str(repeats))); %Estado de progresso
if grupo == 0 ESTADO(2) = ESTADO(2)+Repeat; else ESTADO(2) = ESTADO(2)+1; end rede= init(rede); %Fazer a simulaçao [redeaux,tr] =
train(rede,dados,alvos,[],[],valida,teste); [r c]=size(tr.perf); resultad(a) = tr.perf(c); end auxvect = sortrows(resultad);
Anexos xxxvii
aux = sum(auxvect(1:max(round(repeats*parcials),1)));
%disp('Fitness ='); %disp(aux/max(round(repeats*parcials),1)); y = aux/max(round(repeats*parcials),1); function Numer =
Numero(Cromossoma,NN,NLay) vector = zeros(NLay,1); vector(1) = 1; vector(NLay) = -1; a=NLay; b=0; c=0; nume=0; while vector(1)<= NN vector(NLay) = vector(NLay)+1; for b=NLay:-1:2 if vector(b) > NN vector(b:NLay)=0; vector(b-1)=vector(b-1)+1; end end if sum(vector(1:NLay))==NN b = 0; for a=1:NLay if vector(a) == 0 b=sum(vector(a:NLay)); a = NLay+1; end end if b == 0 c=c+1; if Cromossoma(3:NLay+2)==
transpose(vector) nume = c; end end end end Numer = nume;
Anexos xxxix
Anexo XV – Parâmetros utilizados no AG utilizado para determinação da topologia óptima do PMC
Quadro A 12 – Síntese dos parâmetros utilizados no AG.
Parâmetros da população
Número de variáveis no cromossoma 6 Tipo da população Números inteiros
Dimensão da população (número de indivíduos) 20 Ordenação dos resultados
Diferenciação do desempenho “fitness scaling” Ordenação simples (Rank)
Função de selecção Uniforme estocástica Opções de reprodução
Indivíduos de elite 0
Percentagem de cruzamento 70%
Percentagem de mutação 30% Funções externas utilizadas (ver Anexo XIV)
Função de geração da população inicial @GA_CreNet
Função de cruzamento @GA_xoverNet Função de mutação @GA_MutaNet
Função de desempenho @GAtoolNetComp Número total de nós no PMC
Intervalo do número total de nós no PMC Variável
Variância no número total de nós no PMC 1/10 do número máximo Número de nós por camada
Intervalo do número de nós por camada Variável
Variância do número de nós por camada 1/8 do número máximo Número de camadas ocultas
Intervalo do número camadas ocultas [1 4]
Variância do número camadas ocultas 1 Probabilidades de mutação (apenas cromossomas seleccionados para mutação)
Probabilidade de mutação do número de camadas ocultas 50%
Probabilidade de mutação no número total de nós 80%
Probabilidade de mutação do número de nós em cada camada oculta
75%
Probabilidades de cruzamento (apenas cromossomas seleccionados para cruzamento)
Probabilidade de obtenção de valores intermédios no cruzamento (em oposição a obter valores de um ou outro dos cromossomas “pai”)
33%
Parâmetros para treino dos PMC
Número máximo de épocas de treino do PMC 100 Algoritmo de treino do PMC Retropropagação de Levenberg-Marquardt
(trainlm) Repetições do treino do PMC por época do AG 10
Purga dos piores resultados obtidos no treino do PMC 20%
Dimensão do subconjunto de validação 20% Número de dados a partir dos quais se efectua apenas um treino do PMC por época
40
Anexos xli
Anexo XVI – Resultados da comparação de algoritmos de treino
A comparação seguinte foi levada a cabo para a rede net20x1_5 (escolhida como a mais
adequada para modelação da degradação das redes de distribuição de água). Os grupos de
validação e teste correspondem, cada um, a 20% do total de dados.
Note-se que estes algoritmos correspondem todos a modificações da retropropagação de
Rumelhart, não alterando a essência da propagação dos erros, mas apenas a forma de
computação da correcção do peso sináptico de cada ligação.
Dos algoritmos testados os mais importantes são porventura o traingdx, por ser o mais próximo
da concepção de Rumelhart, e os trainlm (Levenberg-Marquardt) e trainrp (retropropagação
resiliente), devido aos bons resultados obtidos. A lista completa das abreviaturas utilizadas
encontra-se no Anexo IV.
Quadro A 13 – Resultados do EQM obtidos através da utilização de vários algoritmos de
treino, para a rede net20x1_5 (100% dos dados).
Quadro A 14 – Resultados da correlação obtidos através da utilização de vários algoritmos
de treino, para a rede net20x1_5 (100% dos dados).
Quadro A 15 – Resultados tempo de treino [s] obtidos através da utilização de vários
algoritmos de treino, para a rede net20x1_5 (100% dos dados).
EQM (100%)Algoritmo traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
Mínimo 9.24E-04 8.95E-04 9.00E-04 8.90E-04 9.03E-04 9.32E-04 1.01E-03 8.12E-04Máximo 9.74E-04 9.47E-04 9.42E-04 9.33E-04 1.08E-03 1.02E-03 1.05E-03 1.06E-03
Média 9.52E-04 9.15E-04 9.15E-04 9.06E-04 9.23E-04 9.84E-04 1.03E-03 8.54E-04Desvio-padrão 1.18E-05 1.25E-05 1.04E-05 8.94E-06 3.36E-05 2.39E-05 8.68E-06 4.56E-05Amostra (total) 50 50 50 50 50 50 50 50
Correlação (100%)Algoritmo traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
Mínimo 3.8% 28.8% 23.6% 25.3% 5.0% 9.5% -3.5% 8.0%Máximo 33.4% 37.1% 35.8% 35.8% 36.6% 31.6% 17.2% 46.6%
Média 26.4% 34.3% 31.0% 32.2% 33.6% 20.6% 9.8% 41.5%Desvio-padrão 5.0% 1.9% 2.5% 2.5% 5.3% 5.0% 5.1% 7.2%Amostra (total) 50 50 50 50 50 50 50 50
Tempo de treino (100%)Algoritmo traingdx trainrp traincgp traincgb trainscg trainbfg trainoss trainlm
Mínimo 219.8 24.5 30.2 36.8 3.9 24.7 20.8 21.5Máximo 284.3 58.3 67.2 66.2 82.9 77.2 143.8 85.2
Média 248.0 38.3 46.9 50.3 65.2 50.5 50.2 44.6Desvio-padrão 15.4 7.8 7.4 5.8 14.9 10.6 26.4 9.7Amostra (total) 50 50 50 50 50 50 50 50
Anexos xliii
Anexo XVII – Relação entre diâmetros e índice OT/(100km.ano) no conjunto de dados e na RNA
Figura A 11 – Diâmetro nominal versus OT/(100km.ano), para a RNA treinada e para o conjunto de dados.
0
10
20
30
40
50
60
70
80
90
100
0 50 100 150 200 250 300 350
OT
/(1
00
km
.an
o)
Diâmetro nominal da tubagem [mm]
FF
FC
PEAD
FFD
FF sim.
FC sim.
PEAD sim.
FFD sim.
Anexos xlv
Anexo XVIII – Processo de geração de padrões fictícios para análise de resultados
O módulo para geração de padrões fictícios pretende dar uma amostra de todo o hipercubo dos
dados para que a RNA pode, hipoteticamente, vir a ter que fazer previsões. Para este efeito, há
que definir, por parâmetro, quantos e quais os pontos amostrais a considerar. No caso de os
parâmetros corresponderem a variáveis discretas, essa tarefa é directa, no caso de variáveis
contínuas há que definir o intervalo em torno de cada ponto amostral.
Para além de gerar padrões com todas as combinações dos pontos amostrais escolhidos, este
módulo calcula o indicador OT/(100km.ano) real que corresponde a cada padrão fictício. Uma
vez que alguns parâmetros podem ser contínuos, a correspondência é feita de acordo com o
intervalo definido, havendo um “vizinhança” em que registos de padrões reais, semelhantes ao
fictício, são contabilizados.
Posteriormente, a matriz dos padrões fictícios é normalizada e simulada na RNA, obtendo-se um
vector com a as previsões para o índice OT(100km.ano). Os valores normalizados são, portanto
valores representativos dos vários parâmetros em cada um dos padrões. Do Quadro A 17 ao
Quadro A 20 são definidos os pontos amostrais seleccionados para cada um dos parâmetros.
Quadro A 16 – Pontos amostrais admitidos para o parâmetro subsistema de distribuição.
Subsistema de distribuição
Classe
Valor
representativo
Zona Sobrepressora 1
Zona Alta 2
Zona Alta Redutora 3
Zona Superior do Monsanto 4
Zona Superior Redutora 5
-- Não conhecido -- 6
Zona Superior Charneca 7
Zona Baixa 8
Zona Média 9
Zona Baixa Redutora 10
Zona Superior 11
xlvi Anexos
Quadro A 17 – Pontos amostrais admitidos para o parâmetro material.
Quadro A 18 – Pontos amostrais admitidos para o parâmetro idade da tubagem.
Material
Classe
Valor
representativo
FF 1
FC 2
PEAD 3
FFD 4
Idade da tubagem [anos]
Valor
mínimo
Valor
máximo
Valor
representativo
Valor
mínimo
Valor
máximo
Valor
representativo
0 2 1 50 52 51
2 4 3 52 54 53
4 6 5 54 56 55
6 8 7 56 58 57
8 10 9 58 60 59
10 12 11 60 62 61
12 14 13 62 64 63
14 16 15 64 66 65
16 18 17 66 68 67
18 20 19 68 70 69
20 22 21 70 72 71
22 24 23 72 74 73
24 26 25 74 76 75
26 28 27 76 78 77
28 30 29 78 80 79
30 32 31 80 82 81
32 34 33 82 84 83
34 36 35 84 86 85
36 38 37 86 88 87
38 40 39 88 90 89
40 42 41 90 92 91
42 44 43 92 94 93
44 46 45 94 96 95
46 48 47 96 98 97
48 50 49 98 100 99
Anexos xlvii
Quadro A 19 – Pontos amostrais admitidos para o parâmetro diâmetro nominal.
Quadro A 20 – Pontos amostrais admitidos para o parâmetro OT/(100km.ano) prévias.
Diâmetro nominal [mm]
Valor
mínimo
Valor
máximo
Valor
representativo
0 50 25
50 100 75
100 150 125
150 200 175
200 250 225
250 315 283
OT/(100km.ano) prévias
Valor
mínimo
Valor
máximo
Valor
representativo
Valor
mínimo
Valor
máximo
Valor
representativo
0 0 0.0 200 250 225.0
0 5 2.5 250 300 275.0
5 10 7.5 300 400 350.0
10 15 12.5 400 500 450.0
15 20 17.5 500 600 550.0
20 25 22.5 600 700 650.0
25 30 27.5 700 800 750.0
30 35 32.5 800 900 850.0
35 40 37.5 900 1 000 950.0
40 45 42.5 1 000 1 500 1 250.0
45 50 47.5 1 500 2 000 1 750.0
50 60 55.0 2 000 2 500 2 250.0
60 70 65.0 2 500 3 000 2 750.0
70 80 75.0 3 000 3 500 3 250.0
80 90 85.0 3 500 4 000 3 750.0
90 100 95.0 4 000 5 000 4 500.0
100 150 125.0 5 000 6 000 5 500.0
150 200 175.0 6 000 7 000 6 500.0
Anexos xlix
Anexo XIX – Relação entre idade, índice OT/(100km.ano) prévias e índice de OT/(100km.ano) apreendida pela RNA treinada
Figura A 12 – Relação entre idade, índice OT/(100km.ano) prévias e índice de OT/(100km.ano) apreendida pela RNA treinada.
0 13
28
43
65
95 225 45
0 750
1250 27
50 4500
0
500
1000
1500
2000
2500
3000
3500
1
13
25
37
49
61
73
85
97 OT/(100km.ano) prévias
OT
/(1
00
km
.an
o)
Idade da tubagem
3000-3500
2500-3000
2000-2500
1500-2000
1000-1500
500-1000
0-500