1 / 35

Monitoração de Qualidade de água com o uso de Dados simbólicos

Monitoração de Qualidade de água com o uso de Dados simbólicos. Afonso Gustavo Ataide Ferreira. Cenário. Preocupação Mundial Escassez Conflitos Armados Mundo volta-se para a qualidade. (IQA) Iniciativas Brasileiras Conama ANA. Roteiro. Estado da Arte Metodologia Resultados

piper
Download Presentation

Monitoração de Qualidade de água com o uso de Dados simbólicos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Monitoração de Qualidade de água com o uso de Dados simbólicos Afonso Gustavo Ataide Ferreira

  2. Cenário • Preocupação Mundial • Escassez • Conflitos Armados • Mundo volta-se para a qualidade. (IQA) • Iniciativas Brasileiras • Conama • ANA

  3. Roteiro • Estado da Arte • Metodologia • Resultados • Conclusões e Trabalhos Futuros

  4. Estado da Arte Classificação de Amostras de Água

  5. Classificação de Amostras de Água • CONRADS (MLP x Branch/BLTM) • YONG (SOM x MLP) • BARUAH (MLP)

  6. Estado da Arte Análise de Dados Simbólicos

  7. Análise de Dados Simbólicos • Dado Numérico • Dado Categórico • Conjuntos • Intervalos Numéricos • Conjuntos associados a pesos

  8. Análise de Dados Simbólicos

  9. Classificador Simbólico • Amostras: • Espaço:

  10. Classificador Simbólico • Join:

  11. Classificador Simbólico • Aprendizagem: • Sem Mutual Neighborhood Graph • Mutual Neighborhood Graph: • Múltiplas regiões. • Sem interseção com outras classes.

  12. Classificador Simbólico • Classificação:

  13. Metodologia Coleta de Dados Seleção de Variáveis Limpeza dos Dados Análise dos Dados Divisão dos Conjuntos

  14. Coleta de Dados • Bases da CETESB • 35 Características • IQA e outros índices • onze rios, 239 amostras.

  15. Seleção de Variáveis

  16. Seleção de Variáveis • Oxigênio Dissolvidos • Coliformes Fecais • Potencial Hidrogeniônico (pH) • Demanda Bioquímica de Oxigênio • Temperatura • Nitrogênio Total • Fósforo Total • Turbidez • Resíduo Total

  17. Limpeza dos Dados • Valores não numéricos • Ex: NKT < 0,2

  18. Limpeza dos Dados • Valores Ausentes: • Substituídos pela média da classe

  19. Análise dos Dados • Tamanho do conjunto

  20. Análise dos Dados

  21. Conjuntos de Treinamento e Teste • Hold-out estratificado (50 – 50)

  22. Resultados Protótipo Experimentos

  23. Protótipo • Java J2SE1.5 • Tanagra

  24. Experimentos • Classificador Simbólico: • Taxa de Erro: 21,20% • Desempate: Maior Volume

  25. Experimentos • K-Vizinhos (5-nn) • Distância: Euclidiana • Taxa de Erro: 28,84%

  26. Experimentos • Classificador Simbólico: • Taxa de Erro: 29,63% • Desempate: Menor Volume

  27. Resultados • Teste Estatístico • 1000 iterações

  28. Conclusões

  29. Conclusões • Classificador Simbólico um pouco melhor que o k-vizinhos • Performance ruim em algumas classes • Utilização de MNG aumentou taxa de erro.

  30. Trabalhos Futuros

  31. Trabalhos Futuros • Mudança do formato de Região • H-Region • Adaptação do algoritmo de MNG • Testes com outras bases de Dados

  32. Referências • ANA – Agência Nacional de Águas • Java – http://java.sun.com • ICHINO, M., YAGUCHI, H. AND DIDAY, E.: A fuzzy symbolic pattern classifier In: Diday, E. et al (Eds.): Ordinal and Symbolic Data Analysis. Springer, Berlin, (1996) 92–102 • D’OLIVEIRA, S. T., CARVALHO, F.A.T., SOUZA, R. M. C. R.. A Classifier for Quantitative Feature Values Based on a Region Oriented Symbolic Approach. C. Lemaître, C.A. Reyes, J. A. Gonzalez: IBERAMIA 2004, LNAI 3315 pp. 464-473,2004 • TANAGRA. TANAGRA - A Free DATA MINING Software for Teaching and Research. Disponível em: <http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html >. Acesso em: Janeiro 2006.

More Related