Classificação de Dados Multivariados Relacionados a Poluição em Regiões Urbanas Utilizando Self-Organizing Maps

456d07b3f7a1ab66502e232fd9b1d378?s=47 Edson Hilios
December 07, 2015

Classificação de Dados Multivariados Relacionados a Poluição em Regiões Urbanas Utilizando Self-Organizing Maps

Apresentação do artigo de conclusão da disciplina de Análise Exploratória de Dados Espaciais cursada na Escola Politécnica da Universidade de São Paulo.

Objetivos:
- Aplicação de análise multivariada em dados de qualidade do ar;
- Classificação de localidades urbanas em função da dispersão de poluentes em diferentes horarios.
- Analisar o comportamento de cada variável em relação às classes obtidas por similaridade;
- Alimentar a discussão de questões relacionadas à representação cartográfica dos resultados e à granularidade espacial e temporal.

456d07b3f7a1ab66502e232fd9b1d378?s=128

Edson Hilios

December 07, 2015
Tweet

Transcript

  1. Artigo de conclusão Classificação de Dados Multivariados Relacionados a Poluição

    em Regiões Urbanas Utilizando Self- Organizing Maps PMI-5198 – Análise exploratório de dados Espaciais Bruno Meirelles, Edson Hilios e Rafael Oliveira 07 de Dezembro de 2015
  2. Introdução O lançamento de grandes quantidades de fumaça no ar

    causava condições extremamente insalubres, com poluentes sendo lançados mais rapidamente do que podiam ser assimilados e dispersos pela atmosfera, causando problemas a saúde e a este processo demos o nome de poluição.
  3. Poluição do Ar A Lei 6938/81 da Política Nacional do

    Meio Ambiente, define poluição: • Prejudiquem a saúde, a segurança e o bem estar da população; • Criem condições adversas às atividades sociais e econômicas; • Afetem desfavoravelmente à biota; • Afetem as condições estéticas ou sanitárias do meio ambiente; • Lancem matéria ou energia em desacordo com os padrões ambientais.
  4. None
  5. Veículo como sensor móvel Lee et al. (2008) introduzem o

    paradigma das “redes de sensores veiculares”, destacando o fato de a redução do custo (e espaço) de armazenamento computacional tem possibilitado o uso de plataformas móveis para operações cada vez mais complexas.
  6. Objetivos • Aplicação de análise multivariada em dados de qualidade

    do ar; • Classificação de localidades urbanas em função da dispersão de poluentes em diferentes horarios. • Analisar o comportamento de cada variável em relação às classes obtidas por similaridade; • Alimentar a discussão de questões relacionadas à representação cartográfica dos resultados e à granularidade espacial e temporal.
  7. Materiais e métodos

  8. Aquisição de dados: Sensor Foram utilizados kits customizados com sensores

    ambientais integrados, localização por GNSS e recursos de comunicação e armazenamento de dados, embarcados em um ônibus em um mesmo percurso em diversos horários;
  9. Aquisição de dados: Dados ambientais Sensor Faixa de medida Sensibilidade

    ou Acurácia CO 30 ~ 1000ppm 0.13 ~ 0.31 (Taxa da esistência de 300ppm e 100ppm) CO 2 350 ~ 10000ppm 44 ~ 72mv (variação de voltagem entre 350ppm e 3500ppm) NO 2 0.05 ~ 5ppm 6 ~ 100 (tipicamente 55 - Resistências entre os índices de 0.25ppm e o valor de ar) O 3 10 ~ 1000ppb 2 ~ 4 (tipicamente 1.5, resistência entre 100ppm e 50ppm) Umidade 0 ~ 100%RH <±4%RH (a 25ºC, range 30 ~ 80%), <±6%RH (range 0 ~ 100) Temperatura -40ºC,+125ºC ±2ºC (range 0ºC ~ +70ºC), ±4ºC (range -40 ~ +125ºC) GPS Acurácia posicional < 2.5 m, acurácia de velocidade 0.01 m/s Tabela 1: Variáveis sensoriadas e descrição. Fonte: Santos (2014)
  10. Aquisição de dados: Viagens Data Faixa Horária 29/06/2015 18h44min -

    19h32min 30/06/2015 09h44min - 10h28min 20/08/2015 20h01min - 20h46min 21/08/2015 07h54min - 08h52min 22/08/2015 21h01min - 21h30min Fig. 1: Itinerário dos deslocamentos realizados. Fonte: Santos (2014). Tabela 2: Deslocamentos realizados
  11. Self-Organizing Maps

  12. Dados utilizados na análise • Valores associados à concentração de

    poluentes: ◦ CO, CO2, NO2 e O3; • Condições ambientais: ◦ Temperatura e umidade; • Dados espaço-temporais: ◦ Altitude, velocidade e hora;
  13. Parâmetros do SOM • Arranjo de 14x8 unidades; • Topologia

    toroidal com arranjo de vizinhança hexagonal; • Agrupamentos em 20 conjuntos pelo algoritmo k-means.
  14. Contribuição individual das variaveis

  15. Análise das componentes principais

  16. Matriz-U e Matriz-U com densidade e Clusters

  17. Quartil CO O3 NO2 P25 (1º quartil) 1,0060 1,2670 2,3750

    P50 (2º quartil) 1,2120 1,3490 2,3900 P75 (3º quartil) 1,4900 1,4210 2,3980 Tabela 4 - Quartis dos dados de sensibilidade do sensor Classificação por percentil
  18. Resultados I) 21/08/2015 (sex) de 07h54min a 08h52min Os resultados

    foram plotados um mapa num SIG para cada viagem e, ordenados pela hora do dia no qual se passou;
  19. Resultados III) 29/08/2015 (seg) de 18h32min a 19h32min II) 30/08/2015

    (ter) de 09h44min a 10h28min
  20. Resultados V) 22/08/2015 (sab) de 21h01min a 21h30min IV) 29/08/2015

    (qui) de 20h01min a 20h46min
  21. Conclusões A aplicação do Self-Organizing Maps mostrou-se uma ferramenta bastante

    útil para análise dos dados de poluição do ar através dos sensores móveis. A técnica nos fornece facilmente a analise de correlação e os mapas apontam clusters que fazem sentido quando comparados ao conhecimento tradicional da poluição do ar. Mesmo com os sensores não estando calibrados adequadamente.
  22. Discussão Apesar do índice de qualidade que criamos nesse trabalho

    ser diferente daquele tradicionalmente utilizado pela CETESB para o monitoramento da qualidade do ar na RMSP, ele apontou resultados que corroboram aqueles obtidos pelos sistemas tradicionais, ou seja, o campus da USP aparece como uma ilha de boa qualidade do ar quando comparada ao restante do trecho analisado. Também fica evidente que a qualidade do ar piora muito em situações de tráfego carregado e lento, como demonstrado com os dados de CO e NO2.
  23. Obrigado!