Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Classificação de Dados Multivariados Relacionados a Poluição em Regiões Urbanas Utilizando Self-Organizing Maps

Edson Hilios
December 07, 2015

Classificação de Dados Multivariados Relacionados a Poluição em Regiões Urbanas Utilizando Self-Organizing Maps

Apresentação do artigo de conclusão da disciplina de Análise Exploratória de Dados Espaciais cursada na Escola Politécnica da Universidade de São Paulo.

Objetivos:
- Aplicação de análise multivariada em dados de qualidade do ar;
- Classificação de localidades urbanas em função da dispersão de poluentes em diferentes horarios.
- Analisar o comportamento de cada variável em relação às classes obtidas por similaridade;
- Alimentar a discussão de questões relacionadas à representação cartográfica dos resultados e à granularidade espacial e temporal.

Edson Hilios

December 07, 2015
Tweet

More Decks by Edson Hilios

Other Decks in Research

Transcript

  1. Artigo de conclusão
    Classificação de Dados Multivariados Relacionados
    a Poluição em Regiões Urbanas Utilizando Self-
    Organizing Maps
    PMI-5198 – Análise exploratório de dados Espaciais
    Bruno Meirelles, Edson Hilios e Rafael Oliveira
    07 de Dezembro de 2015

    View Slide

  2. Introdução
    O lançamento de grandes quantidades de fumaça no ar causava
    condições extremamente insalubres, com poluentes sendo lançados mais
    rapidamente do que podiam ser assimilados e dispersos pela atmosfera,
    causando problemas a saúde e a este processo demos o nome de
    poluição.

    View Slide

  3. Poluição do Ar
    A Lei 6938/81 da Política Nacional do Meio Ambiente, define poluição:
    ● Prejudiquem a saúde, a segurança e o bem estar da população;
    ● Criem condições adversas às atividades sociais e econômicas;
    ● Afetem desfavoravelmente à biota;
    ● Afetem as condições estéticas ou sanitárias do meio ambiente;
    ● Lancem matéria ou energia em desacordo com os padrões
    ambientais.

    View Slide

  4. View Slide

  5. Veículo como sensor móvel
    Lee et al. (2008) introduzem o
    paradigma das “redes de
    sensores veiculares”, destacando
    o fato de a redução do custo (e
    espaço) de armazenamento
    computacional tem possibilitado o
    uso de plataformas móveis para
    operações cada vez mais
    complexas.

    View Slide

  6. Objetivos
    ● Aplicação de análise multivariada em dados de qualidade do ar;
    ● Classificação de localidades urbanas em função da dispersão de
    poluentes em diferentes horarios.
    ● Analisar o comportamento de cada variável em relação às classes
    obtidas por similaridade;
    ● Alimentar a discussão de questões relacionadas à representação
    cartográfica dos resultados e à granularidade espacial e temporal.

    View Slide

  7. Materiais e métodos

    View Slide

  8. Aquisição de dados: Sensor
    Foram utilizados kits customizados
    com sensores ambientais
    integrados, localização por GNSS e
    recursos de comunicação e
    armazenamento de dados,
    embarcados em um ônibus em um
    mesmo percurso em diversos
    horários;

    View Slide

  9. Aquisição de dados: Dados ambientais
    Sensor Faixa de medida Sensibilidade ou Acurácia
    CO 30 ~ 1000ppm 0.13 ~ 0.31 (Taxa da esistência de 300ppm e 100ppm)
    CO
    2
    350 ~ 10000ppm 44 ~ 72mv (variação de voltagem entre 350ppm e 3500ppm)
    NO
    2
    0.05 ~ 5ppm 6 ~ 100 (tipicamente 55 - Resistências entre os índices de 0.25ppm e o valor de ar)
    O
    3
    10 ~ 1000ppb 2 ~ 4 (tipicamente 1.5, resistência entre 100ppm e 50ppm)
    Umidade 0 ~ 100%RH <±4%RH (a 25ºC, range 30 ~ 80%), <±6%RH (range 0 ~ 100)
    Temperatura -40ºC,+125ºC ±2ºC (range 0ºC ~ +70ºC), ±4ºC (range -40 ~ +125ºC)
    GPS Acurácia posicional < 2.5 m, acurácia de velocidade 0.01 m/s
    Tabela 1: Variáveis sensoriadas e descrição. Fonte: Santos (2014)

    View Slide

  10. Aquisição de dados: Viagens
    Data Faixa Horária
    29/06/2015 18h44min - 19h32min
    30/06/2015 09h44min - 10h28min
    20/08/2015 20h01min - 20h46min
    21/08/2015 07h54min - 08h52min
    22/08/2015 21h01min - 21h30min
    Fig. 1: Itinerário dos deslocamentos realizados. Fonte: Santos (2014).
    Tabela 2: Deslocamentos realizados

    View Slide

  11. Self-Organizing Maps

    View Slide

  12. Dados utilizados na análise
    ● Valores associados à concentração de poluentes:
    ○ CO, CO2, NO2 e O3;
    ● Condições ambientais:
    ○ Temperatura e umidade;
    ● Dados espaço-temporais:
    ○ Altitude, velocidade e hora;

    View Slide

  13. Parâmetros do SOM
    ● Arranjo de 14x8 unidades;
    ● Topologia toroidal com arranjo de vizinhança hexagonal;
    ● Agrupamentos em 20 conjuntos pelo algoritmo k-means.

    View Slide

  14. Contribuição individual das variaveis

    View Slide

  15. Análise das componentes principais

    View Slide

  16. Matriz-U e Matriz-U com densidade e Clusters

    View Slide

  17. Quartil CO O3 NO2
    P25 (1º quartil) 1,0060 1,2670 2,3750
    P50 (2º quartil) 1,2120 1,3490 2,3900
    P75 (3º quartil) 1,4900 1,4210 2,3980
    Tabela 4 - Quartis dos dados de sensibilidade do sensor
    Classificação por percentil

    View Slide

  18. Resultados
    I) 21/08/2015 (sex) de 07h54min a 08h52min
    Os resultados foram plotados um
    mapa num SIG para cada viagem
    e, ordenados pela hora do dia no
    qual se passou;

    View Slide

  19. Resultados
    III) 29/08/2015 (seg) de 18h32min a 19h32min
    II) 30/08/2015 (ter) de 09h44min a 10h28min

    View Slide

  20. Resultados
    V) 22/08/2015 (sab) de 21h01min a 21h30min
    IV) 29/08/2015 (qui) de 20h01min a 20h46min

    View Slide

  21. Conclusões
    A aplicação do Self-Organizing Maps mostrou-se uma ferramenta
    bastante útil para análise dos dados de poluição do ar através dos
    sensores móveis.
    A técnica nos fornece facilmente a analise de correlação e os mapas
    apontam clusters que fazem sentido quando comparados ao
    conhecimento tradicional da poluição do ar. Mesmo com os sensores não
    estando calibrados adequadamente.

    View Slide

  22. Discussão
    Apesar do índice de qualidade que criamos nesse trabalho ser diferente
    daquele tradicionalmente utilizado pela CETESB para o monitoramento
    da qualidade do ar na RMSP, ele apontou resultados que corroboram
    aqueles obtidos pelos sistemas tradicionais, ou seja, o campus da USP
    aparece como uma ilha de boa qualidade do ar quando comparada ao
    restante do trecho analisado.
    Também fica evidente que a qualidade do ar piora muito em situações de
    tráfego carregado e lento, como demonstrado com os dados de CO e
    NO2.

    View Slide

  23. Obrigado!

    View Slide