Upgrade to Pro — share decks privately, control downloads, hide ads and more …

I Know Who Was in That Meeting: Geographical De-Anonymization of Crowds through Smartphone Probes

I Know Who Was in That Meeting: Geographical De-Anonymization of Crowds through Smartphone Probes

Computer Science Degree - Final Thesis Presentation - 2014

Adriano Di Luzio

July 22, 2014
Tweet

More Decks by Adriano Di Luzio

Other Decks in Technology

Transcript

  1. I Know Who Was In That Meeting: Geographical De-Anonymization Of

    Crowds Through Smartphone Probes Adriano Di Luzio, Sapienza Università di Roma a.a. 2013 - 2014 Relatore: Prof. Alessandro Mei
  2. OBIETTIVO Ultimo Angelus di Papa Benedetto XVI: “Da dove venivano

    le persone che erano lì?” Possiamo scoprirlo, ascoltando ciò che ci dicono i loro smartphone.
  3. ASCOLTARE? • Ascoltare, è proprio il termine esatto. • Ogni

    moderno smartphone, urla la propria presenza a tutti gli Access Point (AP) vicini, per associarvisi e godere dei relativi servizi. • Da cui, gli smartphone probes…
  4. SMARTPHONE PROBES (PER GLI ADDETTI AI LAVORI) • Frame speciali

    del protocollo 802.11 (WLAN). • Viaggiano in chiaro, senza cifratura. • Probe di richiesta e di risposta. • Quelli di richiesta possono essere invitati: • Broadcast (destinati a tutti) • Directed (ad uno specifico AP), molto interessanti: • MAC Address del dispositivo • SSID dell’AP
  5. PNL: Adriano-casa sapienza provinciawifi starbucks … PREFERRED NETWORKS LIST Smartphone

    di Adriano, MAC: F1:7F:77:CD:5B:4F Reti conosciute, ci siete?
  6. PNL: Adriano-casa sapienza provinciawifi starbucks … PREFERRED NETWORKS LIST In

    ascolto (sniffing)… Smartphone di Adriano, MAC: F1:7F:77:CD:5B:4F
  7. DATI RACCOLTI E OBIETTIVI • Milioni di probe e tonnellate

    di informazioni. • Ci interessa scoprire la provenienza delle persone presenti: i luoghi in cui vivono o vanno spesso. • Possiamo farlo, associando persone
 ed AP, tramite i probe.
  8. LOCALIZZAZIONE GEOGRAFICA È possibile scoprire la posizione da cui un

    dispositivo proviene in base alle reti cui si è connesso?
  9. LOCALIZZAZIONE: FRAMEWORK • A questo punto abbiamo: • MAC address

    dei dispositivi. • SSID degli Access Point. • Come associare dispositivi, AP e posizioni geografiche? • Posizioni GPS degli Access Point.
  10. ACCESS POINT E GPS • Serve associare una posizione GPS

    ad ogni AP. • Possibili database di informazioni: • Google • wigle.net
  11. ACCESS POINT E GPS • Serve associare una posizione GPS

    ad ogni AP. • Possibili database di informazioni: • Google • wigle.net (non vi concede accesso)
  12. ACCESS POINT E GPS • Serve associare una posizione GPS

    ad ogni AP. • Possibili database di informazioni: • Google • wigle.net (non vi concede accesso) (accesso limitato)
  13. ASSEGNAMENTO SMART • L’assegnamento casuale è troppo ingenuo. • Abbiamo

    però una base di AP localizzati in modo univoco. • Perché non scegliere le posizioni in relazione agli univoci e alle altre richieste del dispositivo?
  14. ASSEGNAMENTO SMART • L’assegnamento casuale è troppo ingenuo • Abbiamo

    però una base di AP localizzati in modo • Perché non in altre Principio di località: di solito gli utenti si c o n n e t t o n o a d A P geograficamente vicini tra loro.
  15. ASSEGNAZIONE SMART Roma Milano 0 0.2 0.4 0.6 0.8 1

    0 2 4 6 8 10 12 14 % of devs connected to >= N APs N(APs in Rome) M5S PDL PortaDiRoma Sapienza Termini P. BenedettoXVI P. Francesco 0 0.2 0.4 0.6 0.8 1 0 2 4 6 8 10 12 14 % of devs connected to >= N APs N(APs in Milan) M5S PDL PortaDiRoma Sapienza Termini P. BenedettoXVI P. Francesco
  16. RISULTATI SMART 0 0.1 0.2 0.3 0.4 0.5 0.6 Torino

    Salerno Rome Parma Palermo Naples Milan Genova % of devices M5S PDL PortaDiRoma Sapienza Termini P.BenedettoXVI P.Francesco
  17. RISULTATI ELETTORALI Città Risultati M5S PDL Roma Elezioni 28% 18%

    Assegnazione Smart 46% 38% Milano Elezioni 17% 20% Assegnazione Smart 8% 10%
  18. DIFFICOLTÀ TECNICHE INCONTRATE 1. Wigle.net, limitazioni in base a: 1.

    Quantità di dati richiesta. 2. Account utilizzato. 3. Indirizzo IP utilizzato. 2. Corruzione degli SSID: 1. provinciawifi ➞ provtnciawofi 2. Alice-15348958 ➞ Alice-15
  19. HACKING WIGLE Come aggirare le limitazioni imposte ed eseguire query

    in automatico? 1. Reverse Engineering delle API. 2. Gestione automatica dello spazio di ricerca. 3. Molti account e proxy, in combinazione.
  20. SSID CORRUPTION: RECOVERY Come recuperare gli SSID originali? 1. Distanza

    di Hamming. 2. “Rilevanza” degli SSID. provtnciawofi ➞ provinciawifi