Slide 1

Slide 1 text

Study Case: PHP com Machine Learning e Geolocalização para segurança de autenticação 1

Slide 2

Slide 2 text

Hello! Bruno Souza Analista de sistema Datainfo/MRE Twitter: @Bruno_HSouza Joind.in @BrunoHSouza 2 Marcelo Neres Analista de sistemas Datainfo/MRE Twitter @marceloncabral Joind.in @mneresc Telegram @mneresc

Slide 3

Slide 3 text

Machine Learning

Slide 4

Slide 4 text

“ 4 Machine Learning is the study of computer algorithms that improve automatically through experience Tom Mitchell, McGraw Hill, 1997

Slide 5

Slide 5 text

5

Slide 6

Slide 6 text

Entre suas principais funções estão: ○ Classificação e previsão ○ Modelos de recomendação ○ Agrupamentos

Slide 7

Slide 7 text

Rexer Analytics - Data Science Survey

Slide 8

Slide 8 text

Aprendizado Supervisionado VS Aprendizado Não Supervisionado

Slide 9

Slide 9 text

O que é geoprocessamento ?

Slide 10

Slide 10 text

Cartografia Digital e Geolocalização

Slide 11

Slide 11 text

Projeção em sistemas cartográficos

Slide 12

Slide 12 text

Entidades Geográficas

Slide 13

Slide 13 text

● Openlayers ● OpenStreetMaps ● GeoJSON ● Servidores de mapa ● Banco de dados geográficos

Slide 14

Slide 14 text

Identificação de Problema

Slide 15

Slide 15 text

Um mesmo usuário autenticando no mesmo sistema/rede em diferentes lugares de longa distância

Slide 16

Slide 16 text

Processo de Machine Learning

Slide 17

Slide 17 text

No content

Slide 18

Slide 18 text

Recuperação de Dados

Slide 19

Slide 19 text

User IP Browser Date/Time 1234 10.20.0.30 Mozilla Firefox 2019-06-09T09:32:45 3456 192.168.90.34 Google Chrome 2019-03-09T03:56:33 0986 192.177.8.94 Google Chrome 2019-03-12T06:33:56

Slide 20

Slide 20 text

Tratamento de Dados

Slide 21

Slide 21 text

● Possuo todos os dados necessários? ● Os dados estão normalizados? ● Existe algum padrão nos dados?

Slide 22

Slide 22 text

public function findIpOnAPI($ip) { $response = $this->httpClient->request( 'GET', 'https://geo.api.org/api/v1', [ 'query' => [ 'ipAddress' => $ip ] ] ); return $response->getContent(); }

Slide 23

Slide 23 text

Treinando o Modelo de Dados

Slide 24

Slide 24 text

... $vicenty = new VicentyService(); $lines = []; foreach($dataset->getSamples() as $key => $sample) { if ($access->getIp() == $sample[0] && $access->getUser() !== $target) { $arrFrom = [$access->getLatitude(), $access->getLongitude()]; $arrTo = [$sample[4], $sample[5]]; $diffDistance = $vicenty->distance($arrFrom, $arrTo); if ($diffDistance > 0) { $lines[] = sprintf('%s,%s,%s,%s,%s', $arrFrom['lat'], $arrFrom['lon'], $arrTo['lat'], $arrTo['lon'], $diffDistance) . PHP_EOL; } } } } file_put_contents('data/datasets/suspect-access.csv', $lines);

Slide 25

Slide 25 text

public function distance(array $coordFrom, array $coordTo): float { $latFrom = deg2rad(str_replace('.', '', $coordFrom[0])); $lonFrom = deg2rad(str_replace('.', '', $coordFrom[1])); $latTo = deg2rad(str_replace('.', '', $coordTo[0])); $lonTo = deg2rad(str_replace('.', '', $coordTo[1])); $lonDelta = $lonTo - $lonFrom; $a = pow(cos($latTo)*sin($lonDelta), 2)+pow(cos($latFrom) * sin($latTo) - sin($latFrom) * cos($latTo) * cos($lonDelta), 2); $b = sin($latFrom) * sin($latTo) + cos($latFrom) * cos($latTo) * cos($lonDelta); $angle = atan2(sqrt($a), $b); return $angle * self::EARTH_RADIUS; }

Slide 26

Slide 26 text

Vincenty Distance

Slide 27

Slide 27 text

PHP e ML?

Slide 28

Slide 28 text

PHP-ML

Slide 29

Slide 29 text

Google Cloud API

Slide 30

Slide 30 text

PHP TensorFlow

Slide 31

Slide 31 text

Jupyter em PHP

Slide 32

Slide 32 text

● Não possui suporte à visualização de dados ● Não possui suporte para processamento em GPU Principais Desafios do PHP com ML

Slide 33

Slide 33 text

Como evoluir o PHP para se adequar com o ML?

Slide 34

Slide 34 text

No content

Slide 35

Slide 35 text

https://github.com/brunohsouza/php-ml-authentication

Slide 36

Slide 36 text

https://github.com/mneresc/maps-machine-learning-exemple

Slide 37

Slide 37 text

Obrigado!