Traiter des requètes, de 200K/jour à 200K/min

Traiter des requêtes De 200K/jour à 200K/min

Qui sommes-nous

Adback, https://adback.co, @adback_co Projet lancé en janvier 2015 3 développeurs
(depuis 6 mois) Outil d’analyse des adblockeurs Qui sommes-nous

Données analytics Accès BO Précalcul des données Enrichissement des données
Qui sommes-nous

Existant en mai Projet mono-bloc 3 serveurs chez OVH 1MySql,
1 Redis Quelques commandes consoles Pas de scaling Pas de monitoring Spaghetti code

Intégration de nouveaux sites Limitation dans le nombre de traitement
Ban par les firewalls OVH en raison de flooding

Il faut migrer!!

Migration Vers quoi ? Vers où ? Avec quelle technologie
? En combien de temps ? Refactoring ? Chez AWS Les mêmes 2 semaines max Non

Identification des différents process Satellites : servir les tags js
et récupérer les données Workers : réaliser l’enrichissement des données Worker-cache : réaliser le pré-calcul des données la nuit Back-office : présenter le résultat aux clients

Première migration Uniquement Redis vers Elasticache. Pas de modification de
code.

Première migration Echec car : Lenteur des accès à redis

Deuxième migration Concerne plus de services : Satellite Worker Redis
Mysql

Procedure Fork du projet Utilisation de elastic beanstalk Lancement sur
AWS

Elastic Beanstalk et docker Permet de lancer plusieurs container sur
une instance EC2 Le scaling est réalisé en ajoutant des instances EC2 La configuration se fait par un fichier Dockerrun.aws.json Mise à disposition d’un executable local (eb) Le déploiement peut aussi mettre à jour les containers

Configuration

En local

Structure du projet

Déploiement (avec codeship)

Résultats

Succès Plateforme iso-prod Scalabilité horizontale Déploiement automatique Premières étapes de
monitoring

Échecs Récupération des ips : $request->getClientIp() => Ip du loadbalancer
AWS Limitation de la base MariaDB (1000 insert/sec) Tests

Analyse des échecs

Modification de la base Séparation des données : Données principales
Données d’enrichissement Données pour les statistiques Destination : MariaDB Aurora Redshift

Modification de la base Procedure : Les entitées sont décrites
par des interfaces Modifications des relations avec les autres entitées

Modification de la base Performance en écriture Mais utilisation CPU
non optimale

Modification de la base Ajout d’un redis local Utilisation de
l’AOP

Migration de la base De Aurora à Redshift : Extraction
des données sous la forme d’un csv Importation dans Redshift en utilisant Embulk

Tests Mise en place d’une librairie partagée : Garantie que
les données sorties sont bien ré-analysées

Optimisation inefficace

Optimisation inefficace Réplication Master-slave Tentative de lissage de charge

Et ensuite ?

Assurer la cohérence des données

Assurer la cohérence des données Utilisation de la stack Druid.io/Pivot
Druid.io permet l’importation des données en CSV Permet de faire de l’analyse en temps réel

Assurer la cohérence des données Utilisation de la stack GGS
pour réaliser du monitoring métier Installation d’un agent statsd par container

Conclusion

Ce qui nous a aidé Être devops : Culture Automatisation
Mesure Partage

Ce qui nous a aidé Être en remote : Obligation
de livrer quelque chose d’utilisable tout de suite Livrer avec la documentation d’utilisation

Ce qui nous a aidé Séparer l’implementation de l’utilisation :
Rendre le code open-sourcable rapidement Ne pas privilégier l’optimisation sur le design

Ce qui nous a aidé Être agile : Cérémonie, stand
up, petites tâches Finir les tâches des collègues

Questions ?

MERCI !

Traiter des requètes, de 200K/jour à 200K/min

Traiter des requètes, de 200K/jour à 200K/min

More Decks by Nicolas Thal

Other Decks in Programming

Featured

Transcript