Faire du traitement du langage naturel avec tensorflow

Faire du traitement de langage naturel avec Tensorflow Yannick Serge
Obam AI/ML Engineer, isoMora ML GDE @OBAMSerge 1

Audience idéale • les Enthousiastes en ML, Développeurs en ML,
Data Scientist 2

Agenda • Introduction au NLP • Gestion des sequences d’un
corpus • Apprentissage par transfert sur les NLP • QA 3

Introduction au NLP 4

C’est quoi le NLP? NLP est une technologie permettant aux
machines de comprendre le langage humain grâce à l’intelligence artificielle tfhub.dev Linguistique Informatique Intelligence Artificielle NLP 5

Les Applications 6

Les différentes approches • L’approche basée sur des règles •
Les approches statistiques Utilisation du corpus parallele source BigSnarf blog 7

Machine Learning Données en entrée Extration des caracteristiques Répresentation des
données Données en sortie Algorithme de ML 8

Prétraitement des textes • Tokenization • Désaccentuation • Stemmer •
Suppression des stopwords • Désaccentuation • Lemmatiser • Passer en minuscule 9

• Sac à mot pour des phrases • TF-IDF •
Named Entity Recognition Représentation du corpus • Extraction de relation • Extraction des événement • POS tagging 10

http://bit.ly/tokenization001 Demo with tensorflow 11

Word embeddings Credit:2 • Word2vec 12

Word embeddings Credit:2 13

http://bit.ly/embeddings001 Demo with tensorflow 14

Gestion des séquences d’un corpus 15

Réseaux de neurons récurrents 16

Réseaux de neurons récurrents 17

Réseaux de neurons récurrents • Problème de memoire. 18

Long Short Term Memory- LSTM 19

http://http://bit.ly/LSTM001 Demo with tensorflow 20

Seq2Seq • Encodeur trouve une représentation de la phrase. •
Décodeur utilise cette représentation pour construire une réponse. . Encoder Decoder Entree Sortie Contexte 21

Attention Traduction automatique avec Attention Tutoriel: 22

Transformer • Encoder-decoder • Self Attention Modèle de transformateur pour
la compréhension du langage Tutoriel: 23

Apprentissage par transfert en NLP 24

C’est quoi transfer learning? 25 Model B Model A Knowlegde
Source task Target task

Transfer learning in NLP 1- GPT – Generative Pre-Training 2-
BERT 3- OpenAI GPT-2 4- Multi-Task Learning Fine tune a BERT Model Tutoriel: Ruder, 2019 26

Questions 27

Credits Training tokenizers Creating word embeddings coding the word2vec algorithm
in python using deep learning State of transfer learning in NLP 29

Merci! Yannick Serge Obam AI/ML Engineer, isoMora ML GDE @OBAMSerge

Faire du traitement du langage naturel avec ten...

Faire du traitement du langage naturel avec tensorflow

Yannick Serge Obam

More Decks by Yannick Serge Obam

Other Decks in Technology

Featured

Transcript

Faire du traitement de langage naturel avec Tensorflow Yannick Serge

Audience idéale • les Enthousiastes en ML, Développeurs en ML,

Agenda • Introduction au NLP • Gestion des sequences d’un

Introduction au NLP 4

C’est quoi le NLP? NLP est une technologie permettant aux

Les Applications 6

Les différentes approches • L’approche basée sur des règles •

Machine Learning Données en entrée Extration des caracteristiques Répresentation des

Prétraitement des textes • Tokenization • Désaccentuation • Stemmer •

• Sac à mot pour des phrases • TF-IDF •