Upgrade to Pro — share decks privately, control downloads, hide ads and more …

datadrink_30072020__Etalab_PIAF

8eada3aa8251117a617e101bb2881366?s=47 etalab-ia
July 30, 2020
35

 datadrink_30072020__Etalab_PIAF

8eada3aa8251117a617e101bb2881366?s=128

etalab-ia

July 30, 2020
Tweet

Transcript

  1. PIAF: Pour des IA francophones Équipe PIAF Pavel SORIANO-MORALES Direction

    interministérielle du numérique Etalab Lab-IA
  2. Le Lab IA d’Etalab Trois grands axes Accompagner les projets

    IA de l’administration Développer des outils mutualisés pour l’action publique Animer la communauté IA de l’administration Et aussi... Développer l’éthique de l’IA dans la sphère publique et la transparence vers les citoyens Construire un partenariat avec l’écosystème de la recherche en IA 1
  3. PIAFv1 2

  4. PIAFv1 . https ://huggingface.co/etalab-ia/camembert-base-squadFR-fquad-piaf 3

  5. PIAFv1 4

  6. PIAFv1 . https://www.data.gouv.fr/fr/datasets/ piaf-le-dataset-francophone-de-questions-reponses/ 5

  7. PIAFv1 . https ://www.aclweb.org/anthology/2020.lrec-1.673/ 6

  8. PIAFv1 . https ://piaf.etalab.studio/ 7

  9. PIAFv1 . https ://piaf.etalab.studio/enseignements-contributions/ 8

  10. PIAFv2 : le retour de PIAF

  11. PIAFv2 : le retour de PIAF Le contrat de travail

    à durée indéterminée (CDI) est la forme normale et générale de la relation de travail. Par définition, il ne prévoit pas la date à laquelle il prend fin. Il peut être rompu sur décision unilatérale soit de l’employeur (licenciement pour motif personnel ou pour motif économique), soit du salarié (démission, départ à la retraite). il ne prévoit pas la date à laquelle il prend fin Quelle est la durée d’un CDI ? Réponse proposée par le modèle Question Extrait du Code de Travail Modèles de langage francophones Dataset QA francophone (Avec notre modèle FR-BERT fine-tuné sur PIAF) 9
  12. PIAFv2 : le retour de PIAF 10

  13. PIAFv2 : le retour de PIAF . https ://github.com/deepset-ai/haystack 11

  14. Objectifs PIAFv2 • Profiter de notre dataset PIAF pour le

    QA ; • Aider les administrations (fonctionnaires et citoyens) à mieux trouver des réponses/documents dans leur bases de connaissances ; • Faciliter l’utilisation de PIAFv2 pour des autres cas d’usage : outil mutualisé • Continuer à familiariser l’administration sur les enjeux de l’IA 12
  15. Résumé • Avec votre aide, nous avons recueilli un dataset

    francophone de Question/Réponses (basé sur SQuAD) ; • Nous avons développé une plate-forme d’annotation QA ; • Nous avons testé une méthodologie contributive et ouverte autour d’une communauté ; • Maintenant, nous utilisons ce dataset pour répondre le défi QA + Doc Retrieval + Chatbot au sein de l’administration ! • Nous utilisons des Transformers (CamemBERT), ElasticSearch le tout packagé dans Haystack. Merci ! 13