langue Jeux de données francophones ˆ Wikipédia ˆ Common Crawl (OSCAR, CCNet) ˆ Piaf [? ] Datasets anglophones ˆ Wikipedia ˆ Common Crawl ˆ BooksCorpus ˆ SQuAD, SQuAD v2 ˆ SNLI, MultiNLI ˆ QNLI, CoLA, STS-B, RTE, MRPC, SST-2, QQP ....... Modèles pré-entrainés [FR] ˆ CamemBERT [? ] ˆ FlauBERT [? ] ˆ Très peu de ne-tuning existants Modèles [EN] ˆ BERT ˆ SBERT ˆ Multitude de versions ne-tunées 11