langue Jeux de données francophones Wikipédia Common Crawl (OSCAR, CCNet) Piaf [? ] Datasets anglophones Wikipedia Common Crawl BooksCorpus SQuAD, SQuAD v2 SNLI, MultiNLI QNLI, CoLA, STS-B, RTE, MRPC, SST-2, QQP ....... Modèles pré-entrainés [FR] CamemBERT [? ] FlauBERT [? ] Très peu de ne-tuning existants Modèles [EN] BERT SBERT Multitude de versions ne-tunées 11