Natural Language Processing Expert Briefing @ PyData Global 2021

Natural Language Processing Trends, Challenges and Opportunities @MarcoBonzanini PyData Global
2021

© Bonzanini Consulting Ltd — BonzaniniConsulting.com Nice to meet you
• Consulting, training and coaching on Python + Data Science • Chair @ PyData London 2

© Bonzanini Consulting Ltd — BonzaniniConsulting.com Natural Language Processing 4
Natural Language  Understanding Natural Language  Generation

© Bonzanini Consulting Ltd — BonzaniniConsulting.com 5 That that is
is that that is not is not is that it it is (That’s proper English)

© Bonzanini Consulting Ltd — BonzaniniConsulting.com 6 That that is,
is. That that is not, is not. Is that it? It is. More fun at: https://en.wikipedia.org/wiki/List_of_linguistic_example_sentences Pics: https://en.wikipedia.org/wiki/Socrates and https://en.wikipedia.org/wiki/Parmenides

© Bonzanini Consulting Ltd — BonzaniniConsulting.com 7 “They ate pizza
with anchovies”

© Bonzanini Consulting Ltd — BonzaniniConsulting.com Language is challenging •
Language is evolving 9

Language is evolving • Language is ambiguous 10

Language is evolving • Language is ambiguous • (Understanding) Language requires context 11

© Bonzanini Consulting Ltd — BonzaniniConsulting.com We need annotated data
12

• Variability: domains and languages 13

• Variability: domains and languages • Available data: sparse 14

• Variability: domains and languages • Available data: sparse • Available data: bias 15

• Variability: domains and languages • Available data: sparse • Available data: bias • Annotating data is a bottleneck 16

© Bonzanini Consulting Ltd — BonzaniniConsulting.com (Incomplete) History of NLP
17

© Bonzanini Consulting Ltd — BonzaniniConsulting.com • 1950s Symbolic /
rule-based 18 (Incomplete) History of NLP

rule-based • 1990s Stats / annotated data / Machine Learning 19 (Incomplete) History of NLP

rule-based • 1990s Stats / annotated data / Machine Learning • 2010s Neural Nets / Deep Learning 20 (Incomplete) History of NLP

© Bonzanini Consulting Ltd — BonzaniniConsulting.com 22 Evolution of Models
Bag-of-words

Bag-of-words Word Embeddings (circa 2013)

Bag-of-words Word Embeddings (circa 2013) “Traditional” ML models

Bag-of-words Word Embeddings (circa 2013) “Traditional” ML models RNN/LSTM (circa 2015)

Bag-of-words Word Embeddings (circa 2013) “Traditional” ML models RNN/LSTM (circa 2015) Transformers (circa 2017)

training on bigger dataset • Fine-tuning on speciﬁc task 29

training on bigger dataset • Fine-tuning on speciﬁc task • Bigger and bigger models 30

training on bigger dataset • Fine-tuning on speciﬁc task • Bigger and bigger models • Pre-trained models 31

THANK YOU @MarcoBonzanini marcobonzanini.com/newsletter

Natural Language Processing Expert Briefing @ P...

Natural Language Processing Expert Briefing @ PyData Global 2021

More Decks by Marco Bonzanini

Other Decks in Technology

Featured

Transcript