Final Mo'Mentum Slides

Consulting Proposal September 4, 20XX Mo’Mentum Optimize your mo’mentum for
social change Peter Winslow

Many resources for sharing petitions!

Victory! Ok, let’s do this! Many resources for sharing petitions!

Is my petition good enough? Many resources for sharing petitions!
Little help for writing petitions...

Just what I was looking for! Mo’Mentum Many resources for
sharing petitions! Little help for writing petitions...

Just what I was looking for! Mo’Mentum My Petition Many
resources for sharing petitions! Little help for writing petitions...

Just what I was looking for! Mo’Mentum Many resources for
sharing petitions! Little help for writing petitions... My Petition Probability of success Time scale to reach signature goal

Data Collection Change.org sitemap Petition urls

Petition urls Petition id’s Data Collection Change.org sitemap

Petition urls Petition id’s Petition text and metadata Change.org API
Data Collection Change.org sitemap

Over ~ 40,000 Petitions Data Collection Petition urls Petition id’s
Petition text and metadata Change.org API Change.org sitemap

Feature Engineering Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization
Features Feature Engineering

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization
Features Metadata Success/Failure Feature Engineering Signature Accumulation Rate

Metadata Success/Failure Signature Accumulation Rate Random Forest Classifier Sentiment, POS
Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization Features Feature Engineering

Accurate Prediction of Petition success Train-Test-evaluation split with 5-fold CV
AUC = 87.4%

Metadata Success/Failure Signature Accumulation Rate Random Forest Classifier Sentiment, POS
Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization Features Feature Engineering Gradient Boosting Regressor

Accurately Predicts signature accumulation rate Train-Test-evaluation split with 5-fold CV
RMSE/Y Max = 15% 81% within 1 92% within 2

Peter Winslow The Professional PhD + 1 Postdoc in theoretical
High Energy Physics and Cosmology. Origin of matter in the Universe New Father! Kiana Winslow, born Nov. 29th 2016

Backup Slides

Algorithms: Classification Random Forest Classifier (Scikit-Learn) Predict success/failure of petition
Reasons for choosing: • Lots of complication yet resistant to overfitting Challenges: • Class imbalance in the data Validation: Train-Test-evaluation split with 5-fold CV Backup Slides

Algorithms: Regression GradientBoostingRegressor (Scikit-Learn) Predict signature accumulation rate Reasons for
choosing: • Many features, highly non-linear, can return predicted “quantiles” Challenges: • The right evaluation metric? Validation: Train-Test-evaluation split with 5-fold CV Backup Slides

Backup Slides Calculation of signature accumulation rate

Insights: Backup Slides New Year’s resolution boom and bust?

Final Mo'Mentum Slides

Final Mo'Mentum Slides

Peter Winslow

More Decks by Peter Winslow

Other Decks in Technology

Featured

Transcript

Consulting Proposal September 4, 20XX Mo’Mentum Optimize your mo’mentum for

Many resources for sharing petitions!

Many resources for sharing petitions!

Victory! Ok, let’s do this! Many resources for sharing petitions!

Is my petition good enough? Many resources for sharing petitions!

Just what I was looking for! Mo’Mentum Many resources for

Just what I was looking for! Mo’Mentum My Petition Many

Just what I was looking for! Mo’Mentum Many resources for

Data Collection Change.org sitemap Petition urls

Petition urls Petition id’s Data Collection Change.org sitemap

Petition urls Petition id’s Petition text and metadata Change.org API

Over ~ 40,000 Petitions Data Collection Petition urls Petition id’s

Feature Engineering Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization

Metadata Success/Failure Signature Accumulation Rate Random Forest Classifier Sentiment, POS

Accurate Prediction of Petition success Train-Test-evaluation split with 5-fold CV

Metadata Success/Failure Signature Accumulation Rate Random Forest Classifier Sentiment, POS

Accurately Predicts signature accumulation rate Train-Test-evaluation split with 5-fold CV

Peter Winslow The Professional PhD + 1 Postdoc in theoretical

Backup Slides

Backup Slides

Backup Slides

Algorithms: Classification Random Forest Classifier (Scikit-Learn) Predict success/failure of petition

Algorithms: Regression GradientBoostingRegressor (Scikit-Learn) Predict signature accumulation rate Reasons for

Backup Slides Calculation of signature accumulation rate

Insights: Backup Slides New Year’s resolution boom and bust?