Mo'Mentum

Consulting Proposal September 4, 20XX Mo’Mentum Optimize your mo’mentum for
social change Peter Winslow

Many resources for sharing petitions!

Victory! Ok, let’s do this! Many resources for sharing petitions!

Is my petition good enough? Many resources for sharing petitions!
Little help for writing petitions...

Just what I was looking for! Many resources for sharing
petitions! Little help for writing petitions... Mo’Mentum

Just what I was looking for! Many resources for sharing
petitions! Little help for writing petitions... Mo’Mentum My Petition

Just what I was looking for! Mo’Mentum Many resources for
sharing petitions! Little help for writing petitions... My Petition Probability of success Time scale to reach signature goal

Data Collection Change.org sitemap Petition urls

Petition urls Petition id’s Data Collection Change.org sitemap

Petition urls Petition id’s Petition text and metadata Change.org API
Data Collection Change.org sitemap

Change.org sitemap Petition urls Petition id’s Petition text and metadata
Over ~ 40,000 Petitions Data Collection Change.org API

Feature Engineering Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization
Features Feature Engineering

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization
Features Metadata Success/Failure Feature Engineering Signature Accumulation Rate

Metadata Success/Failure Signature Accumulation Rate Targets Sentiment, POS Tagging, word/sentence
counts, ... Text data Stopwords, Lemmatization Features Feature Engineering

Accurately Predicts success of petition Random Forest Classifier Train-Test-evaluation split
with 5-fold CV AUC = 87.4%

Predicts signature accumulation rate Gradient Boosting Regressor: Least Squares loss
function Train-Test-evaluation split with 5-fold CV RMSE = 1.6 79.7% within 1 93.1% within 2

Peter Winslow The Professional PhD + 1 Postdoc in theoretical
High Energy Physics and Cosmology. Origin of matter in the Universe New Father! Kiana Winslow, born Nov. 29th 2016

Algorithms: Classification Random Forest Classifier (Scikit-Learn) Predict success/failure of petition
Reasons for choosing: • Lots of complication yet resistant to overfitting Challenges: • Class imbalance in the data Validation: Train-Test-evaluation split with 5-fold CV Backup Slides

Algorithms: Regression GradientBoostingRegressor (Scikit-Learn) Predict signature accumulation rate Reasons for
choosing: • Many features, highly non-linear, can return predicted “quantiles” Challenges: • The right evaluation metric? Validation: Train-Test-evaluation split with 5-fold CV Backup Slides

Insights: Backup Slides New Year’s resolution boom and bust?

Mo'Mentum

Mo'Mentum

Peter Winslow

More Decks by Peter Winslow

Other Decks in Technology

Featured

Transcript

Consulting Proposal September 4, 20XX Mo’Mentum Optimize your mo’mentum for

Many resources for sharing petitions!

Many resources for sharing petitions!

Victory! Ok, let’s do this! Many resources for sharing petitions!

Is my petition good enough? Many resources for sharing petitions!

Just what I was looking for! Many resources for sharing

Just what I was looking for! Many resources for sharing

Just what I was looking for! Mo’Mentum Many resources for

Data Collection Change.org sitemap Petition urls

Petition urls Petition id’s Data Collection Change.org sitemap

Petition urls Petition id’s Petition text and metadata Change.org API

Change.org sitemap Petition urls Petition id’s Petition text and metadata

Feature Engineering Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization

Sentiment, POS Tagging, word/sentence counts, ... Text data Stopwords, Lemmatization

Metadata Success/Failure Signature Accumulation Rate Targets Sentiment, POS Tagging, word/sentence

Accurately Predicts success of petition Random Forest Classifier Train-Test-evaluation split

Predicts signature accumulation rate Gradient Boosting Regressor: Least Squares loss

Peter Winslow The Professional PhD + 1 Postdoc in theoretical

Algorithms: Classification Random Forest Classifier (Scikit-Learn) Predict success/failure of petition

Algorithms: Regression GradientBoostingRegressor (Scikit-Learn) Predict signature accumulation rate Reasons for

Insights: Backup Slides New Year’s resolution boom and bust?