Data & Design Like PB&J

DATA & DESIGN LIKE PB & J C. TODD LOMBARDO
— @IAMCTODD HEAD OF PRODUCT & EXPERIENCE @ WORKBAR [email protected]

WHO WORKS WITH DATA TODAY?

FAST COMPANY

“DATA SCIENCE IS AN ACT OF INTERPRETATION — WE TRANSLATE THE CUSTOMER’S
‘VOICE’ INTO A LANGUAGE MORE SUITABLE FOR DECISION-MAKING.” Riley Newman, Head of Data Science @ Airbnb

“DATA SCIENCE IS AN ACT OF INTERPRETATION — WE TRANSLATE THE CUSTOMER’S
‘VOICE’ INTO A LANGUAGE MORE SUITABLE FOR DECISION-MAKING.” Riley Newman, Head of Data Science @ Airbnb DESIGN NEEDS TAKING ACTIONS

I II III IV x y x y x y
x y 10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58 8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76 13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71 9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84 11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47 14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04 6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25 4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50 12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56 7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91 5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89 99.00 82.51 99.00 82.51 99.00 82.5 99.00 82.51 9.00 7.50 9.00 7.50 9.00 7.50 9.00 7.50 3.32 2.03 3.32 2.03 3.32 2.03 3.32 2.03

1) WHO ARE MY USERS? 2) WHAT ARE THEY DOING?
WHAT WILL THEY DO? 3) WHAT ARE THE LIMITATIONS TO THE DATA? 4) WTF SHOULD I DO?

1 WHO ARE MY USERS?

K-MEANS CLUSTERING

K-WHAT??

FIND GROUPS WHICH HAVE NOT BEEN EXPLICITLY LABELED IN THE
DATA.

3 2 1 PICK RANDOM DATA POINTS

3 2 1 PICK RANDOM DATA POINTS FIND NEAREST POINTS

3 2 1 PICK RANDOM DATA POINTS MAKE CLUSTERS OF
NEAREST DISTANCE FIND NEAREST POINTS

NEAREST DISTANCE FIND NEAREST POINTS FIND NEW CENTER OF CLUSTER

NEAREST DISTANCE FIND NEAREST POINTS FIND NEW CENTER OF CLUSTER CALCULATE NEW CLUSTERS

NEAREST DISTANCE FIND NEAREST POINTS FIND NEW CENTER OF CLUSTER CALCULATE NEW CLUSTERS STOP WHEN POINTS DON’T CHANGE CLUSTERS

LISTING OF OFFERS SOURCE: DATASMART

CUSTOMERS WHO HAVE PURCHASED OFFERS SOURCE: DATASMART

PIVOT TABLES SOURCE: DATASMART

MATRIX SOURCE: DATASMART

DISTANCE TO CLUSTER CENTERS SOURCE: DATASMART

USE SOLVER OBJECTIVE: MINIMIZE DISTANCE TO CLUSTER CENTERS DECISION VARIABLES:
DEAL VALUES OF EACH ROW CONSTRAINTS: CLUSTER CENTERS BETWEEN 0 AND 1 SOURCE: DATASMART

TOP DEALS PER CLUSTER

CLUSTER 1 TOP DEALS WHO LOVES PINOT NOIR? SOURCE: DATASMART

CLUSTER 2 TOP DEALS WHO LOVES A GOOD DEAL? WHO’S
NOT BUYING BIG? SOURCE: DATASMART

CLUSTER 3 TOP DEALS HMMM…..? HOLIDAY CHAMPAGNE? SOURCE: DATASMART

CLUSTER 4 TOP DEALS SUMMER CHAMPAGNE LOVERS! SOURCE: DATASMART

PINOT LOVERS DEALHUNTERS SEASONAL BUYER SUMMER CHAMPAGNE LOVER

2 WHAT ARE THEY DOING? WILL THEY DO?

WHAT ARE THEY DOING?

WHAT WILL THEY DO?

IMAGE: ESHAAN KAUL

DATA NOT REAL, FOR EXAMPLE ONLY

27% 43% 10% 6% DATA NOT REAL, FOR EXAMPLE ONLY
24%

WHAT’S THE OBJECTIVE?

WHAT’S THE OBJECTIVE? HOW DOES THE CURRENT DESIGN REACH THAT
OBJECTIVE?

WHAT’S THE OBJECTIVE? HOW DOES THE CURRENT DESIGN REACH THAT
OBJECTIVE? WHAT WAYS CAN WE BETTER REACH THAT OBJECTIVE?

3 WHAT ARE THE LIMITS OF THE DATA?

DATA CAN MISLEAD

H T T P : / / W W W.
T Y L E R V I G E N . C O M / S P U R I O U S - C O R R E L AT I O N S

CORRELATION ≠ CAUSATION

YOU ARE BIASED AND SO IS THE DATA

A N C H O R I N G S
TAT U S Q U O S E L E C T I O N N E G AT I V E C O N F I R M AT I O N I N - G R O U P P R O B A B I L I T Y R AT I O N A L I Z E G A M B L E R ’ S B A N D WA G O N P R O J E C T I O N C U R R E N T M O M E N T

INCONVENIENT TRUTHS OF DATA SCIENCE SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

INCONVENIENT TRUTHS OF DATA SCIENCE ‣ Data is never clean.
SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. ‣ No one cares how you did it. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. ‣ No one cares how you did it. ‣ Academia and business are two diﬀerent worlds. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. ‣ No one cares how you did it. ‣ Academia and business are two diﬀerent worlds. ‣ Presentation is critical. Context makes the story SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. ‣ No one cares how you did it. ‣ Academia and business are two diﬀerent worlds. ‣ Presentation is critical. Context makes the story ‣ All models are false, but some are useful. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

‣ You will spend most of your time cleaning and preparing data. ‣ 95% of tasks do not require deep learning. ‣ In 90% of cases generalized linear regression will do the trick. ‣ You should embrace the Bayesian approach. ‣ No one cares how you did it. ‣ Academia and business are two diﬀerent worlds. ‣ Presentation is critical. Context makes the story ‣ All models are false, but some are useful. ‣ There is no fully automated Data Science. You need to get your hands dirty. SOURCE: KAMIL BARTOCHA (LASTMINUTE.COM)

4 WHAT CAN I DO AS A DESIGNER?

UNDERSTAND THE PROBLEM: ASK MORE QUESTIONS!

WHAT ARE WE TRYING TO ACCOMPLISH? WHAT DO WE KNOW
TODAY? WHAT DO WE WANT TO KNOW? WHAT DATA DO WE HAVE? WHAT DATA DO WE NEED?

PROBLEM SOLUTION THANKS: W. BRÜNING

PROBLEM SOLUTION Water on the floor Mop THANKS: W. BRÜNING

PROBLEM SOLUTION Water on the floor Mop WHY? Leaky pipe
Replace pipe THANKS: W. BRÜNING

Replace pipe WHY? Too much pressure Lower pressure THANKS: W. BRÜNING

Replace pipe WHY? Too much pressure Lower pressure WHY? Pressure regulator Replace regulator THANKS: W. BRÜNING

Replace pipe WHY? Too much pressure Lower pressure WHY? Pressure regulator Replace regulator WHY? Maintenance schedule More frequent inspection THANKS: W. BRÜNING

BRING DATA INTO YOUR DESIGN PROCESS

K N O W T H E A U D
I E N C E K N O W T H E D ATA U N D E R S TA N D C O N T E X T D E S I G N S O L U T I O N E VA L U AT E

“WHEN WE DON’T WORK WITH REAL DATA, WE DECEIVE OURSELVES.”
Josh Puckett, Design Partner @ Combine VC

REFRESH YOUR MINDSET

DESIGNER SCIENTIST EMPATHIC MAKER FORWARD LOOKING RIGOROUS EXPERIMENTAL HYPOTHESIS DRIVEN

DESIGNTIST

DESIGN / UX PRODUCT DEVELOPMENT

DATA DESIGN / UX PRODUCT DEVELOPMENT DATA

¡GRACIAS! C. TODD LOMBARDO — @IAMCTODD HEAD OF PRODUCT &
EXPERIENCE @ WORKBAR [email protected]

Data & Design Like PB&J

Data & Design Like PB&J

More Decks by C. Todd Lombardo

Other Decks in Design

Featured

Transcript