Avaliação de testes A/B com Pandas

MAIO.2017 - LARISSA LAUTERT E DANIEL SEVERO Avaliação de testes
A/B com Pandas

HOMEOPATIA FUNCIONA?

Teste A/B Placebo Homeopatia

Resultados - Cenário 1 Placebo 10% de cura Homeopatia 75%
de cura

de cura

QUAL É O LIMIAR PARA CONCLUIR ALGO?

Chaordic Você está vendo Compre junto

ÚLTIMAS UNIDADES ÚLTIMAS UNIDADES A B

você está vendo Compre junto + + = Valor dos
3 ítens 169 130 COMPRAR JUNTO A você está vendo Compre junto + + = Valor dos 3 ítens 149 120 COMPRAR JUNTO B

Avaliação de A/B’s • E se o resultado foi por
acaso? • Ferramenta interna • Mais de 60 testes avaliados NumPy matplotlib

O QUE SÃO OUTLIERS?

Outliers • Valores muito maiores • Desviam a média

Outliers - classificação visual

Outliers ab_table = ab_table.query("revenue < 20000")

Outliers - 1% maiores

Outliers - 1% maiores n = len(ab_table) / 100 ab_table
= ab_table.sort(ascending=False) ab_table = ab_table.loc[n+1:]

Outliers - distância da média

Outliers - distância da média μ 3*σ

Outliers - distância da média mean = ab_table.revenue.mean() std_dev =
ab_table.revenue.std() threshold = mean + 3 * std_dev ab_table = ab_table.query("revenue < " + threshold)

SEM OUTLIERS, POSSO CONFIAR NA COMPARAÇÃO DE MÉDIAS?

• E se o resultado foi por acaso? • p-value:
chance de estarmos errados ao confiar na média ◦ Valor seguro: 5% Significância estatística

Significância from scipy.stats import norm zscores_for_significance = abs(means[‘A’]-means[‘B’]) \ /
(stds[‘A’] / np.sqrt(sizes[‘A’]) + stds[‘B’] / np.sqrt(sizes[‘B’])) pvalue = 1 - zscores_for_significance.apply(lambda z: 1-norm.sf(z)*2) YA - YB n σA + σB

INTERVALOS DE CONFIANÇA

Intervalo de confiança

Intervalo de confiança from scipy.stats import norm two_tailed_zscore = norm.ppf(1
- significance / 2) margins_of_error = two_tailed_zscore * stds / np.sqrt(sizes) Y + Z S . n

Intervalo de confiança import matplotlib.pyplot as plt ax = means.plot(style="o--")
for ab_group in margins_of_error: ax.fill_between( margins_of_error.index, means[ab_group] +margins_of_error[ab_group], means[ab_group] -margins_of_error[ab_group], alpha=0.2 )

QUAL É A CHANCE DE HOMEOPATIA SER MELHOR DO QUE
PLACEBO?

Análise Bayesiana

Análise Bayesiana Bayes Factor = chance de B ser melhor
chance de A ser melhor Strength of evidence < 100 negative 100 to 101/2 barely worth mentioning 101/2 to 101 substantial 101 to 103/2 strong 103/2 to 102 very strong > 102 decisive

• Tempo do teste: ◦ Alto volume de dados ◦
Diferença de eficácia entre soluções Concluindo o teste

A MINORIA DOS TESTES INTERNOS GANHA Ganhou Empatou Perdeu

• Valide suas ideias com testes A/B • Análise Bayesiana
é mais simples • Slides em https://speakerdeck.com/llautert • Vaga de estágio em Data Science na Chaordic ◦ https://chaordic.github.io/machinelearning-challenge/ Conclusão

+ + ++ + + OBRIGADA! Larissa Lautert [email protected]

Avaliação de testes A/B com Pandas

Avaliação de testes A/B com Pandas

More Decks by Larissa Lautert

Other Decks in Science

Featured

Transcript