de datos de la Universidad de Harvard que cuenta con aproximadamente 400 mil usuarios de Github y de su API. Utiliza el formato JSON. Para el experimento, se utilizaron 73.349 usuarios • 2.330 para entrenamiento, clasificados manualmente. • 71.019 para predicción. 6 Fuente: Universidad de Harvard
Followers Following Gender Pedro Google US 10 0 5 5 Male Name is_SB is_Google is_Ecuador is_US Repos Gists Followers Following Gender 1 0 1 0 1 10 0 5 5 2
con más ejemplos para tener mejores resultados. • La característica de la biografía podría haber sido utilizada para mejorar la predicción. • Los problemas de Machine Learning requieren de mucha experimentación para encontrar los parámetros adecuados.