Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Konferences - KSchool 2018

Data Konferences - KSchool 2018

Alicia Pérez Jiménez

December 05, 2018
Tweet

More Decks by Alicia Pérez Jiménez

Other Decks in Technology

Transcript

  1. Big data in Fashion Casos de uso en StyleSage Javier

    Ordóñez | @fjordonz Alicia Pérez | @alipeji
  2. +500 retailers + 1M por semana + 50K marcas 12.328

    productos + 400M productos 7.829 productos 291K productos 37 países
  3. Pasos en el aprendizaje 1 . Entrenamiento • Datos =

    • Etiquetas = {Color, Categoría, Tipo de cuellos, etc} 2. Predicción Asignar una etiqueta a un nuevo ejemplo nunca visto Categoría = Jacket Color = Denim Longitud = Cropped
  4. 24 www.analyticsindiamag.com • Función de transformación mediante operaciones no lineales,

    divididas en capas, las cuales controlan el flujo de información. • Aprende corrigiendo sus propios errores mediante una señal supervisora. Perceptrón multicapa
  5. Predicción de imágenes p0 = 0.02 p1 = 0.005 p2

    = 0.01 p3 = 0.005 p4 = 0.01 p5 = 0.01 p6 = 0.015 p7 = 0.01 p8 = 0.91 p9 = 0.005 • Las características o atributos son los píxeles • La señal supervisora es una etiqueta asignada a la imagen
  6. “Convolutional deep belief networks for scalable unsupervised learning of hierarchical

    representations”. H Lee et. al • El sistema aprende automáticamente patrones bidimensionales que representan campos receptivos. Extracción de características
  7. Aprendizaje de características • Inicialización aleatoria de los parámetros. •

    Convergencia gracias a métodos de optimización. • Los parámetros se van moviendo hacia un punto que minimice el error del sistema.
  8. Predicción de imágenes Características relevantes identificadas Predicción de etiqueta Red

    neuronal profunda Preprocesamiento Procesamiento Salida probabilidad
  9. Category: Dress Print: Floral Sleeve: Short Length: Medium Neck: Turtle

    Type: Day Ruffles: No Extracción de atributos
  10. Category: Dress Print: Floral Sleeve: Short Length: Medium Neck: Turtle

    Type: Day Ruffles: No Extracción de atributos
  11. Representaciones de los datos Predicción de etiqueta Practical sophisticated this

    season hot trend jacket . . Texto es transformado en vectores Aprendizaje supervisado = Entrenamiento + predicción Diferente tipo de datos de entrada - Mismo tipo de algoritmos Predicción de texto
  12. Formas distintas de llamar al mismo concepto spandex = elastane?

    Underarmour = Under Armour? XXL = 2XL? Blue = Sky? No siempre es fácil... Títulos y descripciones ambiguas o poco concisas
  13. Formas distintas de llamar al mismo concepto Lenguajes inconsistentes y

    falta de información No siempre es fácil... Títulos y descripciones ambiguas o poco concisas
  14. “[...] ese azul representa millones de dólares, y muchos puestos

    de trabajo, y resulta cómico, que creas que elegiste algo que te exime de la industria de la moda, cuando, de hecho, llevas un jersey que fue seleccionado para tí, por personas como nosotros, entre un montón de cosas.”
  15. Paso 3: agrupar colores Los k centroides iniciales son generados

    aleatoriamente k grupos son generados asociando el punto con la media más cercana El centroide de cada uno de los k grupos se recalcula Pasos 2 y 3 se repiten hasta que se logre la convergencia