Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Mining e Industria Editorial

Data Mining e Industria Editorial

mcnanton

June 11, 2019
Tweet

Other Decks in Education

Transcript

  1. Del análisis de caso a la acción Data mining e

    industria editorial María Nanton ( Marketing Editorial, FFyL – UBA)
  2. BIG DATA / Algunas definiciones «Un gran volumen, velocidad o

    variedad de información que demanda formas costeables e innovadoras de procesamiento de información que permitan ideas extendidas, toma de decisiones y automatización del proceso» -Doug Laney (2001)
  3. DATA MINING / Algunas Definiciones «Es la extracción automatizada o

    conveniente de patrones que representan el conocimiento almacenado implícitamente en grandes bases de datos, depósitos de datos y otros repositorios de información masiva.» -Han y Kamber (2000)
  4. APRENDIZAJE AUTOMÁTICO / Algunas definiciones Es un subconjunto del campo

    más amplio de inteligencia artificial (IA) que «se centra en enseñar a las computadoras cómo aprender sin la necesidad de ser programadas para tareas específicas (...). De hecho, la idea clave detrás de ML es que es posible crear algoritmos que aprendan y hagan predicciones sobre los datos» -Pal y Gulli (2017)
  5. Algunas aplicaciones del aprendizaje automático: • Predicción de ventas, demanda,

    altas y bajas de clientes • Reconocimiento de imágenes • Prevención de fraude • Clasificación de clientes • Análisis de sentimiento • Sistemas de recomendación • Optimización de recursos Imagen: Towards Data Science
  6. “Success with Style: Using Writing Style to Predict the Success

    of Novels” Ashok, Feng y Choi (2013) Técnica: Procesamiento del Lenguaje Natural Estilometría estadística Objetivos: Predicción del éxito de una novela publicada (Clasificación binaria)
  7. Success with style / Ashok, Feng y Choi Conclusiones 84%

    Predicción del éxito de una novela 89% Predicción del éxito de una película
  8. “The Bestseller Code” Archer y Jockers (2016) Técnica: Procesamiento del

    Lenguaje Natural (2799 predictores) Estilometría estadística, modelado de tópico y análisis de sentimiento, entre otras Objetivos: Predicción de bestsellers (Clasificación binaria)
  9. The Bestseller Code / Archer y Jockers Análisis estilográfico -

    Agenciamiento «Mae knew Renata was watching her, and she knew her face was betraying something like horror.»
  10. “Success in books: a big data approach to bestsellers” Barabási

    et al. (2018) Técnica: Análisis exploratorio de datos, Análisis probabilístico Objetivos: Predicción de la dimensión temporal de las ventas de un bestseller