Upgrade to Pro — share decks privately, control downloads, hide ads and more …

A la caza de exoplanetas por imagen directa con...

A la caza de exoplanetas por imagen directa con Python: De la ciencia de datos, la exoplanetología y otros demonios

Charla presentada en la PyconES 2018 (Málaga, España).

Tweet

More Decks by Carlos Alberto Gomez Gonzalez

Other Decks in Research

Transcript

  1. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios Carlos Alberto Gomez Gonzalez Pycon ES. Málaga. Oct 7, 2018
  2. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios Mmm…
  3. Sistema Solar A la caza de exoplanetas por imagen directa

    con Python De la ciencia de datos, la exoplanetología y otros demonios
  4. Exo de extrasolar: planetas extrasolares (fuera del Sistema Solar) A

    la caza de exoplanetas por imagen directa con Python De la ciencia de datos, la exoplanetología y otros demonios
  5. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  6. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  7. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  8. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  9. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  10. Algoritmos para imagen directa de exoplanetas • El problema es

    complejo • Últimos 10 años -> muchos algoritmos: Median frame subtraction, least squares, PCA, NMF, low-rank plus sparse decompositions, matched filtering, maximum likelihood estimation, forward modeling with PCA, etc
  11. D — M = R R - residuo que contiene

    la señal del exoplaneta Detección directa de exoplanetas Algoritmo de reducción de ruido (rango dinámico)
  12. Observador (clasificador) D — M = R o R -

    residuo que contiene la señal del exoplaneta Detección directa de exoplanetas Algoritmo de reducción de ruido (rango dinámico)
  13. No supervisado Supervisado PC 1 PC 2 Dimensionality reduction Clustering

    Reforzado Density estimation Regression Classification Aprendizaje automatico
  14. f = arg min fθ,θ∈Θ n i=1 L(yi, fθ (xi

    )) + g(θ) f : X → Y, Datos de entrenamiento (ejemplos) chihuahua muffin (xi, yi )i=1,...,n Aprendizaje supervisado
  15. { Arquitectura de la red f = arg min fθ,θ∈Θ

    n i=1 L(yi, fθ (xi )) + g(θ) f : X → Y, (xi, yi )i=1,...,n Aprendizaje supervisado
  16. Función de perdida y regularización { Optimización f = arg

    min fθ,θ∈Θ n i=1 L(yi, fθ (xi )) + g(θ) f : X → Y, (xi, yi )i=1,...,n Aprendizaje supervisado
  17. Generación de datos de entrenamiento Diseño y entrenamiento de la

    red Predicción (detección de exoplanetas) Gomez Gonzalez et al. 2018
  18. • Resultados reproducibles • Permite tunear hyper-parametros y la arquitectura

    de la red DataLabeler Model Predictor • Samples flux vs S/N • Estimates fluxes/contrast • Grabbing samples • Data augmentation • Data persistence (load/ save with HDF5) • Builds a model (Keras and Tensorflow) • Trains the model • Model persistence (load/save with HDF5) • Grabs target samples • Generates predictions with trained model • Inspect probability map • Results to HDF5 SODINN
  19. 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max

    pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 3d Convolutional layer kernel=(3x3x3), filters=40 3d Convolutional layer kernel=(2x2x2), filters=80 Dense layer units=128 Output dense layer units=1 3d Max pooling size=(2x2x2) 3d Max pooling size=(2x2x2) ReLU activation + dropout Sigmoid activation X and y to train/test/validation sets 2d Convolutional layer kernel=(3x3), filters=40 Dense layer units=128 Output dense layer units=1 ReLU activation + dropout Sigmoid activation X and y to train/test/validation sets 2d Convolutional layer kernel=(3x3), filters=40 2d Convolutional layer kernel=(3x3), filters=40 2d Convolutional layer kernel=(2x2), filters=80 2d Convolutional layer kernel=(2x2), filters=80 2d Convolutional layer kernel=(2x2), filters=80 … … B-LSTM / B-GRU layer 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 2d Max pooling size=(2x2) 3d Convolutional layer kernel=(3x3x3), filters=40 3d Convolutional layer kernel=(2x2x2), filters=80 Dense layer units=128 Output dense layer units=1 3d Max pooling size=(2x2x2) 3d Max pooling size=(2x2x2) ReLU activation + dropout Sigmoid activation X and y to train/test/validation sets 2d Convolutional layer kernel=(3x3), filters=40 Dense layer units=128 Output dense layer units=1 ReLU activation + dropout Sigmoid activation X and y to train/test/validation sets 2d Convolutional layer kernel=(3x3), filters=40 2d Convolutional layer kernel=(3x3), filters=40 2d Convolutional layer kernel=(2x2), filters=80 2d Convolutional layer kernel=(2x2), filters=80 2d Convolutional layer kernel=(2x2), filters=80 … … B-LSTM / B-GRU layer
  20. A la caza de exoplanetas por imagen directa con Python

    De la ciencia de datos, la exoplanetología y otros demonios
  21. Un momento excitante para estar haciendo ciencia, pero… • Construir

    un CV académico multidisciplinar es como darse un tiro en el propio pie • La investigación brinda muy pocas oportunidades de estabilidad laboral * aunque el dejar la investigación sigue siendo el camino alternativo (fracaso)
  22. Credit: Alexander Refsum Jensenius • Cross/interdisciplinariedad poco reconocida • El

    avance en la carrera científica depende del “paper” • La ciencia se mueve a un ritmo lento, comparado con campos como el ML o la ciencia de datos • Establecer colaboraciones es difícil: investigadores son reacios a salir de su zona de confort