Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ANALISIS DE DATOS CON R

Avatar for Abraham Zamudio Abraham Zamudio
June 16, 2025
1

ANALISIS DE DATOS CON R

ANALISIS DE DATOS CON R
Abraham Zamudio - GMMNS
CENTRO DE TECNOLOGIAS DE INFORMACION Y COMUNICACIONES
22 de Agosto del 2019

Avatar for Abraham Zamudio

Abraham Zamudio

June 16, 2025
Tweet

Transcript

  1. AN´ ALISIS DE DATOS CON R Abraham Zamudio GMMNS CENTRO

    DE TECNOLOG´ IAS DE INFORMACI´ ON Y COMUNICACIONES 22 de Agosto del 2019 22 de Agosto del 2019 1 / 84
  2. Modelado y Pronostico de la Tendencia. Introducci´ on Tiempo es

    el factor m´ as importante que asegura el ´ exito en un negocio. Es dif´ ıcil mantenerse a ritmo en el tiempo. Pero, la tecnolog´ ıa ha desarrollado algunos m´ etodos poderosos con los cuales podemos ver cosas antes de tiempo.No estamos hablando de una maquina del tiempo !!!. Estamos hablando de los m´ etodos de predicci´ on y pron´ ostico. Estos m´ etodos, que se ocupan de datos basados en el tiempo, es decir, Modelamiento de Series de Tiempo. Como su nombre sugiere, implica trabajar en datos basados en el tiempo (a˜ nos, d´ ıas, horas, minutos) para obtener informaci´ on que se encuentra oculta y as´ ı tomar decisiones con mejor informaci´ on. 22 de Agosto del 2019 2 / 84
  3. Modelado y Pronostico de la Tendencia. Introducci´ on Los modelos

    de series temporales son modelos muy ´ utiles cuando se tienen datos correlacionados en serie. La mayor´ ıa de las negocios comerciales trabajan en datos en series de tiempo para analizar , por ejemplo, el n´ umero de ventas para el pr´ oximo a˜ no, el tr´ afico de un sitio web, la posici´ on con respecto ala competencia y muchos otros aspectos. 22 de Agosto del 2019 3 / 84
  4. Modelamiento de Series Temporales Lo B´ asico Esto incluye :

    Series Estacionarias Caminos Aleatorios Coeficiente Rho Test de Estacionalidad de Dickey-Fuller 22 de Agosto del 2019 4 / 84
  5. Modelamiento de Series Temporales Series Estacionarias Hay tres criterios b´

    asicos para que una serie sea clasificada como serie estacionaria: 1. La media de la serie no debe ser una funci´ on del tiempo sino una constante. La imagen izquierda satisface la condici´ on, mientras que la imagen rojo tiene una media dependiente del tiempo. 22 de Agosto del 2019 5 / 84
  6. Modelamiento de Series Temporales Series Estacionarias Hay tres criterios b´

    asicos para que una serie sea clasificada como serie estacionaria: 2. La varianza de la serie no debe ser una funci´ on del tiempo. Esta propiedad es conocida como homocedasticidad. El siguiente gr´ afico representa lo que es y lo que no es una serie estacionaria. 22 de Agosto del 2019 6 / 84
  7. Modelamiento de Series Temporales Series Estacionarias Hay tres criterios b´

    asicos para que una serie sea clasificada como serie estacionaria: 3. La covarianza del i-´ esimo t´ ermino y el (i + m)-esimo t´ ermino no debe ser una funci´ on del tiempo. En el siguiente gr´ afico, notar´ a que la propagaci´ on se hace m´ as estrecha a medida que aumenta el tiempo. Por lo tanto, la covarianza no es constante con el tiempo para la serie roja. 22 de Agosto del 2019 7 / 84
  8. Modelamiento de Series Temporales ¿Porque es importante estudiar estacionariedad? La

    raz´ on por la que se empezo primero con el estudio de la estacionariedad es que no se puede construir un modelo de serie temporal en los casos donde el criterio de estacionariedad es violado, el primer requisito es convertir a estacionaria la serie temporal y luego usar modelos estoc´ asticos para predecir el comportamiento de la serie temporal. 22 de Agosto del 2019 8 / 84
  9. Modelamiento de Series Temporales ¿Cu´ ales son las principales caracter´

    ısticas de las series temporales? La mayor parte de las series temporales tienen una tendencia. Sus valores medios var´ ıan a lo largo del tiempo. Ellas son variables o series no estacionarias. 1 l i b r a r y ( quantmod ) 2 getSymbols ( ”TSLA” ) 3 TESLA <− subset (TSLA, s e l e c t = TSLA . Adjusted ) 4 chart S e r i e s (TESLA) 22 de Agosto del 2019 9 / 84
  10. Modelamiento de Series Temporales ¿Cu´ ales son las principales caracter´

    ısticas de las series temporales? 22 de Agosto del 2019 10 / 84
  11. Modelamiento de Series Temporales ¿Cu´ ales son las principales caracter´

    ısticas de las series temporales? Algunas series siguen un curso que recuerda a los meandros de los r´ ıos, es decir, suben y bajan sin una tendencia a revertir hacia alg´ un punto. Este comportamiento de caminata aleatoria (random walk) es tambi´ en una propiedad de muchas variables no estacionarias. Esto es cierto en todas las series objeto de estudio, con la excepci´ on de la inflaci´ on y la tasa de inter´ es. 22 de Agosto del 2019 11 / 84
  12. Modelamiento de Series Temporales ¿Cu´ ales son las principales caracter´

    ısticas de las series temporales? 22 de Agosto del 2019 12 / 84
  13. Modelamiento de Series Temporales ¿Cu´ ales son las principales caracter´

    ısticas de las series temporales? Los Shocks (choques) tienen un alto grado de persistencia. Los cambios repentinos en la serie toman tiempo para decaer. Esto es especialmente cierto en las variables reales tales como la producci´ on y la inversi´ on. Algunas series se mueven en forma conjunta, es decir tienen un co-movimiento positivo. Por ejemplo, diferentes tasas de inter´ es se mueven en forma conjunta, al igual que lo hace la producci´ on en diferentes pa´ ıses. 22 de Agosto del 2019 13 / 84
  14. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Imag´ ınese

    a una chica movi´ endose al azar en un tablero de ajedrez gigante. En este caso, la siguiente posici´ on de la ni˜ na s´ olo depende de la ´ ultima posici´ on. 22 de Agosto del 2019 14 / 84
  15. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Ahora imaginemos

    que estamos sentados en otra habitaci´ on y no somos capaces de ver a la chica. Se desea predecir la posici´ on de la chica en la linea del tiempo. ¿Cu´ an preciso ser´ a nuestro pronostico? .Es razonable suponer que cada vez seremos m´ as inexactos conforme la posici´ on de la muchacha cambia. En t = 0 sabemos exactamente d´ onde est´ a la chica. Para la segunda vez, ella s´ olo puede moverse a 8 cuadrados y por lo tanto la probabilidad de ubicarse en cualquiera de los cuadrados es 1/8 en lugar de 1 y sigue bajando. Ahora intentemos construir esta serie : X(t) = X(t − 1) + Er(t) (1) Donde Er(t) es el error en el punto t del tiempo. Esta es la aleatoriedad que la chica trae en cada momento. 22 de Agosto del 2019 15 / 84
  16. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo LLegando as´

    ı a la siguiente ecuaci´ on recursiva : X(t) = X(0) + Sum(Er(1), Er(2), Er(3).....Er(t)) (2) 22 de Agosto del 2019 16 / 84
  17. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Ahora, vamos

    a intentar validar nuestras suposiciones de series estacionarias sobre esta formulaci´ on de caminata aleatoria: 1. Es la media constante ? E[X(t)] = E[X(0)]+Sum(E[Er(1)], E[Er(2)], E[Er(3)].....E[Er(t)]) Sabemos que la esperanza de cualquier Error ser´ a cero ya que es aleatorio.Por lo tanto, obtenemos E[X(t)] = E[X(0)] = Constante. 22 de Agosto del 2019 17 / 84
  18. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Ahora, vamos

    a intentar validar nuestras suposiciones de series estacionarias sobre esta formulaci´ on de caminata aleatoria: 2. Es la varianza constante ? Var[X(t)] = Var[X(0)]+Sum(Var[Er(1)], Var[Er(2)], Var[Er(3)].....V Var[X(t)] = t ∗ Var(Error) = Dependiente del tiempo. Por lo tanto, inferimos que el paseo aleatorio no es un proceso estacionario ya que tiene una varianza variante con el tiempo. Adem´ as, si comprobamos la covarianza, vemos que tambi´ en depende del tiempo. 22 de Agosto del 2019 18 / 84
  19. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Vamos a

    condimentar las cosas un poco, Ya sabemos que una caminata aleatoria es un proceso no estacionario. Vamos a introducir un nuevo coeficiente en la ecuaci´ on para ver si podemos hacer la formulaci´ on estacionaria. El coeficiente Rho X(t) = Rho ∗ X(t − 1) + Er(t) (3) 22 de Agosto del 2019 19 / 84
  20. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Ahora, vamos

    a variar el valor de Rho para ver si podemos volver a la serie estacionaria. Aqu´ ı interpretaremos la dispersi´ on visualmente y no haremos ninguna prueba para verificar la estacionariedad.Comencemos con una serie perfectamente estacionaria con Rho = 0. En el siguiente slide veamos la grafica para la serie de tiempo: 22 de Agosto del 2019 20 / 84
  21. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Notamos que

    nuestros ciclos se han vuelto m´ as amplios, pero esencialmente no parece ser una violaci´ on grave de los supuestos estacionarios. Figura: Rho=0.9 22 de Agosto del 2019 23 / 84
  22. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Figura: Rho=1

    Esto obviamente es una violaci´ on a las condiciones estacionarias. ¿Qu´ e hace rho = 1 un caso especial que sale mal en la prueba estacionaria? Encontraremos la raz´ on matem´ atica para esto. 22 de Agosto del 2019 24 / 84
  23. Modelamiento de Series Temporales Caminatas (Paseos) Aleatorios: Ejemplo Tomemos la

    esperanza de cada lado de la ecuaci´ on X(t) = Rho ∗ X(t − 1) + Er(t) E[X(t)] = Rho ∗ E[X(t − 1)] (4) 22 de Agosto del 2019 25 / 84
  24. Explorando series de Tiempo en R Cargando la data Carguemos

    el conjunto de datos AirPassengers y determinemos algunas metricas . 1 data ( Ai rPa sse nge rs ) 2 3 # La data e s t a en formato de s e r i e s de tiempo ( t s ) 4 c l a s s ( A irP ass eng ers ) 5 6 # I n i c i o de l a s e r i e de tiempo 7 s t a r t ( Ai rPa sse nge rs ) 8 #Fin de l a s e r i e de tiempo 9 end ( Ai rPa sse nge rs ) 10 11 frequency ( Air Pas sengers ) 12 13 summary ( Air Pa sse nge rs ) 22 de Agosto del 2019 26 / 84
  25. Explorando series de Tiempo en R Detalles de la data

    1 p l o t ( Air Pas sen ger s ) 2 a b l i n e ( reg=lm ( A irP ass eng ers ˜ time ( Ai rPa sse nge rs ) ) ) 22 de Agosto del 2019 27 / 84
  26. Explorando series de Tiempo en R Algunas operaciones mas 1

    c y c l e ( A irP as sen ger s ) 2 p l o t ( aggregate ( AirPassengers ,FUN=mean) ) 3 boxplot ( Ai rPa sse ngers ˜ c y c l e ( AirP ass eng ers ) ) 22 de Agosto del 2019 28 / 84
  27. Explorando series de Tiempo en R Algunas inferencias La tendencia

    a˜ no tras a˜ no muestra claramente que los #pasajeros han ido aumentando de manera continua. La varianza y el valor medio en julio y agosto es mucho mayor que el resto de los meses. Aunque el valor medio de cada mes es bastante diferente, su varianza es peque˜ na. Por lo tanto, tenemos un fuerte efecto estacional con un ciclo de 12 meses o menos. La exploraci´ on de datos se vuelve m´ as importante en un modelo de series de tiempo - sin esta exploraci´ on, no sabr´ a si una serie es estacionaria o no. 22 de Agosto del 2019 29 / 84
  28. An´ alisis de series temporales con R Definici´ on de

    una serie temporal Trabajemos con el fichero gas6677.dat que contiene datos mensuales del consumo de gasolina en Espa˜ na entre enero de 1966 y agosto de 1977. 1 gas = scan ( ’ gas6677 . dat ’ ) 2 p l o t ( gas ) 22 de Agosto del 2019 30 / 84
  29. An´ alisis de series temporales con R plot(gas) Vemos que

    el gr´ afico resultante no es el m´ as apropiado para describir una serie temporal. Si queremos que R trate a un objeto como serie temporal, tenemos que determinar apropiadamente sus caracter´ ısticas con el comando ts. 22 de Agosto del 2019 31 / 84
  30. An´ alisis de series temporales con R Definici´ on de

    una serie temporal Para definir la serie correctamente escribimos: 1 gas . t s = t s ( gas , s t a r t = c (1966 ,1) , frequency = 12) 2 p r i n t ( gas . t s ) 3 p l o t ( gas . t s ) El argumento frequency se utiliza para indicar la periodicidad de la serie (en este caso mensual), mientras que el argumento start indica la fecha de la primera observaci´ on (enero de 1966). 22 de Agosto del 2019 32 / 84
  31. An´ alisis de series temporales con R plot(gas.ts) Vemos ahora

    c´ omo el resultado depende de las caracter´ ısticas que hemos definido para la serie. 22 de Agosto del 2019 33 / 84
  32. An´ alisis de series temporales con R boxplot Si queremos

    comparar la distribuci´ on del consumo de gasolina para cada mes, un gr´ afico ´ util es 1 boxplot ( gas . t s ˜ c y c l e ( gas . t s ) ) El comando cycle determina la unidad de tiempo a la que pertenece cada observaci´ on de la serie. 22 de Agosto del 2019 34 / 84
  33. An´ alisis de series temporales con R boxplot Por lo

    tanto, en el gr´ afico anterior se ha producido un diagrama de cajas para cada mes del a˜ no. 22 de Agosto del 2019 35 / 84
  34. An´ alisis de series temporales con R Ejercicio El fichero

    jj.dat contiene los beneficios trimestrales de la empresa Johnson & Johnson entre 1960 y 1980: Define la serie temporal y repres´ entala. ¿Cu´ al es el valor de la serie para el tercer trimestre de 1980? ¿Cu´ ales son las principales caracter´ ısticas (tendencia, estacionalidad) de esta serie? 22 de Agosto del 2019 36 / 84
  35. An´ alisis de series temporales con R Descomposici´ on de

    una serie Es frecuente analizar las series temporales desde el punto de vista de sus componentes estructurales: Serie observada = Tendencia + Efecto estacional + Residuos En este modelo, la serie observada es el resultado de sumar una tendencia que representa el comportamiento a largo plazo de la serie, un efecto estacional que describe sus fluctuaciones peri´ odicas y un componente residual que describe las variaciones a corto plazo, normalmente impredecibles. Con R es muy sencillo obtener una descomposici´ on estructural de este tipo. Se usa el comando decompose: 1 gas . t s . desc = decompose ( gas . t s ) 2 p l o t ( gas . t s . desc , xlab=’ year ’ ) 22 de Agosto del 2019 37 / 84
  36. An´ alisis de series temporales con R Descomposici´ on de

    una serie 22 de Agosto del 2019 38 / 84
  37. An´ alisis de series temporales con R Descomposici´ on de

    una serie Esta descomposici´ on se basa en m´ etodos elementales: la tendencia se calcula con una media m´ ovil, el efecto estacional se calcula promediando los valores de cada unidad de tiempo para todos los periodos (por ejemplo, todos los meses de enero si la serie es mensual) y luego centrando el resultado. Finalmente, los residuos se obtienen restando a la serie observada las dos componentes anteriores. La descomposicion solo es totalmente adecuada si se dispone de un n´ umero completo de periodos (por ejemplo, un m´ ultiplo de 12 si la serie es mensual). 22 de Agosto del 2019 39 / 84
  38. An´ alisis de series temporales con R Transformaciones b´ asicas

    de una serie En el gr´ afico de gas.ts se observa que la serie no es estacionaria. La serie presenta una tendencia aparentemente lineal y una estacionalidad muy marcada (el consumo aumenta los meses de verano). Adem´ as, la amplitud de las fluctuaciones aumenta con el tiempo por lo que la variabilidad tampoco es constante. Sin embargo, muchos modelos importantes de series temporales corresponden a series estacionarias (es decir, sin tendencia ni estacionalidad y con variabilidad constante). Antes de ajustar un modelo estacionario tenemos que transformar la serie original. 22 de Agosto del 2019 40 / 84
  39. An´ alisis de series temporales con R Transformaciones b´ asicas

    de una serie Estabilizaci´ on de la varianza: Para estabilizar la variabilidad se suelen tomar logaritmos. Esta transformaci´ on funcionar´ a bien cuando la variabilidad sea aproximadamente proporcional al nivel de la serie. Representamos la serie transformada mediante 1 p l o t ( log ( gas . t s ) ) 22 de Agosto del 2019 41 / 84
  40. An´ alisis de series temporales con R Estabilizaci´ on de

    la varianza 22 de Agosto del 2019 42 / 84
  41. An´ alisis de series temporales con R Transformaciones b´ asicas

    de una serie Eliminaci´ on de tendencia: Una forma sencilla de eliminar una tendencia aproximadamente lineal es diferenciar la serie, es decir, considerar la serie de diferencias entre una observaci´ on y la anterior en lugar de la serie original. Si xt es una serie contenida en x, para calcular ∇xt = xt − xt−1 con R se escribe: 1 x = log ( gas . t s ) 2 d i f 1 . x = d i f f ( x ) 3 p l o t ( d i f 1 . x ) 22 de Agosto del 2019 43 / 84
  42. An´ alisis de series temporales con R Eliminaci´ on de

    tendencia 22 de Agosto del 2019 44 / 84
  43. An´ alisis de series temporales con R Transformaciones b´ asicas

    de una serie Eliminaci´ on de estacionalidad: Para eliminar la estacionalidad de una serie mensual se pueden tomar diferencias estacionales de orden 12. Si xtxt es la serie que queremos desestacionalizar, se trata de calcular ∇12xt = xt − xt−12 1 d i f 1 2 . d i f 1 . x = d i f f ( d i f 1 . x , lag =12) 2 p l o t ( d i f 1 2 . d i f 1 . x ) 22 de Agosto del 2019 45 / 84
  44. An´ alisis de series temporales con R Eliminaci´ on de

    estacionalidad 22 de Agosto del 2019 46 / 84
  45. An´ alisis de series temporales con R Ejercicio Aplica las

    transformaciones adecuadas a la serie de beneficios de la empresa Johnson & Johnson para obtener una serie aproximadamente estacionaria. 22 de Agosto del 2019 47 / 84
  46. An´ alisis de series temporales con R Las funciones de

    autocovarianzas y de autocorrelaciones Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente c´ odigo se puede utilizar para representar el correlograma de la serie. El correlograma es una representaci´ on gr´ afica de las autocorrelaciones ρ(k), es decir, las correlaciones entre xt y xt+k, en funci´ on de k: 1 y = d i f 1 2 . d i f 1 . x 2 acf ( y ) 22 de Agosto del 2019 48 / 84
  47. An´ alisis de series temporales con R Las funciones de

    autocovarianzas y de autocorrelaciones Siempre se tiene que ρ(0) = 1. Las l´ ıneas discontinuas representan las bandas de confianza de ρ(k) de nivel 95 % bajo la hip´ otesis de que la serie es un ruido blanco (incorrelada). En el ejemplo las autocorrelaciones m´ as significativas son las correlaciones entre la observaci´ on de un mes y la del mes siguiente, y la observaci´ on de un mes con la del mismo mes del a˜ no siguiente. Si lo que queremos obtener son los valores num´ ericos de las correlaciones estimadas escribimos 1 acf ( y , p l o t=FALSE) $ acf 22 de Agosto del 2019 50 / 84
  48. An´ alisis de series temporales con R Ejemplo 1: Paseo

    aleatorio Uno de los procesos m´ as elemental para el an´ alisis de series de tiempo es un paseo aleatorio: 1 l i b r a r y (TSA) 2 data ( rwalk ) 3 p l o t ( rwalk , ylab=’ Paseo A l e a t o r i o ’ , type=’ o ’ ) 22 de Agosto del 2019 51 / 84
  49. An´ alisis de series temporales con R Ejemplo 1: Paseo

    aleatorio 22 de Agosto del 2019 52 / 84
  50. An´ alisis de series temporales con R Ejemplo 2: Precios

    del Trigo Este ejemplo tiene como prop´ osito mostrar el uso del comando plot() con los datos del ??ndice de precios del trigo en Canad´ a (Beveridge wheat price index). 1 l i b r a r y (TSA) 2 data ( bev ) 3 p l o t ( bev ) 22 de Agosto del 2019 53 / 84
  51. An´ alisis de series temporales con R Ejemplo 2: Precios

    del Trigo 22 de Agosto del 2019 54 / 84
  52. An´ alisis de series temporales con R Ejemplo 3: Estacionalidades

    En ocasiones un evento se repite sistem´ aticamente a lo largo del tiempo y para el an´ alisis de series de tiempo, visualizar estos patrones resulta s´ umamente ´ util: 1 data ( o i l f i l t e r s ) 2 p l o t ( o i l f i l t e r s , type=’ o ’ , ylab=’ Ventas ’ ) 3 p l o t ( o i l f i l t e r s , type=’ l ’ , ylab=’ Ventas ’ ) 4 p o i n t s ( y=o i l f i l t e r s , x=time ( o i l f i l t e r s ) , pch=as . v e c t o r ( season ( o i l f i l t e r s ) ) ) 22 de Agosto del 2019 55 / 84
  53. An´ alisis de series temporales con R Ejemplo 4: G´

    afico de M´ ultiples Series de Tiempo En otras ocasiones tambi´ en es importante graficar m´ ultiples series de tiempo: 1 rm( l i s t =l s () ) 2 CBE <− read . t a b l e ( ” cbe . dat ” , header = T) 3 CBE[ 1 : 4 , ] 4 Elec . t s <− t s (CBE[ , 3 ] , s t a r t = 1958 , f r e q = 12) 5 Beer . t s <− t s (CBE[ , 2 ] , s t a r t = 1958 , f r e q = 12) 6 Choc . t s <− t s (CBE[ , 1 ] , s t a r t = 1958 , f r e q = 12) 7 p l o t ( cbind ( Elec . ts , Beer . ts , Choc . t s ) ) 22 de Agosto del 2019 57 / 84
  54. An´ alisis de series temporales con R Funciones de autocorrelaci´

    on Procesos Estacionarios - Correlograma El principal prop´ osito del correlograma es detectar autocorrelaciones en las series de tiempo luego de haberles removido y estimado la tendencia y la variaci´ on estacional. El siguiente ejemplo se realiza con la serie de Pasajeros que viene en el paquete R. 1 data ( Ai rPa sse nge rs ) 2 AP <− Ai rPa sse nge rs 3 AP. decom <− decompose (AP, ” m u l t i p l i c a t i v e ” ) 4 p l o t ( t s (AP. decom$random [ 7 : 1 3 8 ] ) ) 5 acf (AP. decom$random [ 7 : 1 3 8 ] ) 22 de Agosto del 2019 59 / 84
  55. An´ alisis de series temporales con R Procesos estacionarios :

    Introduccion Concepto de proceso estoc´ astico Un proceso estoc´ astico es una secuencia de experimentos aleatorios. Generalmente esta secuencia es en el tiempo pero no necesariamente. Para visualizar este concepto: X(t, ω) constituye una familia de funciones, un proceso estoc´ astico, donde t es un instante de realizaci´ on y ω es el par´ ametro de la se˜ nal. X(t, ω8) es una funci´ on de t. X(t0, ω) es una variable aleatoria. X(t0, ω8) es un resultado experimental, un n´ umero real. 22 de Agosto del 2019 62 / 84
  56. An´ alisis de series temporales con R Procesos estacionarios :

    Introduccion Uno de los problemas importantes a resolver es c´ omo representar este proceso, ya que cada una de las realizaciones es una se˜ nal aleatoria que tiene asociada una forma de onda a lo largo del tiempo. Lo que se puede hacer es dejar fija una de las dimensiones y caracterizar las otras. Por ejemplo, si se deja fija la realizaci´ on ξ (es decir, se elige una realizaci´ on en particular), pueden calcularse los momentos correspondientes: mX (ξ) = l´ ım T→∞ 1 T T x(t, ξ)dt (5) RXX (τ, ξ) = l´ ım T→∞ 1 T T x(t, ξ)x(t + τ, ξ)dt (6) PX (ξ) = RXX (0, ξ) (7) 22 de Agosto del 2019 63 / 84
  57. An´ alisis de series temporales con R Procesos estacionarios :

    Introduccion Si, en cambio, se deja fijo el instante del tiempo t0, se pueden obtener otros momentos: µX (t) = ∞ −∞ xf (x; t)dx (8) σ2 X (t) = ∞ −∞ (x − µX (t))2 f (x; t)dx (9) 22 de Agosto del 2019 64 / 84
  58. An´ alisis de series temporales con R Procesos estacionarios Un

    proceso estacionario es aqu´ el que es invariante ante una traslaci´ on en el origen de tiempos. Proceso estacionario de orden 1 Debe cumplirse que para todo ε , sus funciones de probabilidad y de distribuci´ on no dependan del tiempo, sino s´ olo de x: FX (x, t) = FX (x, t + ε) (10) fX (x, t) = fX (x, t + ε) (11) Es decir que la probabilidad no cambia ante una traslaci´ on en el origen de tiempos. Por esto mismo, el valor medio y la varianza ser´ an constantes para todo t: mX (t) = mX y σX (t) = σX . 22 de Agosto del 2019 65 / 84
  59. An´ alisis de series temporales con R Procesos estacionarios Proceso

    estacionario de orden 2 Debe cumplirse que para todo ε : FX1X2 (x1, x2, t1, t2) = FX1X2 (x1, x2, t1 + ε, t2 + ε) (12) Por lo que se puede decir que FX1X2 (x1, x2, t1, t2) = FX1X2 (x1, x2, t2 − t1), ya que solamente depende de la diferencia de tiempos entre t1 y t2. Que un proceso sea estacionario de orden 2 implica que es estacionario de orden 1, es decir que su funci´ on de densidad de probabilidad es independiente del tiempo y que el valor medio y la varianza son constantes en el tiempo. 22 de Agosto del 2019 66 / 84
  60. An´ alisis de series temporales con R Procesos estacionarios particulares

    Ruido blanco Se denomina ruido blanco a una se˜ nal aleatoria con ancho de banda infinito, es decir que contiene a todas las frecuencias. Hay dos tipos de ruido blanco: uniforme o gaussiano. La densidad espectral del ruido blaco es una uniforme que va desde −pi/T hasta pi/T, con valor N0/2. El ruido blanco real no existe, ya que no se puede tener ancho de banda infinito. En la pr´ actica se utilizan se˜ nales que tienen un ancho de banda mayor al del sistema estudiado, por lo que se lo considera infinito. 22 de Agosto del 2019 67 / 84
  61. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR1: Un proceso autoregresivo de primer orden estar´ a dado por la siguiente ecuaci´ on: Xn = aXn−1 + Wn (13) Donde Wn es ruido blanco, con varianza σ2 W y valor medio nulo. En las ecuaciones que se incluyen a continuaci´ on se supone que la entrada es determin´ ıstica, ya que de no ser as´ ı no es posible efectuar la transformada z. Si Xn es un proceso ESA, se puede obtener el valor medio: E [Xn] = aE [Xn−1] + E [Wn] (14) E [Xn] = aE [Xn] + 0 (15) E [Xn] = 0 (16) 22 de Agosto del 2019 68 / 84
  62. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR1: Y la varianza: σ2 X = E X2 n = E a2X2 n−1 + W 2 n + 2aXn−1Wn (17) E X2 n = a2E X2 n−1 + E W 2 n + 2aE [Xn−1Wn] (18) E X2 n = a2E X2 n + σ2 W + 2a0 (19) σ2 X = a2σ2 X + σ2 W (20) σ2 X = σ2 W 1 − a (21) Donde |a| < 1. 22 de Agosto del 2019 69 / 84
  63. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR1: Y, por ´ ultimo, la autocorrelaci´ on: RX (k) = a|k|σ2 X = a|k| 1 − a σ2 W (22) RX (0) = a0σ2 X = σ2 X (23) RX (1) = CX (1) = a1σ2 X = ρσXn σXn−1 (24) Es claro que en este ´ ultimo caso, ρ = a, y para el caso general, ρ(k) = ak, es el coeficiente de correlaci´ on entre Xn y Xn+k. Si se obtiene SX (ω) como la transformada de Fourier de la correlaci´ on, se puede ver la coloraci´ on del ruido. 22 de Agosto del 2019 70 / 84
  64. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR1: Ejemplos de valores de a: a = 0,9, constituye un pasabajos, donde cada valor est´ a muy relacionado con el anterior, la funci´ on CX (k) tendra una numerosa cantidad de valores y el trazado de Xn+1 en funci´ on de Xn es una elipse muy cerrada, inclinada π/4. a = 0,5, se trata de un pasabajos m´ as leve, donde cada valor est´ a un poco relacionado con el anterior, la funci´ on CX (k) tiene menor cantidad de valores y el trazado de Xn+1 en funci´ on de Xn es una elipse levemente cerrada. a = −0,9, se trata de un pasaaltos, donde los valores suelen alternar el signo, la funci´ on CX (k) tambi´ en alternar´ a el signo de sus componentes y el trazado de Xn+1 en funci´ on de Xn es una elipse muy cerrada, inclinada a 3π/4 22 de Agosto del 2019 71 / 84
  65. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR2: Un proceso autoregresivo de orden 2 se describe mediante la siguiente ecuaci´ on: Xn = aXn−1 + bXn−2 + Wn (25) 22 de Agosto del 2019 72 / 84
  66. An´ alisis de series temporales con R Procesos Estacionarios Particulares

    : Modelos lineales en tiempo discreto: procesos AR, MA y ARMA Proceso AR-q: Un proceso autoregresivo de orden q se describe mediante la siguiente ecuaci´ on: Xn = b1Xn−1 + b2Xn−2 + . . . + bqXn−q + Wn (26) Xn = Wn + q i=1 bi Xn−i (27) 22 de Agosto del 2019 73 / 84
  67. An´ alisis de series temporales con R An´ alisis Procesos

    AR(p) 1 rm( l i s t =l s () ) 2 data ( ar1 . s ) 3 p l o t ( ar1 . s , ylab=e x p r e s s i o n (Y[ t ] ) , type=’ o ’ ) 22 de Agosto del 2019 74 / 84
  68. An´ alisis de series temporales con R An´ alisis Procesos

    AR(p): Correlaci´ on entre los rezagos t y t - 1 1 p l o t ( y=ar1 . s , x=z l a g ( ar1 . s ) , ylab=e x p r e s s i o n (Y[ t ] ) , xlab= e x p r e s s i o n (Y[ t −1]) , type=’ p ’ ) 22 de Agosto del 2019 75 / 84
  69. An´ alisis de series temporales con R An´ alisis Procesos

    AR(p):Correlaci´ on entre los rezagos t y t - 1 1 acf ( ar1 . s ) 22 de Agosto del 2019 76 / 84
  70. An´ alisis de series temporales con R AR(2) Simulemos el

    proceso visto en clases, un AR(2) de la forma: Yt = 0,5Yt−1 + 0,3Yt−2 + t con 100 observaciones: 1 ar . sim<−arima . sim ( model= l i s t ( ar=c ( . 5 , . 3 ) ) , n=100) 2 ar . sim La funci´ on de autocorrelaci´ on simple (acf): 1 ar . acf<−acf ( ar . sim , type=” c o r r e l a t i o n ” , p l o t=T) 2 ar . acf 22 de Agosto del 2019 77 / 84
  71. An´ alisis de series temporales con R AR(2) Las gr´

    aficas del proceso anterior se obtienen de: 1 p l o t ( ar . sim , ylab=e x p r e s s i o n (Y[ t ] ) , type=’ o ’ ) 2 ar . acf<−acf ( ar . sim , type=” c o r r e l a t i o n ” , p l o t=T) 3 ar . acf 22 de Agosto del 2019 78 / 84
  72. An´ alisis de series temporales con R AR(2) : Yt

    = 0,5Yt−1 + 0,3Yt−2 + t 22 de Agosto del 2019 79 / 84
  73. An´ alisis de series temporales con R AR(2) Ahora simulemos

    una variante del proceso anterior: Yt = 0,5Yt−1?0,3Yt−2 + t con 100 observaciones: 1 ar . sim2<−arima . sim ( model= l i s t ( ar=c (.5 , −.3) ) , n=100) 2 ar . sim2 La funci´ on de autocorrelaci´ on simple (acf): 1 ar . acf<−acf ( ar . sim2 , type=” c o r r e l a t i o n ” , p l o t=T) 2 ar . acf 22 de Agosto del 2019 81 / 84
  74. An´ alisis de series temporales con R AR(2) : Yt

    = 0,5Yt−1 − 0,3Yt−2 + t 22 de Agosto del 2019 82 / 84
  75. An´ alisis de series temporales con R AR(2) Qu´ e

    sucede cuando el proceso NO ES estacionario? Simulemos el proceso Yt = 0,9Yt−1 + 0,3Yt−2 + t con 100 observaciones: 1 rm( l i s t =l s () ) 2 > ar . sim3<−arima . sim ( model= l i s t ( ar=c ( . 9 , . 3 ) ) , n=100) 3 E rro r i n arima . sim ( model = l i s t ( ar = c ( 0 . 9 , 0 . 3 ) ) , n = 100) : 4 ’ ar ’ part of model i s not s t a t i o n a r y 22 de Agosto del 2019 84 / 84