|
|
EXPLORACION DE PATRONES DE DATOS MEDIANTE ANALISIS DE AUTOCORRELACION Curso: Métodos Predictivos Docente: Dr. Elmer Limache Sandoval UNIVERSIDAD PRIVADA DE TACNA Preparado para los estudiantes de la Escuela profesional de Ciencias Contables y Financieras. Pronósticos en los negocios. John Hanke. 2006
La observación de una serie de tiempo está correlacionada consigo misma cuando se desfasa uno o más períodos. Esta correlación se mide por el coeficiente de autocorrelación. AUTOCORRELACION: Es la correlación existente entre una variable desfasada uno o más períodos y la misma variable.
La fórmula para calcular el coeficiente de correlación de orden k es: Donde: rk = Coeficiente de autocorrelación para un desfase de k períodos (o rezagos) Y= Media de los valores de la serie Yt = Observación en el período de tiempo t. Yt-k = Observación en k períodos anteriores o en el período t-k. Según esto se podría determinar: r1 Coeficiente de autocorrelación de primer orden. r2 Coeficiente de autocorrelación de segundo orden. . rk Coeficiente de autocorrelaciónde k orden.
Datos para hallar el coeficiente de autocorrelación de orden 1 Y= 1704/12 = 142 r1 =843/1474 = 0.572 r2 = 0.463
Las autocorrelaciones se pueden graficar en un correlograma. CORRELOGRAMA: Es una herramienta gráfica que se emplea para exhibir las autocorrelaciones para varios desfases en una serie de tiempo. Ejm. Correlograma para el ejercicio anterior.
Con esta gráfica se pueden estudiar los patrones de datos, incluyendo tendencia, estacionalidad e irregularidad mediante el enfoque del Análisis de Autocorrelación.
En una serie de tiempo se puede dar respuesta a las siguientes preguntas: ¿Los datos son aleatorios? ¿Los datos tienen una tendencia? (No estacionarios) Los datos son estacionarios? ¿Los datos son estacionales?
-1 +1 rk SI UNA SERIE ES ALEATORIA la correlación entre Yt y Yt-1 es cercana a cero y los valores sucesivos de la serie de tiempo no guardan relación entre sí. LCS LCS
-1 +1 rk SI UNA SERIE TIENE TENDENCIA, Yt y Yt-1 están altamente correlacionados y es típico que los coeficientes de autocorrelación sean diferentes de cero de manera significativa para varios de los primeros períodos de desfasamiento y caigan gradualmente hacia cero al incrementarse el número de períodos. r1 es generalmente muy grande (cerca de 1) r2 también lo es pero no tanto como r1) LCS LCS
-1 +1 rk LCS LCS
-1 +1 rk 1 2 3 4 5 6 7 8 9 10 11 12 SI UNA SERIE TIENE UN PATRON ESTACIONAL Se presentará un coeficiente de autocorrelación significativo en el período de desfasamiento correspondiente: 4 en los datos trimestrales, 12 en los datos mensuales, etc. LCS LCS
-1 +1 rk 1 2 3 4 5 6 7 8 9 10 11 12 LCS LCS
¿QUÉ HACE UN PRONOSTICADOR PARA DETERMINAR SI UN COEFICIENTE DE AUTOCORRELACION ES SIGNIFICATIVAMENTE DIFERENTE DE CERO?
Se puede desarrollar una distribución muestral de coeficientes de autocorrelación, tomando un número infinito de muestras de tamaño 30. Los coeficientes de autocorrelación de datos aleatorios tienen una distribución aproximadamente normal con media cero y desviación estándar
Es decir, si rk es el parámetro y rk es el coeficiente de autocorrelación muestral, entonces: E(rk) = 0 V(rk) = 1/n d.e. (rk) = Luego un intervalo de confianza estará dado por: 0 ± Z. Donde Z es el valor de la distribución normal estándar para un nivel de confianza especificado.
Se puede desarrollar, entonces, la siguiente prueba de hipótesis: H0 : rk = 0 (Los datos son aleatorios) H1 : rk = 0 (Los datos no son aleatorios) El estadístico de prueba se obtiene de la siguiente manera: La regla de decisión se toma así: Si |Zc| > Za/2 se rechaza la H0. Esta prueba se realiza para cada rk.
En el siguiente correlograma cuyo n=30
El intervalo de confianza en este caso será 0 ± Z. 0 ± 1.96 = ±0.353 Se aprecia que todas las autocorrelaciones se encuentran entre estos límites por lo que se puede afirmar que rk = 0 (Los datos son aleatorios).
Una serie que tiene una tendencia se dice que es NO ESTACIONARIA
Los coeficientes de autocorrelación de datos estacionarios caen a cero después del segundo o tercer período de desfasamiento, mientras que en las series no estacionarias son significativamente diferentes de cero durante varios períodos. En estas series (no estacionarias) se debe quitar la tendencia antes de realizar cualquier análisis posterior, como su uso en los modelos Box-Jenins.
Para quitar la tendencia de una serie no estacionaria se utiliza un método denominado DIFERENCIACION que consiste en restar Yt -Yt-1, luego Yt-1-Yt-2 y así sucesivamente para crear una nueva serie. Así, la media y la varianza permanecen constantes a través del tiempo y la serie es estacionaria.
Tomemos el siguiente ejemplo de datos aleatorios: 646, 477, 560, 688, 892, 386, 747, 533, 127, 54, 707, 709, 39, 164, 30, 708, 379, 458, 590, 766 Graficar los datos. Generar las autocorrelaciones para 12 desfases Graficar las autocorrelaciones en un correlograma. Graficar las autocorrelaciones parciales.
SELECCIÓN DE UNA TECNICA DE PRONOSTICO
Antes de elegir una técnica de pronóstico se debe responder a las preguntas: ¿Porqué se requiere un pronóstico? ¿Quién utilizará el pronóstico? ¿Cuáles son las características de los datos disponibles? ¿Qué período de tiempo se pronosticará? ¿Cuáles son los requerimientos mínimos de datos? ¿Cuál es la precisión deseada? Un factor pincipal que influye en la selección de la técnica de pronóstico consiste en la identificación y comprensión de patrones históricos en los datos. Si se pueden reconocer patrones de tendencia, cíclicos o estacionales, entonces se pueden seleccionar las técnicas con la capacidad de utilizar eficazmente estos patrones.
a) TECNICAS DE PRONOSTICO PARA DATOS ESTACIONARIOS Una serie es estacionaria si su valor promedio no varía a través del tiempo. Esto se presenta cuando los patrones que influyen sobre la serie son relativamente estables. El pronóstico de series estacionarias comprende el uso de la historia disponible de la serie para estimar su valor promedio el cual se convierte después en el pronóstico de valores futuros.
Las técnicas de pronóstico para series estacionarias se emplean siempre que: a) Las fuerzas que generan una serie se han estabilizado y el medio en el que existe la serie permanece relativamente sin cambios. Ejm. Las ventas de un producto en su etapa de maduración. Fallas por semana en una línea de ensamble que tiene una tasa de producción uniforme. b) Se requiere un modelo muy sencillo debido a la falta de datos o para facilitar su explicación. c) Se puede lograr la estabilidad haciendo correcciones sencillas a factores como crecimiento de la población e inflación. Ejemplo modificar el ingreso por el ingreso per-cápita. d) La serie se puede transformar en una serie estable. Ejemplo, transformación de series mediante logaritmos, raíces cuadradas, o diferencias.
Las técnicas a usarse son: Métodos de promedio simple Métodos de promedios móviles Métodos de atenuación exponencial Técnicas Box-Jenkins
b) TECNICAS DE PRONOSTICO PARA DATOS CON TENDENCIA La tendencia es una serie de tiempo con un componente a largo plazo que representa el crecimiento o declinación de la serie. Una serie tiene tendencia si su valor promedio varía a través del tiempo de modo que se espera que aumente o disminuya durante el período para el que se desea el pronóstico. Es común que las series económicas tengan tendencia.
Estas técnicas de pronóstico se usan siempre que: a) Una productividad creciente y la nueva tecnología conducen a cambios en el estilo de vida. Demanda de componentes electrónicos. Uso del ferrocarril que disminuyó con el advenimiento del avión. b) El incremento en la población provoca un incremento en la demanda de bienes y servicios. Ejemplo: la demanda de energía eléctrica y el uso de materias primas. c) El poder de compra del dólar afecta las variables económicas por causa de la inflación. Ejemplo: Salarios y precios. d) Aumenta la aceptación en el mercado. Ejm. El período de crecimiento en el ciclo de vida de un producto.
Las técnicas a usarse son: Promedio móvil lineal Atenuación exponencial lineal de Brown Atenuación exponencial lineal de Holt Atenuación exponencial cuadrática de Brown Regresión simple Modelo de Gompertz Curvas de crecimiento Modelos exponenciales Box-Jenkins
c) TECNICAS DE PRONOSTICO PARA DATOS CON ESTACIONALIDAD Una serie es estacional cuando tiene un patrón de cambio que se repite año tras año. Por lo regular se seleccionan métodos multiplicativos o de adición y estimar después índices estacionales a partir de la historia de la serie. Estos índices se usan después para incorporar estacionalidad al pronóstico o para eliminarlos de los valores observados.
Las técnicas de pronóstico estacionales se usan cuando: a) El clima influye en la variable de interés. Ejemplo. Consumo de energía eléctrica durante el año, la estacionalidad de la producción agrícola. b) El año calendario influye en la variable de interés. Ejm. Ventas al por menor influido por las festividades, fines de semana y calendarios escolares. Las técnicas que se utilizan son: Descomposición clásica Census II Atenuación exponencial de Winter Regresión Múltiple de series de Tiempo Métodos Box-Jenkins
d) TECNICAS DE PRONOSTICO PARA SERIES CICLICAS El ciclo es la fluctuación en forma de onda alrededor de la tendencia. Los patrones cíclicos se repiten cada dos, tres o más años. Es difícil establecer un modelo para estos patrones ya que no son estables pues las fluctuaciones arriba o debajo de la tendencia rara vez se repiten en intervalos iguales de tiempo así como varía la magnitud del ciclo.
Estas técnicas se usan cuando: a) El ciclo del negocio influye sobre la variable de interés. Ejm. Los factores económicos del mercado y la competencia. b) Se presentan cambios en el gusto popular. La moda, la música. c) Se presentan cambios en la población. Las guerras, escasez, epidemias. d) Se presentan cambios en el ciclo de vida del producto. Ejemplo: Introducción, crecimiento, maduración, saturación y declinación del mercado. Las técnicas a usarse son: Descomposición clásica Indicadores económicos Modelos econométricos Regresión Múltiple Métodos Box-Jenkins
Un factor importante a considerar es el horizonte de pronóstico. Cuanto más amplio el horizonte algunas técnicas se hacen inaplicables. Desarrollaremos la metodología Box Jenkins por adecuarse a datos con diferentes patrones y por ser adecuados para pronósticos de corto y mediano plazo. Para horizontes mayores se usan con frecuencia métodos cualitativos.
MEDICION DEL ERROR EN EL PRONOSTICO La notación básica a usarse en el pronóstico será la siguiente: Yt: Es el valor real de una serie de tiempo en el tiempo t. : Valor del pronóstico para Yt et= - es el residual o error de pronóstico en el tiempo t. Un residual es la diferencia entre el valor real y su valor de pronóstico: et=
Estos errores se requieren para evaluar la precisión de las técnicas de pronóstico mediante indicadores como la DAM EMC PEMA PME.
LA DESVIACION ABSOLUTA DE LA MEDIA (DAM) La DAM mide la precisión de un pronóstico mediante el promedio de la magnitud de los errores de pronóstico (valores absolutos de cada error). Los errores se miden en las mismas unidades que la serie original. Se calcula mediante:
ERROR MEDIO CUADRATICO La suma de errores al cuadrado se divide entre el número de observaciones. Este enfoque da mayor valor a los errores mayores lo cual se constituye en desventaja si la serie tiene errores extremadamente grandes y pequeños, lo cual no sería conveniente. Se calcula:
PORCENTAJE DE ERROR MEDIO ABSOLUTO Se encuentra el error absoluto en cada período dividiéndose éste entre el valor real observado en dicho período dividiéndolos luego entre el número de observaciones. Es útil cuando el tamaño o magnitud de la variable de pronóstico es importante en la evaluación de la precisión del pronóstico. El PEMA proporciona una indicación de qué tan grandes son los errores de pronóstico comparados con los valores reales de la serie. También se la utiliza para comparar la precisión de la misma u otra técnica sobre dos series completamente diferentes. Se calcula así:
PORCENTAJE MEDIO DE ERROR Cuando se desea determinar si un método de pronóstico está sesgado. Se calcula dividiendo la sumatoria de los errores de cada período entre su valor real y promediando luego estos porcentajes. Si el pronóstico no está sesgado el porcentaje será cercano a cero. Si el resultado es un porcentaje negativo grande el método está sobrestimando de manera consistente. Si el resultado es un porcentaje positivo grande el método está subestimando de manera consistente.
Los pronosticadores desean que sus pronósticos produzcan errores pequeños. Las cuatro mediciones de los errores de pronósticos se utilizan para: a) La comparación de la precisión de dos técnicas de pronóstico diferentes. b) La medición de la utilidad y confiabilidad de una técnica. c) La búsqueda de una técnica óptima
Ejemplo:
La DAM indica que cada pronóstico está desviado en un promedio de 4.3 clientes. El EMC de 23.5 y el PEMA de 6.95% se compararía con el EMC y el PEMA de cualquier otro método de pronóstico. El bajo PME de 2.03% indica que la técnica no está desviada, ya que su valor es cercano a cero. La técnica no sobrestima ni subestima en forma consistente el número diario de clientes atendidos.
Summary: pronosticos de exploracion
| URL: |
No comments posted yet
Comments