|
|
Principios de Econometría y modelación Parte 3: Análisis de regresión múltiple Por Lic. Gabriel Leandro, MBA
El modelo de regresión múltiple Es una extensión del modelo de dos variables. Se asume que la variable dependiente Y es función lineal de dos o más variables independientes X1, X2, …, Xk y un término de error e.
El modelo se escribe como: Yi = b1 + b2 X2i + b3 X3i + … + bk Xki + ei Donde: Y es la variable dependiente X corresponde a cada variable indepediente e es el término de error b1 es el término constante de la ecuación Modelo de regresión múltiple
Supuestos del modelo La relación entre Y y cada X es lineal. Las X son variables no estocásticas. No existe una relación lineal exacta entre dos o más variables independientes (no hay multicolinealidad). El error tiene un valor esperado de cero.
Supuestos del modelo Los errores de observaciones diferentes son independientes y por lo tanto no están correlacionados. El término de error tiene varianza constante para todas las observaciones. El término de error está distribuido en forma normal.
Modelo de regresión de tres variables Se expresa como: Yi = b1 + b2 X2i + b3 X3i El objetivo es determinar parámetros que minimicen la suma de cuadrados del error.
Solución del modelo Los coeficientes de la ecuación se obtienen por medio de las fórmulas:
Interpretación de los coeficientes b2 mide el cambio en Y asociado con un cambio en X2, suponiendo que X3 permanece constante. b3 mide el cambio en Y asociado con un cambio en X3, suponiendo que X2 permanece constante.
Ejemplo: Los siguientes datos corresponden al rendimiento de maíz por acre (Y): La cantidad de fertilizante (X2) en libras por acre La cantidad de insecticidas (X3) en libras por acre Todos los datos de 1991 a 2000.
Ejemplo:
Se requiere completar la tabla:
Ejemplo: Resultados De la tabla anterior se obtienen los siguientes resultados:
Ejercicio La tabla muestra Ingreso per cápita (Y, en miles de dólares), fuerza laboral en agricultura (X1, como porcentaje de la fuerza de trabajo) y años de educación (X2, años de educación formal).
Ejercicio Construir un modelo que exprese el Ingreso per cápita como función de la fuerza laboral en agricultura y de los años de educación.
Estadísticas de regresión Dados los supuestos del modelo de regresión múltiple, es posible aplicar el teorema de Gauss-Markov. Los estimadores y son los más eficientes estimadores lineales insesgados de b2 y b3, ya que tienen la varianza mínima de todos los estimadores lineales insesgados.
Estadísticas de regresión Un estimador insesgado y consistente de ² es: Si el error está distribuido normalmente, pueden aplicarse las pruebas t:
Estadísticas de regresión del modelo de tres variables Estimación de la varianza de los coeficientes b2 y b3:
Estadísticas de regresión del modelo de tres variables Error estándar de los coeficientes:
Coeficiente de determinación Se cuenta con as siguientes dos alternativas para calcular R2:
Ejemplo: Rendimiento del maíz Aplicando al caso del rendimiento del maíz:
Ejercicio Con base en el ejercicio del Ingreso per cápita como función de la fuerza laboral en agricultura y de los años de educación: Estimar la varianza y la desviación estándar de los parámetros de regresión. Probar al 5% la significación de los coeficientes de la recta de regresión estimada. Calcular el coeficiente de determinación y el coeficiente de correlación. Interprete los resultados anteriores.
Ejercicio La tabla muestra la cantidad demandada de un artículo (Y), precio (X1) e ingreso de los consumidores (X2).
Ejercicio Construya un modelo que exprese la cantidad demandada en función del precio y del ingreso de los consumidores. Estime la varianza y la desviación estándar de los parámetros de regresión. Pruebe al 5% la significación de los coeficientes de la recta de regresión estimada. Calcule el coeficiente de determinación y el coeficiente de correlación. Interprete los resultados anteriores.
Prueba F La estadística F puede usarse en el modelo de regresión múltiple para probar la significancia de la estadística R2. Permite probar la hipótesis de que ninguna de las variables explicativas ayuda a explicar la variación de Y alrededor de su media.
Prueba F En otras palabras, la estadística F prueba la hipótesis de que: 2 = 3 = … = k = 0 La estadística F se calcula con k-1 y N-k grados de libertad como:
Multicolinealidad El modelo de regresión múltiple supone que no hay relación exacta entre cualesquiera de las variables independientes en el modelo. Si existiera relación se dice que esas variables independientes son colineales.
Ejemplo: Suponga las siguientes tres variables independientes: X2 = Ingreso familiar, en miles de $ X3 = Promedio de horas de estudio por día X4 = Promedio de horas de estudio por semana Las variables X3 y X4 son perfectamente colineales.
Multicolinealidad El problema de la multicolinealidad es que el coeficiente de X3 mide el cambio en Y si las demás variables permanecen constantes. Pero si éstas son colineales esa interpretación sería imposible y por tanto el modelo perdería sentido.
Multicolinealidad La multicolinealidad se refleja en altos errores estándar de los coeficientes de regresión. En estos casos es posible quitar una o más de las variables de la ecuación para disminuir los errores estándar de las variables restantes.
Indicadores de Multicolinealidad Un modelo estimado con errores estándar altos y una estadística t baja podría ser indicativo de multicolinealidad, aunque también podría sugerir un modelo deficiente.
Indicadores de Multicolinealidad Para observar la presencia de multicoli-nealidad hay varios procedimientos: Una R² relativamente alta en una ecuación con una estadística t poco significativa. Correlaciones simples relativamente altas entre uno o más pares de variables explicativas, aunque no necesariamente esto implica multicolinealidad.
Correlación parcial Los coeficientes de correlación parcial miden el efecto de una de las variables independientes X en Y y que no es explicado por las otras variables del modelo.
Correlación parcial
Correlación parcial Los coeficientes de correlación parcial varían entre -1 y 1. Con frecuencia se usan para determinar la importancia relativa de variables diferentes en modelos de regresión múltiple.
Ejercicio Con base en los ejercicios rendimiento de maíz y el de ingreso pe cápita: Calcule los coeficientes de correlación parcial. Efectúe la prueba global de la regresión (prueba F).
Ejercicio: Tasas de interés El archivo EX42 contiene información sobre los movimientos mensuales de las tasas de interés (FYGN3, tasas de bonos de tesorería a 3 meses, de enero de 1960 a agosto de 1995). Se cree que las tasas de interés están determinadas por la demanda agregada y el suministro de activos líquidos.
Ejercicio: Tasas de interés El índice de producción industrial (IP, 1987=100) proporciona una medida útil de la demanda de activos líquidos: Se esperaría que incrementos en la producción implicarían incrementos en la demanda, lo que a su vez incrementaría la tasa de interés. El suministro de dinero (M2, en miles de millones de dólares) es una variable obvia en el modelo: Los cambios en la política monetaria afectan directamente las tasas de interés.
Ejercicio: Tasas de interés De modo similar ocurre con los precios (PW, índice de precios al productor, 1982=100): Mayor inflación conduciría a incrementos en las tasas de interés. Formule, pruebe e interprete el modelo.
Ejercicio: Tasas de interés Proceso de datos en Gretl: File – Open data – Import – ASCII Abrir EX42 Add – Define New Variable GM2 = (FM2-FM2(-1))/FM2(-1) GPW = (PW-PW(-1))/PW(-1) Model – Ordinary Least Squares Dependent variable: FYGN3 Independent variable: const, IP, GM2, GPW Aceptar
Ejercicio: Tasas de interés OLS estimates using the 445 observations 2-446 Dependent variable: FYGN3 VARIABLE COEFFICIENT STDERROR T STAT P-VALUE const 1,53530 0,510100 3,010 0,00276 *** IP 0,0454198 0,00512953 8,855 <0,00001 *** GM2 127,128 35,2113 3,610 0,00034 *** GPW 88,0361 17,3807 5,065 <0,00001 *** Mean of dependent variable = 6,06622 Standard deviation of dep. var. = 2,77412 Sum of squared residuals = 2729,91 Standard error of residuals = 2,48802 Unadjusted R-squared = 0,201059 Adjusted R-squared = 0,195624 F-statistic (3, 441) = 36,9936 (p-value < 0,00001) Log-likelihood = -1035,03 Akaike information criterion (AIC) = 2078,06 Schwarz Bayesian criterion (BIC) = 2094,45 Hannan-Quinn criterion (HQC) = 2084,53
Ejercicio Use Gretl para efectuar los ejercicios de rendimiento de maíz y el de ingreso per cápita.
by gleandro | Added: 2 years ago
Language: Spanish (Detected) | Topic: Business & Finance
| 357 Views | 5 Embeds |
Summary: Modelo de regresión lineal múltiple - Curso Métodos de Pronósticos - AulaDeEconomia.com www.auladeeconomia.com
| URL: |
No comments posted yet
Comments