Econometría I
MTRO. MARCO MÉNDEZ ATIENZA
Try PitchTemario (Caps. Gujarati)
- Multicolinealidad (10.1 - 10.5, 10.7 - 10.9)
- Heterocedasticidad (11.1, 11.3 - 11.6, 11.8)
- Autocorrelación (12.1 - 12.2, 12.4, 12.6 - 12.7, 12-10)
- Ecuaciones simultáneas (18.1 - 18.4, 19.2 - 19.3, 20.2 - 20.4
- Variable dependiente binaria (15.1 - 15.3, 15.5, 15.8 - 15.10)
Heterocedasticidad
Heterocedasticidad: Varianza del error no constante
Try Pitch2. Heterocedasticidad
Try Pitch11.1 GUJARATI
Heterocedasticidad
¿Qué pasa si la varianza del error es no constante?
- Como revisamos en el curso pasado, uno de los supuestos esenciales del modelo de regresión lineal es que la
varianza de cada término de perturbación ui, condicional a los valores de X, sea un número constante igual a o2.
- Es decir, queremos que la varianza de los errores sea homocedástica:
E ( v 2 ) = 02
; i = 1 , 2 , .. . , "
- También revisamos cómo esto se ve gráficamente. En la figura de abajo, la varianza crece conforme aumenta X ->
¡lo que indica una varianza no constante / heterocedástica!
E (v: 2 ) = 0-2
Density
Savings
- Y
B1 +B2Xi
Income
X
E ( v 2 ) = 0 2
Density
Savings
Y
1
B1 + B2Xi
Income
X
Causas de la varianza variable en errores
Try Pitch11.1 GUJARATI
Heterocedasticidad
¿Por qué la varianza de los errores podría ser variable?
- Dependiendo de los datos, los errores podrían ir disminuyendo conforme avanza el tiempo o se incrementa otra
variable. Consideren la siguiente figura, que relaciona el número de errores de escritura (typos) con el número de
horas en cursos de mecanografía.
Como muestra la figura, mientras el número de horas de práctica aumentan, el número promedio de errores decrece.
Density
Typing errors
Y
1
B1 + B2Xi
Hours of typing practice
X
Varianza de errores y discrecionalidad
Try Pitch11.1 GUJARATI
Heterocedasticidad
¿Por qué la varianza de los errores podría ser variable?
- Cuando el ingreso se incrementa, las personas cuentan con más discrecionalidad. Así hay más posibilidades para
gastar el dinero, lo que aumentará la varianza de lo que cada persona ahorra. Puede haber gente que con más
dinero empiece a ahorrar más, pero gente que hará lo contrario.
Density
Savings
Y
₿1 + B2Xi
Income
X
Varianza de errores y técnicas de recolección
Try Pitch11.1 GUJARATI
Heterocedasticidad
¿Por qué la varianza de los errores podría ser variable?
- Mientras las técnicas de recolección de datos, se esperaría que la varianza de los errores disminuya.
- La heteroscedasticidad también puede surgir como resultado de la presencia de valores atípicos (outliers). Un
outlier es una observación que es muy diferente (muy pequeña o muy grande) en relación con las observaciones
de la muestra. La inclusión o exclusión de una observación de este tipo, especialmente si el tamaño de la muestra
es pequeño, puede alterar sustancialmente los resultados del análisis de regresión.
25
.
Chile
15
10
Stock prices (% change)
9
8
7
6
5
4
3
2
1
1
2
3
4
5
6
7
8 9 10
26
Consumer prices (% change)
Heterocedasticidad en análisis de corte transversal
Try Pitch11.1 GUJARATI
Heterocedasticidad
- La heterocedasticidad suele aparecer más en análisis de corte transversal que en series de tiempo.
- En los datos transversales, normalmente se trata de miembros de una población en un momento dado, como
consumidores individuales o sus familias, empresas, industrias o subdivisiones geográficas como un estado, un
país, una ciudad, etc. Estos miembros pueden ser de distintos tamaños, como empresas pequeñas, medianas o
grandes, o de ingresos bajos, medios o altos. En cambio, en los datos de series temporales, las variables tienden a
ser de un orden de magnitud similar porque generalmente se recogen los datos de la misma entidad a lo largo de
un periodo de tiempo.
Estimación MCO con heterocedasticidad
Modelo de 2 variables y varianza
Try Pitch11.2 GUJARATI
Estimación MCO con heterocedasticidad
- Consideren el modelo de 2 variables:
y= = P1+B2 Xi tui
- Asumimos que: Var (vi) = 0:2
- Recordemos que : B= = = (Xi -x) (y ;-; )
E (xi-x) 2
4 = hEyi
y
sabemos que:
又 = 금 산 x:
- Sustituirmos y = P1+B2 Xitui:
y: - y = p2 (xi -x) + (vi -= ) -> B1 desaparece al restan medias
? (xi-x) [B2 (Xi-x) +(vi-[]
E (xi-x) 2
B2 = B2 + 2(xi -x) (vi -= )
Elxi-x)2
- Sacamos la varianza
Van (B2) = Van (
E(xi-x) (vi -= )
E ( x1 - x ) 2
=
)
-> sabemos que las X provenen de los datos
=> son "fijas"
0
E ( xi - x ) 2
(2) ( x- x ) 252 Van (vi -= )
O
- Var (vi -= ) = Van (vi) + Var (v) - 2 Cov (vi, =)
Non (B2 ) =
E (xi-x) o:2
( E ( xi - x ) 2 ) 2
Compañento con la varianza del B2 cuando
hay homocedasticidade:
Van ( B2 ) =_
02
Elxi-x) }
Estimador MCO y homocedasticidad
Try Pitch11.2 GUJARATI
Estimación MCO con heterocedasticidad
var (₿2) =
(Ex2)2
- Recuerden que el estimador MCO es el BLUE si se cumplen los 6 supuestos que revisamos el curso pasado,
incluyendo homocedasticidad.
- ¿ Qué ocurre si se cumplen todos los supuestos, excepto el de homocedasticidad?
- El estimador MCO continuará siendo lineal e insesgado, ¡pero ya no el mejor! - > ya no será BLUE, sino LUE
Mínimos Cuadrados Generalizados (MCG)
Compensación promedio por empleado
Try Pitch11.3 GUJARATI
Mínimos Cuadrados Generalizados (MCG)
- Consideren los siguientes datos sobre la compensación promedio por empellado en diferentes industrias y por
tamaño de empresa.
Employment Size (average number of employees)
Industry
1-4
5-9
10-19
20-49
50-99 100-249 250-499 500-999 1,000-2,499
Food and kindred
products
2,994
3,295
3,565
3,907
4,189
4,486
4,676
4,968
5,342
Tobacco products
1,721
2,057
3,336
3,320
2,980
2,848
3,072
2,969
3,822
Textile mill
products
3,600
3,657
3,674
3,437
3,340
3,334
3,225
3,163
3,168
Apparel and
related products
3,494
3,787
3,533
3,215
3,030
2,834
2,750
2,967
3,453
Paper and allied
products
3,498
3,847
3,913
4,135
4,445
4,885
5,132
5,342
5,326
Printing and
publishing
3,611
4,206
4,695
5,083
5,301
5,269
5,182
5,395
5,552
Chemicals and
allied products
3,875
4,660
4,930
5,005
5,114
5,248
5,630
5,870
5,876
Petroleum and
coal products
4,616
5,181
5,317
5,337
5,421
5,710
6,316
6,455
6,347
Rubber and
plastic products
3,538
3,984
4,014
4,287
4,221
4,539
4,721
4,905
5,481
Leather and
leather products
3,016
3,196
3,149
3,317
3,414
3,254
3,177
3,346
4,067
Average
compensation
3,396
3,787
4,013
4,104
4,146
4,241
4,388
4,538
4,843
Standard deviation
742.2
851.4
727.8
805.06
929.9
1,080.6
1,241.2
1,307.7
1,110.7
Average
productivity
9,355
8,584
7,962
8,275
8,389
9,418
9,795
10,281
11,750
Noten qué ocurre con la variación de
empresas de 1 - 19 empleados. ¿ Y
qué pasa con las de 250-999?
La intuición de MCG es darle más peso a las
empresas de 1-19 empleados que a las más
grandes, ya que las primeras están más
"concentradas" alrededor de la media -> nos
sirven más para estimar la PRF con más
precisión que aquellas observaciones muy
"dispersas" alrededor de la media.
Estrategia de MCG
Try Pitch11.3 GUJARATI
Mínimos Cuadrados Generalizados (MCG)
- Lamentablemente, MCO no sigue esta estrategia porque no toma en cuenta esta información sobre la variación
desigual de los datos.
- ¡ Pero MCG sí toma en cuenta esto! - > y permite derivar estimaciones que serán BLUE.
- Retomemos el modelo de dos variables:
y: = B1 + B2 Xi +ui
en donde, para facilitar los pasos siguientes, reescribiremos como:
yi = p. Xoi + B2 Xi +vi
en donde Xoi = 1 para cada i.
Varianza del error en MCG
Try Pitch11.3 GUJARATI
Mínimos Cuadrados Generalizados (MCG)
- Ahora, asuman que las varianzas heterocedásticas o;2 son conocidas. Dividimos la ecuación anterior por o; para
obtener:
Xoi
yi
oi
· = B. (
oi
+ B2 ( xi ) + (x)
que, por facilidad, escribiremos:
y+ = B1* Xoï + Bž X:+ + vi
donde las variables estrellita son las variables originales divididas por la o; (conocida) -> noten que entonces las B* no
son las mismas que las ß que estimamos con MCO.
Noten ahora qué ocurre con la varianza del error:
Var (v*) = E (v+) 2 = E ( ¿) 2
= + E ( v 2 )
= - 2 ( 0-2 )
dado que se conoce o"
0.2
02
11
= 1 !
que es una constante. ¡ Entonces, la varianza del término de error estrellita u ;* es ahora homocedástica!
Estimadores BLUE con MCG
Try Pitch11.3 GUJARATI
Mínimos Cuadrados Generalizados (MCG)
- Entonces, este resultado nos indica que si aplicamos MCO al modelo transformado (modelo estrellita), y obvio si
se cumplen los demás supuestos, obtendremos estimadores BLUE.
- MCG, entonces, es el método de transformar nuestras variables, que sigan cumpliendo los supuestos, y que al
aplicar MCO obtengamos estimadores BLUE.
- En el Appendix 11A, Section 11A.2 del libro pueden encontrar la derivación detallada, pero la fórmula para obtener
los estimadores de MCG es:
(E wi) (Eui Xi Vi) - (Éwixi) (Ewiyi)
(Ewi) ( Ewi X2) - (Ewi Xi) 2
donde wi = 1/0:2
A
B2 =
*
Diferencia entre MCO y MCG
Minimización de residuales
Try Pitch11.3 GUJARATI
Diferencia entre MCO y MCG
- Recuerden que en MCO, minimizamos:
== = = (y :- Bi- p2 Xi) 2
- Y en MCG, minimizamos:
Ewii? = Ewilyi-B* Noi - B2" X:) 2
- Entonces, en MCG minimizamos la suma ponderada de residuales
cuadrados con wi = 1/6;2 como los pesos.
- Noten que en MCG, el peso asignado a cada observación es
inversamente proporcional a su oi -> entonces, las observaciones
que provengan de una "sección" con gran varianza tendrán un
peso menor; las observaciones de la "sección" con menos varianza
tendrán un peso mayor.
Y
C
Ŷ¡ = Î,+Î2×;
û
SŁA
1
û
B*
1
0
- X
Los estimadores de MCG se llamarán WLS
(weighted least squares)
Consecuencias de la heterocedasticidad
Simulación Monte Carlo
Try Pitch11.4 GUJARATI
Consecuencias de la heterocedasticidad
- ¿ Cuál es la consecuencia específica si usamos MCO para datos con heterocedasticidad?
- Davidson y Mackinnon realizaron una simulación Monte Carlo para comprobar dichas consecuencias.
- La tabla de abajo muestra el error estándar para las estimaciones de B1 y ß2, mediante tres métodos:
- MCO normal (asumiendo que no sabemos que hay heterocedasticidad en los datos)
- MCO permitiendo heterocedasticidad (indicándole al software que sabemos que hay heterocedasticidad, y aún
así forzando la estimación con MCO)
- MCG
Standard error of ₿1
Standard error of ₿2
Value of &
OLS
OLShet
GLS
OLS
OLShet
GLS
0.5
0.164
0.134
0.110
0.285
0.277
0.243
1.0
0.142
0.101
0.048
0.246
0.247
0.173
2.0
0.116
0.074
0.0073
0.200
0.220
0.109
3.0
0.100
0.064
0.0013
0.173
0.206
0.056
4.0
0.089
0.059
0.0003
0.154
0.195
0.017
Try Pitch
Conclusión: si hay
heterocedasticidad, usa MCG.
Detección de heterocedasticidad
Método gráfico para heterocedasticidad
11.5 GUJARATI
Detección de heterocedasticidad
Método gráfico
- Algo importante: no existe información a priori sobre alguna
naturaleza de la heterocedasticidad. Es decir, hemos revisado
ejemplos en donde la varianza va a aumentando o
disminuyendo, pero en la realidad, la varianza podría cambiar
con base en una lógica mucho más complicada.
- Cuando sí existe una lógica o patrón más claro, el método
gráfico es útil.
- (a) muestra que no hay patrón sistemático -> no hay
heterocedasticidad
- De (b) a (e) sí hay patrones sistemáticos -> sí hay
heterocedasticidad
û2
û2
û2
X
X
X
0
0
0
(a)
(b)
(c)
û2
^2
X
- X
0
0
(d)
(e)
Try Pitch