30 Oct

Cuestionario de Econometría Aplicada: Datos Panel

1. Primeras Diferencias en Datos Panel vs. Cortes Transversales Independientes

  1. ¿Por qué no se pueden usar primeras diferencias cuando se tienen cortes transversales independientes en dos años (contrariamente a los datos panel)?

    En los cortes transversales independientes, las muestras son independientes para cada periodo T. Por lo tanto, tendrán distintas dispersiones. Debido a esto, T=2 no depende de T=1 y no tiene sentido utilizar primeras diferencias. En cambio, en datos panel se utiliza la misma muestra (se sigue a los mismos individuos a lo largo del tiempo), por lo tanto, sí se pueden usar primeras diferencias.

2. Inclusión de Variables Temporales en Modelos de Primeras Diferencias

  1. Supón que se desea estimar el efecto de varias variables sobre el ahorro anual y se tiene una base de datos panel sobre personas, recolectada el 31 de enero de 1990 y el 31 de enero de 1992. Si se incluye una variable binaria para 1992 y se utiliza la primera diferenciación, ¿es posible incluir además la edad en el modelo original?

    No es posible, debido a que la edad es una variable que cambia a lo largo del tiempo de manera constante (su variación es constante e igual a 2 en este caso). Al aplicar la primera diferencia, la variable Edad se eliminaría del modelo, ya que la diferencia de una variable que crece linealmente con el tiempo se convierte en una constante, la cual es absorbida por el intercepto. Esto provoca que en la regresión se obtenga un estimador para dicha variable sesgado e inconsistente si se intentara incluir de forma incorrecta.

3. Diseño Experimental y Evaluación de Programas (Diferencia en Diferencias)

  1. Supón que la FEYRI implementa un programa de tutores académicos para mejorar el desempeño de los estudiantes con malas calificaciones. El programa consiste en apoyar a los estudiantes con promedio general inferior a 80, ofreciéndoles clases extra para que se regularicen en las materias que más se les dificultan con el objetivo de que mejoren su promedio general.

    a) Diseño de un Cuasi-Experimento (Diferencia en Diferencias)

    Supón que cuentas con un listado de estudiantes que participan en el programa de tutores. Describe detalladamente un experimento (o cuasi-experimento) para evaluar la efectividad del programa. Establece con cuidado la unidad de análisis, el grupo de control, el grupo de tratamiento y la especificación econométrica.

    • Unidad de Análisis: Calificación final de semestre de los alumnos con menos de 80 de promedio.
    • Grupo de Control (C): Alumnos con promedio inferior a 80 que no recibirán clases extra.
    • Grupo de Tratamiento (T): Alumnos con promedio inferior a 80 que recibirán clases extra.
    • Especificación Econométrica (Diferencia en Diferencias):

    $$ Y_{it} = \beta_0 + \delta_2 D2_t + \beta_1 T_i + \delta_1 (D2_t \cdot T_i) + a_i + u_{it} $$

    Donde:

    • Y: Calificación final semestral.
    • D2: Variable binaria con valor 1 para el semestre con el programa (post-tratamiento).
    • T: Variable binaria con valor 1 para el grupo de tratamiento.
    • D2 · T: Término de interacción.

    b) Parámetro de Interés

    Con base en la regresión del inciso a, ¿cuál es el parámetro de interés? ¿Qué mide?

    El parámetro de interés es $$\delta_1$$ (el coeficiente del término de interacción $D2 \cdot T$).

    Este parámetro mide el efecto causal promedio del programa (las clases extra) sobre la calificación de los estudiantes. Es el estimador de Diferencia en Diferencias (DID). Por lo tanto, nos mostraría cómo cambió la diferencia entre las calificaciones del grupo de Tratamiento (T) y el grupo de Control (C) después de la implementación del programa.

    c) Variables Adicionales

    ¿Qué otras variables incluirías en la ecuación del inciso a?

    Variables Observables (Covariables):

    • Historial académico previo (calificaciones pasadas).
    • Ingreso de los padres o nivel socioeconómico.
    • Características demográficas (sexo, si trabaja o no).

    Variables Inobservables (Efectos Fijos):

    Estas son capturadas por el término $a_i$ (efecto fijo individual) e incluyen:

    • Capacidades innatas del estudiante.
    • Conocimientos previos no medidos.
    • Motivación intrínseca.

4. Transformaciones Econométricas en Datos Panel (T=2)

  1. Sea la ecuación $Y_{it} = \beta_0 + \beta_1 X_{it1} + \beta_2 X_{it2} + a_i + u_{it}$ con $T=2$.

    a) Obtención de la Transformación de Primeras Diferencias

    La transformación de primeras diferencias se obtiene restando la ecuación en $t=1$ de la ecuación en $t=2$:

    $$ Y_{i2} = \beta_0 + \beta_1 X_{i21} + \beta_2 X_{i22} + a_i + u_{i2} $$

    $$ Y_{i1} = \beta_0 + \beta_1 X_{i11} + \beta_2 X_{i12} + a_i + u_{i1} $$

    Restando ambas ecuaciones, se obtiene:

    $$ \Delta Y_{i} = \beta_1 \Delta X_{i1} + \beta_2 \Delta X_{i2} + \Delta u_{i} $$

    Nota: El intercepto $\beta_0$ y el efecto fijo individual $a_i$ se eliminan.

    b) Obtención de la Transformación de Efectos Fijos (Within Transformation)

    La transformación de efectos fijos se obtiene restando la media temporal ($\bar{Y}_i$) de cada variable:

    $$ (Y_{it} – \bar{Y}_i) = \beta_1 (X_{it1} – \bar{X}_{i1}) + \beta_2 (X_{it2} – \bar{X}_{i2}) + (u_{it} – \bar{u}_i) $$

    O, utilizando la notación de variables transformadas:

    $$ \ddot{Y}_{it} = \beta_1 \ddot{X}_{it1} + \beta_2 \ddot{X}_{it2} + \ddot{u}_{it} $$

    Nota: El efecto fijo individual $a_i$ se elimina al restar la media.

    c) Relación entre los Estimadores de Efectos Fijos y Primeras Diferencias

    • Cuando $T=2$: Los estimadores y estadísticos de prueba de Efectos Fijos (EF) y Primeras Diferencias (PD) son idénticos.
    • Cuando $T$ es mayor a 3: Se debe evaluar la correlación serial de $u_{it}$. Si $u_{it}$ no está serialmente correlacionado, Efectos Fijos (EF) da mejores estimadores (es más eficiente) que Primeras Diferencias (PD).

    d) Criterio de Decisión de Efectos Fijos sobre Primeras Diferencias

    El criterio de decisión se basa en la eficiencia, la cual depende de la correlación serial del error idiosincrático $u_{it}$:

    • Con mucha correlación serial (o si $u_{it}$ sigue un paseo aleatorio): Se prefiere Primeras Diferencias (PD).
    • Con poca o nula correlación serial (si $u_{it}$ es ruido blanco): Se prefiere Efectos Fijos (EF), ya que es más eficiente.

5. Ventajas y Supuestos de Efectos Aleatorios

  1. Señala la principal ventaja práctica que tiene la estimación de Efectos Aleatorios sobre Efectos Fijos y Primeras Diferencias.

    La principal ventaja práctica de la estimación de Efectos Aleatorios (EA) es que permite utilizar variables que se mantienen constantes en el tiempo (variables invariantes en el tiempo, como el sexo o la raza). En cambio, los métodos de Primeras Diferencias y Efectos Fijos eliminan estas variables al realizar la transformación.

  1. Establece el supuesto clave de Efectos Aleatorios, las implicaciones de este y cómo se diferencia este supuesto respecto a Efectos Fijos.

    Supuesto Clave de Efectos Aleatorios (EA):

    $$\text{Cov}(X_{itj}, a_i) = 0$$

    Implicaciones:

    Implica que se asume que el efecto individual no observado ($a_i$) no está correlacionado con las variables explicativas ($X_{itj}$). Si este supuesto se cumple, el estimador de Mínimos Cuadrados Generalizados (GLS) de Efectos Aleatorios es consistente y eficiente.

    Diferencia con Efectos Fijos (EF):

    En Efectos Fijos, se permite la correlación arbitraria entre el efecto individual y las variables explicativas:

    $$\text{Cov}(X_{itj}, a_i) \neq 0$$

    Mientras que Efectos Aleatorios requiere que: $$\text{Cov}(X_{itj}, a_i) = 0$$

6. Criterio de Decisión: La Prueba de Hausman

  1. Se lleva a cabo la prueba de Hausman y se obtiene el siguiente resultado:

                test: Ho: difference in coefficients not systematic
                chi2(5) = 10.19
                prob chi2 = 0.07001
            

    a) Con base en la prueba de Hausman, ¿cuál es el estimador preferido?

    El valor de probabilidad (p-value) es $0.07001$. Dado que este valor es mayor a $0.05$ (el nivel de significancia estándar), se acepta la hipótesis nula ($H_0$).

    La $H_0$ establece que la diferencia en los coeficientes no es sistemática, lo que implica que el supuesto clave de Efectos Aleatorios (no correlación entre $X$ y $a_i$) es cierto. Por lo tanto, el estimador preferido es el de Efectos Aleatorios (EA), ya que es consistente y más eficiente que Efectos Fijos.

Deja un comentario