16 Oct

I. Ejercicio Práctico de Modelización Econométrica

P1. Descripción de la Muestra (n=44)

Estadísticos Principales de las Variables

A fin de describir la muestra (n=44) utilizada en nuestro estudio, se presentan los siguientes estadísticos:

  • ¿Cuáles son los valores mínimos, máximos y medios, de las variables Ingresos, Clientes, Productos y Años de Antigüedad? (Buscar en estadísticos principales)

Niveles de Ingresos más Frecuentes

  • ¿Cuál es el nivel, o niveles, de Ingresos más frecuentes entre las empresas de la muestra? (Pulsar en ingreso y buscar los mayores porcentajes en rel, decir los intervalos y los porcentajes)

Los niveles de ingresos más frecuentes son:

  • Las empresas con ingresos entre 3572.5 y 4217.5, que suponen el 27.27% del total de la muestra de empresas.
  • Aquellas con ingresos entre 4862.5 y 5507.5, que suponen el 25.00% del total.

Frecuencia del Número de Clientes

  • ¿Entre las empresas que conforman la muestra de nuestro estudio, son más frecuentes aquellas con menor o con mayor número de clientes? (Pulsar en clientes, distribución de frecuencias y mirar el acumulado del más frecuente)

Son más numerosas las empresas con un menor número de clientes. En particular, las empresas con hasta 25.6 clientes suponen el 63.64% del total de empresas; mientras que aquellas que tienen entre 25.6 y 49, suponen solo el 36.36% restante.

Distribución de la Variable Clientes

  • ¿La variable Clientes sigue una distribución como la Normal? Para justificar la respuesta, explique si dicha variable presenta algún tipo de asimetría y/o de exceso de curtosis distinta a la normal. (Estadísticos principales y asimetría; mirar en el mismo sitio curtosis)

La variable Clientes presenta una asimetría positiva, en particular de 0.72, lo que indica que, respecto a la Normal, presenta mayor concentración de frecuencias en la parte izquierda de la curva de la distribución. Además, tiene un exceso de curtosis negativo, concretamente de -0.15, lo que indica un menor apuntamiento que la distribución normal.

P2. Correlación entre Variables

  • ¿Se aprecia correlación entre la variable endógena (Ingresos) y las variables Clientes, Productos y Años en Activo? (1. Pulsar solo en la endógena, 2. Ver, 3. Matriz correlaciones, 4. Poner los 4 a la derecha, 5. Mirar donde coinciden con la variable endógena)

Sí, se evidencia una elevada correlación en todos los casos. En concreto:

  • Correlación de 0.9733 entre Ingresos y Clientes.
  • Correlación de 0.9762 entre Ingresos y Productos.
  • Correlación de 0.9662 entre Ingresos y Años en Activo.

P3. Propuesta de Modelo Econométrico

  • ¿Qué propuesta de modelo econométrico se podría hacer para estimar el comportamiento de los Ingresos de las empresas en función de Clientes, Productos y Años en Activo? (Pulsar en los 4, darle a modelo, luego a mínimos cuadrados ordinarios, ponemos «ingresos» en variable independiente y los otros tres en regresores, aceptar, archivo y ver ecuación)

El modelo de regresión lineal estimado por Mínimos Cuadrados Ordinarios (MCO) es:

$$\hat{Ingresos} = 720 + 44.4 \cdot Clientes + 18.1 \cdot Productos + 29.7 \cdot AñosEnActivo$$

P4. Interpretación del Modelo Propuesto

Efecto de un Nuevo Cliente

  • ¿Cuánto se incrementarían los Ingresos de las empresas si estas contaran con un nuevo cliente? (El 44.4 que acompaña a clientes)

Se estima que, ante un incremento unitario del número de Clientes, permaneciendo constantes tanto el número de Productos como el número de Años en Activo (*ceteris paribus*), los Ingresos se incrementarían en términos medios en 44.4 euros.

Efecto de un Año Adicional en Activo

  • ¿Y cuánto se incrementarían los Ingresos cuando las empresas contaran con un año más en activo? (El 29.7 que acompaña a año más en el activo)

Se estima que, ante un incremento unitario de Años en Activo, permaneciendo constantes tanto el número de Productos como el número de Clientes (*ceteris paribus*), los Ingresos se incrementarían en términos medios en 29.7 euros.

Nivel de Ingresos Autónomos

  • ¿Y cuál sería el nivel de los Ingresos denominados en econometría como autónomos? (El número que va solo)

Se estima que, en términos medios, los ingresos autónomos (cuando todas las variables explicativas son cero) serían de 720 euros.


Estimación Alternativa (Solo Clientes y Productos)

NOTA IMPORTANTE: El Documento 1 no debe ser eliminado.

  • ¿Qué estimación se podría hacer si los Ingresos dependieran únicamente del número de Clientes y del número de Productos? (Pulsar en los 4, darle a modelo, luego a mínimos cuadrados ordinarios, ponemos «ingresos» en variable independiente, clientes y productos en regresores, aceptar, archivo y ver ecuación)

El modelo estimado es:

$$\hat{Ingresos} = 423 + 49.5 \cdot Clientes + 21.9 \cdot Productos$$

Parámetro con Mayor Pendiente

  • En esta última estimación, ¿qué parámetro estimado podemos decir que supone una mayor pendiente, respecto a la variable Ingresos, en caso de representación gráfica de las variables correspondientes?

El parámetro estimado asociado a la variable Clientes (49.5), al tener un mayor valor que el parámetro estimado asociado a la variable Productos (21.9), supone una mayor pendiente, o una pendiente más elevada, en el plano bidimensional correspondiente.

P5. Propiedades de la Recta de Regresión Estimada (MCO)

  • ¿Se cumplen las propiedades, en el caso del modelo a través del que se estima el comportamiento de los Ingresos en función de Clientes, Productos y Años en Activo, de la recta de regresión estimada?

Las medias muestrales son: Clientes = 23.5; Productos = 145; Años = 12.9; e Ingresos = 4770.9.

  1. Primera Propiedad: La recta de regresión pasa a través de las medias muestrales de X e Y.

    Se comprueba que: $\bar{Y} = \hat{\beta}_0 + \hat{\beta}_1 \bar{X}_1 + \hat{\beta}_2 \bar{X}_2 + \hat{\beta}_3 \bar{X}_3$

    Sustituyendo los valores medios en la ecuación estimada:

    $$4770.9 = 720 + 44.4 \cdot 23.5 + 18.1 \cdot 145 + 29.7 \cdot 12.9$$

    Se evidencia que se cumple esta primera propiedad de la estimación mínimo-cuadrática.

  2. Segunda Propiedad: La media de Y observada es igual que la media de Y estimada. (Guardar valores estimados, ver estadísticos principales, poner los ingresos estimados a la derecha, aceptar y mirar si la media da lo mismo que la media de los ingresos)

    También se cumple esta propiedad, puesto que en ambos casos la media es 4770.9.

  3. Tercera Propiedad: El valor medio de los errores o residuos es 0. (Guardar residuos, matriz correlación, poner residuos e ingresos estimados a la derecha, ver correlación y ver si alguna de las medias es 0)

    También se cumple esta propiedad, puesto que el valor medio de los errores es casi 0, en particular $-1.0335e^{-014}$.

  4. Cuarta Propiedad: Los errores no están correlacionados con los valores estimados de Y. (Seleccionar los dos, ver matriz de correlación, y es donde pone corr(…))

    Tal y como se observa en la matriz de correlaciones, en efecto la variable Residuos y la variable Y estimada presentan incorrelación, puesto que su correlación tiene un valor de 0.

  5. Quinta Propiedad: Los errores no están correlacionados con las variables independientes. (Seleccionar todos, ver matriz de correlación, poner todos a la derecha y mirar abajo a la derecha las correlaciones)

    Tal y como se observa en la matriz de correlaciones, en efecto la variable Residuos y las variables independientes (Clientes, Productos y Años en Activo) presentan incorrelación, puesto que su correlación, en los tres casos, tiene un valor de 0.

P6. Bondad de Ajuste del Modelo

  • ¿El modelo propuesto de estimación, a partir de la muestra utilizada, se puede afirmar que es un buen modelo desde el punto de vista de su bondad de ajuste? (Seleccionar ingresos, estadístico principal y mirar R-CUADRADO)

Sí. Así lo pone de manifiesto el estadístico R-cuadrado corregido, con un valor de 0.981853; lo que indica que el 98.18% de la variabilidad de los ingresos de las empresas se explica por la variabilidad conjunta de las variables independientes Clientes, Productos y Años en Activo.

P7. Elasticidad de los Ingresos

  • ¿A los cambios de qué variable explicativa es más elástico el consumo?

Se calculan los valores de la elasticidad entre Ingresos (Y) y cada una de las tres variables independientes (Xi) del modelo, utilizando la fórmula: $E(Y/X_i) = \hat{\beta}_i \cdot (\bar{X}_i / \bar{Y})$:

  • Ingresos – Clientes: $44.4 \cdot (23.5 / 4770.9) = 0.218$
  • Ingresos – Productos: $18.1 \cdot (145 / 4770.9) = 0.550$
  • Ingresos – Años en Activo: $29.7 \cdot (12.9 / 4770.9) = 0.080$

Interpretación: Cuando el valor es mayor que 1, la relación es elástica; si el valor es menor que 1, es inelástica.

Se puede afirmar que la variable Ingresos, aun siendo inelástica en los tres casos (ya que todos los valores son menores que 1), presenta una mayor elasticidad respecto a la variable Productos (0.550) que al resto de variables.

P8. Predicción y Estimación de Ingresos

  • Ahora queremos hacer una predicción, o una estimación de Ingresos para un determinado valor de Clientes (23), Productos (145) y Años en Activo (11). En concreto, ¿sería razonable unos Ingresos de 5.200 euros para esta empresa?

Dado el modelo estimado, el valor medio estimado esperado de Ingresos, o valor de predicción puntual, para una empresa con 23 clientes, 145 productos y 11 años en activo, se estima que sería de 4,686.70 euros.

Es decir, en este caso, unos Ingresos de 5,200 euros se estiman como algo superior al valor esperado.

Asimismo, para esos mismos valores, los Ingresos tendrían un valor medio estimado esperado siempre que se situara en un intervalo de confianza entre 4,385.67 y 4,987.73 euros. Por lo tanto, dado este intervalo, unos Ingresos de 5,200 euros se estiman como superiores al valor esperado o estimado, y fuera del rango de confianza de la predicción.

P9 y P10. Intervalos de Confianza y Contraste de Hipótesis (Ho: $\beta_i = 0$)

Intervalos de Confianza (IC) para los Parámetros

  • ¿Cuál es el intervalo de confianza para los parámetros del modelo estimado? (Análisis, Intervalo de confianza, Miramos el inferior y el superior)
VariableLímite Inferior (IC)Límite Superior (IC)
Clientes30.942957.8104
Productos11.550824.5890
Años en Activo-3.3415662.6560

Rechazo de la Hipótesis Nula (Ho)

  • Dados los IC, ¿se rechaza la Ho en el caso de algún parámetro asociado a alguna variable explicativa; o no? (Se rechaza si 0 no está en el intervalo)

Rechazamos la Hipótesis Nula ($H_0: \beta_i = 0$) en el caso de Clientes y de Productos, porque el valor cero no está incluido en sus correspondientes intervalos de confianza. Sin embargo, en Años en Activo no rechazamos la $H_0$ porque $\beta = 0$ sí es un valor probable dentro del intervalo [-3.34156, 62.6560].

P11. Significación Individual de los Estimadores

  • ¿Son significativos cada uno de los estimadores del modelo propuesto, dado un nivel de significación del 5%? ¿Y para un nivel de significación del 1%? (Mirar en Valor-P en el Modelo 1)

En el caso de Clientes y Productos, dado que el nivel de significación o límite de aceptación es mayor que el valor-p (5.31e-08 en ambos casos), tanto para un nivel de significación del 5% como del 1%, se puede afirmar que ambas variables son individualmente significativas.

En el caso de Años en Activo, el estimador sería significativo solo para un 10% de significación, puesto que su valor-p es 0.0768 (7.68%), siendo mayor que el 5% y el 1%.

P12. Significación Global del Modelo

  • ¿Considera que el modelo propuesto tiene significatividad global, dado un nivel de significatividad del 5%? ¿Y del 10%? ¿Y del 1%? ¿Por qué? (Mirar Modelo 1 Valor P de F)

Sí, el modelo tiene significatividad global para todos los niveles de significación propuestos (1%, 5% y 10%), porque el valor p del estadístico F es extremadamente bajo, en concreto: $1.80e^{-35}$, siendo menor que cualquiera de esos umbrales.


II. Conceptos Fundamentales de Econometría

Definiciones Clave

Definición y Utilidad de la Econometría

La econometría es la disciplina que combina la teoría económica, la estadística y las matemáticas para analizar datos económicos. Su utilidad radica en cuantificar relaciones económicas, contrastar teorías y realizar predicciones basadas en datos reales.

Datos y Tipologías de Datos

Los datos son observaciones de variables económicas. Pueden ser:

  • Corte Transversal: Diferentes individuos en un mismo momento.
  • Series Temporales: Una misma variable en distintos momentos.
  • Panel: Combinación de ambos.

Concepto de Covariación

La covariación mide cómo dos variables varían conjuntamente. Si ambas aumentan o disminuyen al mismo tiempo, la covariación es positiva; si una aumenta y la otra disminuye, es negativa.

Concepto de Regresión

La regresión analiza la relación entre una variable dependiente y una o más variables independientes, con el objetivo de explicar o predecir el comportamiento de la primera.

Interpretación del Coeficiente de Correlación de Pearson

Mide la intensidad y dirección de la relación lineal entre dos variables. Toma valores entre -1 y 1. Si es positivo, la relación es directa; si es negativo, es inversa; si es cero, no existe relación lineal.

Concepto de Causalidad y Casualidad en Econometría

La causalidad implica una relación de causa y efecto entre dos variables. La casualidad se refiere a la coincidencia o correlación sin que haya una relación causal subyacente. La econometría busca identificar relaciones causales verdaderas.

Principio de Parsimonia

Establece que un modelo debe ser lo más simple posible, explicando el fenómeno con el menor número de variables necesarias para mantener su validez y poder explicativo.

Principio de Ceteris Paribus

Significa “manteniendo todo lo demás constante”. Permite analizar el efecto aislado de una variable sobre otra sin que cambien las demás variables explicativas.

Variables y Tipos de Variables

Una variable es una característica que puede tomar distintos valores. Pueden ser:

  • Dependientes (explicadas).
  • Independientes (explicativas).
  • Cualitativas (categorías).
  • Cuantitativas (números).

Concepto de Modelo

Un modelo es una representación simplificada de la realidad que permite analizar relaciones entre variables y explicar fenómenos económicos.

Tipos de Modelos y Ecuaciones

Modelo Económico y Modelo Econométrico

El modelo económico es teórico y describe relaciones entre variables según principios económicos. El modelo econométrico es su versión empírica, que incorpora datos y un término de error para estimar los parámetros.

Modelo Univariante y Modelo Multivariante

El modelo univariante incluye una variable dependiente y una independiente. El modelo multivariante incluye una variable dependiente y varias independientes.

Modelo Determinista y Modelo Estocástico

El modelo determinista no considera factores aleatorios y su resultado es exacto. El modelo estocástico incorpora un término de error que refleja la influencia de factores no observados o aleatorios.

Ecuación Teórica y Ecuación Estimada

La ecuación teórica representa la relación ideal entre variables. La ecuación estimada se obtiene con datos muestrales y proporciona estimaciones de los parámetros teóricos.

Perturbación Aleatoria

Es el término que recoge los efectos de factores no observados o aleatorios que influyen en la variable dependiente.

Error o Residuo

Es la diferencia entre el valor observado y el valor estimado por el modelo. Indica cuánto se desvía la predicción del valor real.

Métodos y Propiedades

Supuestos Básicos del Modelo de Regresión Lineal (MRL)

Los supuestos clave incluyen: Linealidad en los parámetros, valor esperado del error igual a cero, varianza constante (homocedasticidad), no autocorrelación, independencia entre el error y las variables explicativas, y normalidad del error.

Estimación por Mínimos Cuadrados Ordinarios (MCO)

Método que estima los parámetros minimizando la suma de los cuadrados de los residuos, buscando la mejor recta de ajuste para los datos muestrales.

Propiedades de la Recta de Regresión Estimada

La recta de regresión estimada por MCO:

  • Pasa por el punto medio de los datos.
  • La suma de los residuos es cero.
  • Los residuos son ortogonales a las variables explicativas.
  • Minimiza la suma de los errores al cuadrado.

Concepto e Interpretación de Elasticidad

Mide la variación porcentual de una variable dependiente ante una variación porcentual de una variable independiente. Indica el grado de sensibilidad entre ambas variables.

Contraste de Hipótesis: Utilidad e Interpretación

Permite comprobar si los parámetros estimados son significativamente distintos de cero. Se utiliza para determinar la relevancia estadística de las variables en el modelo.

Intervalos de Confianza: Utilidad e Interpretación

Indican el rango dentro del cual se espera que se encuentre el valor verdadero de un parámetro con una probabilidad determinada (generalmente del 95%).

Coeficiente de Determinación Corregido: Utilidad e Interpretación

Mide el porcentaje de la variación de la variable dependiente explicado por el modelo, ajustado por el número de variables explicativas. Evalúa la calidad del modelo evitando el sobreajuste.

Predicción: Utilidad e Interpretación

Consiste en estimar valores futuros o desconocidos de la variable dependiente a partir del modelo estimado y los valores de las variables explicativas. Permite anticipar comportamientos económicos.

Deja un comentario