27 Oct

1. Codificación e Introducción de Datos

Codificar implica traducir respuestas a números y agrupar datos.

1.1. Tabulación de Datos Unidireccional (o Simple)

Consiste en el recuento del número de casos, presentados en tablas con columnas que representan:

  • Xi: Las diferentes respuestas a la pregunta.
  • Fi o Ni: La frecuencia absoluta.
  • Pi: La frecuencia relativa o porcentajes de las respuestas.

Tipos de Escalas de Tabulación Simple

  1. Escala nominal: Solo permite la distinción de categorías.
  2. Escala ordinal: Permite la ordenación de clases (creciente o decreciente).
  3. Escala cardinal o de intervalo: Combina la ordenación con la distancia entre clases.
  4. Registro de datos: Se registran los datos con cualquier número.

1.2. Tabulación de Datos Cruzada

Se utiliza para poner en relación las respuestas de dos o más preguntas diferentes ligadas entre sí. Utiliza un cuadro de doble entrada (al principio de la línea y al final se indican las frecuencias (Fi, Pi)); en los cruces se muestran las frecuencias conjuntas.

1.3. Tratamiento de los Datos

El tratamiento de los datos puede clasificarse en:

  • (A) Estadística analítica: Si los datos son tratados matemáticamente.
  • (B) Estadística descriptiva: Si los datos se presentan en tablas o gráficos.
  • (C) Estadística inferencial: Permite sacar conclusiones estadísticas de una muestra (“n”) y extender los resultados a la población total (“N”).

Variables Estadísticas

Las variables estadísticas se clasifican en:

  • a) Cuantitativas: Solo toman valores numéricos.
    • Discretas: Toman números aislados (ejemplo: número de hijos).
    • Continuas: Toman cualquier valor (incluyendo decimales).
  • b) Cualitativas: Representan la propiedad que se estudia sin utilizar números (ejemplo: color de pelo).
    • Ordinales: Permiten un orden (de mayor a menor, pero sin valor numérico).
    • Nominales: No permiten ordenación.

1.4. Representación Gráfica de los Datos

El tipo de representación gráfica depende de los objetos a representar, de la escala y de la variable. Los tipos comunes son:

  • Diagrama de líneas.
  • Diagrama de área.
  • Diagrama de barras (utilizado para variables cualitativas y cuantitativas discretas).
  • Diagrama de sectores (utilizado para variables cualitativas).
  • Pictogramas (utilizado para variables cualitativas y cuantitativas).
  • Histogramas (formado por rectángulos; utilizado para variables cuantitativas continuas).
  • Polígonos de frecuencia (bloques unidos por puntos; utilizado para variables cuantitativas continuas).

1.4.1. Objetivos de los Tipos de Gráficos

Los gráficos se utilizan para:

  • Comparar valores (diagrama de barras nominal y ordinal).
  • Analizar comportamiento (diagrama de línea o área).
  • Estudiar distribución (diagrama de sectores nominal y ordinal).
  • Clasificar datos (diagrama de barras nominal y ordinal).

2. Análisis de Datos

2.1. Análisis Univariable de Datos

Se realiza a través de la tabulación simple. Se debe tener en cuenta el tipo de escala. Los resultados obtenidos incluyen:

  • (A) Frecuencias relativas o porcentajes (Pi).
  • (B) Medidas de tendencia central o de posición: moda, mediana, media aritmética.
  • (C) Medidas de dispersión: varianza, desviación típica.

2.2. Análisis Multivariable de Datos

Permite analizar varias variables a la vez. Se aplica en la investigación comercial porque permite:

  • (A) Analizar a la vez toda la información.
  • (B) Analizar un gran número de encuestas.
  • (C) Hacer comprensible la gran cantidad de datos.

Clasificación de Métodos Multivariables

  1. Métodos descriptivos/interdependencia: Todas las variables están relacionadas unas con otras.
    • Método de clasificación: Agrupa individuos o empresas a partir de unas variables de partida (ejemplo: el análisis cluster).
    • Análisis factorial o de componentes (métodos descriptivos).
  2. Métodos explicativos/de dependencia: Explican unas variables en función de otras (ejemplo: métodos de segmentación y el análisis discriminante).
  3. Métodos estructurales: Analizan cómo las variables están relacionadas entre sí y cómo las variables interdependientes afectan a las dependientes.

2.2.1. Clasificación de Métodos Explicativos (Dependencia)

Dentro de los métodos explicativos, hay dos grupos principales:

  1. Si la variable dependiente es cuantitativa:
    • Análisis de regresión: Analiza la relación entre la variable dependiente y varias independientes (ejemplo: predecir el gasto en consumibles a partir de la compra de materiales).
    • Análisis de varianza (ANOVA): Se utiliza si la muestra se divide en grupos basados en variables independientes cualitativas y la dependiente es cuantitativa (ejemplo: si queremos saber si hay diferencia en el nivel de colesterol dependiente del sexo).
  2. Si la variable dependiente es cualitativa:
    • Análisis discriminante: Explica la pertenencia de individuos u objetos a grupos preestablecidos (ejemplo: determinar los ratios financieros de empresas rentables o no).

Métodos Descriptivos (Interdependencia)

Miden asociaciones, pero no establecen relaciones de causalidad.

  • Análisis factorial: Se analizan las interrelaciones entre variables cuantitativas, explicándolas en términos de un número menor de factores (si son inobservables) o de componentes principales (si son observables). (Ejemplo: conocer el estado financiero de una empresa a partir de ratios financieros).
Proceso del Análisis Multivariable
  1. Objetivos del análisis (problema, técnicas, etc.).
  2. Diseño del análisis (tamaño de la muestra “n”).
  3. Hipótesis del análisis.
  4. Realización del análisis y ajuste de datos (desviaciones).
  5. Interpretación de resultados (validez).

2.3. Medidas de Posición Central: Media Aritmética Ponderada

Los datos se agrupan en torno al valor central. Se consideran las variables (xi) y el número de veces que se repiten (ni), calculando la frecuencia absoluta (Ni).

2.4. Medidas de Posición Central: La Mediana

Es el valor que divide en dos partes iguales a un conjunto de datos ordenados. Si el número de datos es impar, la mediana es un valor; si es par, es la media aritmética de los dos valores centrales. Si xi se repite ni veces, se suma la frecuencia absoluta Ni y se divide entre dos.

2.5. Medidas de Posición Central: La Moda

Es el valor dentro del conjunto que se repite más veces.

2.6. Medidas de Posición: Centiles y Cuartiles

Indican la posición que ocupa un valor dentro de la distribución. Ejemplos: Q1 (cuartil 1), P30 (percentil 30), D2 (decil 2). Se calcula mediante la fórmula m * N / k, donde m es la posición a calcular, N es la suma acumulada y k depende del parámetro (4 para cuartiles, 100 para percentiles, 10 para deciles).

2.7. Medidas de Dispersión: Rango o Recorrido

Mide si la distribución de la serie está concentrada o dispersa con respecto a los valores centrales.

  • Rango: R = Xmax – Xmin.
  • Rango intercuartílico: Concentra el 50% de los valores centrales. Q = Q3 – Q1.

2.8. Medidas de Dispersión: Varianza y Desviación Típica

Permiten conocer cuánto se dispersan los datos de su media.

  • A) Varianza (S²): Identifica la media de la distancia que hay entre cada uno de los valores y el punto central (X̄). Se utiliza para verificar si hay diferencias estadísticas entre medias si se estudian varios grupos.
  • B) Desviación Típica (S): Determina el promedio aritmético de esa dispersión.

2.9. Medidas de Forma de la Distribución: Asimetría y Curtosis (Kurtosis)

Si el gráfico muestra una distribución simétrica, la media divide las partes iguales; si la distribución es asimétrica (por ejemplo, asimetría a la izquierda), la mediana es mayor que la media.

Las medidas de Curtosis se aplican a distribuciones campaniformes para estudiar la distribución de la frecuencia en la zona central (medidas de apuntamiento).

Deja un comentario