27 Oct
1. Codificación e Introducción de Datos
Codificar implica traducir respuestas a números y agrupar datos.
1.1. Tabulación de Datos Unidireccional (o Simple)
Consiste en el recuento del número de casos, presentados en tablas con columnas que representan:
- Xi: Las diferentes respuestas a la pregunta.
- Fi o Ni: La frecuencia absoluta.
- Pi: La frecuencia relativa o porcentajes de las respuestas.
Tipos de Escalas de Tabulación Simple
- Escala nominal: Solo permite la distinción de categorías.
- Escala ordinal: Permite la ordenación de clases (creciente o decreciente).
- Escala cardinal o de intervalo: Combina la ordenación con la distancia entre clases.
- Registro de datos: Se registran los datos con cualquier número.
1.2. Tabulación de Datos Cruzada
Se utiliza para poner en relación las respuestas de dos o más preguntas diferentes ligadas entre sí. Utiliza un cuadro de doble entrada (al principio de la línea y al final se indican las frecuencias (Fi, Pi)); en los cruces se muestran las frecuencias conjuntas.
1.3. Tratamiento de los Datos
El tratamiento de los datos puede clasificarse en:
- (A) Estadística analítica: Si los datos son tratados matemáticamente.
- (B) Estadística descriptiva: Si los datos se presentan en tablas o gráficos.
- (C) Estadística inferencial: Permite sacar conclusiones estadísticas de una muestra (“n”) y extender los resultados a la población total (“N”).
Variables Estadísticas
Las variables estadísticas se clasifican en:
- a) Cuantitativas: Solo toman valores numéricos.
- Discretas: Toman números aislados (ejemplo: número de hijos).
- Continuas: Toman cualquier valor (incluyendo decimales).
- b) Cualitativas: Representan la propiedad que se estudia sin utilizar números (ejemplo: color de pelo).
- Ordinales: Permiten un orden (de mayor a menor, pero sin valor numérico).
- Nominales: No permiten ordenación.
1.4. Representación Gráfica de los Datos
El tipo de representación gráfica depende de los objetos a representar, de la escala y de la variable. Los tipos comunes son:
- Diagrama de líneas.
- Diagrama de área.
- Diagrama de barras (utilizado para variables cualitativas y cuantitativas discretas).
- Diagrama de sectores (utilizado para variables cualitativas).
- Pictogramas (utilizado para variables cualitativas y cuantitativas).
- Histogramas (formado por rectángulos; utilizado para variables cuantitativas continuas).
- Polígonos de frecuencia (bloques unidos por puntos; utilizado para variables cuantitativas continuas).
1.4.1. Objetivos de los Tipos de Gráficos
Los gráficos se utilizan para:
- Comparar valores (diagrama de barras nominal y ordinal).
- Analizar comportamiento (diagrama de línea o área).
- Estudiar distribución (diagrama de sectores nominal y ordinal).
- Clasificar datos (diagrama de barras nominal y ordinal).
2. Análisis de Datos
2.1. Análisis Univariable de Datos
Se realiza a través de la tabulación simple. Se debe tener en cuenta el tipo de escala. Los resultados obtenidos incluyen:
- (A) Frecuencias relativas o porcentajes (Pi).
- (B) Medidas de tendencia central o de posición: moda, mediana, media aritmética.
- (C) Medidas de dispersión: varianza, desviación típica.
2.2. Análisis Multivariable de Datos
Permite analizar varias variables a la vez. Se aplica en la investigación comercial porque permite:
- (A) Analizar a la vez toda la información.
- (B) Analizar un gran número de encuestas.
- (C) Hacer comprensible la gran cantidad de datos.
Clasificación de Métodos Multivariables
- Métodos descriptivos/interdependencia: Todas las variables están relacionadas unas con otras.
- Método de clasificación: Agrupa individuos o empresas a partir de unas variables de partida (ejemplo: el análisis cluster).
- Análisis factorial o de componentes (métodos descriptivos).
- Métodos explicativos/de dependencia: Explican unas variables en función de otras (ejemplo: métodos de segmentación y el análisis discriminante).
- Métodos estructurales: Analizan cómo las variables están relacionadas entre sí y cómo las variables interdependientes afectan a las dependientes.
2.2.1. Clasificación de Métodos Explicativos (Dependencia)
Dentro de los métodos explicativos, hay dos grupos principales:
- Si la variable dependiente es cuantitativa:
- Análisis de regresión: Analiza la relación entre la variable dependiente y varias independientes (ejemplo: predecir el gasto en consumibles a partir de la compra de materiales).
- Análisis de varianza (ANOVA): Se utiliza si la muestra se divide en grupos basados en variables independientes cualitativas y la dependiente es cuantitativa (ejemplo: si queremos saber si hay diferencia en el nivel de colesterol dependiente del sexo).
- Si la variable dependiente es cualitativa:
- Análisis discriminante: Explica la pertenencia de individuos u objetos a grupos preestablecidos (ejemplo: determinar los ratios financieros de empresas rentables o no).
Métodos Descriptivos (Interdependencia)
Miden asociaciones, pero no establecen relaciones de causalidad.
- Análisis factorial: Se analizan las interrelaciones entre variables cuantitativas, explicándolas en términos de un número menor de factores (si son inobservables) o de componentes principales (si son observables). (Ejemplo: conocer el estado financiero de una empresa a partir de ratios financieros).
Proceso del Análisis Multivariable
- Objetivos del análisis (problema, técnicas, etc.).
- Diseño del análisis (tamaño de la muestra “n”).
- Hipótesis del análisis.
- Realización del análisis y ajuste de datos (desviaciones).
- Interpretación de resultados (validez).
2.3. Medidas de Posición Central: Media Aritmética Ponderada
Los datos se agrupan en torno al valor central. Se consideran las variables (xi) y el número de veces que se repiten (ni), calculando la frecuencia absoluta (Ni).
2.4. Medidas de Posición Central: La Mediana
Es el valor que divide en dos partes iguales a un conjunto de datos ordenados. Si el número de datos es impar, la mediana es un valor; si es par, es la media aritmética de los dos valores centrales. Si xi se repite ni veces, se suma la frecuencia absoluta Ni y se divide entre dos.
2.5. Medidas de Posición Central: La Moda
Es el valor dentro del conjunto que se repite más veces.
2.6. Medidas de Posición: Centiles y Cuartiles
Indican la posición que ocupa un valor dentro de la distribución. Ejemplos: Q1 (cuartil 1), P30 (percentil 30), D2 (decil 2). Se calcula mediante la fórmula m * N / k, donde m es la posición a calcular, N es la suma acumulada y k depende del parámetro (4 para cuartiles, 100 para percentiles, 10 para deciles).
2.7. Medidas de Dispersión: Rango o Recorrido
Mide si la distribución de la serie está concentrada o dispersa con respecto a los valores centrales.
- Rango: R = Xmax – Xmin.
- Rango intercuartílico: Concentra el 50% de los valores centrales. Q = Q3 – Q1.
2.8. Medidas de Dispersión: Varianza y Desviación Típica
Permiten conocer cuánto se dispersan los datos de su media.
- A) Varianza (S²): Identifica la media de la distancia que hay entre cada uno de los valores y el punto central (X̄). Se utiliza para verificar si hay diferencias estadísticas entre medias si se estudian varios grupos.
- B) Desviación Típica (S): Determina el promedio aritmético de esa dispersión.
2.9. Medidas de Forma de la Distribución: Asimetría y Curtosis (Kurtosis)
Si el gráfico muestra una distribución simétrica, la media divide las partes iguales; si la distribución es asimétrica (por ejemplo, asimetría a la izquierda), la mediana es mayor que la media.
Las medidas de Curtosis se aplican a distribuciones campaniformes para estudiar la distribución de la frecuencia en la zona central (medidas de apuntamiento).

Deja un comentario