Las principales magnitudes de la estadística descriptiva.

La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, resumir y presentar datos de manera informativa. Su objetivo principal es proporcionar una visión clara de los datos sin hacer inferencias o predicciones. Dentro de la estadística descriptiva, existen varias magnitudes fundamentales que ayudan a caracterizar un conjunto de datos. En este artículo, exploraremos las principales magnitudes de la estadística descriptiva, su cálculo y sus aplicaciones.

1. Medidas de tendencia central

Las medidas de tendencia central buscan representar el valor más característico o “centro” de un conjunto de datos. Las principales son:

1.1 Media aritmética

La media aritmética es el promedio de un conjunto de datos y se calcula sumando todos los valores y dividiéndolos por el número total de observaciones:

Donde:

  • Representa cada uno de los valores del conjunto de datos.
  • Es el número total de observaciones.

1.2 Mediana

La mediana es el valor que divide un conjunto de datos ordenados en dos partes iguales. Su cálculo depende de si el número de observaciones es par o impar:

  • Si hay un número impar de valores, la mediana es el valor central.
  • Si hay un número par de valores, la mediana es el promedio de los dos valores centrales.

1.3 Moda

La moda es el valor que más se repite en un conjunto de datos. Puede haber:

  • Una moda (unimodal).
  • Dos modas (bimodal).
  • Más de dos modas (multimodal).

2. Medidas de dispersión

Las medidas de dispersión indican cuánto varían los datos respecto a la media o a otros valores centrales.

2.1 Rango

El rango es la diferencia entre el valor máximo y el mínimo del conjunto de datos:

2.2 Varianza

La varianza mide la dispersión de los datos respecto a la media:

Para muestras, se usa la varianza muestral:

2.3 Desviación estándar

La desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de la dispersión en las mismas unidades que los datos:

2.4 Coeficiente de variación

El coeficiente de variación (cv) expresa la desviación estándar en relación con la media, permitiendo comparar la variabilidad de diferentes conjuntos de datos:

3. Medidas de posición

Estas medidas permiten ubicar un valor dentro de un conjunto de datos.

3.1 cuartiles

Dividen los datos en cuatro partes iguales:

  • (primer cuartil): 25% de los datos están por debajo de este valor.
  • (segundo cuartil o mediana): 50% de los datos están por debajo de este valor.
  • (tercer cuartil): 75% de los datos están por debajo de este valor.

3.2 Percentiles

Dividen los datos en 100 partes iguales, permitiendo conocer la posición relativa de un dato en el conjunto.

4. Medidas de forma

Las medidas de forma describen la distribución de los datos respecto a la simetría y la curtosis.

4.1 Coeficiente de asimetría

Indica si los datos están sesgados hacia la izquierda o derecha:

  • Asimetría positiva: la cola derecha es más larga.
  • Asimetría negativa: la cola izquierda es más larga.
  • Asimetría cero: distribución simétrica.

4.2 Curtosis

La curtosis mide el grado de apuntamiento de la distribución:

  • Curtosis positiva (leptocúrtica): distribución con colas largas.
  • Curtosis negativa (platicúrtica): distribución con colas cortas.
  • Curtosis nula (mesocúrtica): distribución normal.

5. Representación gráfica de los datos

Para complementar el análisis estadístico, se utilizan gráficos:

  • Histograma: representa la distribución de frecuencias de los datos.
  • Diagrama de cajas y bigotes: muestra la mediana, los cuartiles y los valores atípicos.
  • Polígono de frecuencias: conecta los puntos medios de las clases en una distribución de frecuencias.
  • Gráfico de barras: representa datos categóricos.
  • Gráfico de dispersión: muestra la relación entre dos variables cuantitativas.

6. Aplicaciones de la estadística descriptiva

La estadística descriptiva se aplica en diversas áreas:

  • Economía: análisis de inflación y tasas de empleo.
  • Medicina: análisis de datos epidemiológicos.
  • Marketing: estudio del comportamiento del consumidor.
  • Educación: evaluación del rendimiento académico.
  • Ciencias sociales: investigación sobre tendencias de población.

Conclusión

Las magnitudes de la estadística descriptiva permiten analizar y resumir datos de manera efectiva. Comprender las medidas de tendencia central, dispersión, posición y forma ayuda a interpretar los datos con precisión. Su aplicación en diversos campos demuestra su importancia en la toma de decisiones basada en datos.