Medidas de simetría o asimetría Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo: Índice de simetría de Pearson:
Índice de simetría de Fisher:
Si la distribución es simétrica, ambos índices son iguales a 0; si es asimétrica a la derecha, ambos son positivos; y si es asimétrica a la izquierda, ambos índices son negativos. Medidas de curtosis Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:
Si este coeficiente es nulo, la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayorconcentración de los datos en torno a la media. Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada que la primera.
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística. Desviación media La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Desviación típica La desviación típica es la raíz cuadrada de la varianza.
Las medidas de posición dividen un
conjunto de datos en grupos con el mismo número de individuos.
Para
calcular las medidas de posición es necesario que
los datos estén ordenados de menor a mayor.
Las
medidas de posición son:
Cuartiles
Los cuartiles
dividen la serie de datos en cuatro partes iguales. Para calcular
cuartiles se localiza la posición del cuartil solicitado, aplicando la fórmula
de posición: Luego
se aplica la fórmula para determinar un cuartil determinado:
Deciles
Los deciles dividen
la serie de datos en diez partes iguales. El cálculo es similar a las
cuartiles solamente que se calcula con la fórmula:
Percentiles
Los percentiles dividen
la serie de datos en cien partes iguales. Para el calcula de las
percentiles utilizamos la fórmula:
Nos indican
en torno a qué valor (centro) se distribuyen los datos:
Media aritmética
Se define la media aritmética como la suma de
todos los datos dividida por el número de datos. Se representa por
Para
calcular la media aritmética hacemos:
Sin embargo, podemos
observar que aparecen datos repetidos y que en un estudio estadístico tenemos
los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto,
podemos simplificar el cálculo de la media aritmética con la fórmula:
Si la
variable es continua, el cálculo se hace de la misma forma pero utilizando las
marcas de clase.
Mediana
Si ordenamos
todos los valores de la variable de menor a mayor, se define la mediana como el
valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si
hay un número impar de valores, habrá un sólo valor central; mientras que si
hay un número par de valores habrá dos valores centrales.
También
vamos a distinguir para su cálculo entre variable
discreta y variable continua.
Si la
variable es discreta y el número de
datos es impar, la mediana será el dato que ocupe el lugar central.
Si la
variable es discreta y el número de
datos es par, la mediana será la media aritmética de los dos valores centrales.
Si la
variable es continua, no
distinguiremos si el número de datos es par o impar, tendremos un intervalo
para la mediana. Igual que se ha hecho con la moda podemos suponer que los
datos se distribuyen uniformemente en los intervalos y calcular la mediana con
la siguiente fórmula:
En la que N representa el número de
datos y F se refiere a la frecuencia
absoluta acumulada.
Moda
Se define la
moda como el valor de la variable que más se repite, es el decir, aquél que
tiene mayor frecuencia absoluta. Se representa por Mo.
Vamos a
distinguir para el cálculo de la moda entre variables discretas y continuas.
Si la
variable es discreta, el cálculo de
la moda no presenta ninguna dificultad, únicamente observamos las frecuencias,
vemos cuál es la mayor y la moda será el valor de la variable correspondiente a
dicha frecuencia.
Sin embargo
si la variable es continua la mayor
frecuencia absoluta corresponde a un intervalo, del que decimos que es el
intervalo modal. Pero si queremos calcular un único valor de la variable para
la moda, aplicamos la siguiente fórmula:
En la que Li representa el límite inferior del
intervalo modal, c es la amplitud
del intervalo y fMo, fMo-1 y fMo+1 son las frecuencias del intervalo modal, el anterior y el
posterior.
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.