lunes, 28 de noviembre de 2016

Medidas de Forma

Medidas de simetría o asimetría
Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo:

Índice de simetría de Pearson:  

                                                                 


Índice de simetría de Fisher

                                                    


Si la distribución es simétrica, ambos índices son iguales a 0; si es asimétrica a la derecha, ambos son positivos; y si es asimétrica a la izquierda, ambos índices son negativos.

Medidas de curtosis 
Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:

                                   

Si este coeficiente es nulo, la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.

Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayor concentración de los datos en torno a la media.

Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada que la primera.




Medidas de dispersión

Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución.

Las medidas de dispersión son:

Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

                     
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.

                                                     
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.



                                             




Medidas De Posición

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

Las medidas de posición son:

Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales. Para calcular cuartiles se localiza la posición del cuartil solicitado, aplicando la fórmula de posición:
                                                  
                                  Cálculo de los cuartiles
Luego se aplica la fórmula para determinar un cuartil determinado:
                       
                           fórmula de los cuartiles


Deciles

Los deciles dividen la serie de datos en diez partes iguales. El cálculo es similar a las cuartiles solamente que se calcula con la fórmula:
                 
                                   Cálculo de los cuartiles

                fórmula de los cuartiles

Percentiles

Los percentiles dividen la serie de datos en cien partes iguales. Para el calcula de las percentiles utilizamos la fórmula:

                                                        Cálculo de los cuartiles

                                   fórmula de los cuartiles



Medidas de centralización

Nos indican en torno a qué valor (centro) se distribuyen los datos:

Media aritmética

Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Se representa por
  
Para calcular la media aritmética hacemos:

               
         
Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la fórmula:

         
Si la variable es continua, el cálculo se hace de la misma forma pero utilizando las marcas de clase.

Mediana

Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales.

También vamos a distinguir para su cálculo entre variable discreta y variable continua.

Si la variable es discreta y el número de datos es impar, la mediana será el dato que ocupe el lugar central.

Si la variable es discreta y el número de datos es par, la mediana será la media aritmética de los dos valores centrales.

Si la variable es continua, no distinguiremos si el número de datos es par o impar, tendremos un intervalo para la mediana. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula:

                                    

En la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada.


Moda

Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.

Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas.

Si la variable es discreta, el cálculo de la moda no presenta ninguna dificultad, únicamente observamos las frecuencias, vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia.

Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo, del que decimos que es el intervalo modal. Pero si queremos calcular un único valor de la variable para la moda, aplicamos la siguiente fórmula:
         
                              
                             

En la que Li representa el límite inferior del intervalo modal, c es la amplitud del intervalo y fMo, fMo-1 y fMo+1 son las frecuencias del intervalo modal, el anterior y el posterior.



domingo, 27 de noviembre de 2016

Tipos de parámetros estadísticos

Hay cuatro tipos parámetros estadísticos:

  • De centralización.
  • De posición.
  • De dispersión.
  • De forma.





Parámetros estadísticos

Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.  
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.
                                  
                   Archivo:Promedio edad mundo.png