Varianza: Qué es, fórmula y ejemplos
- La varianza es una medida de dispersión que indica cuánto se alejan los datos de su media.
- Elevar al cuadrado los residuos evita sumas negativas, permitiendo que la varianza siempre sea positiva.
- La varianza es fundamental para calcular otros parámetros estadísticos, como la covarianza, y se utiliza en matrices econométricas.
¿Qué es la varianza?
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media.
Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones, entendiendo como residuo a la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.
La varianza: Explicación sencilla
La varianza es una forma de entender cuánto se alejan algunos valores del promedio de un grupo de ellos. Por ejemplo, imagina que tienes una lista de números que representan los precios de algunos pisos de tu barrio. La varianza te ayuda a ver si los precios están muy dispersos o no. Si todos están cerca del promedio, la varianza será baja, pero si están muy esparcidos, la varianza será alta.
También se puede calcular como la desviación típica al cuadrado.
Antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha información sobre una variable en concreto.
Fórmula para calcular la varianza
La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede ser menor que cero.
Donde
- X: variable sobre la que se pretenden calcular la varianza
- xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
- n: número de observaciones.
- x̄: Es la media de la variable X.
O lo que es lo mismo:
¿Por qué se elevan al cuadrado los residuos?
La razón por la que los residuos se elevan al cuadrado es sencilla. Si no se elevasen al cuadrado, la suma de residuos sería cero. Es una propiedad de los residuos. Así pues para evitarlo, tal como ocurre con la desviación típica se elevan al cuadrado. El resultado es la unidad de medida en la que se miden los datos pero elevada al cuadrado.
Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de personas en euros, el dato que arroja la varianza sería en euros cuadrados. Para que tenga sentido la interpretación calcularíamos la desviación típica y pasaríamos el dato a euros.
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
- Desviación -> (2-3) = -1
- Desviación -> (4-3) = 1
Si sumamos todas las desviaciones el resultado es cero.
¿Qué diferencia existe entre la varianza y la desviación típica?
Una cuestión que se podría plantear, y con razón, sería la diferencia entre varianza y desviación típica. En realidad, vienen a medir lo mismo. La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza.
La desviación típica se hace para poder trabajar en las unidades de medida iniciales. Claro que, como es normal, uno puede preguntarse, ¿de qué sirve tener como concepto la varianza? Bien, aunque la interpretación del valor que arroja no nos da demasiada información, su cálculo es necesario para obtener el valor de otros parámetros.
Para calcular la covarianza necesitamos la varianza y no la desviación típica, para calcular algunas matrices econométricas se utiliza la varianza y no la desviación típica. Es una cuestión de comodidad a la hora de trabajar con los datos en según qué cálculos.
Ejemplo de cálculo de la varianza
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con un salario diferente:
Juan: 1.500 euros
Pepe: 1.200 euros
José: 1.700 euros
Miguel: 1.300 euros
Mateo: 1.800 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:
Obtendremos que se debe calcular tal que:
El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros. Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de 228 euros.
En Economipedia, queremos resolver todas tus dudas. Por eso, hemos recopilado las preguntas más frecuentes sobre este tema. Si no encuentras la respuesta que buscas, no dudes en dejarnos un comentario.
¿Qué es la varianza y cómo se calcula?: La varianza es una medida de dispersión que indica cuánto varían los datos respecto a su media, calculándose como la suma de los cuadrados de las diferencias entre cada valor y la media, dividido por el total de observaciones.
¿Por qué es importante la varianza en estadística?: La varianza proporciona información crucial sobre la variabilidad de un conjunto de datos, permitiendo entender el grado de dispersión de los datos alrededor de la media.
¿Cómo se relaciona la varianza con la desviación estándar?: La varianza y la desviación estándar miden la dispersión de un conjunto de datos, pero la desviación estándar es la raíz cuadrada de la varianza, lo que facilita su interpretación al estar en las mismas unidades que los datos.