Distribución normal: Qué es, cómo se calcula y ejemplos
- La distribución normal es un modelo teórico que aproxima el comportamiento de una variable aleatoria a una situación ideal, utilizando la media y la desviación típica como parámetros clave.
- Para representar una distribución normal, se necesita una variable aleatoria, calcular su media y desviación típica, y elegir entre función de densidad de probabilidad o función de distribución.
- La distribución normal se utiliza en diversos campos y es la base para otras distribuciones estadísticas, como la distribución t de Student, la distribución ji-cuadrada y la distribución F de Fisher.
¿Qué es la distribución normal?
Es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a una situación ideal.
La distribución normal explicada fácil
La distribución normal es una forma de describir cómo se comportan ciertos datos. Imagina que tienes un conjunto de datos, como los resultados de un examen o las rentabilidades de las acciones en el mercado. Ésta nos ayuda a entenderlos usando dos números claves: la media y la desviación típica.
La media es como el promedio de los datos, mientras que la desviación típica nos dice qué tan dispersos están los datos alrededor de este promedio.
Hay dos tipos de datos que podemos analizar gracias a ella: Uno es el tipo continuo, que puede tomar cualquier valor. Piensa en cosas como las valoraciones de un examen o del coeficiente de inteligencia. El otro tipo es el discreto, que sólo pueden ser números enteros, como por ejemplo el número de estudiantes de una universidad.
La distribución normal es la base de otras distribuciones como la t de Student, la ji-cuadrada, y la F de Fisher entre otras.
Fórmula de la distribución normal
Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones puede aproximarse satisfactoriamente a una distribución normal tal que:
Donde los parámetros de la distribución son la media o valor central y la desviación típica:
En otras palabras, estamos diciendo que la frecuencia de una variable aleatoria X puede representarse mediante una distribución normal.
Representación
Función de densidad de probabilidad de una variable aleatoria que sigue una distribución normal.
Propiedades
- Es simétrica. El valor de la media, la mediana y la moda coinciden. Matemáticamente,
Media = Mediana = Moda
- Distribución unimodal. Los valores que son más frecuentes o que tienen más probabilidad de aparecer están alrededor de la media. En otras palabras, cuando nos alejamos de la media, la probabilidad de aparición de los valores y su frecuencia descienden.
¿Qué necesitamos para representar una distribución normal?
- Una variable aleatoria.
- Calcular la media.
- Calcular la desviación típica.
- Decidir la función que queremos representar: función de densidad de probabilidad o función de distribución.
Ejemplo teórico
Suponemos que queremos saber si los resultados de un examen pueden aproximarse satisfactoriamente a una distribución normal.
Sabemos que en este examen participan 476 estudiantes y que los resultados podrán oscilar entre 0 y 10. Calculamos la media y la desviación típica a partir de las observaciones (resultados del examen).
Entonces, definimos la variable aleatoria X como los resultados del examen que depende de cada resultado individual. Matemáticamente,
El resultado de cada estudiante se anota en una tabla. De esta forma, obtendremos una visión global de los resultados y de su frecuencia.
Resultados | Frecuencia |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOTAL | 475 |
Una vez hecha la tabla, representamos los resultados del examen y las frecuencias. Si el gráfico se parece a la imagen anterior y cumple con las propiedades, entonces, la variable resultados del examen puede aproximarse satisfactoriamente a una distribución normal de media 4,86 y desviación típica de 2,56.
¿Los resultados del examen pueden aproximarse a una distribución normal?
Razones para considerar dicho caso son:
- Distribución simétrica. Es decir, existe el mismo número de observaciones tanto a la derecha como a la izquierda del valor central. También, que la media, la mediana y la moda tienen el mismo valor.
Media = Mediana = Moda = 5
- Las observaciones con más frecuencia o probabilidad están alrededor del valor central. En otras palabras, las observaciones con menos frecuencia o probabilidad se encuentran lejos del valor central.
La distribución normal describe la variable aleatoria mediante una aproximación que produce errores estándar (las barras encima de cada columna). Estos errores son la diferencia entre las observaciones reales (resultados) y la función de densidad.
En Economipedia, queremos resolver todas tus dudas. Por eso, hemos recopilado las preguntas más frecuentes sobre este tema. Si no encuentras la respuesta que buscas, no dudes en dejarnos un comentario.
¿Qué es la distribución normal?: La distribución normal, también conocida como distribución gaussiana, es un modelo estadístico que describe cómo se distribuyen los valores de un conjunto de datos alrededor de la media.
¿Cuáles son las características principales de la distribución normal?: Las características principales de la distribución normal incluyen su forma de campana simétrica, la media, mediana y moda coincidentes en el centro, y la propiedad de que aproximadamente el 68% de los datos caen dentro de una desviación estándar de la media.
¿Cómo se interpreta el gráfico de la distribución normal?: El gráfico de la distribución normal muestra la frecuencia de los datos. El eje horizontal representa los valores de los datos, y el vertical la frecuencia. La curva simétrica indica que los datos cerca de la media son más frecuentes.