El teorema central del límite (TCL) es una teoría estadística que establece que, dada una muestra suficientemente grande de la población, la distribución de las medias muestrales seguirá una distribución normal.

Además, el TCL afirma que a medida que el tamaño de la muestra se incrementa, la media muestral se acercará a la media de la población. Por tanto, mediante el TCL podemos definir la distribución de la media muestral de una determinada población con una varianza conocida. De manera que la distribución seguirá una distribución normal si el tamaño de la muestra es lo suficientemente grande.

Principales propiedades del teorema central del límite

El teorema central del límite tiene una serie de propiedades de gran utilidad en el ámbito estadístico y probabilístico. Las principales son:

  • Si el tamaño de la muestra es suficientemente grande, la distribución de las medias muestrales seguirá aproximadamente una distribución normal. El TCL considera una muestra como grande cuando el tamaño de la misma es superior a 30. Por tanto, si la muestra es superior a 30, la media muestral tendrá una función de distribución próxima a una normal. Y esto se cumple independientemente de la forma de la distribución con la que estamos trabajando.
  • La media poblacional y la media muestral serán iguales. Es decir, la media de la distribución de todas las medias muestrales será igual a la media del total de la población.
  • La varianza de la distribución de las medias muestrales será σ²/n. Que es la varianza de la población dividido entre el tamaño de la muestra.

Que la distribución de las medias muestrales se parezca a una normal es tremendamente útil. Porque la distribución normal es muy fácil de aplicar para realizar contrastes de hipótesis y construcción de intervalos de confianza. En estadística que una distribución sea normal es bastante importante, dado que muchos estadísticos requieren este tipo de distribución. Además, el TCL nos permitirá hacer inferencia sobre la media poblacional a través de la media muestral. Y esto es de gran utilidad cuando por falta de medios no podemos recolectar datos de toda una población.

Ejemplo del teorema central del límite

Imaginemos que queremos analizar las rentabilidades medias históricas del índice S&P 500, que como sabemos, tiene unas 500 compañías dentro del mismo. Pero no tenemos suficiente información como para analizar la totalidad de las 500 compañías del índice. En este caso la rentabilidad media del S&P 500 sería la media poblacional.

Ahora bien, siguiendo al TCL podemos coger una muestra de estas 500 empresas para realizar el análisis. La única limitación que tenemos es que en la muestra tiene que haber más de 30 compañías para que se cumpla el teorema. Entonces imaginemos que cogemos 50 compañías del índice de manera aleatoria y repetimos el proceso varias veces. Los pasos a seguir del ejemplo serían los siguientes:

  • Elegimos la muestra de unas 50 compañías y obtenemos la rentabilidad media de la totalidad de la muestra.
  • De manera continuada seguimos escogiendo 50 compañías y obtenemos la rentabilidad media.
  • La distribución de todas las rentabilidades medias de todas las muestras escogidas se aproximará a una distribución normal.
  • Las rentabilidades medias de todas las muestras seleccionadas se aproximará a la rentabilidad media del total del índice. Tal y como demuestra el teorema Central del Límite.

Por tanto mediante inferencia de la rentabilidad media de la muestra podemos acercarnos a la rentabilidad media del índice.