Estimador insesgado
Un estimador insesgado es aquel cuya esperanza matemática coincide con el valor del parámetro que se desea estimar. En caso de no coincidir se dice que el estimador tiene sesgo.
La razón de buscar un estimador insesgado es que el parámetro que deseamos estimar esté bien estimado. Es decir, si queremos estimar la media de goles por partido de determinado jugador de fútbol, hemos de utilizar una fórmula que nos proporcione un valor lo más aproximado posible al valor real.
En caso de que la esperanza del estimador no coincida con el verdadero valor del parámetro se dice que el estimador tiene un sesgo. El sesgo se mide como la diferencia entre el valor de la esperanza del estimador y el valor verdadero. Matemáticamente se puede notar como sigue:
De la fórmula anterior queda clara la primera parte y la última. Es decir, la esperanza del estimador es igual al verdadero valor del parámetro. Si se cumple esta igualdad, entonces el estimador es insesgado. La parte de en medio, matemáticamente más abstracta, se explica en el siguiente párrafo.
La media de todas las estimaciones que puede realizar el estimador para cada muestra diferente, es igual al parámetro. Por ejemplo, si tenemos 30 muestras diferentes, lo normal es que en cada muestra el estimador (aunque sea por poco) ofrezca valores diferentes. Si realizamos la media de los 30 valores del estimador en las 30 muestras diferentes, entonces el estimador debe arrojar un valor igual al verdadero valor del parámetro.
El sesgo de un estimador
No siempre se puede encontrar un estimador insesgado para calcular cierto parámetro. Así pues, puede que nuestro estimador tenga sesgo. Que un estimador tenga sesgo no quiere decir que no sea válido. Simplemente, quiere decirnos que no se ajusta todo lo bien que estadísticamente nos gustaría.
Dicho esto, aunque no se ajuste todo lo bien que nos gustaría, en ocasiones, no nos queda otra opción que utilizar un estimador con sesgo. Por tanto, resulta fundamental que conozcamos el tamaño de ese sesgo. Si lo conocemos, podemos utilizar esa información en las conclusiones de nuestra investigación. Matemáticamente el sesgo se define del siguiente modo:
En la fórmula anterior el sesgo es un valor distinto de cero. Si fuese cero, entonces el estimador sería insesgado.
Ejemplo de estimador insesgado
Un ejemplo de estimador insesgado lo encontramos en el estimador media. Este estimador es conocido en estadística como media muestral. Si utilizamos la fórmula matemática descrita al principio llegamos a la conclusión de que la media muestral es un estimador insesgado. Antes de operar, hemos de tener en cuenta la siguiente información:
Denotamos X con una barrita arriba a la media muestral.
La fórmula de la media muestral es la suma de los n valores que tenemos dividido entre el número de valores. Si tenemos 20 datos, n será igual a 20. Tendremos que sumar los valores de los 20 datos y dividirlo entre 20.
La notación anterior significa esperanza o valor esperado de la media muestral. Coloquialmente, podríamos decir que se calcula como el valor medio de la media muestral. Con esto en mente, utilizando las técnicas matemáticas adecuadas podemos deducir lo siguiente:
La esperanza del estimador coincide con ‘mu’ que es el verdadero valor del parámetro. Es decir, la media real. Todo sea dicho, son necesarios unos conceptos básicos sobre matemáticas, para entender el anterior desarrollo.
Del mismo modo, podríamos intentar hacer lo mismo con el estimador de la varianza muestral. En lo que sigue S al cuadrado es la varianza muestral y la letra griega sigma (que parece la letra o con un palito a la derecha) es la varianza real.
La diferencia de la fórmula anterior es la segunda parte de la primera fórmula. Es decir:
Concluimos que la varianza muestral como estimador de la varianza poblacional es sesgado. Su sesgo vale igual al valor indicado anteriormente. Así, depende de la varianza poblacional y del tamaño de la muestra (n). Nótese que si n (tamaño de la muestra) se hace muy grande, el sesgo tiende a cero.
Si cuando la muestra tiende a un tamaño muy grande el estimador se acerca al verdadero valor del parámetro, entonces estaremos hablando de un estimador asintóticamente insesgado.