Niveles de significación
Los niveles de significación son el complemento al intervalo de confianza de una distribución y se utilizan para contrastar la hipótesis nula (H0) en una prueba de inferencia estadística.
En otras palabras, los niveles de significación son las probabilidades que dejamos fuera del intervalo de confianza de una distribución y nos ayudan a determinar si el estadístico de contraste está en zona de rechazo o no.
Relación entre nivel de significación y nivel de confianza
Seguro que todos hemos oído alguna vez a alguien preguntar qué valor deberíamos asignar al alpha de la distribución o con qué nivel de confianza calculamos el intervalo, matemáticamente, (1-alpha). La respuesta acostumbra a ser siempre 1%, 5% o 10% para el alpha o 99%, 95% y 90% para el nivel de confianza.
Es importante tener claro lo siguiente:
- 1%, 5%, 10% = alpha => Niveles de significación.
- 99%, 95%, 90% = (1-alpha) => Intervalo de confianza.
Los intervalos de confianza y los niveles se significación son complementarios dado que la suma de ambos es el área de la función de densidad. Entonces,
Ya sabemos que el área de la función de densidad es 1. Matemáticamente, somos capaces de dar solución a esta integral:
Representación del nivel de significación
En este caso, se ha utilizado la distribución t de Student con 16 grados de libertad para mostrar qué áreas de la función pertenecen a los niveles de significación. Los porcentajes (2,5%, 2,5% y 95%) corresponden al área que hay bajo la función de densidad. Como esta distribución tiene dos colas, el nivel de significación está dividido por la mitad, entonces, 2,5% + 2,5% = 5%. El valor crítico de esta distribución con 16 grados de libertad y 5% como nivel de significación es 2,11991 en cada cola.
2,5% + 2,5% + 95% = 1%
Universales
Etiquetamos a los niveles de significación como universales porque estos niveles son conocidos y utilizados en todos los contrastes estadísticos. Es muy poco usual encontrar un nivel de significación del 20% o 35% a no ser que sea una condición explícita del contraste.
Es cierto que los niveles 1% y 5% son más populares que el nivel 10%, pero es por razones de precisión. Es mejor dar un resultado 1 de cada 100 veces (1/100 = 0,01 = 1%) o 5 de cada 100 veces (5/100 = 0,05 = 5%) que 10 de cada 100 veces (10/100 = 0,1 = 10%), ¿verdad?
También, los niveles de significación reciben el nombre de percentil, por ejemplo, percentil 1% o percentil 5%. Esta nomenclatura es muy utilizada para el cálculo de la métrica valor en riesgo (VaR).
Arbitrarios y no arbitrarios
Los niveles de significación pueden ser arbitrarios y no arbitrarios. Los arbitrarios son los valores que escogemos a priori (antes) de saber las características del experimento. En este caso, sería antes de calcular el estadístico de contraste. Los no arbitrarios son los que se obtienen a partir de un resultado del experimento. En este caso, el valor-p, porque depende del valor que tome estadístico de contraste. Ambos dependen de la distribución que sigan los datos.