Error tipo I
El error tipo 1 en estadística se define como el rechazo de la hipótesis nula cuando esta es, en realidad, cierta. Al error de tipo 1 se le conoce también como falso positivo o error de tipo alfa.
Cometer un error de tipo 1 es básicamente estar negando algo cuando en realidad es cierto. Pensemos por ejemplo en la situación de contrastar si una campaña de marketing realizada en redes sociales aumenta las ventas de helados de una empresa en una semana de verano. Las hipótesis serían las siguientes:
H0: Las ventas no aumentan debido a la campaña de verano
H1: Las ventas aumentan debido a la campaña de marketing
Tras evaluar el tráfico en web de la empresa y las páginas visitadas tras la campaña, se detecta lo siguiente:
- Aumento aunque del tráfico y las visitas de un 50%.
- Aumento de la venta de helados del 200%.
En vista de estos resultados se podría concluir que la campaña publicitaria ha sido fructífera y ha tenido un efecto llamada aumentando las ventas. Sin embargo pensemos que en esa semana hubo una ola de calor llevando las temperaturas por encima de los 40 grados.
Sabiendo esto último, tendríamos que tener en cuenta el factor de la elevada temperatura como causante del aumento de las ventas. Si no tenemos esto en cuenta podríamos rechazar nuestra hipótesis nula cuando es cierta, es decir estaríamos pensando que nuestra campaña había sido un éxito rotundo cuando en realidad el causante del aumento de las ventas era el fuerte calor. Si llegaramos a esta conclusión, estaríamos rechazando la hipótesis nula cuando esta es en realidad cierta y por tanto cometiendo un error de tipo 1.
Causas del error de tipo 1
El error de tipo 1 está relacionado con la significatividad del contraste o alfa, con el error de la estimación de los coeficientes y puede darse por 2 violaciones típicas de los supuestos de partida de una regresión. Estos son:
- La heteroscedasticidad condicional.
- La correlación serial.
Una regresión que presentara alguna de las violaciones anteriores estaría infraestimado el error de los coeficientes. De suceder esto así nuestra estimación del estadístico t, sería mayor que el estadístico t real. Estos valores más grandes del estadístico t aumentarían la probabilidad de que el valor caiga en la zona de rechazo.
Imaginemos 2 situaciones.
Situación 1 (estimación del error incorrecta)
- Significatividad: 5%
- Tamaño muestral: 300 personas.
- Valor crítico: 1,96
- B1: 1,5
- Error de la estimación del coeficiente: 0,5
T= 1,5/0,5 = 3
De esta forma el valor caería en zona de rechazo y estaríamos rechazando la hipótesis nula.
Situación 2 (estimación de error correcta)
- Significatividad: 5%
- Tamaño muestral: 300 personas.
- Valor crítico: 1,96
- B1: 1,5
- Error de la estimación del coeficiente: 1
T= 1,5/1 = 1,5
De esta forma el valor caería en zona de no rechazo y no estaríamos rechazando la hipótesis.
En base a los ejemplos anteriores, la situación 1 en la cual el error está infraestimado, nos llevaría a rechazar la hipótesis nula cuando en realidad es cierta, ya que como vemos en la situación 2 con el error correctamente estimado, no estaríamos rechazando la hipótesis al ser cierta.