Sesgo de supervivencia

Lectura: 2 min

El sesgo de supervivencia es un sesgo que se produce en la recolección de datos cuando se excluyen datos del análisis porque ya no existen en la actualidad.

Este sesgo surge en una amplia variedad de contextos donde nos centramos solamente en esos datos “supervivientes”. Un ejemplo de esto se ve cuando las empresas hacen encuestas a sus clientes acerca de alguno de sus productos. Pero dejan en el olvido a sus no clientes, que en este caso serían los “no supervivientes”.

En este caso, el extraer conclusiones de ese estudio, sería algo erróneo. Ya que los resultados estarían sesgados solo a la población “superviviente”. Y no serían unos resultados representativos.

El sesgo de supervivencia en la práctica

Un claro ejemplo de este sesgo, se puede ver en el estudio de resultados de los fondos de inversión. Donde la mayoría de las bases de datos sólo incluyen los fondos que existen en la actualidad. Sin tener en cuenta a los fondos que existían en el pasado.

La causa del porque no existen en la actualidad, es porque su rendimiento ha sido peor que los “supervivientes”. O incluso varios fondos se han fusionado en uno sólo. Por lo tanto, se está realizando el análisis sobre aquellos fondos con mejores resultados. Y este sesgo, tiende a sobreestimar el rendimiento de la muestra de estos fondos.

El principal problema de esto ya no es sólo esa sobreestimación del rendimiento de los fondos. Sino que la muestra seleccionada no sería una muestra aleatoria de la población total. Y, por ende, los resultados del estudio podrían no ser representativos de la población. Que al final esto es lo que buscamos a la hora de seleccionar una muestra aleatoria de la población.

Solución al sesgo de supervivencia

Imaginémonos que queremos seleccionar algún fondo de inversión para invertir en el, en base a su comportamiento pasado. Para evitar este sesgo de supervivencia y optimizar esa selección, deberíamos realizar los siguientes pasos:

  • Elegir el horizonte temporal con el que pensemos trabajar. Por ejemplo, diez, quince o veinte años de historia.
  • Coger todos los fondos existentes desde inicio del horizonte temporal, existan o no en la actualidad.
  • A partir de ahí, seleccionar la muestra de esa población para el estudio del comportamiento.

La idea de esto, es al final, conseguir esa muestra aleatoria de la población. Y partir de ahí, las conclusiones obtenidas, si podrían ser representativas de esa población.

Comparte este artículo

SI TE HA GUSTADO ESTE ARTÍCULO, TE RECOMENDAMOS LEER:

Deja un comentario