Rho de Spearman

Rho de Spearman es una medida de dependencia no paramétrica en la cual se calcula la jerarquía media de las observaciones, se hace el cuadrado a la diferencias y se incorpora en la fórmula.

En otras palabras, asignamos una clasificación a las observaciones de cada variable y estudiamos la relación de dependencia entre dos variables dadas.

Las correlaciones clasificadas son una alternativa no paramétrica como medida de dependencia entre dos variables cuando no podemos aplicar el coficiente de correlación de Pearson.

Generalmente se asigna la letra giega rho al coeficiente de correlación.

La estimación de la rho de Spearman viene dada por:

Rho Spearman

Procedimiento Rho Spearman

0. Partimos de una muestra de n observaciones (Ai,Bi).

1. Clasificar las observaciones de cada variable ajustándolas por empate.

  • Utilizamos una función de excel que nos clasifique las observaciones y que las ajuste automáticamente si encuentra empates entre los elementos. Esta función recibe el nombre de JERARQUIA.MEDIA(clasificación Ai;clasificación An;orden).
  • El último factor de la función es opcional y nos dice en qué orden queremos ordenar las observaciones. Un número distinto de cero ordenará las observaciones en orden ascendente. Por ejemplo, asignará al menor elemento una clasificación de 1. Si colocamos un cero en la variable orden, asignará al mayor elemento una clasificación de 1 (orden descendente).

Ejemplo práctico

  • En nuestro caso, asignamos a la variable orden un número distinto de cero para que ordene las observaciones en orden ascendente. Es decir, asignando al menor elemento de la variable una clasificación de 1.
  • Comprobamos que las sumas totales de las columnas de Clasificación A y Clasificación B son iguales entre ellos y cumplen:
Clasificación

En este caso n=10 porque tenemos un total de 10 elementos/observaciones en cada variable A y B.

La suma total de Clasificación A es igual a la suma total de Clasificación Y y además cumplen la fórmula anterior.

Clasificacion A Y B Spearman
A B Clasificación A Clasificación B Diferencias al cuadrado
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Total 55 55 130

2. Sumar las diferencias entre las clasificaciones y elevarlas al cuadrado.

  • Una vez tenemos todas las observaciones clasificadas teniendo en cuenta los empates entre ellas, calculamos la diferencia de la forma:

di = Ai – Bi

Definimos (di) como la diferencia entre la clasificación de Ai y la clasificación de Bi.

  • Una vez obtenida la diferencia, la elevamos al cuadrado. Los cuadrados de las diferencias se aplican para tener solo valores positivos.

Definimos di2 como la diferencia al cuadrado entre la clasificación de Ai y la clasificación de Bi.

En la columna de diferencias al cuadrado tendremos:

di2 = (Ai – Bi)2

3. Calcular la rho de Spearman:

  • Calculamos la suma total de las diferencias al cuadrado de la forma:
Ejemplo Rho Spearman

                       En nuestro ejemplo:

Ejemplo 1 Rho Spearman
  • Incorporamos el resultado en la fórmula de la rho de Spearman:
Rho Spearman

En nuestro ejemplo:

Ejemplo 2 Rho Spearman

Comparación: Pearson vs Spearman

Si calculamos el coeficiente de correlación de Pearson dadas las observaciones anteriores y lo comparamos con el coeficiente de correlación de Spearman, obtenemos:

  • Pearson = 0,1109
  • Spearman = 0,2121

Podemos ver que la dependencia entre las variables A y B sigue siendo débil aún utilizando Spearman en vez de Pearson.

Si las observaciones atípicas tuvieran mucha influencia en los resultados, encontraríamos gran diferencia entre Pearson y Spearman y, por tanto, deberíamos utilizar Spearman como medida de dependencia.

¿Quieres referenciar este artículo?

Paula Rodó , 15 de enero, 2020
Rho de Spearman. Economipedia.com