Saltar a un capítulo clave
Definición del coeficiente de correlación de rangos de Spearman
Recuerda que el coeficiente de correlación producto-momento (CCMP) se utiliza para medir una correlación lineal entre dos variables.
Consulta los artículos Correlación y Coeficiente de correlación del momento del producto para obtener más detalles.
Pero, ¿y si tus datos no están correlacionados linealmente, o ni siquiera pueden medirse en una escala continua? En ese caso, puedes utilizar el coeficiente de correlación de rango de Spearman. De hecho, puedes utilizar el coeficiente de correlación de rango de Spearman como aproximación al coeficiente de correlación del momento producto aunque los datos estén correlacionados linealmente, simplemente porque el coeficiente de correlación de rango de Spearman es un cálculo más sencillo.
Para más detalles, consulta Comparar el coeficiente de correlación de rango de Spearman y el coeficiente de correlación del momento producto.
En general, utilizarías el coeficiente de correlación de rango de Spearman si
uno o ambos conjuntos de datos proceden de una población que no se distribuye normalmente;
la relación entre los conjuntos de datos no es lineal; o
uno o ambos conjuntos de datos ya están representados como una clasificación.
Los valores del coeficiente de correlación de rango de Spearman oscilan entre \(-1\) y \(1\).
Un coeficiente de correlación de rangos de Spearman de
- \(1) significa que las clasificaciones coinciden perfectamente;
- \(0) significa que no hay relación entre las clasificaciones; y
- \(-1) significa que las clasificaciones están en orden inverso.
A menudo, el coeficiente de correlación de rangos de Spearman no será exactamente \(1\), \(0\) o \(-1\). Por lo general, cuando realizas una prueba de hipótesis utilizando el coeficiente de correlación de rangos de Spearman, estás comprobando si existe o no una relación entre las clasificaciones.
Para más detalles sobre este tipo de prueba de hipótesis, consulta Prueba de correlación cero.
Gráfico de rangos de Spearman
Para ver si existe una correlación al utilizar el rango de Spearman, puede ser útil representar gráficamente los datos. Recuerda que no buscas si los datos del gráfico forman una línea, sino si los rangos son iguales.
En el gráfico siguiente, puedes ver las clasificaciones que dos jueces dieron en una competición. Las clasificaciones que el juez A dio a los competidores están marcadas con círculos, mientras que las clasificaciones que dio el juez B están marcadas con cruces.
Por ejemplo, el juez A dio al primer competidor una puntuación de \(1\), mientras que el juez B le dio una puntuación de \(2\). Aunque los datos representados no forman una línea, parece que ambos jueces dieron aproximadamente la misma puntuación a todos los competidores, y en tres casos, dieron exactamente la misma puntuación. Por lo tanto, cabría esperar que el coeficiente de correlación de rangos de Spearman para las clasificaciones estuviera más cerca de \(1\) que de \(0\).
Fórmula del coeficiente de correlación de rangos de Spearman
Para utilizar la fórmula del coeficiente de correlación de rangos de Spearman es necesario clasificar los conjuntos de datos. No importa cómo los clasifiques (por ejemplo, de mejor a peor o de peor a mejor), siempre que clasifiques ambos conjuntos de la misma forma. Antes de ver la fórmula, veamos un ejemplo de organización de las clasificaciones.
Se pidió a dos catadores de café que clasificaran \(8\) marcas de café por orden de preferencia. Sus preferencias de orden para las marcas se indican en la tabla siguiente.
Tabla 1. Preferencias de café de los catadores.
Marca de café | A | B | C | D | E | F | G | H |
Catador \(x\) | \(4\) | \(5\) | \(2\) | \(8\) | \(1\) | \(3\) | \(7\) | \(6\) |
Catador \(y\) | \(4\) | \(6\) | \(1\) | \(7\) | \(3\) | \(2\) | \(5\) | \(8\) |
El catador asigna a cada café un número de preferencia. Siempre que el catador \(x\) y el catador \(y\) utilicen \(1\) para referirse a lo mismo en la escala, podrás comparar las clasificaciones. Si no sabes que el catador \(x\) y el catador \(y\) utilizaron \(1\) para referirse al café que más prefieren, no podrás saber qué significa el coeficiente de correlación, aunque podrás calcularlo.
Para calcular el coeficiente de correlación, necesitarás los siguientes valores:
\[ S_{xy} = \suma x_iy_i - \frac{1}{n}\suma x_i \suma y_i; \]
\[ S_{xx} = \suma x_i^2 - \frac{1}{n} \left(\suma x_i\right)^2;\]
y
\S_{yy} = suma y_i^2 - frac{1}{n} izquierda(suma y_i\derecha)^2.\]
El coeficiente de correlación de Spearman puede calcularse mediante la fórmula
\[ r_s = \frac{S_{xy}} {{sqrt{S_{xx}}S_{yy}} .\]
Puedes encontrar un ejemplo en el que se dé la misma puntuación a más de un punto de datos. Esto se llama puntuación empatada.
Un rango empatado se produce cuando dos o más valores de datos de uno de los conjuntos de datos son iguales.
Veamos un ejemplo rápido.
Supongamos que a un catador de café se le pidiera que diera al café una calificación en letras según lo que le gustara. Para los cafés que probaron, dieron puntuaciones de: A, C, F, D, B, C, C, C. Observa que de los ocho cafés de la lista, ¡tres de ellos tienen una puntuación de C! Así que si intentaras hacer una tabla de clasificación obtendrías
Tabla 2. Posible tabla de clasificación
Clasificación | \(1\) | \(2\) | \(7\) | \(8\) | ||||
Grado | A | B | C | C | C | C | D | F |
Pero, ¿qué haces con los cuatro cafés que han obtenido cada uno una C? ¿Les das un rango de \(3\), \(4\), \(5\) o \(6\)? Resulta que les das la media de los rangos, ya que están empatados. Hallar la media te da
\[ \frac{3+4+5+6}{4} = 4,5,\]
por lo que cada uno se clasificaría \(4,5\). La tabla de clasificación completa sería
Tabla 3. Tabla de clasificación completa
Clasificación | \(1\) | \(2\) | \(4.5\) | \(4.5\) | \(4.5\) | \(4.5\) | \(7\) | \(8\) |
Grado | A | B | C | C | C | C | D | F |
Observa que en el ejemplo anterior no estás comparando los rangos del catador \(x\) con los rangos del catador \(y\). Sólo estás comparando los rangos dados por un único catador.
Si hay más de dos rangos empatados, entonces la fórmula
\r_s = \frac{S_{xy}} {{sqrt{S_{xx}}S_{yy}}].
. Sin embargo, si hay dos o menos rangos empatados, puedes utilizar en su lugar la siguiente fórmula:
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2,\]
donde \(n\) es el número de pares de observaciones y \(d\) es la diferencia entre los rangos de cada observación. La fórmula de la diferencia te dará una buena aproximación del coeficiente de correlación de rangos de Spearman siempre que no haya rangos empatados.
Tabla de rangos de Spearman
Una vez que conozcas el coeficiente de correlación de rangos de Spearman, a menudo lo utilizarás para hacer una prueba de hipótesis. Aunque puedes utilizar la tecnología para hallar el valor crítico, es útil poder leer una tabla de rangos de Spearman. A continuación se muestra una sección de una tabla de rangos de Spearman.
Tabla 4. Tabla de rangos de Spearman
\(n\)/\(\alfa \) | \(0.1\) | \(0.05\) | \(0.25\) | \(0.01\) |
\(6\) | \(0.657\) | \(0.829\) | \(0.886\) | \(0.943\) |
\(7\) | \(0.571\) | \(0.714\) | \(0.786\) | \(0.893\) |
\(8\) | \(0.524\) | \(0.643\) | \(0.738\) | \(0.833\) |
La primera columna de la tabla es el tamaño de la muestra \(n\), y la primera fila de la tabla te da el nivel de confianza. Observa que, a medida que aumenta el tamaño de la muestra, disminuye el valor crítico para un nivel de confianza determinado. Recuerda que el margen de error depende del valor crítico:
margen de error = (valor crítico)(error típico).
Esto significa que si aumentas el tamaño de la muestra, el margen de error disminuirá.
Valor crítico del coeficiente de correlación de rango de Spearman
El valor crítico del coeficiente de correlación de rangos de Spearman depende del tamaño de la muestra y del nivel de confianza que estés utilizando. El valor crítico puede hallarse utilizando una tabla o mediante un software estadístico. Por ejemplo, si estás haciendo una prueba de una cola, con un tamaño de muestra de \(7\), con un nivel de confianza de \(0,25\), utilizarías una tabla de coeficientes de Spearman para ver que el valor crítico es \(0,786\). Puedes encontrar este valor crítico en la tabla anterior.
En otras palabras, para un tamaño de muestra de \(7\), el valor crítico de \(r_s\) es significativo al nivel \(0,25\) en una prueba de una cola a \(\pm 0,786\).
Ejemplo de coeficiente de correlación de rangos de Spearman
Volvamos al ejemplo del café y averigüemos cuál es el coeficiente de correlación.
Se pidió a dos catadores de café que clasificaran ocho marcas de café por orden de preferencia, siendo \(1\) el café que más les gustaba. Sus preferencias de orden para las marcas se indican en la tabla siguiente.
Tabla 5. Preferencias de café según el catador.
Marca de café | A | B | C | D | E | F | G | H |
Catador \(x\) | \(4\) | \(5\) | \(2\) | \(8\) | \(1\) | \(3\) | \(7\) | \(6\) |
Catador \(y\) | \(4\) | \(6\) | \(1\) | \(7\) | \(3\) | \(2\) | \(5\) | \(8\) |
Halla e interpreta el coeficiente de correlación de rangos de Spearman.
Solución:
Observa que, aunque los dos catadores eligieron el café A como cuarta opción, no se trata de un ejemplo de empate. El empate se produciría si un catador diera a dos cafés la misma puntuación. Por tanto, es razonable utilizar la fórmula simplificada
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2 .\]
Aquí hay ocho marcas de café, así que \(n=8\). Mirando primero la suma
\[\begin{align} \sum\limits_{i=1}^8 d_i^2 &= (4-4)^2 + (5-6)^2 + (2-1)^2 + (8-7)^2 & \quad + (1-3)^2 + (3-2)^2 + (7-5)^2 + (6-8)^2 &= 0+1+1+1+4+1+4+4 &= 16. \end{align}\]
Entonces
\r_s &= 1 - \frac{6}{n(n^2-1)} \suma d^2 \frac{6}{8(8^2-1)}(16) \frac{6}{8(63)}(16) \frac{6}{8(63)}(16) \frac{6}{0,81 aproximadamente. \end{align}\}]
Como \(r_s \not= 0\), no puedes decir que no haya relación entre las clasificaciones. Sin embargo, como es cercana a cero, puedes decir que hay muy poca correlación entre las clasificaciones de los dos catadores.
Coeficiente de correlación de rangos de Spearman - Aspectos clave
- Utiliza el coeficiente de correlación de rangos de Spearman si
uno o ambos conjuntos de datos proceden de una población que no se distribuye normalmente;
la relación entre los conjuntos de datos no es lineal; o
uno o ambos conjuntos de datos ya están representados como una clasificación.
Un coeficiente de correlación de rangos de Spearman de:
- \(1) significa que las clasificaciones coinciden perfectamente;
- \(0) significa que no hay relación entre las clasificaciones; y
- \(-1) significa que las clasificaciones están en orden inverso.
- En se produce un empate cuando dos o más valores de uno de los conjuntos de datos son iguales.
- Si hay dos o menos rangos empatados, puedes utilizar la fórmula
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2,\2]
para aproximar el coeficiente de correlación de rangos de Spearman, donde \(n\) es el número de pares de observaciones y \(d\) es la diferencia entre los rangos de cada observación.
Aprende más rápido con las 12 tarjetas sobre Coeficiente de Correlación por Rangos de Spearman
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Coeficiente de Correlación por Rangos de Spearman
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más