Saltar a un capítulo clave
Después de pensarlo un rato, me pareció muy lógico. Como los niños pequeños no comen tanto como los adolescentes, está bien cobrarles menos. Parece que existe una relación entre la edad y la cantidad de comida que come una persona. ¿Cómo estudiar esta relación? Quizá podrías hacer una encuesta para esta investigación.
Siempre que estudies la relación entre dos variables que puedes medir, estarás tratando con dos variables cuantitativas. Aquí aprenderás cómo estudiar su relación y las técnicas utilizadas para su representación.
Relación entre dos variables cuantitativas
Antes de continuar, es importante repasar la diferencia entre variables cuantitativas y categóricas.
Una variable cuantitativa es una variable que puede medirse con unidades.
No importa qué tipo de unidades utilices, siempre que puedas medir una variable, entonces es una variable cuantitativa. ¿Y las variables categóricas?
Una variable categórica , también conocida como variable cualitativa, es una variable cuyas propiedades se describen en lugar de medirse.
Las variables categóricas suelen ser cosas como colores, nombres, comidas favoritas, etc.
Supón que estás haciendo una encuesta en tu barrio, y vas a pedir los siguientes datos:
- Edad
- Sexo
- Estatura
- Apellido
- Actividad favorita
¿Qué variables son cuantitativas y cuáles categóricas?
Solución:
Para saber qué variables son cuantitativas debes preguntarte qué variables se pueden medir. De la lista dada, la edad suele medirse en años, mientras que puedes medir la altura en pies, pulgadas, metros o más unidades. Esto significa que las variables cuantitativas son
- Edad
- Altura
El resto de las variables se darán como palabras y no como números, por lo que es más fácil pensar en ellas como etiquetas (en el caso del apellido) o como una descripción de sí mismas (como el sexo y su actividad favorita). Así pues, las variables categóricas son
- Sexo
- Apellido
- Actividad favorita
Normalmente, una encuesta se realiza con el fin de recopilar datos para su inspección. Las decisiones se toman a partir de las conclusiones extraídas de los datos, por lo que es importante analizar la relación entre las variables.
Al comparar dos variables cuantitativas, puedes tener una idea más clara de los datos organizándolos según los valores numéricos que se representen. No ocurre lo mismo con las variables categóricas, como verás en el siguiente ejemplo.
Supón que quieres hacer un gráfico para estudiar la relación entre estos dos pares de variables:
- Altura y peso de los estudiantes varones de secundaria.
- Deporte favorito y color favorito de los alumnos varones de secundaria.
Al hacer un gráfico de dos variables cuantitativas, como en el caso de la altura y el peso de los alumnos, puedes disponer los datos en orden numérico. Es decir, cada eje representará una recta numérica, de modo que antes de rellenarlo con datos, tu gráfico tendrá este aspecto:
El gráfico que compara dos variables cuantitativas es más esclarecedor, ya que si te desplazas hacia la derecha observarás a las personas más altas, y si te desplazas hacia arriba observarás a las personas con mayor peso. ¡Esto se nota aunque el gráfico esté vacío!
Si tuvieras que utilizar un gráfico para representar dos variables categóricas, como en el caso del deporte favorito y el color, no hay una ordenación clara para los datos. Puede que los organices por orden alfabético, o puede que los organices según tus preferencias, pero esta disposición no te dice nada de antemano.
Es importante tener en cuenta el contexto de la encuesta para clasificar correctamente una variable como cuantitativa o categórica. Por ejemplo, puedes pensar que un código postal es una variable cuantitativa porque es un número, pero como sólo es una etiqueta, en su lugar es una variable categórica.
Si quieres saber cómo analizar variables categóricas, consulta nuestro artículo Dos variables categóricas.
Cómo comparar dos variables cuantitativas
Una pregunta natural que surge siempre que te dan dos variables es: ¿Están estas dos variables relacionadas entre sí?
Considera el caso de la altura y el peso. Cuanto más alta sea una persona, más pesará. Esto no significa que una persona más alta pesará siempre más que una más baja, sino que te indica que existe una relación entre estas variables.
También es posible tener dos variables no relacionadas, como la edad y la altura de una población de hombres adultos. Siempre que trates con dos variables, estén o no relacionadas, estás tratando con datos bivariantes .
Los datosbivariantes son datos que se dan como pares de variables.
En el ejemplo de la altura y el peso, cuando hagas una encuesta preguntarás tanto la altura como el peso de cada individuo, por lo que cada uno de estos valores estará emparejado. Éste es un ejemplo de datos bivariantes.
Los datoscuantitativos bivariantes son datos bivariantes que constan de dos variables cuantitativas.
Los datos cuantitativos bivariantes pueden representarse de muchas formas. Por ejemplo, puedes utilizar una tabla de valores, donde cada columna representa una de las variables.
Supongamos que quieres investigar si existe una relación entre los hábitos de consumo y la edad. Para ello, vas a tu centro comercial local y preguntas amablemente a cada persona que se va si está dispuesta a participar en una encuesta. En esta encuesta, sólo preguntas su edad y cuántos artículos compraron, si es que compraron alguno. Tus datos se pueden organizar en una tabla como ésta:
Edad (Años) | Número de artículos comprados |
\[12\] | \[0\] |
\[36\] | \[4\] |
\[21\] | \[12\] |
\[24\] | \[5\] |
\[15\] | \[2\] |
\[23\] | \[7\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
\[11\] | \[1\] |
A partir de la tabla anterior, puedes empezar a observar algunas pautas. Parece que los niños tienden a comprar menos cosas, quizá porque les falta dinero. Por otra parte, a los adultos jóvenes parece gustarles comprar muchas cosas. Por supuesto, hay muchos más factores implicados en los hábitos de consumo, ¡pero esto es un buen comienzo!
Puedes reorganizar la tabla anterior ordenando los datos por edad, en cuyo caso debes asegurarte de emparejar correctamente cada entrada.
Edad (Años) | Número de artículos comprados |
\[11\] | \[1\] |
\[12\] | \[0\] |
\[15\] | \[2\] |
\[21\] | \[12\] |
\[23\] | \[7\] |
\[24\] | \[5\] |
\[36\] | \[4\] |
\[45\] | \[2\] |
\[67\] | \[1\] |
Ten en cuenta que la tabla también puede escribirse horizontalmente, en cuyo caso cada fila representará una consulta.
Otra forma de representar datos cuantitativos bivariantes es dibujando puntos en un plano, como verás en el siguiente apartado.
Gráficos de dos variables cuantitativas
Hay muchas formas de representar datos cuantitativos. Por ejemplo, si te interesa hacer una encuesta sobre las edades de los estudiantes de secundaria, puedes utilizar un histograma, un diagrama de puntos o una representación de tallo y hoja. Sin embargo, todos estos gráficos se utilizan para mostrar una única variable junto con su frecuencia.
Supongamos que te dan un conjunto de datos cuantitativos bivariantes, esto significa que ambas variables son variables cuantitativas, por lo que estás tratando con un par de números. Esto hace que la representación gráfica de datos cuantitativos bivariantes sea una tarea sencilla, ya que puedes representar los datos mediante puntos en el plano. Para ello, debes asignar un eje a cada variable.
Considera nuestro ejemplo del centro comercial. Puedes asignar cualquiera de las variables a cualquiera de los ejes, pero normalmente asignarás el eje \(x\)- a variables como la edad y la altura, que cambian a un ritmo constante o tienen menos probabilidades de cambiar.
En cambio, variables como el peso, el número de artículos comprados o las botellas de agua que se han bebido en una semana, es más probable que se asignen al eje \(y\)-.
Ten en cuenta que la edad de los clientes oscila entre 11 y 67 años, por lo que el eje x se escala en consecuencia. Del mismo modo, el eje Y oscila entre 0 y 12 años.
Ahora que tienes el plano etiquetado de forma representativa, es el momento de dibujar un montón de puntos. Aquí, cada punto representa una investigación.
El gráfico mostrado en el ejemplo anterior se conoce como diagrama de dispersión, y es una de las formas más comunes de mostrar datos cuantitativos bivariados.
Para más información sobre estos gráficos, consulta nuestro artículo Gráficos de dispersión.
Correlación entre dos variables cuantitativas
Una de las razones por las que los gráficos de dispersión se utilizan a menudo para representar datos cuantitativos bivariantes es que permiten identificar patrones en los datos. Considera el siguiente gráfico de dispersión.
Del diagrama de dispersión anterior podrías haber encontrado un patrón en el que, en general, a medida que aumenta la edad de los niños, éstos son más altos, lo cual tiene mucho sentido. En este caso, decimos que ambas variables están correlacionadas.
La correlación es una medida del grado de asociación entre dos variables cuantitativas.
Conviene señalar que la correlación sólo se aplica a dos variables cuantitativas. Si tratas con datos bivariantes en los que una o ambas variables son categóricas, entonces no debes buscar la correlación.
Cuando dos variables están correlacionadas, puedes trazar una línea recta que describa más o menos cómo se comportan los datos. Esta línea se conoce como línea de mejor ajuste, que se obtiene mediante regresión lineal .
Consulta nuestro artículo Regresión lineal para obtener más información sobre este tema.
Si dos variables están correlacionadas, esperas que el cambio de una afecte a la otra de forma significativa. Por eso, si las variables están correlacionadas, la línea de mejor ajuste será una línea creciente o decreciente.
Por otra parte, si dos variables no están correlacionadas en absoluto, debes esperar que la línea de mejor ajuste sea horizontal, ya que el cambio en una variable no influye en absoluto en la otra. En este caso, los datos estarán dispersos por todo el contorno.
Para medir lo correlacionadas que están dos variables, tienes que fijarte en el coeficiente de correlación de Pearson.
El coeficiente de correlación de Pearson, también conocido como \(r\) de Pearson, o simplemente como coeficiente de correlación, es un número que oscila entre \(-1\) y \(1\), que se utiliza para medir la correlación de datos bivariantes.
Para más información sobre el coeficiente de correlación y cómo se obtiene, echa un vistazo a nuestro artículo sobre Correlación lineal.
Hay algunas cosas que hay que tener en cuenta cuando se habla de correlación, que se pueden abordar utilizando el coeficiente de correlación.
Forma de la correlación
La correlación se refiere típicamente a la asociación lineal entre dos variables, pero también es posible encontrar que algunas variables están relacionadas por otros tipos de relaciones, como la cuadrática o la exponencial.
Estos otros tipos de correlación no se tratarán más en este artículo.
¡El coeficiente de correlación de Pearson sólo se aplica a datos bivariantes correlacionados linealmente!
Dirección de la correlación
En los ejemplos anteriores, has visto cómo en el caso de dos variables correlacionadas, a medida que una aumenta, también lo hace la otra. Se trata de un tipo particular de correlación, denominada correlación positiva.
Dos variables están correlacionadas positivamente si el coeficiente de correlación de Pearson es positivo.
Cuando dos variables están correlacionadas positivamente, la recta de mejor ajuste tiene una pendiente positiva. Sin embargo, también es posible tener variables correlacionadas negativamente.
Dos variables están correlacionadas negativamente si el coeficiente de correlación de Pearson es negativo.
Del mismo modo, cuando dos variables están correlacionadas negativamente, la recta de mejor ajuste tiene una pendiente negativa.
Recuerda que correlación negativa significa que los datos están correlacionados. La palabra negativa se utiliza para referirse a la pendiente de la recta de mejor ajuste.
Fuerza de la correlación
A veces observarás que un diagrama de dispersión se parece mucho a un gráfico lineal, mientras que otros tienen los datos tan dispersos que ¡parece casi como si fuera aleatorio! El valor absoluto del coeficiente de correlación de Pearson te dará una idea de esta cuestión.
Sea \(r\) el coeficiente de correlación de Pearson de un conjunto de datos cuantitativos bivariantes. Cuanto más se acerque \(r|\) a \(1,\), más fuerte será la correlación. Un coeficiente de correlación de Pearson de exactamente \(1\) o \(-1\) significa que los datos son completamente lineales, lo cual es un escenario tan perfecto que es improbable que ocurra.
En cambio, si el coeficiente de correlación de Pearson se aproxima a \(0\), los datos sugieren que las variables no están correlacionadas, o lo están de forma débil.
Ejemplos de dos variables cuantitativas
Aquí puedes ver algunos ejemplos de diagramas de dispersión de dos variables cuantitativas y decir si representan datos correlacionados o no.
Se realizó una encuesta a mujeres adultas sobre sus hábitos de lectura, obteniéndose el siguiente diagrama de dispersión.
- ¿De qué trata este diagrama de dispersión?
- ¿Las variables implicadas son variables cuantitativas?
- ¿Qué conclusión puedes sacar de este diagrama de dispersión?
Solución:
- Observando los ejes del gráfico, puedes ver que la altura está en el eje horizontal, mientras que el número medio de libros leídos en un año está en el eje vertical. Por tanto, este diagrama de dispersión se utiliza para estudiar si existe relación entre las estaturas y los hábitos de lectura de las mujeres adultas.
- Este diagrama de dispersión relaciona la altura, que puede medirse, y el número medio de libros leídos en un año, que puede contarse. Por tanto, ambas variables son variables cuantitativas.
- Al observar el diagrama de dispersión, puedes ver que los datos están muy dispersos, sin una tendencia clara hacia una correlación positiva o negativa. Por tanto, puedes suponer que no existe relación entre la estatura de una mujer adulta y el número de libros que lee en un año.
¡Puedes encontrar correlaciones incluso en tu tienda de comestibles!
Supongamos que estás a dieta y te recomiendan evitar el azúcar añadido en las bebidas enlatadas, como zumos y refrescos.
Eres escéptico ante esta sugerencia, así que decides estudiar si existe una relación entre el azúcar añadido y las calorías por ración.
Para ello, vas al supermercado y compruebas la información nutricional de \(20\) diferentes productos que consumirías. Cuando vuelves a casa, haces el siguiente diagrama de dispersión.
¿Deberías seguir la recomendación?
Solución:
Observando los datos puedes comprobar que, a medida que aumenta la cantidad de azúcar añadido, también lo hace la cantidad de calorías por ración en estas bebidas enlatadas.
Puedes concluir que existe una correlación positiva entre la cantidad de azúcar media y las calorías de las bebidas enlatadas. Como estás a dieta, debes limitar las calorías que consumes, por lo que debes seguir la recomendación.
Dos variables cuantitativas - Puntos clave
- Una variable cuantitativa es una variable que puede medirse con unidades.
- Los datoscuantitativos bivariantes son datos que se dan como pares de variables cuantitativas.
- Los datos cuantitativos bivariantes se representan en un plano. Cada punto del plano corresponde a una investigación.
- Losgráficos de dispersión se utilizan para representar datos cuantitativos bivariantes.
- En un diagrama de dispersión puede utilizarse una recta de mejor ajuste para representar la tendencia de los datos.
- Si la pendiente de una recta de mejor ajuste es positiva, los datos están correlacionados positivamente.
- Si la pendiente de una recta de mejor ajuste es negativa, los datos están correlacionados negativamente.
- Si los datos de un diagrama de dispersión están muy dispersos fuera de la línea de mejor ajuste, entonces los datos están débilmente correlacionados.
Aprende más rápido con las 11 tarjetas sobre Dos variables cuantitativas
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Dos variables cuantitativas
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más