Iniciar sesión Empieza a estudiar
La app de estudio todo en uno
4.8 • +11 mil reviews
Más de 3 millones de descargas
Free
|
|

Distribuciones bidimensionales

Distribuciones bidimensionales

Si has leído nuestros artículos sobre variable aleatoria, sabes que en un experimento se mide una variable aleatoria \(x\), cuyo resultado \(y\) se ve modificado por ciertos parámetros (bastante parecido a una función).

Sin embargo, esto ocurre cuando se tiene una sola variable y, en ciertos casos, te encontrarás con sistemas con más de una variable aleatoria. Esto es parte de una rama de las estadística llamada estadística multivariable. En este artículo nos enfocaremos en el caso de la bivariable:

En la estadística bivariable se miden las interacciones entre dos variables en un sistema y cómo los cambios de cada una afectan a la otra.

  • El coeficiente de correlación, que puede ser obtenido en estos, no permite saber la correlación entre ambas variables.

Estadística descriptiva bidimensional

Al igual que la estadística descriptiva para una simple variable aleatoria, en las distribuciones de datos donde hay más de una variable asociada a un resultado, existen ciertos puntos que debes reconocer:

  • La variable estadística multidimensional o bidimensional —en este caso, \(x=(X, Y)\)—.

  • Diagrama de dispersión, que en este caso es una gráfica que representa los puntos de las variables \((X,Y)\).

  • La covarianza muestral, que mide la dispersión conjunta de las variables \((X,Y)\).

  • El centro de gravedad, que son las medias de ambas variables \(X\) y \(Y\) en los rangos en los que existen.

Variable estadística bidimensional

En distribuciones que presentan más de una variable asociada a un resultado, se dice que se tiene una variable estadística multidimensional. En el caso que sean dos se tiene una variable estadística bidimensional.

Se dice que se tiene una variable estadística bidimensional si se tiene un experimento aleatorio, muestra o mediciones, donde cada objeto \(x\) puede ser asociado a dos variables cuyos resultados son distintos \((Y,X)\).

Un ejemplo de una variable aleatoria bidimensional sería el estudio entre el peso de las personas en un colegio y el salario que se obtiene en sus casas.

En este caso, es muy probable que una variable tenga un impacto en la otra, ya que la clase de dieta y alimentos disponibles sufrirán cambios —dependiendo de sus ingresos o, al menos, eso indicaría una posible teoría—.

Tabla de contingencia

Para poder representar los resultados de una variable bidimensional o multidimensional se usan tablas de contingencia.

  • En la primera columna de esta tabla se establecen las categorías o resultados que puede obtener la variable \(Y\). La primera fila, entonces, muestra las categorías o resultados que puede obtener las variables \(X\).
  • Cada celda representa la población que une los valores o categorías conjuntas de \((X=a_i,Y=b_i)\).
  • La columna y fila finales contienen las frecuencias relativas absolutas o el número de valores totales para cierto valor de \(X\) o \(Y\).

Esto lo podemos ver en la siguiente tabla:

\(1\)\(2\)...\(n\)
\(X\)\(a_1\)\(a_2\)...\(a_n\)
\(Y\)\(b_1\)\(b_2\)...\(b_n\)
Tabla 1: Las categorias \(X\) y \(Y\) tienen frequencias relativas para cada valor de \(1, 2,..., n\).

Si quieres saber más acerca de qué son y cómo se calculan estas frecuencias relativas, no olvides leer nuestro artículo sobre tablas de contingencia.

Diagrama de dispersión

Una vez tenemos la tabla de contingencia, podemos representar todos estos datos en una gráfica denominada diagrama de dispersión o nube de puntos. En esta, uno de los ejes representa una de las variables \(X\) y el otro eje representa la otra variable \(Y\). La intencionalidad de esta gráfica es ver cómo se relacionan las variables. Así podemos entender si las variables tienen una dependencia directa (vemos que \(Y\) crece de manera proporcional con \(X\), o inversamente proporcional) o son independientes (no observamos ninguna relación entre las variables).

Por ejemplo, una nube homogénea de puntos te puede decir que el centro gravedad está en el centro de la nube ( como se ve en la gráfica a continuación).

Distribuciones bidimensionales dispersión centro de gravedad StudySmarterFig. 1: Centro de gravedad \(PM\) de de una nube de puntos. En este caso, las entradas \((x,y)\) de \(PM\) son la media aritmética de las coordenadas \((x,y)\) de cada punto.

En cambio, si existe una relación fuerte entre ambas variables, se generaría un patrón consistente de los resultados. Uno de estos patrones, fácilmente, podría ser una relación lineal. En la siguiente gráfica puedes observar la relación lineal de las variables \(X\) y \(Y\).

Distribuciones bidimensionales ajuste lineal StudySmarterFig. 2: Recta que se ajusta, de mejor manera, a los datos (puntos).

Covarianza y relaciones entre variables

El valor de la covarianza es muy importante: dependiendo de su resultado, podemos saber cómo se comportan las variables:

  • Si la covarianza es positiva, la relación es directa; entonces, los puntos se apilan cerca a una recta con pendiente positiva.

  • Si la covarianza es negativa, la relación es inversa; entonces, los puntos se apilan cerca a una recta con pendiente negativa.

  • Si la covarianza es cero, se dice que no hay relación entre ambas variables.

Debes saber que cuanto más alto sea el valor de la covarianza, la relación se asemejará cada vez más a una recta.

Recta de regresión

Cuando se tiene una relación lineal, se puede obtener la recta de regresión. Esta es la función igual a una recta de tipo \(y=mx+b\), que nos dice la relación entre ambas variables.

La fórmula para esto es: \[y-\mu_y=\dfrac{ \sigma_{xy}}{\sigma^2_x} (x-\mu_x)\]

Aquí \( \sigma_{xy}\) es la covarianza, que se define como: \[\sigma_{xy}=\dfrac{\sum x_i y_i}{n} - \sigma_x \sigma_y\]

Distribuciones bidimensionales - Puntos clave

  • La estadística multivariable estudia la relación entre dos o más variables.

  • En la estadística bivariable, dos variables se relacionan entre sí para observar cómo ambas influyen en la otra.

  • Las tablas de contingencia son muy útiles para representar las frecuencias relativas absolutas en estadística multivariable.

  • Ciertos parámetros que nos indican cosas importantes de las distribuciones con más de una variable son: la covarianza como medida de dispersión y el centro de gravedad como media.

  • Dadas la covarianza y el centro de gravedad, se puede obtener una recta, que representa la relación entre los datos; pero, esto solo en caso de que los datos tengan una relación directa o inversa.

  • Si la covarianza arroja un valor positivo, la relación es directamente proporcional; si la varianza arroja un valor negativo, es directamente proporcional con pendiente negativa; y si da un valor cercano a cero, no hay relación entre las variables.

Preguntas frecuentes sobre Distribuciones bidimensionales

Es una distribución de probabilidad que depende, no de una variable aleatoria, sino de dos de ellas.

Nos permite relacionar dos variables y cómo se afectan mutuamente.

Se dice que se tiene una variable estadística bidimensional si se tiene un experimento aleatorio, muestra o mediciones, donde cada objeto x puede ser asociado a dos variables cuyos resultados son distintos a X, Y.

Una distribución bidimensional se puede tener en forma de tabla de contingencia, en la cual tenemos la relación entre las variables X e Y. A partir de esta, podemos representar los datos en una gráfica, de modo que obtenemos un diagrama de dispersión o nube de puntos.

Es la recta calculada para la relación dada entre dos variables aleatorias.

Cuestionario final de Distribuciones bidimensionales

Pregunta

¿Qué es una medida de tendencia central?

Mostrar respuesta

Answer

Una medida de tendencia central es un valor en una serie de datos; por ejemplo, en una lista de alturas que intenta resumir estos datos usando un valor único.

Show question

Pregunta

Calcula la media aritmética de la siguiente serie: \(x={1; 4; 6; 9; 12; 0}\).

Mostrar respuesta

Answer

5,33

Show question

Pregunta

Calcula la media aritmética de las siguientes alturas: \(x={1,35\,m; 1,78\,m; 1,4\,m; 1,25\,m; 1,67\,m}\).

Mostrar respuesta

Answer

1,49 m

Show question

Pregunta

Calcula la media aritmética de los siguientes pesos: \(x={35\,kg; 102\,kg; 56\,kg; 76\,kg; 67\,kg}\).

Mostrar respuesta

Answer

67,2 kg

Show question

Pregunta

¿Con qué otro nombre se conoce al promedio en estadística?

Mostrar respuesta

Answer

Media aritmética

Show question

Pregunta

¿Qué es la moda en estadística?

Mostrar respuesta

Answer

Es el dato que más se repite.

Show question

Pregunta

¿Cuál es la moda en la siguiente lista de datos: \(x={1; 3; 5; 12; 56; 1; 3; 45; 6; 78; 1}\)?

Mostrar respuesta

Answer

1

Show question

Pregunta

A los datos que poseen dos modas se le conoce como:

Mostrar respuesta

Answer

Bimodales

Show question

Pregunta

¿Qué es la mediana?

Mostrar respuesta

Answer

Es el dato a la mitad de todo el conjunto de datos

Show question

Pregunta

¿Qué son las medidas de desviación y dispersión?

Mostrar respuesta

Answer

Medidas que te indican qué tanto tus datos se desvían entre sí o con respecto a las medidas de tendencia central.

Show question

Pregunta

¿Cuáles son las tres medidas de desviación y dispersión que vimos?

Mostrar respuesta

Answer

La desviación media, la desviación típica o desviación estándar y la varianza

Show question

Pregunta

¿Qué es la desviación media?

Mostrar respuesta

Answer

La desviación media es la medida que nos indica qué tan alejados están todos los valores con respeto a la media aritmética.

Show question

Pregunta

La varianza es una medida alternativa a la dispersión estándar. ¿Verdadero o falso?

Mostrar respuesta

Answer

Verdadero

Show question

Pregunta

En términos de la desviación estándar, ¿cómo se calcula la varianza?

Mostrar respuesta

Answer

\[Varianza=\sigma^2\]

Show question

Pregunta

Calcula la desviación estándar del siguiente conjunto de datos: \(x={2; 4; 6; 1; 2; 3; 4; 5; 6; 10; 3; 5; 6; 7}\).

Mostrar respuesta

Answer

2,37

Show question

Pregunta

La regresión lineal es un método:

Mostrar respuesta

Answer

Estadístico.

Show question

Pregunta

El método de regresión lineal también se conoce como:

Mostrar respuesta

Answer

Ajuste lineal.

Show question

Pregunta

El método de regresión lineal consiste en:


Mostrar respuesta

Answer

Ajustar datos a una función del tipo \(y=ax+b\).

Show question

Pregunta

¿Qué valores puede tomar el coeficiente de correlación lineal?

Mostrar respuesta

Answer

De menos a uno a uno.

Show question

Pregunta

¿Qué valores puede tomar el coeficiente de determinación lineal?

Mostrar respuesta

Answer

De cero a uno.

Show question

Pregunta

Para obtener el coeficiente de de determinación usando el coeficiente de correlación se debe:

Mostrar respuesta

Answer

Elevar el coeficiente de correlación al cuadrado.

Show question

Pregunta

¿Qué nos dice el coeficiente de correlación?

Mostrar respuesta

Answer

Cómo de bien se ajusta la curva a los datos obtenidos.

Show question

Pregunta

¿Qué nos dice el coeficiente de determinación lineal?

Mostrar respuesta

Answer

Es una manera alternativa de medir cómo de bien se ajusta la curva a los datos.

Show question

Pregunta

¿Cuál es la fórmula del residuo?

Mostrar respuesta

Answer

\(\dfrac{\sum (y_i - y_i’)^2}{n}\).

Show question

Pregunta

En la regresión lineal, ¿cuál es el método de ajuste por mínimos cuadrados?

Mostrar respuesta

Answer

Un método para ajustar una función a un conjunto de datos.

Show question

Pregunta

¿Qué significa si el coeficiente de correlación tiene un valor de uno?

Mostrar respuesta

Answer

Que el ajuste describe los datos perfectamente.

Show question

Pregunta

¿Qué es la dispersión?

Mostrar respuesta

Answer

La dispersión de datos, en estadística, es la medida en la cual datos recabados varían con respecto a un valor central o esperado.

Show question

Pregunta

Si un dato difiere mucho del valor esperado, se dice que:

Mostrar respuesta

Answer

Tiene una alta dispersión.

Show question

Pregunta

Si un dato medido se aleja demasiado de la función que se encuentra usando la regresión lineal, se dice que:

Mostrar respuesta

Answer

Tiene una alta dispersión.

Show question

Pregunta

Una recta con un coeficiente de correlación de cero se dice que:

Mostrar respuesta

Answer

No tiene un buen ajuste de datos.

Show question

Pregunta

¿Cuántas variables se miden en la estadística multivariable?

Mostrar respuesta

Answer

Dos variables.

Show question

Pregunta

Un estudio estadístico de las relaciones entre dos variables dependientes entre sí \(X\) y \(Y\) es un estudio estadístico: 

Mostrar respuesta

Answer

Bivariable.

Show question

Pregunta

Un estudio estadístico bidimensional es lo mismo que:

Mostrar respuesta

Answer

Un estudio estadístico multivariable.

Show question

Pregunta

¿Cuál es el centro de gravedad?

Mostrar respuesta

Answer

El punto medio de todos los valores \(X\) y \(Y\).

Show question

Pregunta

¿Qué es un diagrama de dispersión?

Mostrar respuesta

Answer

Una gráfica que muestra los resultados de los valores \((X,Y)\).

Show question

Pregunta

¿Qué es la covarianza?

Mostrar respuesta

Answer

Una herramienta que mide la dispersión de los datos en la estadística bivariable.

Show question

Pregunta

¿Cuál es una variable estadística bidimensional?

Mostrar respuesta

Answer

\(x=(X,Y)\).

Show question

Pregunta

¿Cuál es la recta de regresión?

Mostrar respuesta

Answer

Cuando se tiene una relación lineal, se puede obtener la recta de regresión; esta es la función igual a una recta de tipo \(y=mx+b\), que nos dice la relación entre ambas variables.

Show question

Pregunta

¿Qué pasa si la covarianza es positiva?

Mostrar respuesta

Answer

La relación es directamente proporcional.

Show question

Pregunta

 ¿Qué pasa si la covarianza es negativa?

Mostrar respuesta

Answer

La relación es inversa.

Show question

Pregunta

¿Qué pasa si la covarianza es cercana a cero?

Mostrar respuesta

Answer

No hay relación entre las variables.

Show question

Pregunta

Una relación directa significa que el trazado de \(X,Y\):

Mostrar respuesta

Answer

Sigue una recta con pendiente positiva.

Show question

Pregunta

Una relación inversa significa que el trazado de \(X,Y\):

Mostrar respuesta

Answer

Sigue una recta con pendiente negativa.

Show question

Pregunta

¿Cómo se calcula el centro de gravedad?

Mostrar respuesta

Answer

Es la media de los datos, tanto en \(X\) como en \(Y\), o la media aritmética de las coordenadas en los pares ordenados de cada dato \(\mu=(\mu_X, \mu_Y)\).

Show question

Pregunta

Es una herramienta muy útil para calcular las frecuencias relativas en una distribución bidimensional:


Mostrar respuesta

Answer

Tablas de contingencia.

Show question

Conoce más sobre Distribuciones bidimensionales
60%

de los usuarios no aprueban el cuestionario de Distribuciones bidimensionales... ¿Lo conseguirás tú?

Empezar cuestionario

Scopri i migliori contenuti per le tue materie

No hay necesidad de copiar si tienes todo lo necesario para triunfar. Todo en una sola app.

Plan de estudios

Siempre preparado y a tiempo con planes de estudio individualizados.

Cuestionarios

Pon a prueba tus conocimientos con cuestionarios entretenidos.

Flashcards

Crea y encuentra fichas de repaso en tiempo récord.

Apuntes

Crea apuntes organizados más rápido que nunca.

Sets de estudio

Todos tus materiales de estudio en un solo lugar.

Documentos

Sube todos los documentos que quieras y guárdalos online.

Análisis de estudio

Identifica cuáles son tus puntos fuertes y débiles a la hora de estudiar.

Objetivos semanales

Fíjate objetivos de estudio y gana puntos al alcanzarlos.

Recordatorios

Deja de procrastinar con nuestros recordatorios de estudio.

Premios

Gana puntos, desbloquea insignias y sube de nivel mientras estudias.

Magic Marker

Cree tarjetas didácticas o flashcards de forma automática.

Formato inteligente

Crea apuntes y resúmenes organizados con nuestras plantillas.

Regístrate para poder subrayar y tomar apuntes. Es 100% gratis.