|
|
Distribución de probabilidad

Entender las distribuciones es esencial en estadística. Las distribuciones nos permiten describir el comportamiento de los resultados de diferentes fenómenos o experimentos, y arrojan luz sobre los resultados que podríamos esperar y lo probables que pueden ser. 

Mockup Schule

Explora nuestra app y descubre más de 50 millones de materiales de aprendizaje totalmente gratis.

Distribución de probabilidad

Illustration

Lerne mit deinen Freunden und bleibe auf dem richtigen Kurs mit deinen persönlichen Lernstatistiken

Jetzt kostenlos anmelden

Nie wieder prokastinieren mit unseren Lernerinnerungen.

Jetzt kostenlos anmelden
Illustration

Entender las distribuciones es esencial en estadística. Las distribuciones nos permiten describir el comportamiento de los resultados de diferentes fenómenos o experimentos, y arrojan luz sobre los resultados que podríamos esperar y lo probables que pueden ser.

Empecemos por hablar sobre la base de las distribuciones de probabilidad: el experimento aleatorio.

Experimento aleatorio

Supongamos que tienes un dado que es no tiene ninguna irregularidad (es uniforme) y, por tanto, su peso está distribuido uniformemente. Si tiras el dado varias veces, sin forzarlo a que caiga en un resultado específico, entonces cada resultado tendrá la misma probabilidad. Además, nunca sabes cuál es el resultado que caerá, por lo tanto es aleatorio: lo que significa que los resultados no tienen ningún orden cuando aparecen.

En un experimento aleatorio los resultados no tienen ninguna preferencia.

Tirar una moneda al aire \(50\) veces es un ejemplo de un experimento aleatorio, con \(50\) posibles resultados, que tienen la misma probabilidad de ocurrir cada vez que se repite el experimento.

Mediciones y distribuciones de probabilidad

En un experimento se miden los resultados; después de una cantidad de resultados suficientemente grande, se pueden contar estos resultados y se puede llegar a una idea de la probabilidad de cada uno.

En el caso de una moneda, si la tiras \(50\) veces, es seguro que obtendrás algo cercano a \(25\) caras y \(25\) cruces. Si repites esto otra vez, te debería dar lo mismo; en este caso, la probabilidad de que caiga cara o cruz es del \(50\%\).

Pero, ¿qué pasa cuando haces mediciones de algún dato o variable? Estas probabilidades cambian, debido a factores externos.

La estatura de los alumnos de una escuela

Supongamos que deseas medir los datos de las estaturas de una escuela; en específico, deseas medir a los alumnos de quinto curso. Si lo haces, es muy posible que obtengas datos más probables que otros. De hecho, es muy probable que alumnos más bajos o más altos que estos datos sean raros. Esto lo puedes ver en la imagen a continuación, donde \(p(x)\) es la probabilidad de cierta estatura \(e\).

Distribuciones de probabilidad ejemplo StudySmarter

Fig. 1. Distribución de probabilidad de las estaturas de una clase en el colegio. \(n\) es el número de estudiantes con esa estatura y \(e\) es la estatura.

Esto se debe a que los alumnos tienen la misma edad y, a ciertas edades, es más común que los alumnos tengan ciertas alturas. Las desviaciones, que son alumnos más altos o bajos, pueden ser dadas por factores externos.

La forma en la que se distribuyen las alturas de los alumnos nos puede decir muchas cosas.

Por ejemplo, si repetimos esta medición en muchas clases de quinto curso, obtendremos suficientes datos para que en una nueva clase del mismo curso sepamos cuál es la probabilidad de que los alumnos tengan ciertas estaturas. Esto se debe a que con las medidas anteriores podemos calcular la probabilidad de cómo están distribuidas las alturas.

La función que define cómo se comportan las alturas es llamada la distribución de probabilidad.

Distribuciones de probabilidad

Una distribución de probabilidad describe el conjunto de resultados que puede tomar una variable aleatoria en un espacio muestral.

El espacio muestral son los valores que pueden obtenerse en un experimento al azar; la distribución muestra cómo estos se distribuyen a lo largo de cierto rango de valores. Una distribución puede ser discreta o continua; sin embargo, la suma de todos los resultados posibles debe ser igual a uno.

Función masa de probabilidad

La función que se encarga de relacionar los resultados y sus respectivas probabilidades se llama función masa de probabilidad y se aplica sobre las variables aleatorias, que pueden ser continuas o discretas.

Una función masa de probabilidad es la función que le asigna a cada posible resultado de \(X\) un valor menor o igual que \(1\), donde este valor significa cuán probable es que lo obtengamos. La probabilidad de este resultado \(x\), es denotado como \(P\). De este modo, la probabilidad de que \(X\) sea \(x\), es:

$$P(X=x)$$

Una función masa de probabilidades la función que le asigna a cada posible resultado de \(X\) un valor menor o igual que \(1\), donde este valor significa cuán probable es que lo obtengamos. La probabilidad de este resultado \(x\), es denotado como \(P\). De este modo la probabilidad de que \(X\) sea \(x\), es:

$$P(X=x)$$

Una variable aleatoria discreta tiene un número finito de valores que pueden obtenerse y puede describirse mediante una función de probabilidad conocida como función masa de probabilidad.

Una variable continua es aquella que puede tomar cualquier valor entre un rango determinado de \(a\) a \(b\).

Un ejemplo de una variable discreta es el resultado de exámenes que tienen una nota de \(0\) a \(10\), sin decimales; por tanto, solo se pueden obtener valores iguales a \(1,2,3,4,5,6,7,8,9,10\).

Un ejemplo de una variable continua es la altura de alumnos en una escuela donde el menor mide \(1{,}31\text{ m}\) y el mayor \(1{,}75\text{ m}\). Teóricamente, las alturas de los alumnos pueden ser cualquier valor entre esos dos números; asimismo, solo estarían limitadas por la resolución de nuestro instrumento de medición la resolución es la cantidad más pequeña que podemos medir con exactitud. Un alumno podría medir \(1{,}7101\text{ m}\), pero nuestro instrumento podría solo medir hasta \(\text{m}\), realmente, dando un valor de \(1{,}71\text{ m}\).

La función masa, que describe la probabilidad de que se produzca cualquiera de los valores, es parecida a una función en cálculo pero a la inversa: mientras que en cálculo usas una función para conocer el resultado, en probabilidad usas una función para saber cuán probable es ese resultado.

Para un dado de seis caras, la probabilidad que se obtenga en una cara cualquiera de los números del uno al seis viene dada por la función de masa de probabilidad, con el valor siguiente:

\(x\)
\(1\)
\(2\)
\(3\)
\(4\)
\(5\)
\(6\)
\(P(X=x)\)
\(\dfrac{1}{6}\)
\(\dfrac{1}{6}\)
\(\dfrac{1}{6}\)
\(\dfrac{1}{6}\)
\(\dfrac{1}{6}\)
\(\dfrac{1}{6}\)

Tabla 1. Probabilidades de los resultados de un dado.

Una distribución discreta también puede describirse mediante una función de probabilidad acumulada. Esta describe la probabilidad de que se produzcan eventos hasta ese momento o que el resultado sea igual a dos posibles resultados.

Veamos uno de esos casos:

Para un dado de \(6\) caras, se hacen dos tiradas. ¿Cuál es la probabilidad de que se obtenga un dos en ambas?

Debido a que esta es una función de probabilidad acumulada, el resultado se obtiene multiplicando la probabilidad de obtener un dos en el primer resultado y un dos en el segundo:

$$P(X=2)_{\text{evento}_1}=\dfrac{1}{6}P(X=2)_{\text{evento}_2}=\dfrac{1}{6}$$

$$P(X=2)_{\text{acumulada}}=\dfrac{1}{6}·\dfrac{1}{6}=\dfrac{1}{36}$$

Como puedes ver, es menos probable; esto se debe a que la posibilidad de un dos en la segunda tirada (o evento 2) depende de otro evento (que es el evento 1), por lo cual es menos probable.

En el caso de una variable aleatoria continua, ya no podemos describir las cosas de esta manera, ya que no tenemos un número finito de valores. Esto significa que la probabilidad de un evento único es cero; pero, podemos encontrar la probabilidad de que obtenga un valor en un rango determinado.

Describimos una distribución continua mediante una función de densidad de probabilidad, normalmente denominada \(f(x)\). Para satisfacer el criterio de ser una distribución de probabilidad, necesitamos que el área bajo esta función sea igual a uno en el espacio muestral dado. Entonces, para hallar la probabilidad de que ocurra un suceso \(P(a<x<b)\), evaluamos la integral siguiente:

$$\int_a^b f(x)dx$$

Supongamos que tenemos un espacio muestral de \([0,1]\) y tenemos una variable aleatoria continua \(X\), con una función de densidad de probabilidad de: \(f(x)=4x^3\).

Encuentra la probabilidad de \(P(0<x<0{,}5)\):

$$P(0<x<0{,}5)=\int_0^{0{,}5} 4x^3dx=x^4\Big|_0^{0{,}5}=\dfrac{1}{16}$$

La distribución de Bernoulli

Puede ser que haya eventos en los que solo ocurran resultados binarios, donde binario significa que solo se obtienen dos valores. Estos experimentos que solo pueden ser uno u otro, verdadero o falso, siguen una distribución más simple, denominada distribución de Bernoulli.

Una distribución de Bernoulli es una distribución discreta. En esta distribución, el fracaso se calcula con la siguiente fórmula: \(q=1-p\), donde \(p\) es la probabilidad del evento.

Pongamos un ejemplo.

En una línea de producción existe una pieza que se ha calculado que tiene una probabilidad del \(10\%\) de ser defectuosa. ¿Cuál es el valor de la probabilidad \(p\) para nuestra distribución?

Solución:

Debemos, simplemente, despejar para obtener \(p=1-q\).

Y, dado que el \(10\%=0{,}1\), entonces: \(p=0{,}9\).

La distribución binomial

Al realizar un experimento con varios ensayos, podemos modelar el número de ensayos con éxito con una variable aleatoria discreta. En este caso, la distribución binomial es una generalización de la distribución de Bernoulli.

Podemos modelar el número de ensayos con éxitoXcon una distribución binomial \(X\sim B(n,p)\), si se cumplen las siguientes condiciones:

  • Un número fijo de ensayos o experimentos (\(n\)).

  • Dos resultados posibles (éxito o fracaso).

  • Una probabilidad de éxito fija (\(p\)).

  • Todos los ensayos son independientes.

Si una variable aleatoria \(X\) sigue una distribución binomial, podemos escribir \(X\sim B(n,p)\), esta tendrá la función de masa de probabilidad de:

$$P(X=x)=\begin{pmatrix}n\\x\end{pmatrix}p^x (1-p)^{n-p}$$

\(X\) se distribuye binomialmente con \(n=5\) y \(p=0{,}25\).

Encuentra \(P(X=2)\):

$$P(X=2)=\begin{pmatrix}5\\2\end{pmatrix}0{,}25^2·0{,}75^3=10·\dfrac{1}{16}·\dfrac{27}{64}=\dfrac{135}{512}$$

\(X\) se distribuye binomialmente con \(n=5\) y \(p=0{,}25\).

Halla:

$$\begin{align}P(X\leq 2)&=P(X=0)+P(X=1)+P(X=2)=\\&=P(X\leq 2)=\begin{pmatrix}5\\2\end{pmatrix}0{,}25^0·0{,}75^5+\begin{pmatrix}5\\1\end{pmatrix}0{,}25^1·0{,}75^4+\begin{pmatrix}5\\2\end{pmatrix}0{,}25·0{,}75^3=\\&=1·1·\dfrac{243}{1024}+5+\dfrac{1}{4}·\dfrac{81}{256}+10·\dfrac{1}{16}·\dfrac{27}{64}=\\&=\dfrac{459}{512} \end{align}$$

La distribución normal

La distribución normal es continua y viene dada por la función de densidad de probabilidad, que es:

$$f(x)=\dfrac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

Esta función tiene parámetros poblacionales que representan:

  1. La media de la población: \(\mu\).

  2. La varianza de la población: \(\sigma^2\).

  3. La desviación estándar: \(\sigma\).

Las matemáticas, para mostrar esto son complejas; pero, podemos decir que el resultado de integrar esta función es uno.

¡Por suerte, para encontrar las probabilidades de los intervalos, puedes utilizar tanto tu calculadora como las tablas estadísticas!

Una distribución normal es simétrica y se representa mediante una curva de campana, asintótica en ambos extremos. Su media es igual a la moda y a la mediana. Aproximadamente el \(68\%\) de los datos están dentro de una desviación estándar de la media, y esto se convierte en el \(95\%\) para dos desviaciones estándar y el \(99{,}7\%\) para tres desviaciones estándar.

Si trazamos la distribución normal, tiene el siguiente aspecto:

Distribuciones de probabilidad normal StudySmarterFig. 2: Distribución normal, mostrando los intervalos para la desviación estándar σ.

Si una variable aleatoria se distribuye binomialmente, con cierta media y varianza, entonces escribimos: \(X\sim N(\mu,\sigma^2)\).

\(X\) es una variable aleatoria, y la distribución que sigue tiene valores: \(X\sim (12{,}25)\)

Halla la desviación estándar y, luego, encuentra \(P(10<x<15)\).

Solución:

Si la varianza es \(25\), entonces la desviación estándar es \(5\); ya que: \(\sqrt{25}\).

La probabilidad es:

$$P(10<x<15)=P(X<15)-P(x<10)$$

$$P(10<x<15)=0{,}725-0{,}344=0{,}381$$

La distribución normal inversa

Como sugiere su nombre, la normal inversa se utiliza de forma opuesta a la normal: se da una región para la distribución normal y se utiliza para calcular la probabilidad. Sin embargo, con la normal inversa, se le da la probabilidad y se espera que encuentre la región asociada.

Esto se hace utilizando la distribución normal inversa en tu calculadora.

\(X\) es una variable aleatoria continua, y la distribución tiene los valores: \(X\sim N(6,4^2)\).

Encuentra la probabilidad para: \(P(x<a)=0{,}7\).

Solución:

Poniendo esto en la calculadora, obtendrás: \(a=8{,}097602\).

La distribución normal estándar

Es posible estandarizar nuestra distribución normal para que tenga una media de \(0\) y una desviación estándar de \(1\). Podemos hacerlo codificando los datos como: \(Z=\dfrac{X-\mu}{\sigma}\).

Esto da un conjunto de valores \(Z\). Entonces, la probabilidad se puede escribir como: \(P(Z<a)\).

Algunos valores para \(\phi(z)\) se pueden encontrar en tablas estadísticas.

La variable aleatoria \(X\) sigue la distribución: \(X\sim N(20,25)\).

Y se busca la probabilidad de:

$$P(16<x<28)$$

Solución:

$$\begin{align}P(16<x<28)&=P(X<28)-P(X<16)=\\&=P\left(Z<\dfrac{28-20}{5}\right)-P\left(Z<\dfrac{16-20}{5}\right)=\\&=P(Z<1{,}6)-P(Z<-0{,}8)=\\&=\phi(1{,}6)-\phi(0{,}8) \end{align}$$

Aproximación de la distribución binomial

En una situación en la que tenemos, \(X\sim B(n,p)\), si la muestra \(n\) es suficientemente grande y \(p\) está suficientemente cerca de \(0{,}5\), entonces la binomial puede ser aproximada por la distribución normal; donde denotamos:

$$\mu=np$$

$$\sigma=\sqrt{np(1-p)}$$

Al calcular las probabilidades utilizando esta aproximación, hay que tener en cuenta que hay que aplicar una corrección de continuidad cuando pasamos de una distribución continua a una discreta.

Por ejemplo, si tenemos la variable aleatoria \(X\sim B(n,p)\), que está siendo aproximada por \(Y\sim (\mu,\sigma)\), aplicaríamos las siguientes correcciones de continuidad:

  • \(P(X>n)\approx P(Y>n+0{,}5)\)
  • \(P(X<n)\approx P(Y<n-0{,}5)\)
  • \(P(X=n)\approx P(n-0{,}5<Y<n+0{,}5)\)
  • \(P(X\leq n)\approx P(Y<n+0{,}5)\)
  • \(P(X\geq n)\approx P(Y>n-0{,}5)\)

Supongamos que: \(X\sim B(200, 0{,}4)\).

Utiliza una aproximación normal para obtener: \(P(80<X\leq 95)\).

Si queremos que \(Y\) se aproxime a \(X\), con una aproximación normal, tenemos:

$$\mu=np=200·0{,}4=80$$

$$\sigma=\sqrt{np(1-p)}=\sqrt{200·0{,}4·0{,}6}=4\sqrt{3}$$

Para encontrar esta probabilidad, necesitamos utilizar una corrección de continuidad:

$$P(80<X\leq 95)=P(X<80)\approx P(Y<95{,}5)-P(Y<79{5})$$

$$P(80<X\leq 95)=0{,}984809-0{,}471234=0{,}513575$$

Distribuciones de probabilidad discretas

Las distribuciones de probabilidad discretas son aquellas en las que el valor de la variable es un número discreto dentro del intervalo \( [a,b]\).

Volvamos al ejemplo de las alturas de los alumnos: estas son una distribución continua, pueden tomar cualquier valor como \(1{,}23, 1{,}34, 1{,}27...\). Si quisiéramos convertir esto en una distribución discreta, podríamos decidir que los alumnos solo pueden medir \(1{,}2, 1{,}3, 1{,}4, 1{,}5, 1{,}6, 1{,}7\) y, por lo tanto, ningún otro valor es posible. Esto, por supuesto no es viable.

Pongamos, entonces, un ejemplo más sencillo.

Supongamos que deseas saber cuántos coches tiene una familia promedio en las afueras de un barrio de Madrid.

Para esto:

  1. Escoges un barrio.
  2. Cuentas cuántas casas familiares hay.
  3. Cuentas cuántos coches hay.

Aquí, el número mínimo es \(0\), excepto que todos tengan un coche; y el número máximo es la familia con más coches (o \(n\)).

Esta es una distribución discreta, porque solo puede haber números enteros de coches como \(2,3,4,5...\); pero, nunca \(1{,}5\) coches, por ejemplo.

Distribuciones - Puntos clave

  • Una distribución describe el conjunto de resultados de una variable aleatoria.
  • Una función de probabilidad es una variable aleatoria discreta, mientras que una función de densidad de probabilidad describe una variable aleatoria continua.
  • La distribución binomial es una distribución discreta con \(n\) ensayos y una probabilidad de éxito \(p\).
  • Las condiciones de la distribución binomial son: dos resultados posibles, un número fijo de ensayos, un resultado fijo de éxito y que todos los ensayos sean independientes.
  • Una distribución normal es una distribución continua con una media poblacional y una varianza poblacional.
  • La distribución normal inversa permite calcular una región de la distribución, dada una probabilidad.
  • La distribución normal estándar tiene una media de \(0\) y una desviación estándar de \(1\). Llegamos a esto desde la normal, usando: \(Z=\dfrac{X-\mu}{\sigma}\)
  • Podemos escribir la distribución de un valor como: \(P(Z,z)=\phi(z)\)
  • Podemos utilizar la distribución normal para aproximar una distribución binomial, siempre que la probabilidad de éxito sea cercana a \(0{,}5\) y el número de ensayos sea grande.
  • Al aproximar la distribución binomial, utilizando la distribución normal, debemos recurrir a una corrección de continuidad.

Preguntas frecuentes sobre Distribución de probabilidad

Las tres principales distribuciones de probabilidad que verás en tus cursos serán:

  • Distribución normal.
  • Distribución binomial. 
  • Distribución normal estándar.

Al realizar un experimento con varios ensayos, podemos modelar el número de ensayos con éxito con una variable aleatoria discreta. El ensayo puede ser exitoso o un fallo. Una distribución de probabilidad con esta característica es conocida como distribución binomial.

Las distribuciones de probabilidad discretas son aquellas en las que el valor de la variable es un número discreto dentro del intervalo [a,b].

Para poder calcular las probabilidades en una distribución normal estandarizada, primero se deben codificar los datos usando usando la siguiente fórmula:

Z=(X-μ)/σ


Donde:

 σ es la desviación estándar,

 μ es la media, 

 X es la variable aleatoria de la distribución. 


Al realizar el cálculo, se obtiene Z, que es el valor de la variable aleatoria en la distribución normal estándar.

Los cálculos en cada distribución de probabilidad son distintos, dependiendo de su tipo. En general, se deben saber sus medidas de tendencia central, como la media y la desviación estándar. 


Después de esto, se debe proceder a hacer cálculos para obtener la probabilidad de un cierto resultado en un experimento o ensayo. 


En la distribución normal estándar se usan tablas, mientras que en la distribución normal se puede usar la distribución de probabilidad.

Pon a prueba tus conocimientos con tarjetas de opción múltiple

Si el evento \(A\) tiene una probabilidad de \(0.3\) en un experimento que sigue una distribución binomial, ¿cuál es la probabilidad de \(B\)?

Si el evento \(B\) tiene una probabilidad de \(0{,}4\) en un experimento que sigue una distribución binomial, ¿cuál es la probabilidad de \(B\)?

Si el evento \(A\) tiene una probabilidad de \(0{,}4\) en un experimento que sigue una distribución binomial y \(B\) tiene una probabilidad de \(0{,}2\), ¿cuál es la probabilidad del tercer resultado \(C\)?

Siguiente
Conoce más sobre Distribución de probabilidad

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

La primera app de aprendizaje que realmente tiene todo lo que necesitas para superar tus exámenes en un solo lugar.

  • Tarjetas y cuestionarios
  • Asistente de Estudio con IA
  • Planificador de estudio
  • Exámenes simulados
  • Toma de notas inteligente
Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter. Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

Regístrate para poder subrayar y tomar apuntes. Es 100% gratis.

Entdecke Lernmaterial in der StudySmarter-App

Google Popup

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

La primera app de aprendizaje que realmente tiene todo lo que necesitas para superar tus exámenes en un solo lugar.

  • Tarjetas y cuestionarios
  • Asistente de Estudio con IA
  • Planificador de estudio
  • Exámenes simulados
  • Toma de notas inteligente
Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.