Saltar a un capítulo clave
Definición de la distribución t
Puede que conozcas la distribución normal como una curva en forma de campana, ¡pero no es la única distribución en forma de campana que existe!
Hay muchas otras que comparten esta forma, una de las cuales es la distribución \(t\)-. Aunque estas dos distribuciones son muy parecidas, se utilizan en situaciones diferentes.
Utilizarías una distribución normal si estuvieras haciendo un intervalo de confianza o una prueba de hipótesis en la que
las poblaciones se distribuyen normalmente y tienen igual varianza
se conoce la varianza de la población; o
el tamaño de la muestra es grande.
Por otra parte, utilizarías una distribución \(t\)- si estuvieras haciendo un intervalo de confianza o una prueba de hipótesis en los casos en que:
la población se distribuye normalmente y no conoces las varianzas de la población; o
la población se distribuye normalmente pero el tamaño de la muestra es pequeño.
Recuerda que si conoces la varianza poblacional, o tienes una muestra suficientemente grande, para una variable aleatoria distribuida normalmente, \(X\), donde
\[\bar{X} \sim \text{N}\left(\mu, \dfrac{\sigma ^2}{n}\right)\].
puedes construir un intervalo de confianza o una prueba de hipótesis.
En realidad, no es probable que conozcas la varianza real de la población, del mismo modo que no sueles conocer la media de la población, que suele ser lo que estás comprobando.
Cuando el tamaño de la muestra \(n\) es lo suficientemente grande, puedes utilizar la varianza muestral \(S\) en lugar de la varianza poblacional \(\sigma\). En este caso, el Teorema Central del Límite te da que
\[\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}\]
es aproximadamente normal, y
\[\frac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}} \approx \text{N}(0,1^2).\]
Cuando \(n\) es pequeño, en lugar de utilizar la distribución normal, puedes utilizar la distribución \(t\). El valor de \(t\) viene dado por
\[t=\frac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}.\]
A continuación puedes ver el gráfico de la distribución normal estándar comparada con la distribución \(t\) para distintos valores de \(n\).
Como puedes ver en el gráfico anterior, a medida que aumenta \(n\), la distribución \(t\)-se acerca más a la distribución normal estándar. Ésta es una de las razones por las que los estadísticos afirman que un tamaño de muestra de \(20\) suele ser lo suficientemente grande como para pasar de utilizar una distribución \(t\) a una distribución normal.
Como el tamaño de la muestra desempeña un papel importante en las distribuciones t, recibe un nombre especial, como verás en el siguiente apartado.
Grados de libertad en la distribución t
Al igual que ocurre con la distribución chi-cuadrado y la distribución \(F\), el tamaño de la muestra \(n\) determina el número de grados de libertad. El tamaño de la muestra te dice dos cosas sobre los grados de libertad de la distribución \(t\)-:
El número de grados de libertad, \(\upsilon\), viene determinado por el tamaño de la muestra menos \(1\): \(\upsilon = n-1\).
A medida que \(\upsilon \a \infty\), la distribución \(t\)-se aproxima a \(\text{N}(0,1^2)\).
De hecho, las distribuciones normal y \(t\)-son bastante similares. Ambas son simétricas y presentan una forma de curva de campana, y tienen el mismo comportamiento final.
Para indicar que estás utilizando un grado de libertad concreto para una distribución \(t\)-puedes escribir distribución \(t_\upsilon\).
La fórmula de la distribución t
La siguiente es la fórmula que necesitarás para la distribución t.
Si se selecciona una muestra aleatoria \(X_1,X_2,X_3, \dots,X_n\) de una distribución normal con una varianza desconocida \(\sigma ^2\), entonces
\[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}\]
donde \(t\) es una \(t_{n-1})-distribución y \(S^2\) es un estimador insesgado de \(|sigma^2\).
Para recordar lo que significa ser insesgado, consulta el artículo Sesgo del estimador.
Al igual que con la distribución normal estándar, existen tablas de valores que puedes utilizar con la distribución \(t\)-.
Tablas para la distribución t
La tabla siguiente es una sección de una tabla de probabilidades de la distribución t.
Tabla 1. \Tabla de probabilidad de la distribución t
\(0,100%) | \(0.100\) | \(0.050\) | \(0.025\) |
\(1\) | \(3.0777\) | \(6.3138\) | \(12.7062\) |
\(2\) | \(1.8856\) | \(2.9200\) | \(4.3027\) |
\(3\) | \(1.6377\) | \(2.3534\) | \(3.1824\) |
Los valores de la tabla son los que superan la probabilidad en la parte superior de la tabla dado un determinado número de grados de libertad.
Por ejemplo, supongamos que \(X\) tiene \(3\) grados de libertad. El número \(3,1824\) de la esquina inferior derecha de la tabla anterior significa que
\(P(X>3,1824) = 0,025\); y
\(P(X<3,1824) = 1-0,025=0,975\).
Como la distribución \(t\)-es simétrica para cualquier grado de libertad, también sabes que
\(P(X<-3,1824) = 0,025\); y
\(P(X>-3,1824) = 1-0,025=0,975\).
El área \(P(X>3.1824 )=0,025\) para una curva de distribución \(t\) con \(3\) grados de libertad está sombreada en el gráfico siguiente. Recuerda que cuando \(\upsilon = 3\) el tamaño de la muestra es \(n=4\).
Veamos un ejemplo.
Supón que \(X\) es una variable aleatoria con grados de libertad \(\upsilon\). Halla el valor de \(s\) donde \(P(|X|<s)=0,80\) donde \(\upsilon = 3\).
Solución
Observa que \(P( |X|<s) =0,80\) es lo mismo que \(P(|X|>s)=0,20\) porque la distribución \(t\)-es simétrica. Esto parece un poco raro, pero significa simplemente que \(P(X<-s)=0,1\) y \(P(X>s)=0,1\). A menudo puede ser útil hacer un dibujo de lo que estás buscando.
Puedes utilizar la tabla de distribución \(t\) o una calculadora para averiguar que el valor de \(s\) que te da \(P (X>s)=0,1\) es \(s=1,6377 \).
Valores críticos de la distribución t
Los valores críticos se utilizan al construir intervalos de confianza. Los intervalos de confianza dependen del nivel de confianza que estés utilizando. Recuerda que los límites de confianza para un \(100(1-alfa)\%) siempre tienen la forma
estadístico de prueba \(\pm\) (\(t\)-valor crítico)(error típico).
En el caso de las distribuciones \(t\)-, el error típico viene dado por
\[ \text{error típico} = \frac{s}{cuadrado{n}},\}].
y el valor crítico es
\text{valor crítico} =t^*= t_{n-1}\left(\frac{alfa}{2}\right) .\]
Solución:
Para el nivel de confianza \(90\%\), el primer objetivo es hallar \(\alpha\). Aquí
\[ 90\% = 100\%(1-alfa) \]
por lo que
\[ 0,9 = 1 - \alpha\\}]
y
\[ \alfa = 0,1.\]
Entonces, para el valor crítico de \(t\),
\^*& = t_{n-1} izquierda(\frac{\alpha} {2} derecha) \ & = t_2 izquierda(\frac{0,10} {2} derecha) \ &= t_2(0,05) \ &= 2,92 . \end{align}\]
Del mismo modo, para el nivel de confianza \(95\%\), el valor crítico \(t\)es
\t^*& = t_{n-1}left(\frac{\alpha}{2}\right) \ & = t_2left(\frac{0,05}{2}\right) \ &= t_2(0,025) \&= 4,3027, \end{align} \]
y para el nivel de confianza \(99\%) el valor crítico \(t\)es
\t^*& = t_{n-1}izquierda(\frac{0,01}{2}derecha) \ & = t_2izquierda(\frac{0,01}{2}derecha) \ &= t_2(0,005) \ &= 9,925 . \end{align}\]
Observa que, a medida que aumenta el nivel de confianza, también lo hace el valor crítico \(t\), lo que significa que tu intervalo de confianza aumenta. Esto tiene sentido por dos razones principales
cuanto más confías en una predicción, más difícil es garantizar que has capturado el parámetro poblacional en el intervalo de confianza; y
el valor crítico \(t\)-está relacionado con el área bajo la curva de distribución \(t\)-.
Por ejemplo, en el nivel de confianza \(80\%\) en realidad estás pidiendo que se capture \(80\%\) del área bajo la curva en el área sombreada. Cuanto mayor sea tu nivel de confianza, ¡mayor será el área sombreada!
Esta es una de las razones por las que puede ser útil hacer un dibujo de lo que intentas averiguar antes de echar mano de la calculadora o de la tabla de la distribución T.
Distribución T - Puntos clave
- Si la muestra aleatoria \(X_1,X_2,X_3, \dots,X_n\) se distribuye normalmente con una varianza desconocida, \(\sigma ^2\), entonces tienes \[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{sqrt{n}}}] donde \(t\) tiene una distribución \(t_{n-1}) y \(S^2\) es un estimador insesgado de \(\sigma ^2\).
- El número de grados de libertad viene determinado por el tamaño de la muestra menos \(1\),\(\upsilon = n-1\).
- A medida que \(\upsilon \a \infty\), la distribución \(t\) se aproxima a \(\text{N}(0,1^2)\).
- El valor crítico, \(t^*\), para el nivel de confianza \(\alpha\) puede hallarse con la fórmula \[ t^*= t_{n-1}\left(\frac{\alpha}{2}\right). \]
Aprende más rápido con las 11 tarjetas sobre Distribución T
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Distribución T
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más