Saltar a un capítulo clave
¿Te parece convincente? Seguramente lo dicen para vender más. Lo bueno es que, en situaciones como la anterior, puedes utilizar una prueba de hipótesis para la pendiente de un modelo de regresión para comprobar lo útil que es una recta de regresión para modelizar el comportamiento entre dos conjuntos de datos.
Significado de la prueba de hipótesis para la pendiente de regresión
Supongamos que, para hallar la relación entre dos variables, has utilizado la regresión lineal para obtener una ecuación \[\hat{y}=\alpha+\beta x.\].
En teoría, esta ecuación debería permitirte predecir valores de \(y\), evaluando en \(x\), es decir, \(y\approx\hat{y}(x)\).
Pero, ¿cómo puedes estar seguro de que la ecuación de regresión lineal obtenida es buena para predecir los valores de \(y\)? Como hemos dicho al principio, una prueba de hipótesis puede ayudarte.
La prueba de hipótesis se basa en calcular la probabilidad de obtener una muestra como la tuya, si se asumen ciertas condiciones, en este caso, asumiendo la pendiente de regresión obtenida, cuál es la probabilidad de obtener la muestra en cuestión.
Recuerda que la pendiente \(\beta\) representa el cambio medio de la variable \(y\) respecto al cambio por unidad de la variable \(x\).
Importancia de la prueba de hipótesis para la pendiente de regresión
Siempre que utilices la regresión lineal para modelizar el comportamiento de dos conjuntos de datos que están relacionados, la pendiente de regresión que obtienes es una estimación de cómo cambia un dato respecto al otro.
Normalmente, esta ecuación de regresión lineal cambia cada vez que tomas una muestra diferente, por lo que tiene sentido preguntarse si el valor real de la pendiente de la población es similar al que obtienes de la muestra utilizando la regresión lineal.
Las siguientes imágenes muestran los gráficos de dispersión de \(2\) conjuntos de datos con su respectiva recta de regresión.
Una buena recta de regresión debería permitirte predecir los valores \(y-\)conociendo los valores \(x-\)con bastante exactitud. Si observas la primera imagen, te darás cuenta de que, como los puntos están cerca de la recta, la recta de regresión es buena.
En cambio, en la segunda imagen, varios valores están lejos de los valores predichos por la recta de regresión. Por este motivo, se puede decir que la recta de regresión no es tan buena.
En situaciones como la del gráfico anterior, tiene sentido dudar de lo buena que es la recta de regresión obtenida.
Prueba de hipótesis para los coeficientes de regresión
Hay muchas pruebas de hipótesis que se pueden realizar sobre la pendiente de la recta de regresión. Consisten en tener una hipótesis nula, que puede ser
\[H_0:\; \beta=\beta_0,\]
es decir, que la pendiente de la regresión es igual a un valor determinado.
Mientras que la hipótesis alternativa será alguna forma de negación de la hipótesis nula, como por ejemplo
\( H_a:\;\beta>\beta_0 \);
\(H_a:\; \beta<\beta_0 \); o
\( H_a:\; \beta\neq\beta_0 \).
Aunque la pendiente de una recta de regresión puede tener muchos valores, las pruebas de hipótesis generalmente sólo se centran en responder: ¿Es la pendiente diferente de cero? Si es distinta de cero, entonces podrás utilizarla para hacer predicciones. Por lo tanto, este artículo sólo se centrará en formular este tipo de hipótesis.
¿Por qué no puedes utilizar una recta de regresión con pendiente cero para hacer predicciones? Una recta de regresión con pendiente cero significa que los datos de \(y\) no dependen de \(x\), es decir, conocer el valor de \(x\) no te permite predecir el valor de \(y\) utilizando la recta de regresión. Esto significa que la recta de regresión no es útil.
Condiciones para la prueba de hipótesis de la pendiente de regresión
Para poder hacer inferencias sobre los coeficientes de la recta de regresión, debes asegurarte de que tus datos cumplen las siguientes condiciones:
Linealidad: El diagrama de dispersión de los datos parece recto.
Independencia: Los residuos deben ser independientes (consulta el artículo Residuos para obtener más información al respecto).
Igualdad de varianza: La desviación típica de los valores de \(y\) debe ser casi igual para todos los valores de \(x\).
Población normal: Los valores \(y\)- se distribuyen normalmente para cualquier valor de \(x\).
Métodos de prueba de hipótesis para la pendiente de regresión
Recuerda que en este artículo sólo aprenderás a realizar la prueba de hipótesis para demostrar que la pendiente de la recta de regresión es distinta de cero. Por tanto, el procedimiento es el siguiente:
Paso 1. Plantea las hipótesis.
La hipótesis nula y la hipótesis alternativa vienen dadas por
\[\begin{align} &H_0\\; :\beta=0 \\\\\ H_a:\\a;\beta\neq 0. \end{align}\]
La hipótesis nula afirma que la pendiente es cero, lo que equivale a decir que no existe una relación lineal útil entre \(x\) y \(y\), mientras que la hipótesis alternativa afirma que existe una relación lineal útil.
Paso 2. Determina el nivel de significación que vas a utilizar.
Normalmente, el nivel de significación \(\alfa) se toma como \(0,05\), pero también puedes considerar \(0,01\), o \(0,1\).
Paso 3. Halla el estadístico de la prueba y el valor \(p-\)correspondiente.
Para este paso, necesitas el error típico de la pendiente, la pendiente de la regresión lineal, los grados de libertad (para muestras que tienen \(n\) pares de datos, los grados de libertad son \(n-2\)) y el valor \(p-\)asociado al estadístico de prueba.
La estadística de la prueba viene dada por
\[t=frac{b}{s_b},\]
donde \(b\) es la pendiente de la recta de regresión de la muestra, y el error típico \(s_b\) viene dado por
\[s_b=\frac{s_e}{\sqrt{\sum\limits_{i=1}^n(x_i-\mu_x)^2}}\]
donde
\[s_e=\sqrt{\frac{\sum\limits_{i=1}^n(y_i-\hat{y})^2}{n-2}}.\]
Recuerda que para un tamaño de muestra pequeño, o cuando no conozcas la varianza de la población, utilizarás la distribución \(t\)-en lugar de una distribución normal.
También necesitarás los grados de libertad de la distribución "t". Como se trata de datos emparejados (el valor de \(x\) está emparejado con un valor de \(y\)), hay \(n-2\) grados de libertad.
Paso 4. Interpreta los resultados.
Si el resultado obtenido en la muestra es inusual, dada la hipótesis nula, entonces se rechaza la hipótesis nula.
Este paso consiste en comparar el valor \(p\)- obtenido con el nivel de significación, y se rechaza la hipótesis nula si el valor \(p\)- es menor que el nivel de significación. En caso contrario, no podrás rechazar la hipótesis nula.
Consulta el artículo Pruebas de hipótesis para obtener una explicación de por qué no se dicen cosas como "la hipótesis nula es cierta".
Ejemplo de prueba de hipótesis para la pendiente de regresión
Ana quiere saber si existe una relación lineal útil entre el tamaño de la mano y el tamaño del pie. Para ello, decide recoger datos de su familia. A continuación se muestra la tabla con las tallas de manos y pies en centímetros de los distintos miembros de su familia.
Tamaño de la mano | 15 | 17 | 18 | 19 | 21 |
Talla del pie | 17 | 24 | 26 | 25 | 28.5 |
¿Existe una relación lineal significativa entre el tamaño de la mano y el del pie? Utiliza un nivel de significación de \(\alfa=0,05\).
Solución:
Lo primero que hay que hacer es comprobar las condiciones para hacer una prueba de hipótesis. Haciendo un gráfico rápido de los datos, puedes ver que cumplen las condiciones de linealidad , independencia, igual varianza y población normal.
Paso 1. Como quieres saber si existe una relación lineal significativa entre los dos datos, la hipótesis nula es
\[H_0:\;\beta=0,\]
que dice que no hay relación lineal útil. La hipótesis alternativa es
\[H_a:\;\beta\neq0 ,\]
que dice que existe una relación lineal útil.
Paso 2. En este caso, el nivel de significación es \(\alfa=0,05\).
Paso 3. Utilizando una calculadora estadística puedes obtener que la recta de regresión para los datos anteriores.
Si quieres calcular la recta de regresión a mano, consulta el artículo Regresión por mínimos cuadrados para obtener información sobre cómo hacerlo junto con un ejemplo.
La regresión dada por
\[\hat{y}=1.775x-7.85,\]
y el error típico es
\[s_b=0,43.\]
A continuación, calcula el estadístico de la prueba mediante la fórmula
\[\begin{align} t&=\frac{b}{s_b}\\ &=\frac{1,775}{0,43}\ &=4,128.\end{align}\]
Como tienes 5 pares de datos, tu estadístico de prueba sigue una distribución t con 3 grados de libertad.
Paso 4. Si utilizas una tabla \(t), puedes ver que el valor \(p) asociado a \(4,128), con \(3) grados de libertad, está entre \(0,01) y \(0,025). Como el valor \(p\)-es menor que el nivel de significación \((0,05)\), se rechaza la hipótesis nula.
Para más información sobre cómo utilizar la tabla \(t\)-, consulta nuestro artículo Distribución \(t\)-.
Por lo tanto, hay pruebas de que existe una relación lineal útil entre el tamaño de la mano y el tamaño del pie.
Prueba de hipótesis para la pendiente de regresión - Aspectos clave
- La prueba de hipótesis para la pendiente de regresión consiste en comprobar si existe una relación lineal útil entre los datos.
- La hipótesis nula utilizada al hacer una prueba de hipótesis para la pendiente de una recta de regresión es \(H_0:\; \beta=0\), y la hipótesis alternativa es \(H_a:\; \beta\neq 0\), donde \(\beta\) es la pendiente de la recta de regresión.
- Para realizar la prueba de hipótesis de la pendiente de una recta de regresión, deben verificarse las condiciones de linealidad, independencia, igualdad de varianzas y población normal.
Aprende más rápido con las 9 tarjetas sobre Pruebas de hipótesis para la pendiente de un modelo de regresión
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Pruebas de hipótesis para la pendiente de un modelo de regresión
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más