Saltar a un capítulo clave
¿Te interesan los datos estadísticamente significativos? ¡Sigue leyendo!
Datos estadísticamente significativos: Definición
Empecemos con una definición.
Los datosestadísticamente significativos se refieren a los resultados de un experimento que probablemente se atribuyan a una causa específica.
Si los datos de un experimento son estadísticamente significativos, es poco probable que el resultado se haya producido por casualidad.
Es importante tener en cuenta el error de muestreo, la probabilidad y la certeza.
Error de muestreo: error estadístico que se produce cuando un analista selecciona una muestra que no representa efectivamente a toda la población.
Probabilidad: probabilidad de que ocurra un hecho.
Probabilidad frente a certeza
Nada en la vida es 100% seguro. Podrían crecerte alas y adquirir la capacidad de volar. Sí, es muy poco probable, pero no imposible. No hay forma de saberlo con certeza.
Por eso, en estadística utilizamos la probabilidad, no la certeza.
Análisis estadístico y datos estadísticamente significativos
¿Qué es la estadística y por qué la necesitamos?
Las estadísticas son pruebas que se utilizan para analizar, interpretar y presentar datos numéricos.
Sin pruebas estadísticas, nuestros datos no significan realmente nada. No son más que una colección de números. Pero analizando nuestros datos, podemos encontrar asociaciones o diferencias entre ellos, que respaldan nuestros resultados y nos ayudan a comprender mejor el entorno natural.
Hipótesis
Al planificar un experimento, los científicos formulan dos hipótesis: la hipótesis nula y la hipótesis alternativa.
La hipótesis nula (H0) afirma que no habrá relaciones o diferencias significativas en los datos.
La hipótesis alternativa (H1) afirma que habrá una relación o diferencia significativa en los datos.
Amy quiere saber si los bebés prefieren jugar con juguetes azules antes que con juguetes naranjas.
H0: Los bebés no prefieren jugar con juguetes azules a jugar con juguetes naranjas.
H1: Los bebés prefieren jugar con juguetes azules a jugar con juguetes naranjas.
Si el experimento muestra un resultado estadísticamente significativo, se rechazará la hipótesis nula. Si no muestra un resultado estadísticamente significativo, se aceptará la hipótesis nula.
Comprobación de la significación estadística
Para comprobar que los resultados de una prueba estadística son significativos, debemos comprobar el nivel de significación y los grados de libertad.
Niveles de significación
El nivel de significación (también llamado valor p) es la probabilidad de rechazar incorrectamente la hipótesis nula.
El valor p describe la probabilidad, no la certeza.
En biología y ciencias ambientales, el nivel de significación es 0,05. Esto significa que si hay menos de un 5% de probabilidades de rechazar incorrectamente la hipótesis nula, los datos se consideran estadísticamente significativos.
Grados de libertad
Grados de libertad = n - 1, donde n es el tamaño del conjunto de datos.
El uso de grados de libertad nos ayuda a encontrar valores críticos de corte para las pruebas estadísticas. Cuantos más grados de libertad haya, mayor será el valor crítico.
Los valores críticos se encuentran en tablas. Puedes encontrarlas fácilmente en Internet o en un libro de estadística.
Datos estadísticamente significativos: Varianza
La varianza es una forma de medir las diferencias entre dos conjuntos de datos. Considera la dispersión de los puntos de datos dentro de un conjunto de datos.
Los científicos pueden comprobar la varianza mediante la prueba F. ¿Cómo funciona?
Calcula la media de tu conjunto de datos.
Resta cada punto de datos de la media para hallar su desviación.
Eleva al cuadrado cada desviación para asegurarte de que tienes un número positivo.
Halla la suma de los cuadrados.
Divide los cuadrados por n-1 para hallar las varianzas.
Divide la varianza mayor entre la menor para hallar el valor F calculado.
Compara el valor calculado con el valor crítico. Si el valor calculado es menor que el valor crítico, existe una varianza estadísticamente significativa.
n es el tamaño de tu conjunto de datos.
Varianza: Ejemplo
Un meteorólogo quería ver si hay una diferencia significativa entre la velocidad del viento en Hull y la velocidad del viento en Nottingham. Redactó dos hipótesis.
Hipótesis nula: No hay diferencia significativa entre la velocidad del viento en Hull y la velocidad del viento en Nottingham.
Hipótesis alternativa: Existe una diferencia significativa entre la velocidad del viento en Hull y la velocidad del viento en Nottingham.
Después, recopiló las medias mensuales y las utilizó para calcular la varianza.
Mes | Casco Velocidad del viento (km/h) | Casco Desviación | Casco Desviación2 | Nottingham Velocidad del viento (km/h) | Nottingham Desviación | NottinghamDesviación2 |
Enero | 24.3 | -4.2 | 17.64 | 21.5 | -3.2 | 10.24 |
Febrero | 23.0 | -2.9 | 8.41 | 20.7 | -2.4 | 5.76 |
Marzo | 21.5 | -1.4 | 1.96 | 19.8 | -1.5 | 2.25 |
Abril | 18.9 | 1.2 | 1.44 | 17.6 | 0.7 | 0.39 |
Mayo | 17.7 | 2.4 | 5.76 | 16.8 | 1.5 | 2.25 |
Junio | 16.3 | 3.8 | 14.44 | 15.7 | 2.6 | 6.76 |
Julio | 16.1 | 4.0 | 16 | 15.7 | 2.6 | 6.76 |
Agosto | 17.1 | 3.0 | 9 | 16.0 | 2.3 | 5.29 |
Septiembre | 19.3 | 0.8 | 0.64 | 17.4 | 0.9 | 0.81 |
Octubre | 21.4 | -1.3 | 1.69 | 18.8 | -0.5 | 0.25 |
Noviembre | 22.4 | -2.3 | 5.29 | 19.4 | -1.1 | 1.21 |
Diciembre | 23.3 | -3.2 | 10.24 | 20.4 | -2.1 | 4.41 |
Media | 20.1 | N.D. | N.D. | 18.3 | N.D. | N.D. |
Suma | N/A | N/A | 92.51 | N/A | N/A | 46.38 |
Para Hull, la velocidad media del viento es de 20,1 km/h. La suma de las desviaciones al cuadrado es 92,51.
Desviación:
92.51 ÷ (12-1)
92.51 ÷ 11 = 8.41
Para Nottingham, la velocidad media del viento es de 18,3 km/h. La suma de las desviaciones al cuadrado es 46,38.
Varianza:
46.38 ÷ (12-1)
46.38 ÷ 11 = 4 .22
Valor F calculado = 8,41 ÷ 4,22 = 1,99
Por último, la meteoróloga halló el valor crítico f en una tabla. Se aseguró de comprobar los grados de libertad (en este ejemplo, 11) y el nivel de significación (0,05).
Para esta prueba, el valor crítico F es 2,16.
Como el valor F calculado es inferior al valor F crítico, existe una varianza estadísticamente significativa entre los conjuntos de datos. El meteorólogo rechazó la hipótesis nula.
Datos estadísticamente significativos: Correlación
El coeficiente de correlación de rango de Spearman se utiliza para comprobar si existe una asociación o relación entre dos variables. La relación puede ser positiva o negativa.
Relaciónpositiva : el aumento de una variable está asociado al aumento de la otra
Relación negativa: el aumento de una variable se asocia a una disminución de la otra
Al realizar una prueba de Rango de Spearman, es importante comprender que correlación ≠ causalidad. Que dos cosas estén relacionadas no significa que una provoque un cambio en la otra.
El consumo de chocolate per cápita está correlacionado con los Premios Nobel per cápita. Por desgracia, ¡eso no significa necesariamente que comer más chocolate te haga más inteligente!
¿Cómo funciona el rango de Spearman?
Ordena los puntos de datos de ambas variables.
Calcula la diferencia entre los rangos.
Eleva al cuadrado la diferencia de rangos para asegurarte de que tienes un número positivo.
Introduce los datos en la ecuación que se muestra a continuación para obtener el valor r calculado.
Compara el valor calculado con el valor crítico. Si el valor calculado es igual o superior al valor crítico, existe una varianza estadísticamente significativa.
Al clasificar los datos, puede hacerse de menor a mayor o de mayor a menor. Sólo asegúrate de que clasificas ambas variables utilizando el mismo método.
Ecuación: p = 1 - (6 x ∑ D2) ÷ (n(n2-1))
- D: diferencia de rangos
- n: número de puntos de datos del conjunto
Correlación: Ejemplo
Un zoólogo quería saber si el número de manchas de un dálmata estaba relacionado con su peso. Redactó dos hipótesis.
Hipótesis nula: El número de manchas de un dálmata no está relacionado con su peso.
Hipótesis alternativa: El número de manchas de un dálmata está relacionado con su peso.
Pesó diez dálmatas adultos y contó cuántas manchas tenían.
Peso (kg) | Puntos | Rango de Peso | Rango de manchas | Diferencia entre rangos | Diferencia2 |
24.8 | 113 | 6 | 5 | 1 | 1 |
22.2 | 144 | 3 | 8 | -5 | 25 |
19.3 | 199 | 1 | 10 | -9 | 81 |
28.9 | 65 | 9 | 2 | 7 | 49 |
26.0 | 129 | 7 | 7 | 0 | 0 |
20.1 | 78 | 2 | 3 | -1 | 1 |
31.2 | 145 | 10 | 9 | 1 | 1 |
23.5 | 50 | 4 | 1 | 3 | 9 |
24.5 | 123 | 5 | 6 | -1 | 1 |
26.7 | 110 | 8 | 4 | 4 | 16 |
Suma | 184 |
A continuación, el zoólogo introdujo los datos en la ecuación
p = 1 - (6 × 184) ÷ (12(122-1))
p = 1 - (1104 ÷ 1716)
Valor p calculado = 0,356
Por último, el zoólogo halló el valor p crítico. Para esta prueba, el valor p crítico fue de 0 ,553. Como el valor p calculado era inferior al valor p crítico, no existe una correlación estadísticamente significativa entre las variables. El zoólogo aceptó la hipótesis nula.
Espero que este artículo te haya aclarado los datos estadísticamente significativos. Un dato estadísticamente significativo es un resultado que es muy improbable que se haya producido por casualidad. Para determinar si tus datos son estadísticamente significativos, tienes que comparar tu valor calculado con el valor crítico (que depende del nivel de significación y de los grados de libertad).
Datos estadísticamente significativos - Puntos clave
- Estadísticamente datos significativos se refiere a los resultados de un experimento que es probable que se atribuyan a una causa específica.
- Utilizamos pruebas estadísticas para encontrar asociaciones o diferencias en nuestros datos. Esto respalda nuestros resultados y nos ayuda a comprender mejor el mundo natural.
- Al planificar un experimento, escribimos una hipótesis nula y una hipótesis alternativa. Si el resultado es estadísticamente significativo, se rechaza la hipótesis nula.
- Al comprobar la significación, necesitamos utilizar niveles de significación (normalmente 0,05) y grados de libertad (n-1).
- La varianza mide la diferencia entre dos conjuntos de datos, teniendo en cuenta la dispersión de los puntos de datos. Se utiliza una prueba F para ver si la varianza es estadísticamente significativa.
- Una correlación comprueba si existe una asociación o relación entre dos variables. Se utiliza una prueba de rango de Spearman para ver si la correlación es estadísticamente significativa.
1. Aloys Leo Prinz, Consumo de chocolate y premios Noble, Social Sciences & Humanities Open, 2020
2. Harry Dean, ¿Los dálmatas nacen con manchas? La mayoría no lo sabe, The Puppy Mag, 2022
3. Hill's, Información sobre la raza de perro dálmata y rasgos de personalidad, 2022
4. Weather Spark, Clima y tiempo medio durante todo el año en Hull, 2022
5. 5. Chispa del tiempo, clima y tiempo medio durante todo el año en Nottingham, 2022
Aprende más rápido con las 5 tarjetas sobre Datos estadísticamente significativos
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Datos estadísticamente significativos
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más