Saltar a un capítulo clave
¿Cuál es la definición de análisis estadístico en biología?
El análisisestadístico consiste en recopilar, explorar e interpretar conjuntos de datos para descubrir tendencias y patrones que permitan sacar conclusiones.
Dentro de la biología, tenemos el campo de la bioestadística.
Labioestadística es el campo de estudio en el que los investigadores aplican el análisis estadístico a temas biológicos.
Por ejemplo, podemos diseñar experimentos biológicos, con el fin de extraer y analizar datos y, finalmente, interpretar los resultados para llegar a conclusiones.
Las partes esenciales de los experimentos biológicos que implican el análisis estadístico en orden son:
1. Determinación del tamaño de las muestras
- La selección aleatoria significa que todos los miembros de una población muestreada tienen la posibilidad de ser seleccionados.
- Realizamos la selección aleatoria porque los investigadores esperan que, al extraer una muestra de una población grande, la muestra o el grupo sea más representativo de toda la población.
- En general, la selección aleatoria ayuda a garantizar que es menos probable que se produzcan sesgos.
- Otras partes vitales de la determinación del tamaño de las muestras incluyen la selección del número correcto de ensayos. Por ejemplo, en los ensayos clínicos para el desarrollo de fármacos, la FDA (Administración de Alimentos y Medicamentos de EE.UU.) exige ensayos de Fase I, II y III. Estos ensayos son necesarios para determinar si se puede aprobar el uso del fármaco.
2. Comprobación de hipótesis
- Tras elegir el tamaño de la muestra y el número de ensayos, los científicos deben considerar si sus datos arrojarán resultados estadísticamente significativos.
- Los científicos lo hacen estableciendo una hipótesis nula y calculando el valor p. Ambas cosas las estudiaremos más a fondo en secciones posteriores. Lo importante ahora es comprender que obtener resultados estadísticamente significativos significa que es improbable que un resultado se deba al azar. Por lo tanto, lo más probable es que el resultado sea exacto y se pueda confiar en él.
3. Interpretación de los datos
- Para concluir cualquier cosa, tenemos que ser capaces de interpretar los datos.
- Hoy en día, utilizamos Software de Análisis Estadístico (SAS), Excel o lenguajes de programación como Python y R para conjuntos de datos sustanciales.
- Algunos métodos que te ayudan a interpretar los datos son la determinación del tamaño de la muestra, la desviación típica, la media y la regresión. Ampliaremos esta información en la sección de métodos de análisis estadístico.
Tipos de análisis estadístico en biología
Tras repasar qué es el análisis estadístico, ahora podemos centrarnos en los tipos habituales de análisis estadístico que se utilizan en los experimentos biológicos.
Análisis estadístico descriptivo
- La estadística descriptiva describe o resume los datos.
- Esta estadística no te permite hacer inferencias o conclusiones más allá de los datos.
- Los estadísticos descriptivos son esenciales para ayudar a visualizar cantidades considerables de datos.
- Ejemplos habituales de análisis descriptivo son las medidas de tendencia central (media, mediana, moda), las medidas de dispersión (desviación típica, rango y cuartiles), la asimetría y el coeficiente de correlación.
Análisis estadístico inferencial
- La estadística inferencial nos permite comparar lo que estamos probando y hacer predicciones a partir de los datos, a diferencia de la estadística descriptiva.
- La estadística inferencial utiliza múltiples tamaños de muestra y ensayos para hacer generalizaciones sobre la población en general.
- Las generalizaciones que podemos hacer son si los datos de nuestra muestra o experimento se basan en el azar o son estadísticamente significativos. Estadísticamente significativo significa que los datos de la muestra son representativos de la población en la que estamos interesados.
- Ejemplos habituales de análisis inferencial son las pruebas t, chi-cuadrado, valores p y regresión lineal.
Aunque hay más análisis estadísticos que los dos mencionados, el descriptivo y el inferencial son los más habituales en la investigación biológica.
Métodos de análisis estadístico
Ahora que hemos visto los tipos de análisis estadístico en biología. Podemos repasar con más detalle los ejemplos comunes mencionados en las estadísticas descriptiva e inferencial. La cantidad de información de este artículo se limitará únicamente a las estadísticas que necesitamos conocer en biología.
Correlacionales
Los estudios o pruebas correlacionales miden lo estrechamente relacionadas que están dos o más variables. Por estrechamente relacionadas entendemos linealmente o cómo cambian juntas a un ritmo constante. Los científicos suelen utilizar este método para describir relaciones entre dos o más variables sin vincular una causa y un efecto. Como los estudios correlacionales entran dentro de la estadística descriptiva, ayudan a describir relaciones sencillas. Por ejemplo, piensa en cómo se correlacionan el tiempo dedicado al estudio y las notas. Normalmente, diríamos que están correlacionadas positivamente si los alumnos estudian activamente.
Medimos las correlaciones utilizando el coeficiente de correlación o r, que va de -1 a +1.
- Los valores negativos de r indican una correlación negativa. Una correlación o relación negativa se produce cuando una variable aumenta y la otra disminuye, como se muestra en la Figura 1.
- Los valores positivos de r indican una correlación positiva. Una correlación o relación positiva se produce cuando ambas variables aumentan, como se muestra en la figura 2.
- Una correlación negativa perfecta sería r= -1, y una correlación positiva perfecta sería r= +1. Es extremadamente raro encontrar correlaciones perfectas en el mundo real.
- Por ejemplo, si nos fijamos en la Figura 2, se daría una correlación perfecta de r= +1 si cada vez que el alumno estudiara, subieran sus notas. Esto no ocurre porque 1) la máxima nota que puede obtener un estudiante es el 100%, 2) después de un tiempo estudiando, obtenemos rendimientos decrecientes porque los estudiantes se distraen, se cansan, etc., y 3) necesitamos una cantidad adecuada de nutrición y sueño para que nuestro cerebro funcione óptimamente.
- Cuanto más se acerque r a 0, más probable es que no haya ninguna correlación, como se muestra en la Figura 3.
Cuanto mayor sea la pendiente, ya sea negativa o positiva, mayor será la inclinación de la línea. La diferencia es que las pendientes positivas se inclinan o se inclinan hacia la derecha, en comparación con las negativas, que se inclinan o se inclinan hacia la izquierda. El gráfico sin correlación es simplemente una línea recta o pendiente de 0.
Para más información sobre lacorrelación, visita nuestro artículo"Correlación".
Regresión
Las regresiones definen la fuerza entre una variable independiente (normalmente denominada X) y una variable dependiente (normalmente marcada como Y). Si intervienen más de dos variables independientes, estamos ante un modelo de regresión lineal múltiple. Medimos la regresión mediante el coeficiente de determinación o \( R^2\). Cuanto mayor sea el coeficiente de determinación, mejor se ajusta el modelo a nuestros datos.
Media
La media o promedio de un conjunto de datos es un término matemático comúnmente conocido. Lo utilizamos para observar el panorama general o la tendencia general de un conjunto de datos. Ten en cuenta que la media puede ser un método estadístico inexacto si los datos tienen muchos valores atípicos. La calculamos sumando todos los números del conjunto de datos y dividiéndolos por el número de números que haya en el conjunto de datos.
Desviación típica
La desviación típica es un método estadístico que mide la dispersión de nuestros datos respecto a la media. Una desviación típica baja significa que nuestros datos están cerca de la media y separados de la media o de la norma si nuestra desviación típica es alta. Las distribuciones normales tienen datos simétricos sin sesgo. Los investigadores suelen utilizar la desviación típica cuando necesitan determinar si sus puntos de datos están agrupados o no.
Ejemplos de análisis estadístico
Ahora que entendemos la definición de análisis estadístico y los tipos y métodos de análisis estadístico, es hora de pasar a los ejemplos o aplicaciones de los métodos de análisis estadístico mencionados anteriormente.
Algunos ejemplos de cómo los científicos utilizan la media en el análisis estadístico son la comprobación de hipótesis o la comparación de medias
El método de comparación de medias consiste en comparar las medias de dos o más conjuntos o grupos diferentes.
Si comparamos dos grupos o conjuntos, podemos utilizar pruebas t, pero si necesitas comparar más de dos grupos, los investigadores suelen utilizar una prueba ANOVA. Sólo repasaremos la prueba t, que es la más utilizada.
Para utilizar una prueba t, primero debemos suponer que nuestros datos lo son:
- Ambas muestras se obtuvieron mediante muestreo aleatorio.
- Ambas muestras tienen observaciones independientes entre sí.
- Ambas muestras tienen una distribución normal o cercana a ella.
- Ambas muestras tienen una varianza o distribución similar.
- Ambas muestras tienen datos continuos o que pueden tomar cualquier valor, no sólo números enteros.
¿Qué tipo de prueba t utilizan los científicos?
- Una prueba t pareada se utiliza cuando los grupos de interés proceden de una única población. Compara las medias de dos valores procedentes del mismo objeto, población, etc. Por ejemplo, comparar los niveles de colesterol de los mismos humanos o sujetos en 1999 y 2007.
- Una prueba t independiente o prueba t de dos muestras se utiliza cuando los grupos de interés proceden de poblaciones diferentes. Compara las medias de dos valores procedentes de objetos, poblaciones, etc. diferentes. Por ejemplo, comparar los niveles de colesterol en 1999 entre diferentes humanos o sujetos.
- La prueba t de una muestra se utiliza cuando se compara un grupo con una medida o valor estándar. Por ejemplo, los científicos saben que el nivel ideal de colesterol de una mujer es de unos 50 mg/dl. Los científicos recopilan datos de mujeres que acuden al mismo hospital y han sido absueltas de problemas de colesterol. Quieren ver cómo se compara la media de este grupo con el valor de 50 mg/dl.
Tras seleccionar el tipo de prueba t que necesitan en función de sus experimentos, los investigadores suelen utilizar un software estadístico para calcular el valor t. Cuanto mayor sea el valor t absoluto, más probable es que la media de la muestra difiera de la media de la población.
Los valores importantes que se relacionan con una prueba t son:
- La hipótesis nula (\(H_0\)) afirma que no hay correlación o relación entre las dos variables de interés. En otras palabras, los resultados no son estadísticamente significativos y se deben al azar. Siempre se asume que la hipótesis nula es cierta hasta que se demuestre lo contrario.
- El valor p describe la probabilidad de que nuestra hipótesis nula sea cierta. Una p > 0,05 indica que tus resultados no son estadísticamente significativos y que la hipótesis nula es cierta. Cuando p es menor o igual que 0,05, el estudio es estadísticamente significativo.
La desviación típica y la media pueden utilizarse conjuntamente para saber dónde se sitúan los valores de tu conjunto de datos si siguen una distribución normal.
A esta regla la llamamos regla empírica o regla del 68-95-99,7, que afirma
Aproximadamente el 68% de las puntuaciones están dentro de 1 desviación típica (DE) de la media.
Alrededor del 95% de las puntuaciones están dentro de 2 desviaciones típicas (DE) de la media.
Aproximadamente el 99,7% de las puntuaciones están dentro de las 3 desviaciones típicas (DE) de la media.
Los científicos utilizan la regla empírica para asegurarse de que su conjunto de datos o valores predichos se aproximan a la media o promedio. Si no es así, la probabilidad de que la predicción, el experimento o la teoría sean correctos es baja.
Finalidad del análisis estadístico
Los investigadores utilizan el análisis estadístico con el fin de responder a preguntas esenciales y a menudo experimentales en biología. Normalmente, los científicos recogen datos para responder a preguntas como "¿Cuál es el grado de correlación?", "¿Cuánto?", "¿Cuántos?", etc. El análisis estadístico puede proporcionar un método para cuantificar los datos y observaciones recogidos.
Por ejemplo, una empresa farmacéutica nos dice que la mayoría de sus pacientes no mostraron efectos adversos del fármaco durante los tres ensayos. Querríamos determinar cuál fue el tamaño de su muestra. En otras palabras, queremos saber qué significa "la mayoría". ¿La mayoría significa que sobreviven 120/200 o sólo el 60% de las personas, o que sobreviven 199/200 personas? También querríamos saber si el muestreo fue aleatorio, la media del conjunto de datos y qué entienden por efectos secundarios adversos.
Análisis estadístico en biología - Puntos clave
- El análisis estadístico implica recopilar, explorar e interpretar conjuntos de datos para descubrir tendencias y patrones que permitan sacar conclusiones.
- Dentro de la biología, tenemos el campo de la bioestadística. La bioestadística es el campo de estudio en el que los investigadores aplican el análisis estadístico a temas biológicos.
Los tipos más comunes de análisis estadístico utilizados en la investigación biológica son el descriptivo y el inferencial.
Los métodos habituales de análisis estadístico en biología incluyen la correlación, la regresión, la desviación típica y la media.
Los investigadores utilizan el análisis estadístico con el fin de responder a preguntas esenciales y a menudo experimentales en Biología.
Referencias
- https://www.biointeractive.org/teacher-guide-math-and-statistics
- https://www.sciencedirect.com/topics/medicine-and-dentistry/statistical-analysis
- https://www.sciencedirect.com/topics/medicine-and-dentistry/inferential-statistics
- https://sphweb.bumc.bu.edu/otlt/mph-modules/bs/sas/sas4-onesamplettest/SAS4-OneSampleTtest7.html
Aprende más rápido con las 13 tarjetas sobre Análisis estadístico en biología
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Análisis estadístico en biología
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más