Saltar a un capítulo clave
No es ideal que los investigadores presenten valores numéricos de los datos recogidos a partir de instrumentos o encuestas. Los datos deben organizarse para contar la historia de lo que quieres destacar en tu investigación. Esto debe centrarse en el problema que quieres resolver, también conocido como "planteamiento del problema". Es la función principal de la investigación.
En el proceso se utilizan herramientas estadísticas, que te ayudan a transformar los datos en información útil que puede ayudarte a llegar a conclusiones importantes. Este proceso se denomina análisis de datos. Es después de este proceso cuando los datos pueden interpretarse plenamente.
Métodos estadísticos
Los métodos estadísticos te permiten trabajar con tus datos. Imagina que tienes las puntuaciones de los exámenes de 100 alumnos, y quieres interpretar estos datos. Examinar las puntuaciones sólo a ojo podría ser bastante difícil. Aquí tienes dos métodos que simplificarían esta tarea.
Medidas de tendencia central
Los valores de tendencia central se utilizan para describir algunas características clave de todo el conjunto de datos, produciendo un único valor que es típico de todo el conjunto. Por ejemplo, la moda te dará el valor que se da con más frecuencia.
La media es la medida de tendencia central más utilizada y es la media matemática. Para calcular la media, sumas todos los valores disponibles y lo divides por el número de valores que has sumado. La media se representa por μ, y su fórmula esdonde n es el Número de datos de la muestra y es la suma de todos los valores de los datos.
La mediana es el valor medio de tu conjunto de datos. Cuando la mediana son dos números, es la media de ambos valores en los datos ordenados.
El modo es el valor que se da con más frecuencia.
Desviación por defecto
Otra medida estadística que se utiliza habitualmente es la variabilidad, también conocida como dispersión. El rango es la forma más sencilla de variabilidad. Tomemos de nuevo el conjunto de datos de las notas del examen: el rango es el intervalo entre los valores numéricos más bajos y más altos.
Otra medida habitual es la varianza, que es la desviación media al cuadrado de la media. Esta cifra indica cuánto se desvían de la media los valores individuales. Lo que verás indicado más a menudo es la Desviación típica. Ésta se modela como la raíz cuadrada de la varianza. La Desviación típica expresa cuánto difieren las puntuaciones individuales de la clase del valor medio del grupo. Matemáticamente, puede modelizarse en una ecuación:
Datos de una sola variable
Los Datos de Variable Única implican el examen de una variable concreta relevante para un conjunto de datos. El análisis de datos únicos es habitual en las formas descriptivas de análisis y utiliza, entre otros métodos, Histogramas, Distribuciones de frecuencias y Diagramas de caja. Se utiliza sobre todo en el primer paso de la investigación de datos. Veamos un diagrama de cajas.
boxplot
Un diagrama de cajas muestra un resumen de cinco números de un conjunto de datos. Son el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo. Los cuartiles nos informan sobre la dispersión de los datos dividiendo el conjunto de datos en cuartiles. El cuartil inferior, Q1, representa el 25%, el cuartil medio equivale al 50% y el cuartil superior representa el 75%.
Se recogieron las edades de 10 alumnos de 12º curso y son las siguientes:
15, 21, 19, 19, 17, 16, 17, 18, 19, 18.
Vamos a ordenarlas primero en orden ascendente.
15, 16, 17, 17, 18, 18, 19, 19, 19, 21.
Ahora podemos hallar la mediana, que es el número medio. Y como tenemos un número par, tenemos dos. Hallar la media es una práctica habitual; sin embargo, con la nuestra, tenemos el mismo número.
mediana = 18
Ahora hallaremos los cuartiles. El primero es la mediana situada a la izquierda de la mediana global.
Eso significará que estamos hallando la mediana de 15, 16, 17, 17, 18.
Esto es igual a 17.
El tercer cuartil será la mediana a la derecha de la mediana.
18, 19, 19, 19, 21
Lo que hará que sean 19.
Ahora documentaremos el número mínimo que es 15.
Y también documentaremos el máximo, que es 21.
La imagen de arriba es el diagrama de cajas que representa los datos de las edades de los alumnos del 12º curso.
Tomaremos otro ejemplo con un número impar de puntos de datos.
La tabla siguiente son datos de los puntos anotados por partido por los jugadores de baloncesto en un intervalo de siete partidos. Visualízalos en un diagrama de cajas y bigotes.
Partido | Puntos |
1 | 10 |
2 | 17 |
3 | 5 |
4 | 32 |
5 | 16 |
6 | 18 |
7 | 20 |
Paso 1.
Reordena los valores del conjunto de datos de menor a mayor.
5, 10, 16, 17, 18, 20, 32.
Paso 2.
Identifica ahora los valores más alto y más bajo del conjunto de datos
Valor más alto: 32
Valor más bajo: 5
Paso 3.
Ahora podemos identificar el valor medio (mediana) del conjunto de datos.
Mediana = 17
Paso 4.
Ahora hallaremos los cuartiles superior e inferior.
El cuartil inferior es la mediana de la primera mitad del conjunto de datos.
Esto significa que vamos a hallar la mediana de 5, 10, 16
Cuartil inferior = 10
El cuartil superior es la mediana de la segunda mitad del conjunto de datos.
Esto significa también que encontramos la mediana de 18, 20, 32
Cuartil superior = 20
Paso 5.
Ahora que tenemos todos los valores necesarios, construiremos nuestrodiagrama de cajas y bigotes .
Valor más alto = 32
Valor más bajo = 5
Mediana = 17
Cuartil superior = 20
Cuartil inferior = 10
Primero dibujaremos una Recta numérica que se ajuste a los datos, y trazaremos todos los valores necesarios que hayamos encontrado.
Construye un rectángulo que encierre la mediana de todo el conjunto de datos, de modo que sus líneas verticales pasen por los cuartiles superior e inferior. Ahora construye una línea vertical que pase por la mediana y llegue a ambos extremos del rectángulo.
Ya tenemos nuestro diagrama de caja y bigotes para los partidos de baloncesto.
Datos bivariantes
A diferencia de los Datos de una sola variable, los Datos bivariantes constan de dos variables para cada individuo. Por ejemplo, en los grandes estudios del sector sanitario, es habitual recoger variables como la altura, la edad, la tensión arterial, etc. de cada individuo. Veamos un ejemplo en una tabla de frecuencias bidireccional.
Se trata del número de hombres y mujeres que tuvieron cada grado en un proyecto de matemáticas en la escuela.
grados | Mujer | Total | |
A | 9 | 21 | |
B. | 18 | 32 | |
C | 11 | ||
D | 2 | 3 | 5 |
E | 1 | 2 | 3 |
Total | 38 | 42 | 80 |
Podemos ver que hay 9 hombres y 12 mujeres que obtuvieron una A, 18 hombres y 14 mujeres que obtuvieron una B, y así sucesivamente.
Ahora podemos responder a un par de preguntas.
¿Cuántos alumnos en total obtuvieron un sobresaliente?
Respuesta: 21 alumnos.
¿Cuántos hombres fueron encuestados?
Respuesta: 38 varones.
¿Cuántos hombres obtuvieron una calificación de A?
Contesta: 9.
A continuación se muestra una representación gráfica de dos variables, las ventas de helado en una tienda determinada frente a la temperatura del día. Esto demuestra cuánto helado se compra a cada temperatura dada.
Probabilidad
La probabilidad es la medida de la probabilidad de que ocurra un suceso. Las probabilidades pueden situarse en una recta numérica entre 0 y 1, como se muestra a continuación.
Por tanto, si la Probabilidad de un acontecimiento es cero, es imposible que ocurra. Mientras que si es 1, entonces es seguro. Entonces tenemos grados variables entre los dos valores, y 0,5 significaría que hay una probabilidad par de que ocurra el acontecimiento.
Las probabilidades se escriben utilizando la siguiente Notación :
P (A): la probabilidad de que ocurra el suceso A.
P (A '): la probabilidad de que el suceso A no ocurra.
Si el suceso A está entre suceder y no suceder, entonces la probabilidad de que el suceso A no suceda = 1 - P (A ')
Por ejemplo, si la P (A) = 0,8
P(A') = 0,2.
Ambos deben sumar 1.
Estos son los conceptos básicos que utilizarás a lo largo de la probabilidad en este nivel. También puedes reintroducirte en los diagramas de Venn, los diagramas de árbol, etc.
Interpretación de datos - Puntos clave
- La interpretación de datos se refiere al proceso de someter los datos recogidos a procesos predefinidos, de modo que puedan derivarse conclusiones lógicas y estadísticas.
- La presentación se refiere a la representación de los datos en gráficos, diagramas, tablas de frecuencias, etc.
- La medida de tendencia central produce un único valor que es típico de todo el conjunto. Los valores básicos son la media, la moda y la mediana.
- Los datos de una sola variable implican el examen de una variable concreta relevante en un conjunto de datos.
- A diferencia de los datos de una sola variable, los datos bivariantes constan de dos variables para cada individuo.
- La probabilidad es la medida de la probabilidad de que ocurra un suceso.
Aprende más rápido con las 4 tarjetas sobre Interpretación de datos
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Interpretación de datos
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más