Saltar a un capítulo clave
Normalmente, aquí es donde entran en juego los gráficos y diagramas, como los histogramas o los diagramas de dispersión. Son una forma estupenda de saber lo que un conjunto de datos intenta decirte.
Algunos gráficos y diagramas son estupendos para grandes conjuntos de datos, cuando sólo intentas buscar tendencias. Pero a veces, para un conjunto de datos más pequeño, puedes querer ver esas tendencias sin dejar de ver todos los puntos de datos. Los gráficos de puntos son perfectos para este tipo de conjuntos de datos.
Definición de un gráfico de puntos
Un gráfico de puntos es la opción más adecuada para representar datos cuando trabajas con conjuntos más pequeños de puntos de datos. Lo definimos a continuación.
Un diagrama de puntos es una representación gráfica de la distribución de un conjunto de datos, utilizando puntos para cada punto de datos y ejes para los valores de los datos.
Como primer ejemplo, tomemos el siguiente diagrama de puntos que muestra los resultados de una encuesta en la que se pregunta a cada estudiante cuánto tiempo dedica a estudiar para un examen.
Comopuedes ver, los diagramas de puntos se organizan generalmente con el eje \(x\) mostrando el rango de valores y el eje \(y\) mostrando el número de puntos de datos en cada valor o categoría.
El eje de frecuencias, que suele ser el eje Y, no siempre se muestra, ya que los puntos representan los puntos de datos. Así, un gráfico de puntos suele parecerse a una recta numérica que muestra los valores de los datos, con puntos encima que representan cada punto de datos. Aquí, cada punto representa a un alumno de la clase.
La altura de cada pila de puntos representa el número de puntos de datos de esa categoría. Puedes ver que el tiempo de estudio más común es de 2 horas, ya que 6 alumnos estudiaron 2 horas, y que un alumno es un valor atípico, ya que el tiempo dedicado al estudio fue de 9 horas.
También puedes ver que el gráfico está, en general, sesgado a la izquierda hacia los valores más pequeños.
Los gráficos de puntos pueden parecer desordenados si hay demasiados puntos o valores. Por eso los gráficos de puntos son mejores para conjuntos de datos pequeños que para conjuntos de datos grandes con muchos puntos de datos.
Ejemplos de gráficos de puntos
Veamos un ejemplo de datos adecuados para un gráfico de puntos y veamos cómo construir un gráfico de puntos a partir de un conjunto de datos.
Tu profesor de matemáticas pide a los alumnos que midan su altura en centímetros y la anoten en una lista de la clase. A continuación, escribe la lista de alturas en la pizarra como
\60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68.\final].
Solución:
Primero, empieza por hacer el eje horizontal para tus datos. Busca el valor más bajo, aquí 58 pulgadas, y el más alto, 75 pulgadas, en tu lista de datos.
Haz una recta numérica que abarque al menos ese intervalo de números, quizá un poco más allá en cada extremo para que el gráfico quede bien.
A continuación, empieza a colocar puntos sobre tu recta numérica para cada punto de datos, colocando un punto por punto de datos sobre el valor de ese punto de datos. A medida que coloques tu punto en la recta numérica, táchalo en tu lista para recordar que ya lo has trazado.
\[ {comienza{align}{no{61}, {no{68}, 62, 63, 70, 68, 63, 59, &61,\} 60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68.\final{align}\}].
Sigue rellenando tu diagrama de puntos hasta que hayas tachado todos los puntos de datos de tu lista.
Como puedes ver, el diagrama de puntos organiza todos los puntos de datos. Puedes ver cuántos alumnos tienen la misma altura, qué altura es la más común. Te da una visión general bastante buena de la lista que recopiló el profesor.
Rango en un gráfico de puntos
Recordamos que el rango de un conjunto de datos es la diferencia entre los valores más altos y más bajos de los datos. Esto también se aplica al rango en un diagrama de puntos.
El rango en un gráfico de puntos es la diferencia entre los valores más altos y más bajos de los datos.
Consideremos el ejemplo anterior de nuestro conjunto de datos y gráfico de puntos,
\[61, 58, 62, 63, 70, 68, 63, 59, 61, 60, 66, 64, 63, 65, 66, 75, 63, 67, 65, 61, 59, 68.\]
Encontrar los valores más altos y más bajos en la lista de datos puede no ser rápido. Pero en un diagrama de puntos, ¡es mucho más fácil!
- Para encontrar el valor más bajo de los datos, céntrate en el extremo izquierdo de un gráfico horizontal, aquí, 58 pulgadas.
- Para encontrar el valor más alto, céntrate en el extremo derecho del gráfico horizontal, aquí, 75 pulgadas.
- Ahora, para hallar el rango, resta los dos valores anteriores para obtener \[75-58=17,\].
¿Cómo hallar la media, la mediana y la moda de los gráficos de puntos?
Para definiciones, fórmulas y ejemplos de Media, Mediana y Moda, consulta Media, Mediana y Moda.
Media
Para hallar la media del conjunto de datos del gráfico de puntos, aún tienes la opción de enumerar los puntos de datos, sumarlos y dividirlos por el número de puntos del gráfico. Pero también puedes ahorrar un poco de tiempo con un pequeño atajo que se explica a continuación.
Volvamos a nuestro ejemplo anterior para ver cómo se puede hacer.
Tomando el mismo ejemplo anterior, halla la media a partir del gráfico de puntos correspondiente.
Solución:
Paso 1.
Multiplica el número de puntos de datos, es decir, los puntos, de una determinada categoría de valores por el valor
1er valor. \(58\cdot 1=58\).
Repite este paso para cada valor de tu eje.
2º valor. \(59\cdot 2=118\).
3er valor. \(60\cdot 1=60\).
4º valor. \(61\cdot 3=183).
5º valor. \(62 punto 1=62).
6º valor. \(63\cdot 4=252).
7º valor. \(64\cdot 1=64\).
8º valor. \(65 puntos 2 = 130).
9º valor. \(66 puntos 2 = 132).
10º valor. \(67\cdot 1=67\).
11º valor. \(68 puntos 2 = 136).
12º valor. \(70 puntos 1=70).
13º valor. \(75 puntos 1 = 75).
Paso 2.
Suma los productos que acabas de encontrar, así obtendrás la suma total de los datos,
\[\begin{align}&58+118+60+183+62+252+\\&64+130+132+67+136+70+75=1407.\end{align}\]
Paso 3.
Divide la suma obtenida en el Paso 1 por el número de puntos de datos de tu gráfico hallados en el Paso 2, ésta es tu media o promedio de tus datos,
\frac[\frac{text{número total de datos}}{{text{número de alumnos}}={frac{1407}{22}=63,95 \quad \text{pulgadas}.\frac[\frac[\text{pulgadas}].
Median
Al igual que con la media, puedes enumerar los puntos de datos y encontrar el valor medio cuando busques la mediana. Pero el diagrama de puntos ya debería tener los datos ordenados de menor a mayor, por lo que no debería ser muy diferente de hallar la mediana a partir del propio diagrama. De nuevo, utilizaremos el ejemplo anterior para hallar la mediana.
Tomando el mismo ejemplo anterior, halla la mediana a partir del diagrama de puntos correspondiente.
Solución:
Paso 1.
Determina si el conjunto de datos tiene un número par o impar de puntos de datos.
- Los conjuntos con un número impar de puntos de datos tienen un valor del conjunto como mediana.
- Los conjuntos con un número par de puntos de datos tienen dos valores en el medio porque el conjunto puede dividirse en dos partes iguales. La mediana es la media de esos dos valores.
Aquí, el diagrama de puntos de la altura de los alumnos tiene 22 puntos de datos.
Paso 2.
Divide el número de puntos de datos por 2, para obtener\[22\div2=11.\]
Paso 3.
Empieza por el menor punto de datos, tacha cada punto a medida que cuentas hacia arriba.
- Si tienes un número impar de puntos de datos y obtienes un decimal, redondea hacia arriba. Éste es el número del punto de datos hasta el que tienes que contar para hallar la mediana.
- Si tienes un número par de puntos de datos y obtienes un número entero, cuenta hasta este número de puntos de datos, empezando por el punto de datos más pequeño. Utiliza este punto y el siguiente de la lista para hallar la mediana promediando los dos valores.
Para este conjunto de 22 puntos de datos, la mediana será la media de los puntos de datos 11º y 12º.
El 11º punto de datos es 63 pulgadas, y el 12º punto de datos es 63 pulgadas. La media de 63 y 63 es 63. Por tanto, la mediana de este conjunto de datos es 63 pulgadas.
Moda
Los gráficos de puntos son excelentes para identificar fácilmente la moda de un conjunto de datos. Sólo tienes que buscar la columna de puntos más alta, o la más larga si el gráfico es horizontal. El valor asociado a esa columna es la moda.
Tomaremos el mismo ejemplo para ver cómo puede hacerse.
Observamos que la columna de puntos más alta es 63, y por tanto la moda es 63 pulgadas.
Recuerda que es posible tener varios modos o no tener ninguno. Aunque si no hay modo, un gráfico de puntos probablemente no sería la mejor representación de ese conjunto de datos.
Comparar gráficos de puntos
Como los gráficos de puntos ofrecen una buena visión general de un conjunto de datos, también pueden ser útiles para comparar dos conjuntos de datos diferentes sobre temas relacionados.
De hecho, observando los gráficos de puntos, puedes encontrar las modas y compararlas.
Aunque no puedas encontrar la media y la mediana simplemente mirando, la inclinación de los gráficos puede indicarte qué conjunto tendrá una media o mediana más alta.
Recordamos las siguientes definiciones antes de poner un ejemplo sobre cómo comparar gráficos de puntos.
Los datos están sesgados cuando la mayoría de los datos se sitúan en el extremo izquierdo o derecho del gráfico. Parece como si el gráfico se "inclinara" hacia una dirección en lugar de ser simétrico.
Un gráfico sesgado hacia la izquierda tendrá una media y una mediana más bajas que un gráfico sesgado hacia la derecha.
Para identificar valores atípicos y conglomerados y hacer inferencias sobre las razones de los datos, recordamos lo siguiente.
Un valor at ípico es un punto de datos que es mucho más alto o mucho más bajo que la mayoría de los datos. Suele ser un único punto que está muy alejado de un extremo del gráfico, normalmente con una distancia considerable entre él y el resto de los datos.
Un conglomerado se produce cuando hay una agrupación de varios puntos de datos en un intervalo pequeño. Un conglomerado a veces puede hacer que un gráfico se incline hacia la izquierda o hacia la derecha.
Tomemos el ejemplo siguiente, para ver cómo se hacen las cosas.
Veamos dos gráficos de puntos para hacer algunas comparaciones.
Abajo están los gráficos de puntos que muestran los puntos por partido de un equipo de softball durante dos temporadas consecutivas. Veamos qué podemos averiguar sobre los datos.
- En primer lugar, veamos el modo. Durante la temporada 2020, la puntuación por partido más común fue de 3 puntos, mientras que durante la temporada 2021 fue de 5 puntos.
- A continuación, veamos la dispersión y el sesgo. La dispersión, o rango, de los dos conjuntos de datos es similar. De hecho, el rango del primer gráfico es 11 y el del segundo 12. Pero los datos de la temporada 2020 están ligeramente sesgados hacia la izquierda, hacia números más pequeños, y los datos de la temporada 2021 son ligeramente más simétricos o centrados. Esto sugiere que la puntuación media y la mediana serán un poco más altas en la temporada 2021.
- También puedes fijarte en los valores atípicos y los grupos. En la temporada 2020, el partido con mayor puntuación, 11 puntos, es un poco atípico. Durante la temporada 2021, hay un grupo de partidos de alta puntuación de 10 a 12 puntos, lo que demuestra que los partidos de alta puntuación fueron más frecuentes durante esa temporada.
Si quisieras analizar el progreso de este equipo a lo largo de las dos temporadas, estas comparaciones podrían ser muy útiles. Los gráficos muestran que el equipo tuvo una temporada mejor en 2021, lo que podría incitarte a investigar las razones. ¿Tuvo el equipo menos errores esa temporada? ¿Se mantuvo la misma plantilla, con jugadores más maduros y experimentados? ¿Hubo más home runs o RBI que contribuyeran a los partidos con tantos?
En realidad, hay dos tipos diferentes de gráficos de puntos.
- Los gráficos de puntos más estándar, mostrados arriba, se llaman gráficos de puntos Wilkinson, en honor a Leland Wilkinson, estadístico estadounidense.
- El segundo tipo de gráfico de puntos se llama gráfico de puntos Cleveland , en honor a William S. Cleveland, informático estadounidense. Un gráfico de puntos Cleveland utiliza sólo un punto en cada categoría para indicar la frecuencia de esa categoría. También es más probable que los gráficos de puntos Cleveland se muestren horizontalmente.
A continuación se muestra un diagrama de puntos Cleveland de los datos del ejemplo anterior de los resultados de los partidos de la temporada 2020 de un equipo de softball.
La principal ventaja es que el gráfico está mucho menos recargado, lo que lo hace útil para conjuntos de datos más grandes. También permite mostrar varios conjuntos de datos en un gráfico, diferenciando entre los conjuntos cambiando la forma o el color de los puntos.
A continuación se muestra un gráfico de los resultados de las dos temporadas del equipo de softball.
Ventajas e inconvenientes de los gráficos de puntos
Recordemos que los histogramas utilizan barras para representar grupos de datos, lo que puede ser muy útil tanto para grandes conjuntos de datos como para conjuntos más pequeños. Puesto que un diagrama de puntos es similar a un histograma, puede que te preguntes: "¿en qué se diferencian o son mejores los gráficos de puntos de los histogramas?"
A continuación enumeramos algunas ventajas de los gráficos de puntos.
- Los gráficos de puntos muestran todos y cada uno de los puntos de datos del conjunto.
- También son una representación sencilla de los datos, que te proporciona esa "instantánea" que puedes estar buscando para tus datos. A partir del diagrama de puntos de tus datos, puedes ver lo dispersos que están y si están sesgados hacia un extremo u otro de la recta numérica. También es fácil identificar conglomerados, valores atípicos y vacíos en los valores de tus datos.
- También puedes hacerte una idea de cuáles son las medidas de tendencia central (media, mediana y moda), aunque no puedas identificarlas exactamente.
- Los gráficos de puntos también pueden utilizarse para datos cuantitativos o categóricos.
En cuanto a las desventajas, enumeramos las siguientes,
- La principal desventaja de los gráficos de puntos es que no son adecuados para grandes conjuntos de datos. El gráfico quedaría rápidamente desordenado y confuso. Construir el diagrama de puntos también puede llevar un poco de tiempo, dependiendo de cuántos puntos de datos tenga tu conjunto y de cómo se presenten los datos.
- La media y la mediana también pueden ser algo difíciles de encontrar a partir del diagrama de puntos. No es mucho más fácil calcular esos valores a partir del gráfico que calcularlos simplemente a partir de la lista de datos. Además, si sólo hay un punto de datos para cada valor, habría que agrupar los datos en intervalos de clase (o intervalos), lo que sería más adecuado para un histograma.
Gráfico de puntos - Puntos clave
- Un diagrama de puntos es una representación gráfica de los puntos de una lista de datos mediante puntos sobre un eje horizontal o una recta numérica.
- Los gráficos de puntos son mejores para conjuntos de datos pequeños.
- Los gráficos de puntos te permiten ver fácilmente muchas características de un conjunto de datos, como la dispersión, la inclinación, la forma, los grupos, los huecos y los valores atípicos.
Aprende más rápido con las 4 tarjetas sobre Diagrama de puntos
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Diagrama de puntos
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más