Es probable que ya te hayas encontrado con métodos de análisis e interpretación de datos en distribuciones de datos dadas. En muchas aplicaciones del mundo real, tenemos que comparar información entre varios conjuntos de datos. Veamos cómo comparar datos entre distribuciones de datos.
Al comparar varias distribuciones de datos, puedes comentar
Una medida de localización: una medida de localización se utiliza para resumir todo un conjunto de datos con un único valor. Por ejemplo, la media y la mediana son medidas de localización.
Una medida dedispersión - una medida de dispersión nos proporciona información sobre la variabilidad de los datos de un conjunto de datos determinado, es decir, lo cerca o lejos que están entre sí los distintos puntos de un conjunto de datos. La desviación típica y el rango intercuartílico son ejemplos de medidas de dispersión.
Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos. En los casos en que los conjuntos de datos contienen valores extremos y/o valores atípicos, suele ser más apropiado utilizar la mediana y los rangos intercuartílicos.
No utilices la mediana y la desviación típica juntas, ni la media y los rangos intercuartílicos juntos.
Profundicemos en el concepto con ayuda de ejemplos.
Comparar la media y las desviaciones típicas de conjuntos de datos
Las temperaturas medias diarias durante el mes de agosto se registran en Heathrow y Leeming. Para Heathrow, ∑x=562, ∑x²=10301,2. Para Leeming, la temperatura media fue de 15,6° C con una desviación típica de 2,01° C
a) Calcula la media y la desviación típica de Heathrow. b) Compara los datos de Heathrow con los de Leeming.
Soluciones
Para Heathrow
\(\begin{align} media &= \frac {\suma{x}}{n} \ y= frac 562 31 = 18,1º C fin)
b) A partir de la información anterior, vemos que la temperatura media en Heathrow durante agosto fue superior a la de Leeming, y la dispersión/variabilidad de las temperaturas fue inferior a la de Leeming.
Una empresa recopila los plazos de entrega en minutos de los proveedores A y B durante un periodo de 20 días. A continuación se muestra el resultado de los datos recogidos. Compara los resultados de los dos proveedores.
A partir de la información anterior, vemos que el proveedor A tiene un plazo de entrega más largo, mientras que el proveedor B tiene una mayor dispersión en el plazo de entrega.
Considera el ejemplo anterior en un contexto real. Si la empresa quiere mantener a uno de sus proveedores y prescindir del otro, podría comparar los datos anteriores como lo hemos hecho nosotros. Si la prioridad de la empresa es reducir los plazos de entrega en promedio, favorecería al proveedor B. Si, por el contrario, la prioridad es una mayor fiabilidad, favorecería al proveedor con menor variabilidad, y ése sería el proveedor A.
Comparación de la mediana y el rango intercuartílico de conjuntos de datos
Los alumnos de dos secciones diferentes se presentan a un examen. Se proporciona el cuartil y la mediana de las notas de cada sección. Compara el rendimiento de las 2 secciones.
Sección
mediana
Sección 1
58
71
87
Sección 2
62
74
83
Soluciones
El rango intercuartílico de la Sección 1 = Q3 - Q1= 87-58 = 29
El rango intercuartílico de la Sección 2 = Q3 - Q1= 83-62 = 21
A partir de los datos dados, vemos que la mediana de las notas es mayor en la sección 2, mientras que la variabilidad de las notas es mayor en la sección 1.
Una empresa recopila los plazos de entrega de los proveedores A y B durante un período de 20 días. La mediana del plazo de entrega fue de 4 horas para el proveedor A, y de 3 horas para el proveedor B. El intervalo intercuartílico para el proveedor A fue de 0,8 horas y para el proveedor B fue de 1,5 horas.
Compara el rendimiento de los proveedores en términos de rapidez y fiabilidad.
Soluciones
El proveedor B parece ser el más eficiente en términos de rapidez, con un plazo de entrega medio inferior. El proveedor A parece ser más fiable, con una menor dispersión/variabilidad en el plazo de entrega.
Comparación de datos - Conclusiones clave
En muchas aplicaciones del mundo real tenemos que comparar información entre varios conjuntos de datos.
Al comparar múltiples distribuciones de datos, puedes comentar
una medida de localización
una medida de dispersión
Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos.
¿Cómo te aseguras de que tu contenido sea preciso y confiable?
En StudySmarter, has creado una plataforma de aprendizaje que atiende a millones de estudiantes. Conoce a las personas que trabajan arduamente para ofrecer contenido basado en hechos y garantizar que esté verificado.
Proceso de creación de contenido:
Lily Hulatt
Especialista en Contenido Digital
Lily Hulatt es una especialista en contenido digital con más de tres años de experiencia en estrategia de contenido y diseño curricular. Obtuvo su doctorado en Literatura Inglesa en la Universidad de Durham en 2022, enseñó en el Departamento de Estudios Ingleses de la Universidad de Durham y ha contribuido a varias publicaciones. Lily se especializa en Literatura Inglesa, Lengua Inglesa, Historia y Filosofía.
Gabriel Freitas es un ingeniero en inteligencia artificial con una sólida experiencia en desarrollo de software, algoritmos de aprendizaje automático e IA generativa, incluidas aplicaciones de grandes modelos de lenguaje (LLM). Graduado en Ingeniería Eléctrica de la Universidad de São Paulo, actualmente cursa una maestría en Ingeniería Informática en la Universidad de Campinas, especializándose en temas de aprendizaje automático. Gabriel tiene una sólida formación en ingeniería de software y ha trabajado en proyectos que involucran visión por computadora, IA integrada y aplicaciones LLM.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.