Saltar a un capítulo clave
Definición de sesgado
En primer lugar, veamos la definición de asimétrica.
Si una distribución se desvía de la distribución normal, se dice que es asimétrica.
Por tanto, el grado de asimetría de tu distribución te indica hasta qué punto es asimétrica y te da una idea de la existencia de valores atípicos en los datos.
¿Hay distribuciones sin asimetría? Claro que las hay
la distribución normal
la distribución \(t\)-;
la distribución uniforme continua (rectangular); y
la distribución de Laplace;
todas tienen sesgo cero.
Observa el gráfico siguiente. Muestra una distribución normal y una distribución de datos graficadas juntas. Como puedes ver, la distribución normal es simétrica, pero la distribución de datos no lo es. La distribución de los datos no es simétrica como la distribución normal, por lo que se dice que la distribución de los datos es asimétrica.
La mayoría de los programas estadísticos calculan el sesgo por ti. Pero una regla general es que una buena fórmula para medir la asimetría es
\[ \text{skew} = 3\left( \frac{text{media}} - \text{mediana}} {{text{desviación típica}} \right) .\]
Veamos los distintos tipos de asimetría.
Distribución sesgada positivamente
Una distribución sesgada positivamente es aquella en la que el sesgo es mayor que cero. En otras palabras, la media de la distribución es mayor que la mediana. También puedes ver que esta distribución se denomina sesgada a la derecha. Puedes ver en el gráfico siguiente que la distribución normal tiene la media, la mediana y la moda en el mismo punto, pero la distribución sesgada positivamente tiene
\[ \text{modo} < \text{mediana} < \text{media}.\]
La distribución sesgada positivamente tiene una cola mayor en el lado derecho del gráfico, que coincide con la dirección positiva en el eje \(x\)-.
Si puedes tener una distribución sesgada positiva, por supuesto, ¡también puedes tener una distribución sesgada negativa!
Distribución sesgada negativamente
Una distribución sesgada negativamente es aquella en la que el sesgo es menor que cero. En otras palabras, la media de la distribución es mayor que la mediana. También puedes ver que esta distribución se llama sesgada a la izquierda. Puedes ver en el gráfico siguiente que la distribución sesgada negativamente tiene
\[ \text{modo} > \text{mediana} > \text{media}.\]
La distribución sesgada negativamente tiene una cola mayor en el lado izquierdo del gráfico, que coincide con la dirección negativa del eje \(x\)-.
A continuación, ¿cómo se interpreta la asimetría?
Interpretación de la asimetría
Una de las cosas que puedes aprender de la asimetría de la distribución es dónde se encuentran los valores atípicos del conjunto de datos. En cualquier distribución sesgada, los valores atípicos son puntos de datos situados en la cola larga de la distribución. Esto te indica que
en una distribución sesgada positiva, los valores atípicos están en la cola larga a la derecha de la media; y
en una distribución sesgada negativa, los valores atípicos están en la cola larga a la izquierda de la media.
Lo que la asimetría no te dice es cuántos valores atípicos hay.
La asimetría no siempre es mala. En algunos conjuntos de datos, es de esperar.
Supongamos que has recogido datos sobre la longitud que recorre una pelota de béisbol al ser golpeada durante los partidos de béisbol profesional. La mayoría de los datos indicarán que la pelota recorre una distancia comprendida entre el lanzador y los asientos del estadio. Sin embargo, en ocasiones, un jugador bateará la pelota y ésta sólo recorrerá una corta distancia.
Los bunts serían valores atípicos, y los datos estarían sesgados hacia las distancias recorridas más largas. Esto significa que la distribución de los datos está sesgada. Eso es lo que se espera de este tipo de datos, y no un indicio de que algo vaya mal en el conjunto de datos.
Además de la asimetría, puedes utilizar la curtosis para obtener información sobre la distribución de los datos.
Asimetría y curtosis
La curtosis es una forma de describir la forma de las colas de una distribución de datos en comparación con el centro.
La curtosis es una medida de las colas de un conjunto de datos, ¡no del pico del conjunto de datos!
Hay tres tipos principales de curtosis.
Las distribucionesmesocurticas tienen \(\text{kurtosis} = 3\), y suelen tener colas similares a las de una distribución normal.
Las distribucionesleptocúrticas tienen una curtosis > 3. El prefijo es "lepto", que significa "delgado". Las distribuciones leptocúrticas tienen colas muy largas a ambos lados de la distribución, lo que hace que el centro parezca muy delgado y alto. La forma de este tipo de distribución indica que, en realidad, ¡hay valores atípicos a ambos lados de la media!
Recuerda, lo importante de las distribuciones leptocúrticas es que tienen colas gordas, no que tengan centros delgados. La curtosis es una descripción de las colas de una distribución. Un ejemplo de distribución leptocúrtica es una distribución \(t\)-con un grado de libertad bajo.
Por último, existen las distribuciones platicúrticas, que tienen \( \text{curtosis} < 3\). El prefijo es "platy", que significa "amplia". Las distribuciones platicurticas tienen colas muy cortas a ambos lados de la distribución, lo que hace que el centro parezca muy corto y ancho. Un ejemplo de distribución platicúrtica es la distribución uniforme.
En el gráfico siguiente puedes ver que cada una de las distribuciones es simétrica, lo que significa que tienen sesgo cero. Sin embargo, la cola de las distribuciones es diferente en cada caso.
Así que una cosa que puedes ver ahora es que ¡la asimetría y la curtosis no tienen nada que ver!
Asimetría - Puntos clave
- Si una distribución se desvía de la distribución normal, se dice que está sesgada.
- Una distribución sesgada positivamente tiene la media de la distribución mayor que la mediana, y una cola más larga en el lado derecho del gráfico.
- Una distribución sesgada negativamente tiene la media de la distribución menor que la mediana y una cola más larga en el lado izquierdo del gráfico .
- La curtosis es una forma de describir la forma de las colas de una distribución de datos en comparación con el centro.
- Las distribuciones mesocurticas tienen \(\text{kurtosis} = 3\), y son similares a la distribución normal.
- Las distribuciones leptocúrticas tienen \(\text{kurtosis}> 3\), y colas muy largas a ambos lados de la distribución, lo que hace que el centro parezca muy delgado y alto.
- Las distribuciones platikurticas tienen \(\text{kurtosis} < 3\), y colas muy cortas a ambos lados de la distribución, lo que hace que el centro parezca muy corto y ancho.
Aprende más rápido con las 13 tarjetas sobre Sesgo
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Sesgo
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más