Saltar a un capítulo clave
Lo mismo ocurre en varias áreas del conocimiento, sobre todo en estadística. Hay un resultado matemático tan importante en estadística que se empeñaron en incluir la palabra central en su designación. Y es central no sólo por su importancia, sino también por su poder simplificador.
Es el Teorema del Límite Central y en este artículo verás su definición, su fórmula, condiciones, cálculos y ejemplos de aplicación.
Comprender el Teorema Central del Límite
Considera el siguiente ejemplo.
Imagina que tienes una bolsa con cuatro bolas
- de igual tamaño
- indistinguibles al tacto
- y numeradas con los números pares 2, 4, 6 y 8.
Vas a sacar dos bolas al azar, con reemplazo, y vas a calcular la media de los números de las dos bolas que has sacado.
"Con reemplazo" significa que sacas la primera bola de la bolsa, la vuelves a meter y sacas la segunda. Y sí, esto puede hacer que saques dos veces la misma bola.
Observa que tienes 16 combinaciones posibles; las presentamos en las tablas siguientes, con sus medias calculadas.
1ª bola | 2 | 2 | 2 | 2 | 4 | 4 | 4 | 4 |
2ª bola | 2 | 4 | 6 | 8 | 2 | 4 | 6 | 8 |
media | 2 | 3 | 4 | 5 | 3 | 4 | 5 | 6 |
1ª bola | 6 | 6 | 6 | 6 | 8 | 8 | 8 | 8 |
2ª bola | 2 | 4 | 6 | 8 | 2 | 4 | 6 | 8 |
media | 4 | 5 | 6 | 7 | 5 | 6 | 7 | 8 |
Ahora vamos a dibujar un gráfico de barras de estas medias, figura 2.
Si te fijas, la forma de este gráfico de barras se acerca a la forma de una distribución normal, ¿no te parece? ¡Se está acercando a la forma de una curva normal!
Ahora bien, si en lugar de 4 bolas numeradas con 2, 4, 6 y 8, tuvieras 5 bolas numeradas con 2, 4, 6, 8 y 10, entonces tendrías 25 combinaciones posibles, lo que da lugar a 25 medias.
¿Qué aspecto tendría la barra gráfica de esta nueva lista de medias? Sí, tendría una forma similar a la de una curva normal.
Si siguieras aumentando el número de bolas numeradas, el gráfico de barras correspondiente se acercaría cada vez más a una curva normal.
"¿Por qué?", te preguntarás. Esto te lleva a la siguiente sección.
Definición del Teorema Central del Límite
El Teorema del Límite Central es un teorema importante en estadística, si no el más importante, y es el responsable del efecto de aproximación de los gráficos de barras para valores crecientes del número de bolas numeradas a la curva de la distribución normal en el ejemplo anterior.
Empecemos por ver su enunciado, y luego recordemos dos conceptos importantes implicados en él: una distribución de medias muestrales, y la distribución normal útil.
Enunciado del Teorema Central del Límite
El enunciado del Teorema Central del Límite dice
Si tomas un número suficientemente grande de muestras de cualquier distribución aleatoria, la distribución de las medias muestrales puede aproximarse mediante la distribución normal.
Fácil, ¿verdad? "¡Uhh... No...!" Vale, vale. Entendámoslo simplificando un poco su enunciado:
Si tomas un gran número de muestras de una distribución, la media muestral de esta distribución puede aproximarse mediante la distribución normal.
Olvidemos por un momento "un número suficientemente grande" y "cualquier distribución aleatoria", y centrémonos en
y la distribución normal.
Comprender la distribución de las medias muestrales
Imagina que tienes que realizar un estudio estadístico sobre un atributo concreto. Identificas la población de tu estudio y, de ella, extraerás una muestra aleatoria. A continuación, calcularás una estadística concreta relacionada con el atributo que te interesa a partir de esta muestra, y será la media .
Ahora imagina que extraes otra muestra al azar de la misma población, con el mismo tamaño que la anterior, y calculas la media del atributo de esta nueva muestra.
Imagina que haces esto unas cuantas veces más (y más y más). Lo que obtendrás al final es una lista de medias de las muestras que has extraído. Y ¡voilà! Esa lista de medias con la que acabas constituye una distribución de medias muestrales.
Para profundizar en este tema, lee nuestro artículo Media muestral.
Recordando la distribución normal
Una gran utilidad de la distribución normal está asociada al hecho de que se aproxima de forma bastante satisfactoria a las curvas de frecuencia de las medidas físicas. Es decir, medidas físicas como la altura y el peso de una muestra de elementos de la población humana pueden aproximarse mediante esta distribución. Ahora estás a punto de ver otra aplicación importante de esta distribución.
A estas alturas puede que ya sepas que la distribución normal es una distribución de probabilidad con dos parámetros, una media \(\mu\) y una desviación típica \(\sigma\), y que tiene el aspecto gráfico de una curva en forma de campana - véase la figura 1.
Fig. 1 - Curva normal de una distribución normal de media 0 y desviación típica 0,05
La media es el valor en el que se centra la distribución, y la desviación típica describe su grado de dispersión.
En el caso de la figura 1, la curva normal está centrada en 0 y su dispersión es algo baja, 0,05. Cuanto menor sea la dispersión, más cerca estará la curva del eje \(y\)-.
Para refrescarte la memoria sobre este tema, lee nuestro artículo Distribución normal.
¿Cuántas muestras son suficientes?
Lo que tienes que entender aquí es que el Teorema Central del Límite nos dice que para un "número" de muestras de una distribución, la media muestral se acercará más a la distribución normal.
Recordando el ejemplo anterior
"Imagina que tienes una bolsa con cuatro bolas
- de igual tamaño
- indistinguibles al tacto
- y numeradas con los números pares 2, 4, 6 y 8.
Vas a sacar dos bolas al azar, con reemplazamiento, y vas a calcular lamedia de los números de las dos bolas que has sacado".
Observa que aquí las muestras son las medias de las dos bolas extraídas, y la distribución será de la lista de medias obtenidas.
Ahora, incluyendo lo que hemos quitado por un momento, el Teorema Central del Límite dice que, sea cual sea la distribución - "cualquier distribución aleatoria"-, la distribución de su media se aproxima a la distribución normal a medida que crece el número de muestras - "un número suficientemente grande de muestras"-.
Ahora se impone la pregunta, ¿qué es un número suficientemente grande de muestras? Esto nos lleva al siguiente apartado.
Condiciones del Teorema Central del Límite
Hay dos condiciones principales que deben cumplirse para que puedas aplicar el Teorema Central del Límite.
Las condiciones son las siguientes
Aleatoriedad: la colección de muestras debe ser aleatoria, lo que significa que cada elemento de la población debe tener la misma probabilidad de ser seleccionado.
Volviendo al primer ejemplo, tenías las 4 bolas en una bolsa, y eran indistinguibles al tacto. Estos elementos aleatorizan el experimento.
Muestra suficientemente grande: como regla práctica, cuando el número de muestras es de al menos 30, la distribución de las medias muestrales se aproximará satisfactoriamente a una distribución normal.
Por eso el ejemplo anterior sólo sirve para ilustrar con sencillez la idea del Teorema Central del Límite. De él obtuvimos 16 muestras, y si hubiera 5 bolas, sólo podríamos obtener 25 muestras, lo que de nuevo no es un número suficientemente grande de muestras.
Fórmula del Teorema del Límite Central
Abordar la fórmula del Teorema Central del Límite equivale a replantearla introduciendo toda la notación necesaria y dándole más detalles.
Merece la pena repetir la primera afirmación:
Si tomas un número suficientemente grande de muestras de cualquier distribución aleatoria, la distribución de las medias muestrales puede aproximarse mediante la distribución normal.
Introduce ahora la notación adecuada:
Supón quetienes una distribución inicial, con una distribución de probabilidad desconocida o conocida, ysea \(\mu\) su media y \(\sigma\) su desviación típica.
Supón también que tomarás \(n\) muestras de esta distribución inicial, y \( n\ge30\).
Entonces, la media muestral, \(\bar{x}\), con media \(\mu_\bar{x}\) ydesviación típica \(\sigma_\bar{x}\),se distribuirá normalmente con media \(\mu\) y variación típica \(\frac{\sigma}{\sqrt{n}\}).
Como resultado de este nuevo replanteamiento del Teorema Central del Límite, puedes concluir que:
- La media de la distribución de la media muestral \(\bar{x}\) será igual a la media de la distribución inicial, es decir, \[\mu_bar{x}=\mu;\].
- La desviación típica de la distribución de la media muestral \(\bar{x}) será \(\frac{1}{sqrt{n}}) de la desviación típica de la distribución inicial, es decir, \[\sigma_bar{x}=\frac{\sigma}{sqrt{n};\].
En realidad, esto es bueno: fíjate en que para un valor creciente de \(n\), \(\frac{\sigma}{\sqrt{n}}) disminuye, la dispersión de \(\bar{x}\) disminuye, lo que significa que se comporta cada vez más como una distribución normal.
- El Teorema del Límite Central se aplica a cualquier distribución con muchas muestras, ya sea conocida (como una distribución binomial, uniforme o de Poisson) o desconocida.
Veamos un ejemplo en el que verás esta notación en acción.
Un estudio informa de que la edad media de los compradores de cacahuetes es de \(30\) años y la desviación típica es de \(12\). Con una muestra de 100 personas, ¿cuál es la media y la desviación típica de las edades medias muestrales de los compradores de cacahuetes?
Solución:
La población y, en consecuencia, la muestra del estudio está formada por compradores de cacahuetes, y el atributo que les interesaba era la edad.
Entonces, te dicen que la media y la desviación típica de la distribución inicial son \(\mu=30\) y \(\sigma=12\).
También te dicen el número de muestras, por lo que \(n=100\).
Como \(n\) es mayor que \(30\), puedes aplicar el Teorema del Límite Central. Entonces, habrá una media muestral \(\bar{x}\) que se distribuye normalmente con media \(\mu_bar{x}\) y desviación típica \(\sigma_bar{x}\).
Y sabes más,
\[|mu_bar{x}&=\mu\\\_y=30\_final{align}]
y
\ [inicio \sigma_\bar{x}&=\frac{\sigma}{\sqrt{n}} \\ y=frac 12 = 100 \\ y = frac {12} {10} \\ &=1,2 .\end{align} \]
Por tanto, \(\bar{x}\) se distribuye normalmente con media \(30\) y desviación típica \(1,2\).
Cálculos con el Teorema Central del Límite
Como ya sabrás, el Teorema Central del Límite nos permite aproximar cualquier distribución de medias, para un gran número de muestras, a la distribución normal. Esto significa que algunos de los cálculos en los que es aplicable el Teorema Central del Límite implicarán cálculos con la distribución normal. Aquí, lo que harás será convertir una distribución normal en la distribución normal estándar.
Para recordar más sobre este último tema conceptual, lee nuestro artículo Distribución normal estándar.
La importancia de hacer esta conversión es que entonces tendrás acceso a una tabla de valores de la normal estándar, también conocida como puntuación z, a la que podrás remitirte para proceder con tus cálculos.
Cualquier punto\(x\) de una distribución normal puede convertirse a la distribución normal estándar \(z\) haciendo lo siguiente
\[z=\frac{x-\mu}{\sigma},\]
donde \(z\) sigue la distribución normal estándar (con media \(\mu=0\) y desviación típica \(\sigma=1\)).
Como\( \bar{x}\) se distribuye normalmente con media \(\mu\) y desviación típica
\[\frac{\sigma}{\sqrt{n}},\]
la conversión será más bien
\[z=\frac{x-\mu}{\frac{\sigma}{\sqrt{n}}}.\]
Puedes refrescar tu memoria sobre este tema leyendo nuestro artículo z-score.
Este ejemplo sirve para recordar la conversión a la distribución normal estándar.
Se selecciona una muestra aleatoria de tamaño \ (n=90\) de una población con media \(\mu=20\) y desviación típica \(\sigma=7\). Determina la probabilidad de que \(\bar{x}\) sea menor o igual que \(22\).
Solución:
Como el tamaño de la muestra es \(n=90\), puedes aplicar el Teorema del Límite Central. Esto significa que \(\bar{x}\) seguirá una distribución normal con media
\[\mu_\bar{x}=\mu=22\]
y desviación típica
\[\bar{align} \sigma_\bar{x}&=\frac{\sigma}{\sqrt{n}} \\ y=frac 7 = 90 \\ &=0,738 \end{align}\]
con tres decimales.
Ahora quieres hallar \(P(\bar{x}\le 22)\), y para ello aplicas la conversión a la normal estándar:
\[\begin{align} P(\bar{x}\le 22)&=P\left( z\le \frac{22-20}{0,738} \right) \ \ \t=P( z\le 2,71) \t=texto{ área bajo la curva normal a la izquierda de 2,71} \t=texto{ área bajo la curva normal a la izquierda de 2,71} \t=texto{ área bajo la curva normal a la izquierda de 2,71}. \\ &=0,9966 \end{align} \]
Ejemplos del Teorema Central del Límite
Para consolidar lo aprendido en este artículo, pasemos ahora a los ejemplos de aplicación. Aquí verás un resumen de los principales aspectos del Teorema Central del Límite.
Por el primer ejemplo.
Los datos de peso de una población femenina siguen una distribución normal. Tiene una media de 65 kg y una desviación típica de 14 kg. ¿Cuál es la desviación típica de la muestra elegida si un investigador analiza los registros de 50 mujeres?
Solución:
La distribución inicial es la del peso de las mujeres. Sabes que tiene una media de 65 kg y una desviación típica de 14 kg. Una muestra de 50 hembras significa que \(n=50\), que es mayor que \(30\). Por tanto, puedes aplicar el Teorema del Límite Central.
Esto significa que hay una media muestral \(\bar{x}\) que sigue una distribución normal con media \(\mu_bar{x}=65\) y desviación típica \(\sigma_bar{x}=\frac{14}{sqrt{50}}= 1,98 \) con dos decimales.
Por tanto, la desviación típica de la muestra elegida por el investigador es \(1,98\).
Hagamos un último problema de palabras.
Un pequeño hotel recibe de media \(10\) clientes nuevos al día, con una desviación típica de 3 clientes. Calcula la probabilidad de que, en un período de 30 días, el hotel reciba por término medio más de \(12\) clientes en 30 días.
Solución:
La distribución inicial tiene una media \(\mu=10\) y una desviación típica \(\sigma=3\). Como el periodo de tiempo es de 30 días, \(n=30\). Por tanto, puedes aplicar el Teorema Central del Límite. Esto significa que tendrás \(\bar{x}\) cuya distribución tiene una media \(\mu_bar{x}\) y una desviación típica \(\sigma_bar{x}\), y
\[\ inicio{align} \mu_bar{x}&=\mu\\ &=10 \final{align} \]
y
\[Inicio \sigma_\bar{x}&=\frac{\sigma}{\sqrt{n}}\\ &=\frac{3}{\sqrt{30}} \\ &=0,548 \end{align} \]
con tres decimales.
Se te pide que calcules \(P(\bar{x}\ge 12)\), y para ello convertirás \(\bar{x}\) a la norma normal \(z\):
\[ \begin{align} P(\bar{x}\ge 12)&=P\left(z \ge \frac{12-10}{0,548} \right) \\\\ P(z \ge 3,65) .\end{align} \]
Ahora, los cálculos finales:
\[ \begin{align} P(z\ge 3,65)&=\text{ área bajo la curva normal a la derecha de 3,65} \\ &=1-0,9999 &=0,0001, (0,01%). \]
Por tanto, la probabilidad de que en un periodo de 30 días el hotel reciba de media más de \(12\) clientes en 30 días es \(0,01\% \).
Importancia del Teorema Central del Límite
Hay muchas situaciones en las que el Teorema Central del Límite es importante. He aquí algunas de ellas:
En los casos en que es difícil recoger datos sobre cada elemento de una población, se utiliza el Teorema Central del Límite para aproximar las características de la población.
El Teorema Central del Límite es útil para hacer inferencias significativas sobre la población a partir de una muestra. Puede utilizarse para saber si dos muestras se han extraído de la misma población, y también para comprobar si la muestra se ha extraído de una población determinada.
Para construir modelos estadísticos robustos en la ciencia de datos, se aplica el Teorema Central del Límite.
Para evaluar el rendimiento de un modelo en el aprendizaje automático, se emplea el Teorema Central del Límite.
En estadística se comprueba una hipótesis utilizando el Teorema Central del Límite para determinar si una muestra pertenece a una determinada población.
El Teorema Central del Límite - Puntos clave
ElTeorema Central del Límite dice que, si tomas un número suficientemente grande de muestras de cualquier distribución aleatoria, la distribución de las medias muestrales puede aproximarse por la distribución normal.
Otra forma de enunciar el Teorema Central del Límite es que si \(n\ge 30 \), entonces la media muestral \(\bar{x}\) sigue una distribución normal con \(\mu_bar{x}=\mu\) y \(\sigma_bar{x}=\frac{\sigma}{\sqrt{n}}.\}.
Cualquier distribución normal puede convertirse a la normal estándar haciendo \(z=\frac{x-\mu}{\frac{\sigma}{\sqrt{n}}.\)
El conocimiento de la distribución normal estándar, su tabla y sus propiedades te ayudan en los cálculos que implican el Teorema Central del Límite.
Aprende más rápido con las 0 tarjetas sobre Teorema del Límite Central
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Teorema del Límite Central
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más