Saltar a un capítulo clave
Pero, puede que no nos interese simplemente la probabilidad de que una altura sea igual a \(1{,}4\,\mathrm{m}\), o que el bus pase \(20\,\mathrm{min}\) tarde. Es posible que lo que nos interese calcular sea la probabilidad de que cierto valor caiga en un rango. En este caso, queremos saber: si un valor cae en un intervalo, la probabilidad de que ocurra o nuestra confianza.
En este artículo te hablaremos acerca de la probabilidad de que un variable \(x\) obtenga cierto valor en un rango entre \([a, b]\).
Intervalos de confianza: fórmulas
Supongamos que tienes muchas piezas producidas por una máquina, y las piezas deben medir lo mismo \(l=0{,}25\, \mathrm{cm}\). Sin embargo, las piezas presentan desviaciones en sus medidas: algunas son más grandes\(l=0,26\,\mathrm{cm}\) y otras son más pequeñas \(l=0{,}22\,\mathrm{cm}\). Muchas otras piezas tienen valores muy cercanos a la media y las desviaciones son menores, conforme te alejas de la media.
En este caso, si tienes muchas piezas, esta distribución se acerca a la distribución normal: la media debe ser el valor más repetido y (como mencionamos en Propiedades de la función de densidad) sigue la forma de una campana. Aquí, el máximo es la medida más común; y la cola y cabeza —que tienden hacia cero— son las piezas con medidas más grande y más pequeña.
En este caso, que una pieza tenga una medida menor que la media se representa con probabilidades menores que el máximo (que es la media): \(m_4<m_3<m_2<m_1<m_0\).
A medida que la desviación es mayor \(m_1 \rightarrow m_2 \rightarrow m_3 \rightarrow m_4 \), la probabilidad es menor \(P(m_4)<P(m_3)<P(m_2)<P(m_1)\).
Pero, también podemos necesitar —no la probabilidad de una medida específica— sino la probabilidad de que esta medida caiga entre dos valores. Veámoslo en la siguiente imagen:
Esto se conoce como un intervalo de confianza. La definición específica sería:
Se conoce como intervalo de confianza a la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico
Una muestra o población son los objetos de medición en un experimento aleatorio.
Para poder obtener estos intervalos de confianza, se requiere calcular un límite superior y un límite inferior; estos límites se encuentran alrededor de la media y su fórmula es:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu-z\dfrac{\sigma}{\sqrt{n}}\]
Podemos extraer los valores de \(z\) de la siguiente tabla para nuestros siguientes ejemplos:
Porcentaje \(%\) | \[Z\] |
\[80\%\] | \[1{,}282\] |
\[85\%\] | \[1{,}440\] |
\[90\%\] | \[1{,}645\] |
\[95\%\] | \[1{,}960\] |
\[99\%\] | \[2{,}576\] |
\[99{,}5\%\] | \[2{,}807\] |
\[99{,}9\%\] | \[3{,}291\] |
Tabla 1: Valores de \(z\) para diversos intervalos de confianza.
Por lo general, requerirás calcular intervalos de confianza del \(90\%\), \(95\%\) o \(99\%\). Esto se debe a que si se hace algún experimento, muchas veces no se pueden medir todos los objetos.
Supongamos que se desea medir la altura de las personas, en un país, entre ciertas edades. En este caso, en un estudio se puede tener una muestra de la población. La muestra debe ser aleatoria y representativa de la población; es decir, debe contener individuos, al azar, de todas las partes posibles del país.
Debido a que el número de personas en la muestra \(P_m(n)\) es menor que el número de personas en el país \(P_t(n)\), requieres que la población que hayas escogido represente lo mejor posible a la población del país.
Sin embargo, la media de tu población no será la misma que la de la población general: \[\mu(P_m(n)) \neq \mu(P_t(n)) \]
Un intervalo de confianza alto te dirá que es muy probable que la media real se encuentre en cierto intervalo de alturas alrededor de la media de tu muestra: \(\mu(P_m(n)) \rightarrow [\mu(P_t(n))-d, \mu(P_t(n))+d]\). Aquí, \(d\) es una desviación de la media de tu muestra.
Cuanto más grande sea la posibilidad de que la media total esté en un intervalo cada vez más pequeño de tu muestra, significa que tu muestra es más representativa.
En estadística, decir que algo es representativo significa que la muestra o población tiene valores muy cercanos a la población general. Por lo tanto, se pueden usar los valores de la muestra para representar los valores de toda la población.
Nivel de confianza
Una de las razones por las cuales son importantes los intervalos de confianza es que estos nos dicen cuán representativos son los valores que vemos en la muestra; un concepto relacionado, muy importante, el nivel de confianza.
El nivel de confianza es el valor que nos dice cuán probable es que los parámetros estadísticos de la muestra represente a la población.
Veamos estos casos:
- Se tiene una población \(A\), de donde se mide el peso \(a\). De esta, se extraen datos como el peso medio, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza bajo.
Se tiene una población \(B\), de donde se mide también el peso \(a\), se extraen nuevamente datos como la media, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza muy alto.
Se hace un estudio de toda la población \(C\) —que contiene a \(A\) y \(B\)— y se extrae la verdadera media, moda, mediana y desviación estándar.
Debido a que el nivel de confianza es bajo en los datos extraídos de la muestra \(A\), es muy poco probable que datos como la media, mediana, moda y desviaciones estándar sean los mismos, o cercanos, a los reales de \(C\). En cambio, es extremadamente probable que los datos extraídos de la muestra \(B\) —como la media, mediana, moda y desviación estándar— sean iguales o cercanos a los reales de \(C\).
En resumen, cuanto más alto sea el nivel de confianza, más seguros estamos que los datos son cercanos a los reales y que no habría que repetir la muestra.
Muestreo y los intervalos de confianza
Una parte importante de hacer una buena estimación de los parámetros estadísticos de una población es el muestreo.
En estadística, el muestreo es el método por el cual se escoge una parte de una población para estimar las características de toda la población.
Te hemos hablado de los intervalos de confianza y los niveles de confianza; pero, como ya te mencionamos, todo esto depende de elegir la muestra correcta.
Supongamos lo siguiente:
Se tiene un barrio donde existen casas, escuelas, supermercados, etc. En este barrio se desea medir la edad media de las personas que viven ahí, y se hacen dos estudios.
En el estudio uno, se hacen preguntas a las personas y se anotan sus edades. El estudio comprende dos zonas con casas, cuatro alrededor de las escuelas y uno en un supermercado.
En el segundo estudio, se hacen las mismas preguntas y se anotan sus edades, pero se hace un estudio preguntando en casas, ninguno en escuelas y cinco en el supermercado.
En ambos estudios los resultados podrían ser muy distintos, solo por la manera en que fueron elegidos los puntos de las encuestas:
- En el estudio uno, es muy probable que las edades sean más jóvenes, debido a que se hacen más estudios en las escuelas, que estas estarán llenas de jóvenes.
- En el estudio dos, es muy probable que la población tenga datos de edades mayores, ya que es más posible encontrar adultos en los supermercados, a excepción que acudan con niños o jóvenes.
Esto significa que ambos estudios tendrán valores distintos de media, moda, mediana y desviación estándar, solo por como fueron elegidas las muestras.
Por eso, puedes asumir que cuanto mejor sea tu muestreo, tendrás mejores intervalos de confianza.
Intervalos de confianza para medias
Uno de los parámetros más importantes que se puede trabajar usando los intervalos de confianza es la media de una población, o \(\mu\). En este caso, lo que se requiere es que la media de la muestra sea lo suficientemente cercana a la media de la población general.
Como ya te hemos mencionado, el parámetro se ve afectado por:
La manera en que se hizo el muestreo (cómo se escogieron los objetos a medir).
Cómo de grande es la población.
Por eso, en la mayoría de los casos se recomienda que:
Las mediciones se hagan a la población al azar; es decir, que no haya ningún patrón que sigamos y se escojan miembros de toda la población.
La muestra sea lo más grande posible.
Desarrollemos un poco la idea con un ejemplo, para clarificar los conceptos:
Se requiere el peso de una población de elefantes en una reserva en la que hay \(4000\) individuos, y se requiere que la media de la población sea representativa.
Solución
1. En este caso, se escoge un rango de elefantes para medir su peso; supongamos elefantes entre \(30\)y \(40\) años, ya que el peso varía con la edad.
3. Debido a que hay varias poblaciones en la reserva, se pesan elefantes de todas las poblaciones; estos deben abarcar las edades de \(30-40\) años, proporcionalmente, por lo que debe haber la misma cantidad de elefantes entre estas o —al menos— saltos regulares entre las edades.
4. Se debe escoger una población alta, digamos \(100\) elefantes a medir; esto es \(25\%\) de la población total.
5. Se debe calcular la media de los pesos \(\mu\), la desviación estándar \(\sigma\) y el valor de \(z\) que, en este caso, pediremos que sea igual al \(90\%\): \[1{,}645\]
6. Usando las fórmulas:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
Donde \(n=100\),
y calculando la media de los pesos y la desviación estándar, obtendremos el intervalo de confianza para la media.
7. El intervalo de confianza para la media nos dirá que, en este caso, el rango de valores alrededor de la media de la población total caiga, con un \(90\%\) de probabilidad.
En este ejemplo no hemos abordado cómo calcular la media y la desviación estándar debido a que no tenemos los datos de los pesos de los elefantes, para saber que debes hacer cuándo tienes estos datos puedes leer el artículo de estadística descriptiva.
Intervalos de confianza: ejemplos
Hagamos un par de ejemplos para que calcules los intervalos de confianza:
Calcula los intervalos de confianza en la medición de una muestra de piezas con: una población de 2300 objetos, una media de \(\mu=20\,\mathrm{cm}\) y una desviación estándar de \(\sigma=1\). En esta muestra se requiere que el intervalo de confianza sea del \(80\%\).
Solución
En este caso debes de observar, primero, tus tablas; obtienes el valor de \(z\) de la siguiente tabla:
Porcentaje \(%\) | \[z\] |
\[80\%\] | \[1{,}282\] |
\[85\%\] | \[1{,}440\] |
\[90\%\] | \[1{,}645\] |
\[95\%\] | \[1{,}960\] |
\[99\%\] | \[2{,}576\] |
\[99{,}5\%\] | \[2{,}807\] |
\[99{,}9\%\] | \[3{,}291\] |
Al hacer esto, aplicamos las fórmulas:
\[x_s=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]
\[x_i=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]
Resolviendo:
\[x_s=20{,}0274\]
\[x_i=19{,}9733\]
Esto significa que en la muestra que tenemos existe un \(80\%\) de probabilidades de que, al escoger una pieza al azar, esté entre estos dos valores.
Se tiene una granja con mil cabezas de ganado; en esta granja se pesó el \(2\%\) de la población y se sabe que, en general, el ganado tiene un peso parecido; pero, se quiere obtener la media de esta muestra y saber si esta es representativa, con una seguridad de más del \(99\%\).
Los datos son:
\[\mu=231{,}5\]
\[\sigma^2=1\]
Calcula el intervalo de confianza para la media.
Solución
Nuevamente, usamos las fórmulas:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
En este caso, al sustituir cada valor y una \(z=2{,}807\), obtenemos:
\[x_s=231{,}5+2{,}807 \dfrac{1}{\sqrt{1000}}\]
\[x_i=231{,}5-2{,}807 \dfrac{1}{\sqrt{1000}}\]
\[x_s=231{,}589\]
\[x_i=231{,}411\]
Así que hay casi un \(100\%\) de probabilidades que nuestra media de la población total caiga en ese intervalo.
Intervalos de confianza - Puntos clave
A la probabilidad de que un parámetro de una muestra, o población, en un experimento caiga en un rango específico se le conoce como intervalo de confianza.
El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra permitan que esta represente a la población.
Los límites del intervalo de confianza, para una media de una muestra dentro de una población total, están dados por las formulas siguientes:\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
Aprende más rápido con las 5 tarjetas sobre Intervalos de confianza
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Intervalos de confianza
¿Qué es un intervalo de confianza y para qué se utiliza?
A la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico se le conoce como intervalo de confianza.
¿Cómo se calculan los intervalos de confianza?
Se usan el límite superior del intervalo xs y el límite inferior del intervalo xi, que son:
xs=μ+z σ/√(n)
xi=μ-z σ/√(n)
- Aquí n es la población y z está dado por el porcentaje de confianza que se requiere.
¿Qué tipos de intervalos de confianza existen?
Hay intervalos de confianza para la media de una población e intervalos de confianza para una proporción de la población.
¿Qué es el nivel de confianza en estadística?
El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra representen a la población.
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más