|
|
Intervalos de confianza

Ya hemos hablado en otros artículos sobre la probabilidad y la estadística; sobre un experimento aleatorio o una variable aleatoria; y acerca de cómo, al repetir experimentos que nos dan cierto valor, a veces se obtienen valores que cambian (se distribuyen). Muchas veces, estos valores cambian de tal forma que hay un valor más probable (máximo,) que es la moda. También, si se trata de una distribución normal, incluso podemos saber (si sabemos la desviación estándar y la media) cuál es la probabilidad de que la variable obtenga cierto valor: \[N(\mu, \sigma)\]

Mockup Schule

Explora nuestra app y descubre más de 50 millones de materiales de aprendizaje totalmente gratis.

Intervalos de confianza

Illustration

Lerne mit deinen Freunden und bleibe auf dem richtigen Kurs mit deinen persönlichen Lernstatistiken

Jetzt kostenlos anmelden

Nie wieder prokastinieren mit unseren Lernerinnerungen.

Jetzt kostenlos anmelden
Illustration

Ya hemos hablado en otros artículos sobre la probabilidad y la estadística; sobre un experimento aleatorio o una variable aleatoria; y acerca de cómo, al repetir experimentos que nos dan cierto valor, a veces se obtienen valores que cambian (se distribuyen). Muchas veces, estos valores cambian de tal forma que hay un valor más probable (máximo,) que es la moda. También, si se trata de una distribución normal, incluso podemos saber (si sabemos la desviación estándar y la media) cuál es la probabilidad de que la variable obtenga cierto valor: \[N(\mu, \sigma)\]

Pero, puede que no nos interese simplemente la probabilidad de que una altura sea igual a \(1{,}4\,\mathrm{m}\), o que el bus pase \(20\,\mathrm{min}\) tarde. Es posible que lo que nos interese calcular sea la probabilidad de que cierto valor caiga en un rango. En este caso, queremos saber: si un valor cae en un intervalo, la probabilidad de que ocurra o nuestra confianza.

En este artículo te hablaremos acerca de la probabilidad de que un variable \(x\) obtenga cierto valor en un rango entre \([a, b]\).

Intervalos de confianza: fórmulas

Supongamos que tienes muchas piezas producidas por una máquina, y las piezas deben medir lo mismo \(l=0{,}25\, \mathrm{cm}\). Sin embargo, las piezas presentan desviaciones en sus medidas: algunas son más grandes\(l=0,26\,\mathrm{cm}\) y otras son más pequeñas \(l=0{,}22\,\mathrm{cm}\). Muchas otras piezas tienen valores muy cercanos a la media y las desviaciones son menores, conforme te alejas de la media.

En este caso, si tienes muchas piezas, esta distribución se acerca a la distribución normal: la media debe ser el valor más repetido y (como mencionamos en Propiedades de la función de densidad) sigue la forma de una campana. Aquí, el máximo es la medida más común; y la cola y cabeza —que tienden hacia cero— son las piezas con medidas más grande y más pequeña.

Intervalos de confianza distribución normal StudySmarterFig. 1. Imagen de la forma de campana de una distribución normal.

En este caso, que una pieza tenga una medida menor que la media se representa con probabilidades menores que el máximo (que es la media): \(m_4<m_3<m_2<m_1<m_0\).

Intervalos de confianza probabilidades decrecientes StudySmarterFig. 2: Probabilidades decrecientes de que la medida de una pieza sea diferente de la media \(m_0\).

A medida que la desviación es mayor \(m_1 \rightarrow m_2 \rightarrow m_3 \rightarrow m_4 \), la probabilidad es menor \(P(m_4)<P(m_3)<P(m_2)<P(m_1)\).

Pero, también podemos necesitar —no la probabilidad de una medida específica— sino la probabilidad de que esta medida caiga entre dos valores. Veámoslo en la siguiente imagen:

Intervalos de confianza intervalo probabilidad StudySmarterFig. 3. También se puede calcular la probabilidad de que una variable pueda obtener valores entre dos puntos distintos como una integral entre esos dos puntos \(P(x)=\int^{b}_{a}f(x)dx\).

Esto se conoce como un intervalo de confianza. La definición específica sería:

Se conoce como intervalo de confianza a la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico

Una muestra o población son los objetos de medición en un experimento aleatorio.

Para poder obtener estos intervalos de confianza, se requiere calcular un límite superior y un límite inferior; estos límites se encuentran alrededor de la media y su fórmula es:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu-z\dfrac{\sigma}{\sqrt{n}}\]

Podemos extraer los valores de \(z\) de la siguiente tabla para nuestros siguientes ejemplos:

Porcentaje \(%\)
\[Z\]
\[80\%\]
\[1{,}282\]
\[85\%\]
\[1{,}440\]
\[90\%\]
\[1{,}645\]
\[95\%\]
\[1{,}960\]
\[99\%\]
\[2{,}576\]
\[99{,}5\%\]
\[2{,}807\]
\[99{,}9\%\]
\[3{,}291\]

Tabla 1: Valores de \(z\) para diversos intervalos de confianza.

Por lo general, requerirás calcular intervalos de confianza del \(90\%\), \(95\%\) o \(99\%\). Esto se debe a que si se hace algún experimento, muchas veces no se pueden medir todos los objetos.

Supongamos que se desea medir la altura de las personas, en un país, entre ciertas edades. En este caso, en un estudio se puede tener una muestra de la población. La muestra debe ser aleatoria y representativa de la población; es decir, debe contener individuos, al azar, de todas las partes posibles del país.

Debido a que el número de personas en la muestra \(P_m(n)\) es menor que el número de personas en el país \(P_t(n)\), requieres que la población que hayas escogido represente lo mejor posible a la población del país.

Sin embargo, la media de tu población no será la misma que la de la población general: \[\mu(P_m(n)) \neq \mu(P_t(n)) \]

Un intervalo de confianza alto te dirá que es muy probable que la media real se encuentre en cierto intervalo de alturas alrededor de la media de tu muestra: \(\mu(P_m(n)) \rightarrow [\mu(P_t(n))-d, \mu(P_t(n))+d]\). Aquí, \(d\) es una desviación de la media de tu muestra.

Cuanto más grande sea la posibilidad de que la media total esté en un intervalo cada vez más pequeño de tu muestra, significa que tu muestra es más representativa.

En estadística, decir que algo es representativo significa que la muestra o población tiene valores muy cercanos a la población general. Por lo tanto, se pueden usar los valores de la muestra para representar los valores de toda la población.

Nivel de confianza

Una de las razones por las cuales son importantes los intervalos de confianza es que estos nos dicen cuán representativos son los valores que vemos en la muestra; un concepto relacionado, muy importante, el nivel de confianza.

El nivel de confianza es el valor que nos dice cuán probable es que los parámetros estadísticos de la muestra represente a la población.

Veamos estos casos:

  • Se tiene una población \(A\), de donde se mide el peso \(a\). De esta, se extraen datos como el peso medio, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza bajo.
    • Se tiene una población \(B\), de donde se mide también el peso \(a\), se extraen nuevamente datos como la media, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza muy alto.

    • Se hace un estudio de toda la población \(C\) —que contiene a \(A\) y \(B\)— y se extrae la verdadera media, moda, mediana y desviación estándar.

Debido a que el nivel de confianza es bajo en los datos extraídos de la muestra \(A\), es muy poco probable que datos como la media, mediana, moda y desviaciones estándar sean los mismos, o cercanos, a los reales de \(C\). En cambio, es extremadamente probable que los datos extraídos de la muestra \(B\) —como la media, mediana, moda y desviación estándar— sean iguales o cercanos a los reales de \(C\).

En resumen, cuanto más alto sea el nivel de confianza, más seguros estamos que los datos son cercanos a los reales y que no habría que repetir la muestra.

Muestreo y los intervalos de confianza

Una parte importante de hacer una buena estimación de los parámetros estadísticos de una población es el muestreo.

En estadística, el muestreo es el método por el cual se escoge una parte de una población para estimar las características de toda la población.

Te hemos hablado de los intervalos de confianza y los niveles de confianza; pero, como ya te mencionamos, todo esto depende de elegir la muestra correcta.

Supongamos lo siguiente:

  • Se tiene un barrio donde existen casas, escuelas, supermercados, etc. En este barrio se desea medir la edad media de las personas que viven ahí, y se hacen dos estudios.

    • En el estudio uno, se hacen preguntas a las personas y se anotan sus edades. El estudio comprende dos zonas con casas, cuatro alrededor de las escuelas y uno en un supermercado.

    • En el segundo estudio, se hacen las mismas preguntas y se anotan sus edades, pero se hace un estudio preguntando en casas, ninguno en escuelas y cinco en el supermercado.

En ambos estudios los resultados podrían ser muy distintos, solo por la manera en que fueron elegidos los puntos de las encuestas:

  • En el estudio uno, es muy probable que las edades sean más jóvenes, debido a que se hacen más estudios en las escuelas, que estas estarán llenas de jóvenes.
  • En el estudio dos, es muy probable que la población tenga datos de edades mayores, ya que es más posible encontrar adultos en los supermercados, a excepción que acudan con niños o jóvenes.

Esto significa que ambos estudios tendrán valores distintos de media, moda, mediana y desviación estándar, solo por como fueron elegidas las muestras.

Por eso, puedes asumir que cuanto mejor sea tu muestreo, tendrás mejores intervalos de confianza.

Intervalos de confianza para medias

Uno de los parámetros más importantes que se puede trabajar usando los intervalos de confianza es la media de una población, o \(\mu\). En este caso, lo que se requiere es que la media de la muestra sea lo suficientemente cercana a la media de la población general.

Como ya te hemos mencionado, el parámetro se ve afectado por:

  • La manera en que se hizo el muestreo (cómo se escogieron los objetos a medir).

  • Cómo de grande es la población.

Por eso, en la mayoría de los casos se recomienda que:

  • Las mediciones se hagan a la población al azar; es decir, que no haya ningún patrón que sigamos y se escojan miembros de toda la población.

  • La muestra sea lo más grande posible.

Desarrollemos un poco la idea con un ejemplo, para clarificar los conceptos:

Se requiere el peso de una población de elefantes en una reserva en la que hay \(4000\) individuos, y se requiere que la media de la población sea representativa.

Solución

1. En este caso, se escoge un rango de elefantes para medir su peso; supongamos elefantes entre \(30\)y \(40\) años, ya que el peso varía con la edad.

3. Debido a que hay varias poblaciones en la reserva, se pesan elefantes de todas las poblaciones; estos deben abarcar las edades de \(30-40\) años, proporcionalmente, por lo que debe haber la misma cantidad de elefantes entre estas o —al menos— saltos regulares entre las edades.

4. Se debe escoger una población alta, digamos \(100\) elefantes a medir; esto es \(25\%\) de la población total.

5. Se debe calcular la media de los pesos \(\mu\), la desviación estándar \(\sigma\) y el valor de \(z\) que, en este caso, pediremos que sea igual al \(90\%\): \[1{,}645\]

6. Usando las fórmulas:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

Donde \(n=100\),

y calculando la media de los pesos y la desviación estándar, obtendremos el intervalo de confianza para la media.

7. El intervalo de confianza para la media nos dirá que, en este caso, el rango de valores alrededor de la media de la población total caiga, con un \(90\%\) de probabilidad.

En este ejemplo no hemos abordado cómo calcular la media y la desviación estándar debido a que no tenemos los datos de los pesos de los elefantes, para saber que debes hacer cuándo tienes estos datos puedes leer el artículo de estadística descriptiva.

Intervalos de confianza: ejemplos

Hagamos un par de ejemplos para que calcules los intervalos de confianza:

Calcula los intervalos de confianza en la medición de una muestra de piezas con: una población de 2300 objetos, una media de \(\mu=20\,\mathrm{cm}\) y una desviación estándar de \(\sigma=1\). En esta muestra se requiere que el intervalo de confianza sea del \(80\%\).

Solución

En este caso debes de observar, primero, tus tablas; obtienes el valor de \(z\) de la siguiente tabla:

Porcentaje \(%\)
\[z\]
\[80\%\]\[1{,}282\]
\[85\%\]\[1{,}440\]
\[90\%\]\[1{,}645\]
\[95\%\]\[1{,}960\]
\[99\%\]\[2{,}576\]
\[99{,}5\%\]\[2{,}807\]
\[99{,}9\%\]\[3{,}291\]
Tabla 2: Valores de \(z\) para diversos intervalos de confianza.

Al hacer esto, aplicamos las fórmulas:

\[x_s=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]

\[x_i=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]

Resolviendo:

\[x_s=20{,}0274\]

\[x_i=19{,}9733\]

Esto significa que en la muestra que tenemos existe un \(80\%\) de probabilidades de que, al escoger una pieza al azar, esté entre estos dos valores.

Se tiene una granja con mil cabezas de ganado; en esta granja se pesó el \(2\%\) de la población y se sabe que, en general, el ganado tiene un peso parecido; pero, se quiere obtener la media de esta muestra y saber si esta es representativa, con una seguridad de más del \(99\%\).

Los datos son:

\[\mu=231{,}5\]

\[\sigma^2=1\]

Calcula el intervalo de confianza para la media.

Solución

Nuevamente, usamos las fórmulas:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

En este caso, al sustituir cada valor y una \(z=2{,}807\), obtenemos:

\[x_s=231{,}5+2{,}807 \dfrac{1}{\sqrt{1000}}\]

\[x_i=231{,}5-2{,}807 \dfrac{1}{\sqrt{1000}}\]

\[x_s=231{,}589\]

\[x_i=231{,}411\]

Así que hay casi un \(100\%\) de probabilidades que nuestra media de la población total caiga en ese intervalo.

Intervalos de confianza - Puntos clave

  • A la probabilidad de que un parámetro de una muestra, o población, en un experimento caiga en un rango específico se le conoce como intervalo de confianza.

  • El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra permitan que esta represente a la población.

  • Los límites del intervalo de confianza, para una media de una muestra dentro de una población total, están dados por las formulas siguientes:\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

Preguntas frecuentes sobre Intervalos de confianza

A la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico se le conoce como intervalo de confianza.

Se usan el límite superior del intervalo xs y el límite inferior del intervalo xi, que son:

xs=μ+z σ/√(n)

xi=μ-z σ/√(n)

  • Aquí n es la población y z está dado por el porcentaje de confianza que se requiere.

Hay intervalos de confianza para la media de una población e intervalos de confianza para una proporción de la población.

El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra representen a la población.

Pon a prueba tus conocimientos con tarjetas de opción múltiple

¿Qué forma tiene la distribución normal?

La probabilidad de un valor de la variable aleatoria \(x\), que define una distribución normal \(N(\mu, \sigma)\), obtiene un valor \(x=a\) que es distinto de la media. ¿Cómo es este valor con respecto a la media?

¿Qué es un intervalo de confianza?

Siguiente

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

La primera app de aprendizaje que realmente tiene todo lo que necesitas para superar tus exámenes en un solo lugar.

  • Tarjetas y cuestionarios
  • Asistente de Estudio con IA
  • Planificador de estudio
  • Exámenes simulados
  • Toma de notas inteligente
Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter. Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

Regístrate para poder subrayar y tomar apuntes. Es 100% gratis.

Entdecke Lernmaterial in der StudySmarter-App

Google Popup

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.

La primera app de aprendizaje que realmente tiene todo lo que necesitas para superar tus exámenes en un solo lugar.

  • Tarjetas y cuestionarios
  • Asistente de Estudio con IA
  • Planificador de estudio
  • Exámenes simulados
  • Toma de notas inteligente
Únete a más de 22 millones de estudiantes que aprenden con nuestra app StudySmarter.