Iniciar sesión Empieza a estudiar
La app de estudio todo en uno
4.8 • +11 mil reviews
Más de 3 millones de descargas
Free
|
|

Intervalos de confianza

Intervalos de confianza

Ya hemos hablado en otros artículos sobre la probabilidad y la estadística; sobre un experimento aleatorio o una variable aleatoria; y acerca de cómo, al repetir experimentos que nos dan cierto valor, a veces se obtienen valores que cambian (se distribuyen). Muchas veces, estos valores cambian de tal forma que hay un valor más probable (máximo,) que es la moda. También, si se trata de una distribución normal, incluso podemos saber (si sabemos la desviación estándar y la media) cuál es la probabilidad de que la variable obtenga cierto valor: \[N(\mu, \sigma)\]

Pero, puede que no nos interese simplemente la probabilidad de que una altura sea igual a \(1{,}4\,\mathrm{m}\), o que el bus pase \(20\,\mathrm{min}\) tarde. Es posible que lo que nos interese calcular sea la probabilidad de que cierto valor caiga en un rango. En este caso, queremos saber: si un valor cae en un intervalo, la probabilidad de que ocurra o nuestra confianza.

En este artículo te hablaremos acerca de la probabilidad de que un variable \(x\) obtenga cierto valor en un rango entre \([a, b]\).

Intervalos de confianza: fórmulas

Supongamos que tienes muchas piezas producidas por una máquina, y las piezas deben medir lo mismo \(l=0{,}25\, \mathrm{cm}\). Sin embargo, las piezas presentan desviaciones en sus medidas: algunas son más grandes\(l=0,26\,\mathrm{cm}\) y otras son más pequeñas \(l=0{,}22\,\mathrm{cm}\). Muchas otras piezas tienen valores muy cercanos a la media y las desviaciones son menores, conforme te alejas de la media.

En este caso, si tienes muchas piezas, esta distribución se acerca a la distribución normal: la media debe ser el valor más repetido y (como mencionamos en Propiedades de la función de densidad) sigue la forma de una campana. Aquí, el máximo es la medida más común; y la cola y cabeza —que tienden hacia cero— son las piezas con medidas más grande y más pequeña.

Intervalos de confianza distribución normal StudySmarterFig. 1. Imagen de la forma de campana de una distribución normal.

En este caso, que una pieza tenga una medida menor que la media se representa con probabilidades menores que el máximo (que es la media): \(m_4<m_3<m_2<m_1<m_0\).

Intervalos de confianza probabilidades decrecientes StudySmarterFig. 2: Probabilidades decrecientes de que la medida de una pieza sea diferente de la media \(m_0\).

A medida que la desviación es mayor \(m_1 \rightarrow m_2 \rightarrow m_3 \rightarrow m_4 \), la probabilidad es menor \(P(m_4)<P(m_3)<P(m_2)<P(m_1)\).

Pero, también podemos necesitar —no la probabilidad de una medida específica— sino la probabilidad de que esta medida caiga entre dos valores. Veámoslo en la siguiente imagen:

Intervalos de confianza intervalo probabilidad StudySmarterFig. 3. También se puede calcular la probabilidad de que una variable pueda obtener valores entre dos puntos distintos como una integral entre esos dos puntos \(P(x)=\int^{b}_{a}f(x)dx\).

Esto se conoce como un intervalo de confianza. La definición específica sería:

Se conoce como intervalo de confianza a la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico

Una muestra o población son los objetos de medición en un experimento aleatorio.

Para poder obtener estos intervalos de confianza, se requiere calcular un límite superior y un límite inferior; estos límites se encuentran alrededor de la media y su fórmula es:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu-z\dfrac{\sigma}{\sqrt{n}}\]

Podemos extraer los valores de \(z\) de la siguiente tabla para nuestros siguientes ejemplos:

Porcentaje \(%\)
\[Z\]
\[80\%\]
\[1{,}282\]
\[85\%\]
\[1{,}440\]
\[90\%\]
\[1{,}645\]
\[95\%\]
\[1{,}960\]
\[99\%\]
\[2{,}576\]
\[99{,}5\%\]
\[2{,}807\]
\[99{,}9\%\]
\[3{,}291\]

Tabla 1: Valores de \(z\) para diversos intervalos de confianza.

Por lo general, requerirás calcular intervalos de confianza del \(90\%\), \(95\%\) o \(99\%\). Esto se debe a que si se hace algún experimento, muchas veces no se pueden medir todos los objetos.

Supongamos que se desea medir la altura de las personas, en un país, entre ciertas edades. En este caso, en un estudio se puede tener una muestra de la población. La muestra debe ser aleatoria y representativa de la población; es decir, debe contener individuos, al azar, de todas las partes posibles del país.

Debido a que el número de personas en la muestra \(P_m(n)\) es menor que el número de personas en el país \(P_t(n)\), requieres que la población que hayas escogido represente lo mejor posible a la población del país.

Sin embargo, la media de tu población no será la misma que la de la población general: \[\mu(P_m(n)) \neq \mu(P_t(n)) \]

Un intervalo de confianza alto te dirá que es muy probable que la media real se encuentre en cierto intervalo de alturas alrededor de la media de tu muestra: \(\mu(P_m(n)) \rightarrow [\mu(P_t(n))-d, \mu(P_t(n))+d]\). Aquí, \(d\) es una desviación de la media de tu muestra.

Cuanto más grande sea la posibilidad de que la media total esté en un intervalo cada vez más pequeño de tu muestra, significa que tu muestra es más representativa.

En estadística, decir que algo es representativo significa que la muestra o población tiene valores muy cercanos a la población general. Por lo tanto, se pueden usar los valores de la muestra para representar los valores de toda la población.

Nivel de confianza

Una de las razones por las cuales son importantes los intervalos de confianza es que estos nos dicen cuán representativos son los valores que vemos en la muestra; un concepto relacionado, muy importante, el nivel de confianza.

El nivel de confianza es el valor que nos dice cuán probable es que los parámetros estadísticos de la muestra represente a la población.

Veamos estos casos:

  • Se tiene una población \(A\), de donde se mide el peso \(a\). De esta, se extraen datos como el peso medio, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza bajo.
    • Se tiene una población \(B\), de donde se mide también el peso \(a\), se extraen nuevamente datos como la media, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza muy alto.

    • Se hace un estudio de toda la población \(C\) —que contiene a \(A\) y \(B\)— y se extrae la verdadera media, moda, mediana y desviación estándar.

Debido a que el nivel de confianza es bajo en los datos extraídos de la muestra \(A\), es muy poco probable que datos como la media, mediana, moda y desviaciones estándar sean los mismos, o cercanos, a los reales de \(C\). En cambio, es extremadamente probable que los datos extraídos de la muestra \(B\) —como la media, mediana, moda y desviación estándar— sean iguales o cercanos a los reales de \(C\).

En resumen, cuanto más alto sea el nivel de confianza, más seguros estamos que los datos son cercanos a los reales y que no habría que repetir la muestra.

Muestreo y los intervalos de confianza

Una parte importante de hacer una buena estimación de los parámetros estadísticos de una población es el muestreo.

En estadística, el muestreo es el método por el cual se escoge una parte de una población para estimar las características de toda la población.

Te hemos hablado de los intervalos de confianza y los niveles de confianza; pero, como ya te mencionamos, todo esto depende de elegir la muestra correcta.

Supongamos lo siguiente:

  • Se tiene un barrio donde existen casas, escuelas, supermercados, etc. En este barrio se desea medir la edad media de las personas que viven ahí, y se hacen dos estudios.

    • En el estudio uno, se hacen preguntas a las personas y se anotan sus edades. El estudio comprende dos zonas con casas, cuatro alrededor de las escuelas y uno en un supermercado.

    • En el segundo estudio, se hacen las mismas preguntas y se anotan sus edades, pero se hace un estudio preguntando en casas, ninguno en escuelas y cinco en el supermercado.

En ambos estudios los resultados podrían ser muy distintos, solo por la manera en que fueron elegidos los puntos de las encuestas:

  • En el estudio uno, es muy probable que las edades sean más jóvenes, debido a que se hacen más estudios en las escuelas, que estas estarán llenas de jóvenes.
  • En el estudio dos, es muy probable que la población tenga datos de edades mayores, ya que es más posible encontrar adultos en los supermercados, a excepción que acudan con niños o jóvenes.

Esto significa que ambos estudios tendrán valores distintos de media, moda, mediana y desviación estándar, solo por como fueron elegidas las muestras.

Por eso, puedes asumir que cuanto mejor sea tu muestreo, tendrás mejores intervalos de confianza.

Intervalos de confianza para medias

Uno de los parámetros más importantes que se puede trabajar usando los intervalos de confianza es la media de una población, o \(\mu\). En este caso, lo que se requiere es que la media de la muestra sea lo suficientemente cercana a la media de la población general.

Como ya te hemos mencionado, el parámetro se ve afectado por:

  • La manera en que se hizo el muestreo (cómo se escogieron los objetos a medir).

  • Cómo de grande es la población.

Por eso, en la mayoría de los casos se recomienda que:

  • Las mediciones se hagan a la población al azar; es decir, que no haya ningún patrón que sigamos y se escojan miembros de toda la población.

  • La muestra sea lo más grande posible.

Desarrollemos un poco la idea con un ejemplo, para clarificar los conceptos:

Se requiere el peso de una población de elefantes en una reserva en la que hay \(4000\) individuos, y se requiere que la media de la población sea representativa.

Solución

1. En este caso, se escoge un rango de elefantes para medir su peso; supongamos elefantes entre \(30\)y \(40\) años, ya que el peso varía con la edad.

3. Debido a que hay varias poblaciones en la reserva, se pesan elefantes de todas las poblaciones; estos deben abarcar las edades de \(30-40\) años, proporcionalmente, por lo que debe haber la misma cantidad de elefantes entre estas o —al menos— saltos regulares entre las edades.

4. Se debe escoger una población alta, digamos \(100\) elefantes a medir; esto es \(25\%\) de la población total.

5. Se debe calcular la media de los pesos \(\mu\), la desviación estándar \(\sigma\) y el valor de \(z\) que, en este caso, pediremos que sea igual al \(90\%\): \[1{,}645\]

6. Usando las fórmulas:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

Donde \(n=100\),

y calculando la media de los pesos y la desviación estándar, obtendremos el intervalo de confianza para la media.

7. El intervalo de confianza para la media nos dirá que, en este caso, el rango de valores alrededor de la media de la población total caiga, con un \(90\%\) de probabilidad.

En este ejemplo no hemos abordado cómo calcular la media y la desviación estándar debido a que no tenemos los datos de los pesos de los elefantes, para saber que debes hacer cuándo tienes estos datos puedes leer el artículo de estadística descriptiva.

Intervalos de confianza: ejemplos

Hagamos un par de ejemplos para que calcules los intervalos de confianza:

Calcula los intervalos de confianza en la medición de una muestra de piezas con: una población de 2300 objetos, una media de \(\mu=20\,\mathrm{cm}\) y una desviación estándar de \(\sigma=1\). En esta muestra se requiere que el intervalo de confianza sea del \(80\%\).

Solución

En este caso debes de observar, primero, tus tablas; obtienes el valor de \(z\) de la siguiente tabla:

Porcentaje \(%\)
\[z\]
\[80\%\]\[1{,}282\]
\[85\%\]\[1{,}440\]
\[90\%\]\[1{,}645\]
\[95\%\]\[1{,}960\]
\[99\%\]\[2{,}576\]
\[99{,}5\%\]\[2{,}807\]
\[99{,}9\%\]\[3{,}291\]
Tabla 2: Valores de \(z\) para diversos intervalos de confianza.

Al hacer esto, aplicamos las fórmulas:

\[x_s=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]

\[x_i=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]

Resolviendo:

\[x_s=20{,}0274\]

\[x_i=19{,}9733\]

Esto significa que en la muestra que tenemos existe un \(80\%\) de probabilidades de que, al escoger una pieza al azar, esté entre estos dos valores.

Se tiene una granja con mil cabezas de ganado; en esta granja se pesó el \(2\%\) de la población y se sabe que, en general, el ganado tiene un peso parecido; pero, se quiere obtener la media de esta muestra y saber si esta es representativa, con una seguridad de más del \(99\%\).

Los datos son:

\[\mu=231{,}5\]

\[\sigma^2=1\]

Calcula el intervalo de confianza para la media.

Solución

Nuevamente, usamos las fórmulas:

\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

En este caso, al sustituir cada valor y una \(z=2{,}807\), obtenemos:

\[x_s=231{,}5+2{,}807 \dfrac{1}{\sqrt{1000}}\]

\[x_i=231{,}5-2{,}807 \dfrac{1}{\sqrt{1000}}\]

\[x_s=231{,}589\]

\[x_i=231{,}411\]

Así que hay casi un \(100\%\) de probabilidades que nuestra media de la población total caiga en ese intervalo.

Intervalos de confianza - Puntos clave

  • A la probabilidad de que un parámetro de una muestra, o población, en un experimento caiga en un rango específico se le conoce como intervalo de confianza.

  • El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra permitan que esta represente a la población.

  • Los límites del intervalo de confianza, para una media de una muestra dentro de una población total, están dados por las formulas siguientes:\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]

Preguntas frecuentes sobre Intervalos de confianza

A la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico se le conoce como intervalo de confianza.

Se usan el límite superior del intervalo xs y el límite inferior del intervalo xi, que son:

xs=μ+z σ/√(n)

xi=μ-z σ/√(n)

  • Aquí n es la población y z está dado por el porcentaje de confianza que se requiere.

Hay intervalos de confianza para la media de una población e intervalos de confianza para una proporción de la población.

El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra representen a la población.

Cuestionario final de Intervalos de confianza

Pregunta

¿Qué forma tiene la distribución normal?


Mostrar respuesta

Answer

Una campana.

Show question

Pregunta

¿Cuáles son los dos parámetros que definen una distribución normal?

Mostrar respuesta

Answer

La media y desviación estándar.

Show question

Pregunta

La probabilidad de un valor de la variable aleatoria \(x\), que define una distribución normal \(N(\mu, \sigma)\), obtiene un valor \(x=a\) que es distinto de la media. ¿Cómo es este valor con respecto a la media?

Mostrar respuesta

Answer

\(P(a)>P(\mu)\).

Show question

Pregunta

¿Qué es un intervalo de confianza?


Mostrar respuesta

Answer

Es la probabilidad de que un parámetro de una muestra o población, en un experimento, caiga en un rango específico.

Show question

Pregunta

Una variable aleatoria \(x\) obtiene un valor en un rango \([a,b]\) dentro de una distribución normal cuyos valores existen en el rango \([-c, c]\) y la relación entre estas variables es \(-c<a\) y \(c>b\). ¿Cuál es el valor de la probabilidad del rango \([a, b]\) con respecto a la probabilidad total del rango \([-c, c]\)?


Mostrar respuesta

Answer

\(P(b)-P(a)>P(-c)-P(c)\).

Show question

Pregunta

Se dice que una variable aleatoria obtiene un valor de \(P(x)=30%\). ¿Es este un intervalo de confianza?


Mostrar respuesta

Answer

No, debido a que es un valor único.

Show question

Pregunta

Se dice que una variable aleatoria tiene una probabilidad del \(50\%\) de obtener un valor en el rango \([-c, \mu]\), donde \(-c\) es la parte inferior del intervalo. ¿Es este un intervalo de confianza?

Mostrar respuesta

Answer

Sí, debido a que es un valor para un intervalo. En este caso, es la probabilidad de obtener un valor entre el límite inferior y la media. La distribución parece ser normal, ya que esto cubre el \(50\%\).

Show question

Pregunta

Escribe la fórmula para el límite inferior del intervalo de confianza:

Mostrar respuesta

Answer

\(x_i=\mu-z\dfrac{\sigma}{\sqrt{n}}\).

Show question

Pregunta

Escribe la fórmula para el límite superior del intervalo de confianza:

Mostrar respuesta

Answer

\(x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\).

Show question

Pregunta

Se sabe que se tiene una distribución normal estándar, cuya población usada para obtener la probabilidad es de 3451 individuos. Calcula los límites del intervalo de confianza para un \(80\%\) de probabilidad dado \(z=1{,}282\).

Mostrar respuesta

Answer

\([-0{,}0218,0{,}0218]\).

Show question

Pregunta

Se tiene una distribución normal de una variable aleatoria con parámetros \(N(\mu=1{,}23,\sigma=2{,}3)\).

La población de la cual se tomó la muestra es igual a \(3933\). Calcula el intervalo de confianza para la media, si se requiere un \(99\%\) de confianza donde \(z=2{,}576\).


Mostrar respuesta

Answer

\([1{,}324, 1{,}135 ]\).

Show question

Pregunta

¿Qué es el muestreo?

Mostrar respuesta

Answer

En estadística, el muestreo es el método por el cual se escoge una parte de una población para estimar las características de toda la población.

Show question

Pregunta

¿El tamaño de la población afecta al valor de las medias, modas y desviaciones estándar cuando se hace un muestreo aleatorio?

Mostrar respuesta

Answer

Sí. De hecho, es uno de los factores determinantes para ello: cuanto más grande sea el muestreo, se puede decir que la probabilidad de que estas sean representativas es más alta.

Show question

Pregunta

¿La forma en la que se hace un muestreo aleatorio afecta los valores de la media, moda y desviaciones estándar?

Mostrar respuesta

Answer

Sí. De hecho es uno de los factores determinantes para ello: cuanto más grande sea el muestreo, se puede decir que la probabilidad de que estas sean representativas es más alta.

Show question

Pregunta

Si se tienen dos muestreos de una población, donde ambos siguen el mismo patrón para extraer muestras de una población total \(N_t=1000\) y los muestreos tienen las muestras \(n_a=100\) y \(n_b=20\). ¿Cuál de las muestras tendría valores de media, moda y desviación estándar más representativas?


Mostrar respuesta

Answer

\(n_a\).

Show question

60%

de los usuarios no aprueban el cuestionario de Intervalos de confianza... ¿Lo conseguirás tú?

Empezar cuestionario

Scopri i migliori contenuti per le tue materie

No hay necesidad de copiar si tienes todo lo necesario para triunfar. Todo en una sola app.

Plan de estudios

Siempre preparado y a tiempo con planes de estudio individualizados.

Cuestionarios

Pon a prueba tus conocimientos con cuestionarios entretenidos.

Flashcards

Crea y encuentra fichas de repaso en tiempo récord.

Apuntes

Crea apuntes organizados más rápido que nunca.

Sets de estudio

Todos tus materiales de estudio en un solo lugar.

Documentos

Sube todos los documentos que quieras y guárdalos online.

Análisis de estudio

Identifica cuáles son tus puntos fuertes y débiles a la hora de estudiar.

Objetivos semanales

Fíjate objetivos de estudio y gana puntos al alcanzarlos.

Recordatorios

Deja de procrastinar con nuestros recordatorios de estudio.

Premios

Gana puntos, desbloquea insignias y sube de nivel mientras estudias.

Magic Marker

Cree tarjetas didácticas o flashcards de forma automática.

Formato inteligente

Crea apuntes y resúmenes organizados con nuestras plantillas.

Regístrate para poder subrayar y tomar apuntes. Es 100% gratis.