La app de estudio todo en uno
4.8 • +11 mil reviews
Más de 3 millones de descargas
Free
Ya hemos hablado en otros artículos sobre la probabilidad y la estadística; sobre un experimento aleatorio o una variable aleatoria; y acerca de cómo, al repetir experimentos que nos dan cierto valor, a veces se obtienen valores que cambian (se distribuyen). Muchas veces, estos valores cambian de tal forma que hay un valor más probable (máximo,) que es la moda.…
Explore our app and discover over 50 million learning materials for free.
Guarda la explicación ya y léela cuando tengas tiempo.
GuardarLerne mit deinen Freunden und bleibe auf dem richtigen Kurs mit deinen persönlichen Lernstatistiken
Jetzt kostenlos anmeldenYa hemos hablado en otros artículos sobre la probabilidad y la estadística; sobre un experimento aleatorio o una variable aleatoria; y acerca de cómo, al repetir experimentos que nos dan cierto valor, a veces se obtienen valores que cambian (se distribuyen). Muchas veces, estos valores cambian de tal forma que hay un valor más probable (máximo,) que es la moda. También, si se trata de una distribución normal, incluso podemos saber (si sabemos la desviación estándar y la media) cuál es la probabilidad de que la variable obtenga cierto valor: \[N(\mu, \sigma)\]
Pero, puede que no nos interese simplemente la probabilidad de que una altura sea igual a \(1{,}4\,\mathrm{m}\), o que el bus pase \(20\,\mathrm{min}\) tarde. Es posible que lo que nos interese calcular sea la probabilidad de que cierto valor caiga en un rango. En este caso, queremos saber: si un valor cae en un intervalo, la probabilidad de que ocurra o nuestra confianza.
En este artículo te hablaremos acerca de la probabilidad de que un variable \(x\) obtenga cierto valor en un rango entre \([a, b]\).
Supongamos que tienes muchas piezas producidas por una máquina, y las piezas deben medir lo mismo \(l=0{,}25\, \mathrm{cm}\). Sin embargo, las piezas presentan desviaciones en sus medidas: algunas son más grandes\(l=0,26\,\mathrm{cm}\) y otras son más pequeñas \(l=0{,}22\,\mathrm{cm}\). Muchas otras piezas tienen valores muy cercanos a la media y las desviaciones son menores, conforme te alejas de la media.
En este caso, si tienes muchas piezas, esta distribución se acerca a la distribución normal: la media debe ser el valor más repetido y (como mencionamos en Propiedades de la función de densidad) sigue la forma de una campana. Aquí, el máximo es la medida más común; y la cola y cabeza —que tienden hacia cero— son las piezas con medidas más grande y más pequeña.
Fig. 1. Imagen de la forma de campana de una distribución normal.
En este caso, que una pieza tenga una medida menor que la media se representa con probabilidades menores que el máximo (que es la media): \(m_4<m_3<m_2<m_1<m_0\).
Fig. 2: Probabilidades decrecientes de que la medida de una pieza sea diferente de la media \(m_0\).
Pero, también podemos necesitar —no la probabilidad de una medida específica— sino la probabilidad de que esta medida caiga entre dos valores. Veámoslo en la siguiente imagen:
Fig. 3. También se puede calcular la probabilidad de que una variable pueda obtener valores entre dos puntos distintos como una integral entre esos dos puntos \(P(x)=\int^{b}_{a}f(x)dx\).
Esto se conoce como un intervalo de confianza. La definición específica sería:
Se conoce como intervalo de confianza a la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico
Una muestra o población son los objetos de medición en un experimento aleatorio.
Para poder obtener estos intervalos de confianza, se requiere calcular un límite superior y un límite inferior; estos límites se encuentran alrededor de la media y su fórmula es:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu-z\dfrac{\sigma}{\sqrt{n}}\]
Podemos extraer los valores de \(z\) de la siguiente tabla para nuestros siguientes ejemplos:
Porcentaje \(%\) | \[Z\] |
\[80\%\] | \[1{,}282\] |
\[85\%\] | \[1{,}440\] |
\[90\%\] | \[1{,}645\] |
\[95\%\] | \[1{,}960\] |
\[99\%\] | \[2{,}576\] |
\[99{,}5\%\] | \[2{,}807\] |
\[99{,}9\%\] | \[3{,}291\] |
Tabla 1: Valores de \(z\) para diversos intervalos de confianza.
Por lo general, requerirás calcular intervalos de confianza del \(90\%\), \(95\%\) o \(99\%\). Esto se debe a que si se hace algún experimento, muchas veces no se pueden medir todos los objetos.
Supongamos que se desea medir la altura de las personas, en un país, entre ciertas edades. En este caso, en un estudio se puede tener una muestra de la población. La muestra debe ser aleatoria y representativa de la población; es decir, debe contener individuos, al azar, de todas las partes posibles del país.
Debido a que el número de personas en la muestra \(P_m(n)\) es menor que el número de personas en el país \(P_t(n)\), requieres que la población que hayas escogido represente lo mejor posible a la población del país.
Sin embargo, la media de tu población no será la misma que la de la población general: \[\mu(P_m(n)) \neq \mu(P_t(n)) \]
Un intervalo de confianza alto te dirá que es muy probable que la media real se encuentre en cierto intervalo de alturas alrededor de la media de tu muestra: \(\mu(P_m(n)) \rightarrow [\mu(P_t(n))-d, \mu(P_t(n))+d]\). Aquí, \(d\) es una desviación de la media de tu muestra.
Cuanto más grande sea la posibilidad de que la media total esté en un intervalo cada vez más pequeño de tu muestra, significa que tu muestra es más representativa.
En estadística, decir que algo es representativo significa que la muestra o población tiene valores muy cercanos a la población general. Por lo tanto, se pueden usar los valores de la muestra para representar los valores de toda la población.
Una de las razones por las cuales son importantes los intervalos de confianza es que estos nos dicen cuán representativos son los valores que vemos en la muestra; un concepto relacionado, muy importante, el nivel de confianza.
El nivel de confianza es el valor que nos dice cuán probable es que los parámetros estadísticos de la muestra represente a la población.
Veamos estos casos:
Se tiene una población \(B\), de donde se mide también el peso \(a\), se extraen nuevamente datos como la media, la moda, la mediana y su desviación estándar. Pero, esta tiene un nivel de confianza muy alto.
Se hace un estudio de toda la población \(C\) —que contiene a \(A\) y \(B\)— y se extrae la verdadera media, moda, mediana y desviación estándar.
Debido a que el nivel de confianza es bajo en los datos extraídos de la muestra \(A\), es muy poco probable que datos como la media, mediana, moda y desviaciones estándar sean los mismos, o cercanos, a los reales de \(C\). En cambio, es extremadamente probable que los datos extraídos de la muestra \(B\) —como la media, mediana, moda y desviación estándar— sean iguales o cercanos a los reales de \(C\).
En resumen, cuanto más alto sea el nivel de confianza, más seguros estamos que los datos son cercanos a los reales y que no habría que repetir la muestra.
Una parte importante de hacer una buena estimación de los parámetros estadísticos de una población es el muestreo.
En estadística, el muestreo es el método por el cual se escoge una parte de una población para estimar las características de toda la población.
Te hemos hablado de los intervalos de confianza y los niveles de confianza; pero, como ya te mencionamos, todo esto depende de elegir la muestra correcta.
Supongamos lo siguiente:
Se tiene un barrio donde existen casas, escuelas, supermercados, etc. En este barrio se desea medir la edad media de las personas que viven ahí, y se hacen dos estudios.
En el estudio uno, se hacen preguntas a las personas y se anotan sus edades. El estudio comprende dos zonas con casas, cuatro alrededor de las escuelas y uno en un supermercado.
En el segundo estudio, se hacen las mismas preguntas y se anotan sus edades, pero se hace un estudio preguntando en casas, ninguno en escuelas y cinco en el supermercado.
En ambos estudios los resultados podrían ser muy distintos, solo por la manera en que fueron elegidos los puntos de las encuestas:
Esto significa que ambos estudios tendrán valores distintos de media, moda, mediana y desviación estándar, solo por como fueron elegidas las muestras.
Por eso, puedes asumir que cuanto mejor sea tu muestreo, tendrás mejores intervalos de confianza.
Uno de los parámetros más importantes que se puede trabajar usando los intervalos de confianza es la media de una población, o \(\mu\). En este caso, lo que se requiere es que la media de la muestra sea lo suficientemente cercana a la media de la población general.
Como ya te hemos mencionado, el parámetro se ve afectado por:
La manera en que se hizo el muestreo (cómo se escogieron los objetos a medir).
Cómo de grande es la población.
Por eso, en la mayoría de los casos se recomienda que:
Las mediciones se hagan a la población al azar; es decir, que no haya ningún patrón que sigamos y se escojan miembros de toda la población.
La muestra sea lo más grande posible.
Desarrollemos un poco la idea con un ejemplo, para clarificar los conceptos:
Se requiere el peso de una población de elefantes en una reserva en la que hay \(4000\) individuos, y se requiere que la media de la población sea representativa.
Solución
1. En este caso, se escoge un rango de elefantes para medir su peso; supongamos elefantes entre \(30\)y \(40\) años, ya que el peso varía con la edad.
3. Debido a que hay varias poblaciones en la reserva, se pesan elefantes de todas las poblaciones; estos deben abarcar las edades de \(30-40\) años, proporcionalmente, por lo que debe haber la misma cantidad de elefantes entre estas o —al menos— saltos regulares entre las edades.
4. Se debe escoger una población alta, digamos \(100\) elefantes a medir; esto es \(25\%\) de la población total.
5. Se debe calcular la media de los pesos \(\mu\), la desviación estándar \(\sigma\) y el valor de \(z\) que, en este caso, pediremos que sea igual al \(90\%\): \[1{,}645\]
6. Usando las fórmulas:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
Donde \(n=100\),
y calculando la media de los pesos y la desviación estándar, obtendremos el intervalo de confianza para la media.
7. El intervalo de confianza para la media nos dirá que, en este caso, el rango de valores alrededor de la media de la población total caiga, con un \(90\%\) de probabilidad.
En este ejemplo no hemos abordado cómo calcular la media y la desviación estándar debido a que no tenemos los datos de los pesos de los elefantes, para saber que debes hacer cuándo tienes estos datos puedes leer el artículo de estadística descriptiva.
Hagamos un par de ejemplos para que calcules los intervalos de confianza:
Calcula los intervalos de confianza en la medición de una muestra de piezas con: una población de 2300 objetos, una media de \(\mu=20\,\mathrm{cm}\) y una desviación estándar de \(\sigma=1\). En esta muestra se requiere que el intervalo de confianza sea del \(80\%\).
Solución
En este caso debes de observar, primero, tus tablas; obtienes el valor de \(z\) de la siguiente tabla:
Porcentaje \(%\) | \[z\] |
\[80\%\] | \[1{,}282\] |
\[85\%\] | \[1{,}440\] |
\[90\%\] | \[1{,}645\] |
\[95\%\] | \[1{,}960\] |
\[99\%\] | \[2{,}576\] |
\[99{,}5\%\] | \[2{,}807\] |
\[99{,}9\%\] | \[3{,}291\] |
Al hacer esto, aplicamos las fórmulas:
\[x_s=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]
\[x_i=20+(1{,}282)\dfrac{1}{\sqrt{2300}}\]
Resolviendo:
\[x_s=20{,}0274\]
\[x_i=19{,}9733\]
Esto significa que en la muestra que tenemos existe un \(80\%\) de probabilidades de que, al escoger una pieza al azar, esté entre estos dos valores.
Se tiene una granja con mil cabezas de ganado; en esta granja se pesó el \(2\%\) de la población y se sabe que, en general, el ganado tiene un peso parecido; pero, se quiere obtener la media de esta muestra y saber si esta es representativa, con una seguridad de más del \(99\%\).
Los datos son:
\[\mu=231{,}5\]
\[\sigma^2=1\]
Calcula el intervalo de confianza para la media.
Solución
Nuevamente, usamos las fórmulas:
\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
En este caso, al sustituir cada valor y una \(z=2{,}807\), obtenemos:
\[x_s=231{,}5+2{,}807 \dfrac{1}{\sqrt{1000}}\]
\[x_i=231{,}5-2{,}807 \dfrac{1}{\sqrt{1000}}\]
\[x_s=231{,}589\]
\[x_i=231{,}411\]
Así que hay casi un \(100\%\) de probabilidades que nuestra media de la población total caiga en ese intervalo.
A la probabilidad de que un parámetro de una muestra, o población, en un experimento caiga en un rango específico se le conoce como intervalo de confianza.
El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra permitan que esta represente a la población.
Los límites del intervalo de confianza, para una media de una muestra dentro de una población total, están dados por las formulas siguientes:\[x_s=\mu+z\dfrac{\sigma}{\sqrt{n}}\]\[x_i=\mu+z\dfrac{\sigma}{\sqrt{n}}\]
A la probabilidad de que un parámetro de una muestra o población en un experimento caiga en un rango específico se le conoce como intervalo de confianza.
Se usan el límite superior del intervalo xs y el límite inferior del intervalo xi, que son:
xs=μ+z σ/√(n)
xi=μ-z σ/√(n)
Hay intervalos de confianza para la media de una población e intervalos de confianza para una proporción de la población.
El nivel de confianza es el valor que nos dice cómo de probable es que los parámetros estadísticos de la muestra representen a la población.
de los usuarios no aprueban el cuestionario de Intervalos de confianza... ¿Lo conseguirás tú?
Empezar cuestionarioHow would you like to learn this content?
How would you like to learn this content?
Free matematicas cheat sheet!
Everything you need to know on . A perfect summary so you can easily remember everything.
Siempre preparado y a tiempo con planes de estudio individualizados.
Pon a prueba tus conocimientos con cuestionarios entretenidos.
Crea y encuentra fichas de repaso en tiempo récord.
Crea apuntes organizados más rápido que nunca.
Todos tus materiales de estudio en un solo lugar.
Sube todos los documentos que quieras y guárdalos online.
Identifica cuáles son tus puntos fuertes y débiles a la hora de estudiar.
Fíjate objetivos de estudio y gana puntos al alcanzarlos.
Deja de procrastinar con nuestros recordatorios de estudio.
Gana puntos, desbloquea insignias y sube de nivel mientras estudias.
Cree tarjetas didácticas o flashcards de forma automática.
Crea apuntes y resúmenes organizados con nuestras plantillas.
Regístrate para poder subrayar y tomar apuntes. Es 100% gratis.
Guarda las explicaciones en tu espacio personalizado y accede a ellas en cualquier momento y lugar.
Regístrate con email Regístrate con AppleAl registrarte aceptas los Términos y condiciones y la Política de privacidad de StudySmarter.
¿Ya tienes una cuenta? Iniciar sesión