0% encontró este documento útil (0 votos)
31 vistas12 páginas

R.A Estadisticas

El documento aborda el análisis de datos en Probabilidad y Estadística, enfatizando la importancia de las distribuciones muestrales y el Teorema del Límite Central para la inferencia estadística. Se explica cómo calcular el error estándar y su relevancia en la representación de muestras poblacionales. Además, se presentan ejercicios prácticos para ilustrar la aplicación de estos conceptos.

Cargado por

josejulianlr1503
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
31 vistas12 páginas

R.A Estadisticas

El documento aborda el análisis de datos en Probabilidad y Estadística, enfatizando la importancia de las distribuciones muestrales y el Teorema del Límite Central para la inferencia estadística. Se explica cómo calcular el error estándar y su relevancia en la representación de muestras poblacionales. Además, se presentan ejercicios prácticos para ilustrar la aplicación de estos conceptos.

Cargado por

josejulianlr1503
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

“2025, Año de Rosario Castellanos Figueroa”

“2025, Año de Rosario Castellanos Figueroa”

INDICE
“2025, Año de Rosario Castellanos Figueroa”

UNIVERSIDAD TECNOLOGICA DE LA SELVA

UNIDAD ACADEMICA RAYÓN.

TSU EN CONSTRUCCIÓN.

MATERIA:

PROBALIDAD Y ESTADISTICA

TRABAJO:

R.A

INTEGRANTES:

RAFAEL AGUILAR ROJAS.

LISANDRA HERNÁNDEZ VILLARREAL.

JOSE JULIAN LÓPEZ RUEDA.

LEYDI SOFÍA VÁZQUEZ ÁLVAREZ.

JUANI CITLALY VÁZQUEZ JIMENEZ.

DOCENTE: MTRO. CARLOS FABIAN CAMACHO DURANTE

GRADO Y GRUPO:

5to CUATRIMESTRE “A”

LUGAR Y FECHA DE ENTREGA: RAYÓN CHIAPAS; 02/04/2025.


“2025, Año de Rosario Castellanos Figueroa”

INTRODUCCIÓN

En Probabilidad y Estadística, el análisis de datos generalmente se basa en


muestras extraídas de una población más grande. Sin embargo, debido a la
variabilidad inherente de los datos, es importante comprender cómo se comportan
diferentes estadísticas muestrales, como la media o la varianza, cuando se
obtienen múltiples muestras.

Las distribuciones muestrales surgen de este análisis y permiten describir la


variabilidad de una estadística de muestra. Son fundamentales en la inferencia
estadística, ya que nos ayudan a estimar parámetros poblacionales, evaluar la
precisión de estimaciones y realizar pruebas de hipótesis.

Un concepto clave en este tema es el Teorema del Límite Central, que establece
que, al tomar suficientes muestras de una población, la distribución de las medias
muestrales tiende a seguir una distribución normal, independientemente de la
distribución original de la población.

Comprender las distribuciones muestrales es esencial para tomar decisiones


informadas basadas en datos, asegurando que los análisis estadísticos sean
precisos y confiables.
“2025, Año de Rosario Castellanos Figueroa”

DISTRIBUCION MUESTRAL

En cada una de las distintas muestras que pueden ser extraídas de una población
se pueden calcular estadísticos como la media aritmética o la proporción de
elementos que presentan cierta característica; por ejemplo, la media de estaturas
o la proporción de licenciados universitarios. Cuando los elementos son escogidos
de manera aleatoria, los estadísticos pueden tomar distintos valores en cada una
de las muestras, cada uno de ellos con distinta probabilidad. En los ejemplos del
inicio de esta sección ya vimos que los valores de la media en diferentes muestras
aleatorias se encontraban con mayor probabilidad cerca del valor de la media
poblacional, y que era menos probable que se encontrasen muy alejados de ella.

La probabilidad de cada uno de los posibles valores que puede tomar un


estadístico en muestras extraídas al azar viene dada por una función matemática
denominada distribución muestral, que depende del estadístico en cuestión. Se
habla así, por ejemplo, de la distribución muestral de la media aritmética o de la
distribución muestral de la proporción.

Una distribución muestral es una función de probabilidad, ya que asigna a cada


posible valor de un estadístico su probabilidad de aparecer en una muestra
extraída al azar. En realidad, esta definición es estrictamente cierta solo cuando la
variable toma valores discretos; por ejemplo, cuando procede de un contaje y sus
posibles valores son 0, 1, 2, 3, etc. Cuando el valor del estadístico muestral es una
variable continua, la distribución muestral correspondiente se denomina función de
densidad de probabilidad. La probabilidad en este caso corresponde gráficamente
a un área bajo la curva de esa función, delimitada por un cierto intervalo de la
variable. Analíticamente, esa área se calcula como la integral de la función entre
los límites del intervalo de la variable, que en la práctica se obtiene con un
ordenador o se consulta en una tabla. El área total bajo la curva, que se extiende a
todos los posibles valores de la variable, es siempre uno, que corresponde a la
probabilidad de un suceso seguro.

La siguiente gráfica muestra la curva de una función de densidad de probabilidad


para una variable x, y en ella se señala la probabilidad de que esa variable se
encuentre entre los valores 1 y 2, que corresponde al área bajo la curva marcada
en azul:
“2025, Año de Rosario Castellanos Figueroa”

La función de densidad de probabilidad más importante en estadística se llama


distribución normal o distribución gaussiana, o también campana de Gauss, por la
forma que toma cuando es representada gráficamente (como aparece en la figura
anterior). Su forma concreta depende de dos parámetros, la media y la varianza.
La curva alcanza un máximo cuando la variable toma el valor de la media, y es
simétrica respecto a ese valor, aproximándose a cero indefinidamente conforme la
variable se aleja de la media por ambos lados. La desviación típica, que es la raíz
cuadrada de la varianza, está relacionada con la anchura de la campana: a mitad
de altura del máximo, la anchura de la campana es aproximadamente 2,36 σ. Una
distribución normal de media μ y varianza σ2 se puede simbolizar como N (μ, σ2),
y así lo usaremos aquí.

Para una variable aleatoria x se define su variable tipificada como:

Si la variable x sigue una distribución N (μ, σ2), su variable tipificada


correspondiente sigue una distribución N (0,1), que se denomina distribución
normal estándar, con media 0 y varianza 1 (es la representada en la figura de
arriba). Existen infinitas distribuciones normales distintas, tantas como posibles
valores de la media y la varianza, pero las áreas bajo la curva normal estándar son
las únicas que se pueden encontrar en tablas para su consulta.

ERROR ESTÁNDAR
“2025, Año de Rosario Castellanos Figueroa”

El error estándar de la media, o simplemente error estándar, indica la probabilidad


de que la media poblacional difiera de la media muestral. Indica cuánto variaría la
media muestral si se repitiera un estudio con nuevas muestras de una misma
población.

El error estándar de la media (EE o EEM) es el tipo de error estándar que se


informa con mayor frecuencia. Sin embargo, también se puede encontrar el error
estándar para otros estadísticos, como las medianas o las proporciones. El error
estándar es una medida común del error de muestreo: la diferencia entre un
parámetro poblacional y un estadístico muestral.

Por qué es importante el error estándar

En estadística, los datos de muestras se utilizan para comprender poblaciones


más grandes. El error estándar es importante porque ayuda a estimar qué tan bien
los datos de la muestra representan a toda la población.

Con el muestreo probabilístico, donde los elementos de una muestra se


seleccionan aleatoriamente, se pueden recopilar datos que probablemente sean
representativos de la población. Sin embargo, incluso con muestras
probabilísticas, persistirá cierto error de muestreo. Esto se debe a que una
muestra nunca coincidirá perfectamente con la población de la que proviene en
términos de medidas como la media y la desviación estándar.

Al calcular el error estándar, puede estimar qué tan representativa es su muestra


de su población y sacar conclusiones válidas.

Un error estándar alto indica que las medias muestrales están muy dispersas en
torno a la media poblacional; es posible que su muestra no represente fielmente a
su población. Un error estándar bajo indica que las medias muestrales están muy
dispersas en torno a la media poblacional; es decir, su muestra es representativa
de su población.

Cómo calcular el error estándar


“2025, Año de Rosario Castellanos Figueroa”

Paso 1: Anote el número de mediciones (n) y determine la media muestral (μ). Es


el promedio de todas las mediciones.

Paso 2: Determinar cuánto varía cada medida con respecto a la media.

Paso 3: Eleva al cuadrado todas las desviaciones determinadas en el paso 2 y


suma todas: Σ (x i – μ) ²

Paso 4: Divida la suma del paso 3 por uno menos que el número total de
mediciones (n-1).

Paso 5: Tome la raíz cuadrada del número obtenido, que es la desviación


estándar (σ).

Paso 6: Finalmente, divida la desviación estándar obtenida entre la raíz cuadrada


del número de mediciones (n) para obtener el error estándar de su estimación.

Consulte el ejemplo a continuación para comprender el método de cálculo del


error estándar.

TEOREMA DEL LIMITE CENTRAL

El teorema del límite central se basa en el concepto de distribución de muestreo ,


que es la distribución de probabilidad de una estadística para una gran cantidad
de muestras tomadas de una población.

Imaginar un experimento puede ayudarle a comprender las distribuciones de


muestreo:

 Supongamos que extrae una muestra aleatoria de una población y calcula


una estadística para la muestra, como la media.
 Ahora extrae otra muestra aleatoria del mismo tamaño y calcula
nuevamente la media.
 Repite este proceso muchas veces y termina con una gran cantidad de
medios, uno para cada muestra.
“2025, Año de Rosario Castellanos Figueroa”

El teorema del límite central establece que la distribución muestral de la media


siempre será normal, siempre que el tamaño de la muestra sea suficientemente
grande. Independientemente de si la población tiene una distribución normal, de
Poisson, binomial o cualquier otra, la distribución muestral de la media será
normal.

Una distribución normal es una distribución simétrica, en forma de campana, con


cada vez menos observaciones cuanto más se aleja del centro de la distribución.

Fórmula del teorema del límite central

Afortunadamente, no es necesario muestrear repetidamente una población para


conocer la forma de la distribución muestral. Los parámetros de la distribución
muestral de la media están determinados por los parámetros de la población:

 La media de la distribución muestral es la media de la población.

 La desviación estándar de la distribución de muestreo es la desviación


estándar de la población dividida por la raíz cuadrada del tamaño de la
muestra.

Tamaño de la muestra y teorema del límite central

El tamaño de la muestra (n) es el número de observaciones extraídas de la


población para cada muestra. El tamaño de la muestra es el mismo para todas las
muestras.

El tamaño de la muestra afecta la distribución muestral de la media de dos


maneras.

1. Tamaño de la muestra y normalidad


“2025, Año de Rosario Castellanos Figueroa”

Cuanto mayor sea el tamaño de la muestra, más se ajustará la distribución del


muestreo a una distribución normal.

Cuando el tamaño de la muestra es pequeño, la distribución muestral de la media


a veces no es normal. Esto se debe a que el teorema del límite central solo se
cumple cuando el tamaño de la muestra es suficientemente grande.

Por convención, consideramos que un tamaño de muestra de 30 es


“suficientemente grande”.

 Cuando n < 30, el teorema del límite central no se aplica. La distribución


muestral seguirá una distribución similar a la de la población. Por lo tanto, la
distribución muestral solo será normal si la población es normal.
 Cuando n ≥ 30, se aplica el teorema del límite central. La distribución
muestral seguirá aproximadamente una distribución normal.

2. Tamaño de la muestra y desviaciones estándar

El tamaño de la muestra afecta la desviación estándar de la distribución muestral.


La desviación estándar es una medida de la variabilidad o dispersión de la
distribución (es decir, su amplitud o estrechez).

 Cuando n es bajo, la desviación estándar es alta. Existe una gran


dispersión en las medias de las muestras porque no son estimaciones
precisas de la media de la población.
 Cuando n es alto, la desviación estándar es baja. No hay mucha dispersión
en las medias de las muestras, ya que son estimaciones precisas de la
media de la población.
“2025, Año de Rosario Castellanos Figueroa”

Ejercicio 1:

Una población tiene una media de μ=50 y una desviación estándar de σ=10. Se
extraen muestras de tamaño n=25.

1. ¿Cuál es la media y la desviación estándar de la distribución muestral de la


media? 2
2. ¿Cuál es la probabilidad de que una muestra tenga una media mayor a 52?
15.87%.

Solución:

1. La media de la distribución muestral de la media es:

μ x =μ=50

La desviación estándar de la distribución muestral (error estándar) es:

σ 10 10
σx ¿ = = =2
√n √ 25 9
Para encontrar la probabilidad de que x >52, se normaliza usando la distribución
normal estándar:

x−μ x 50−52 2
z= = = =1
σx 2 2

Usando la tabla de la distribución normal, P(Z>1) es aproximadamente 0.1587.


Respuesta: La probabilidad es 15.87%.

Ejercicio 2:

En una población, el 40% de los individuos tienen una característica particular


(p=0.4p). Se toma una muestra de n=100.

¿Cuál es la media y la desviación estándar de la distribución muestral de la


proporción?0.049

¿Cuál es la probabilidad de que la proporción muestral sea mayor a 0.49? 15.39%.


“2025, Año de Rosario Castellanos Figueroa”

Solución:

La media de la proporción muestral es:

μ ^p =p=0.4

La desviación estándar es:

σ ^p =
√ p ( 1− p )
n √=
100 √
0.4 ( 0.6 )
=
0.24
100
=√ 0.00 24=0.049

Para encontrar P ( p >0.45):

^p −μ ^p 0.45−0.4 0.05
z= = = =1.02
σ ^p 0.049 0.049

Usando la tabla normal, P(Z>1.02) ≈0.1539.


Respuesta: La probabilidad es 15.39%.

También podría gustarte