0% encontró este documento útil (0 votos)
60 vistas13 páginas

Capitulo 5

Este documento presenta información sobre la cátedra de Probabilidad y Estadística del Departamento de Matemáticas Básicas. La cátedra se dicta para las carreras de Ingeniería Eléctrica, Mecánica y Metalúrgica. La docente a cargo es la Dra. Ana María Craveri y la ayudante es Est. Susana Carasai. El documento también incluye detalles sobre distribuciones de probabilidad continuas y la distribución normal.

Cargado por

Nico Barrios
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
60 vistas13 páginas

Capitulo 5

Este documento presenta información sobre la cátedra de Probabilidad y Estadística del Departamento de Matemáticas Básicas. La cátedra se dicta para las carreras de Ingeniería Eléctrica, Mecánica y Metalúrgica. La docente a cargo es la Dra. Ana María Craveri y la ayudante es Est. Susana Carasai. El documento también incluye detalles sobre distribuciones de probabilidad continuas y la distribución normal.

Cargado por

Nico Barrios
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CÁTEDRA

PROBABILIDAD Y ESTADÍSTICA
Depto. Ms. Básicas

ESPECIALIDADES

Ingeniería Eléctrica
Ingeniería Mecánica
Ingeniería Metalúrgica

DOCENTES

Prof. Adjunto: Dra. Ana María Craveri


Ayudante de Primera: Est. Susana Carasai

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 1


CAPÍTULO 5
UNIDAD Nº 5
DISTRIBUCIONES DE PROBABILIDAD EN UNA DIMENSIÓN. VARIABLES
ALEATORIAS CONTINUAS – DENSIDAD DE PROBABILIDAD

5.1.-Variables aleatorias continuas. Función de densidad de probabilidad


Sabemos que una variable continua puede tomar un número infinito de valores entre dos
puntos fijos cualesquiera.
Para ayudarnos a comprender la naturaleza de la distribución de una variable continua se
debe pensar en el histograma de frecuencias relativas que origina una variable de este tipo e
imagínese que el número de observaciones crece y que la amplitud de los intervalos de
clase se hace muy pequeño. Es así como el polígono de frecuencia se transforma en una
curva, que es la forma de representar las distribuciones de probabilidades continuas.

Se puede expresar entonces la siguiente definición:

“Una función f(x) recibe el nombre de distribución de probabilidad (o función de


densidad) de la variable aleatoria X, si:
a) f(x) ≥ 0
b) el área limitada por su curva y el eje x es igual a 1(condición de cierre)
c) el área, limitada por la curva, el eje x y las ordenadas f(a) y f(b) de dos puntos
cualesquiera a<b del campo de variación de la variable, da la probabilidad de que x este
b
comprendida entre dichos puntos. En símbolos: P(a<x<b)= ∫ f ( x )dx
a
d) la probabilidad de cualquier valor puntual de la variable es cero. En símbolos:
a
P(x=a)= ∫ f ( x )dx = 0 ”
a

5.2.- Función de distribución: Como en el caso discreto, simbolizaremos con F(x) la


probabilidad de que una variable aleatoria con función de densidad de probabilidad f(x)
adopte un valor menor o igual que x. Suponiendo -∞ < x <+∞ resulta en símbolos:

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 2


x
F(x)= P(X<x) = ∫ f ( x )dx
−∞

Ejemplo 5.1
Si una variable aleatoria tiene la siguiente función de densidad de probabilidad

2 e −2 x si x>0
f (x ) =
0 si x ≤ 0

Calcular la probabilidad de que l variable X adopte un valor:


a) Entre 1 y 3
b) Mayor que 0.5

Solución:
3
a) P(1<x<3)= ∫ 2e −2 x dx = − e −6 + e −2 = 0.133
1

+∞

∫ 2e
−2 x
b) P(x>0.5) = dx = e −1 = 0.368
0.5

5.5.- Parámetros
+∞
Esperanza: E(X)=µ = ∫ xf ( x )dx
−∞
+∞
1
En nuestro ejemplo: E(X)=µ = ∫ x 2e −2 x dx =
0
2

+∞ +∞

∫ ( x − µ) f ( x )dx = ∫x f ( x )dx − µ 2
2 2 2
Variancia: V(X)=σ =
−∞ −∞

+∞ +∞ 2
1 1
En nuestro ejemplo: V(x) = σ = ∫ ( x − µ ) 2e
2 2 −2 x
dx = ∫x
2
2e −2 x
dx −   =
0 0 2 4

5.6.- LA DISTRIBUCIÓN NORMAL


La densidad de probabilidad normal llamada por lo general distribución normal de Gauss es
de gran aplicación en Estadística. Se estudió originalmente en el siglo XVIII cuando los
científicos observaron un asombroso grado de regularidad en errores de medición.
Descubrieron que los patrones (distribuciones) observados se aproximaban a una

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 3


distribución continua a la que llamaron “curva de errores normal” y que atribuyeron a las
leyes del azar. Para muchas experiencias, en las ciencias físicas, en la industria, etc. se
encuentra que la distribución normal se aproxima a la distribución empírica obtenida en un
gran número de repeticiones del experimento.
Bajo la influencia de los trabajos de Gauss y Laplace, se consideró mucho tiempo casi
como un axioma, que todas las distribuciones estadísticas se aproximarían a la normal si se
dispusiera de un número suficientemente grande de observaciones.
Sin que hoy puedan aceptarse tales ideas, debe señalarse la extraordinaria frecuencia con
que esta distribución se encuentra en las más variadas aplicaciones y también como otras
pueden reducirse a ella.

5.6.1.-Función de densidad normal: Diremos que la variable aleatoria X se distribuye


normalmente con parámetros µ y σ, si la función de densidad está dada por:

−1 x − µ
1 ( )2
f ( x) = e2 σ
2π σ

Simbólicamente se expresa:
X ~ N (µ, σ)

Campo de variación de la variable: -∞< x < +∞

Su representación para distintos valores de σ:

Cuanto más pequeño es el valor de σ, tanto más


concentrada resulta la masa de las distribución en
el entorno del punto x = µ

Las características más generales de esta curva son:

• Tiene forma de campana, siendo simétrica con respecto a µ.


• La media, mediana y modo coinciden.
• Es asintótica con respecto al eje x.
• La distribución normal queda completamente determinada por los valores µ y σ es
decir que existe una curva para cada par de estos valores.
• El rango intercuartil es aproximadamente igual a 1,33 σ
Conocidos los valores de µ y de σ podemos determinar el área bajo la curva entre dos
valores cualesquiera de la variable, (o sea, la probabilidad de un intervalo de valores de X),
para lo cual necesitamos hacer un cambio de variable. Este cambio de variable consiste en
expresar la variable aleatoria X en términos de una variable Z, denominada variable
aleatoria estandarizada.

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 4


5.6.2.- Distribución normal estandarizada
Dada una variable X ~ N(µ, σ), entonces la variable

Efectivamente

Var (Z) = Var(x - µ) = Var(x) = 1

La transformación que sufre el eje de las x será:

La expresión de la función de densidad es la siguiente:

Por su condición de simetría, dos valores diferentes de xi (o de zi) que muestran la misma
desviación en valor absoluto de µ tienen la misma densidad de probabilidad.
Utilizando la tabla de Distribución Normal Estandarizada acumulada (- ∞ a z)
En esta tabla en la parte superior se presenta el centésimo de z y a la izquierda el entero con
el décimo correspondiente a cada valor de z.
z 0,00 0,01 0,02 0,03

0,0
0,1
0,2

0,3
0,4

0 z
Ejemplo 5.2:
Dada la distribución N(0,1) encontrar el área bajo la curva entre z = 0 y z = -2

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 5


-2 0
P(-2 ≤ z ≤ 0) = P( z ≤ 0) - P(z ≤ -2) = 0,5 – 0,0228 = 0,4772

Si ahora interesa: P(z ≤ 1) = 0,8413

0 1
Si planteamos:
P(z ≥ 1) = 1 - P( z ≤ 1) = 1- 0,8413 = 0,1587

0 1

Puede, además, interesar encontrar un valor en particular asociado con una probabilidad
determinada,
Por ejemplo: si P( z ≤ z0) = 0,1112 ⇒ z0 = -1,22
Z 0,00 0,01 0,02 0,03

-1,2 0,1112
-1,1
-1,0
-0,9
-0,8

Ejemplo 5.3
El peso de un producto semiterminado se distribuye en forma aproximadamente normal con
µ = 340 kg. y σ = 42 kg. Se decide reelaborar a aquellos cuyo peso es mayor a 350 kg.
¿Qué proporción de la producción se devuelve?
X ∼ N (µ = 340 ; σ = 42)
Debemos trabajar con la variable estandarizada, para ello calculamos:

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 6


Se devuelve para su reelaboración el 40,52% de la producción.

Ejemplo 5.4
Investigaciones han establecido que el porcentaje de fósforo presente en cierta sustancia se
distribuye normalmente con µ = 6,5% y σ = 0,8%
Se elige un compuesto al azar y se quiere saber:
• ¿Cuál es la probabilidad de que el porcentaje de fósforo sea mayor de 7%?

=0,2643
• ¿Cuál es la probabilidad de que el porcentaje de fósforo esté comprendido entre 5%
y 7%?

• ¿Cuál es la probabilidad de que el porcentaje de fósforo sea menor que 5,8%?

• Si la probabilidad de que el porcentaje de fósforo sea menor que un cierto valor es


0,8212 ¿Cuál es dicho porcentaje de fósforo?

Debemos pensar que ⇒


El valor de fósforo es 7,236%

5.6.3.- Uso de las funciones de Microsoft Excel: Podemos utilizar para el cálculo de las
probabilidades de este ejemplo, el asistente para funciones de Microsoft Excel de la
siguiente manera:
En el Menú ► fx ► Categoría de la función: Estadísticas ► Nombre de la función: Distr.
Norm ► Aceptar. En la ventana que se despliega deberá informar los datos que
correspondan al problema específico. En Acumulado informar 1. ► Aceptar (imprime el
resultado en una celda de la hoja de cálculo que puede estar preseleccionada)

5.6.4. Aproximación Normal a la Distribución Binomial


Cuando analizamos la Distribución Binomial observamos que es simétrica si p = 0,5
Pero cuando más cerca de p = 0,5 y más grande es el número de observaciones de la
muestra n, la distribución se acerca más a una distribución simétrica. Además, a medida
que aumenta el tamaño de muestra es más laborioso el proceso de cálculo.
En consecuencia es útil el uso de la distribución normal para aproximar las probabilidades
exactas de éxito.
Esta aproximación normal es válida cuando n.p y n(1-p) son al menos 5

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 7


Como la media de la distribución binomial es µ = n.p y el desvío estándar es
Sustituimos en y obtenemos
Si n es suficientemente grande, z se distribuye aproximadamente normal N(0,1)
Entonces, para encontrar probabilidades aproximadas tenemos
y las probabilidades se obtienen buscando en la tabla de distribución normal estandarizada
acumulada.

Ejemplo 5.5.1
Si el 20% de los chips de memoria fabricados en cierta planta son defectuosos ¿cuál es la
probabilidad de que en un lote de 100 aleatoriamente seleccionados para su inspección a lo
sumo 15 sean defectuosos?
La variable aleatoria de este problema es discreta y se define como
X: número de chips defectuosos en una muestra de 100 chips
La probabilidad de observar un chip defectuoso es p=0.20
µ= 100 (0.20)= 20 ; σ= 100 × 0.2 × 0.8 = 4
15.5 − 20
Pbi ( x ≤ 15) ≅ PN ( x < 15.5) = P ( z < ) = P ( z < −1.13) = 0.1292
4

Ejemplo 5.5.2
Se sabe que el 5% de los artículos fabricados tienen una vida útil inferior a 80 hs. Se
venden en lotes de 100 unidades, el fabricante garantiza que por lo menos el 90% de los
artículos de cada lote duran más de 80 hs. ¿Qué porcentaje de los lotes no cumplen la
garantía?

X: duración en hs. de los artículos


P(X<80)= 0.05

P(X>80)=0.95

Y: Nº de artículos que duran más de 80 hs. al observar 100


Y se distribuye aproximadamente normal con parámetros µ=n*p=95;
σ= n * p * (1 − p ) = 4.75 =2.18
90.5 − 95
PBi (Y < 90) ≅ PNormal (Y < ) = 0.0195
2.18
5.7.- Suposición de Normalidad
Dada la importancia que tiene la distribución normal en la inferencia estadística surge el
interés de poder determinar si un conjunto de datos siguen ó pueden aproximarse a una
Distribución Normal.
Se puede verificar la suposición de normalidad mediante la comparación de las
características reales de los datos con las propiedades de la distribución normal, para lo cual
se sugieren los siguientes pasos:
1- Verificar la apariencia de los datos, con respecto a la simetría de los mismos,
utilizando el Diagrama de Tallos y Hojas (si lo utilizó) , el de Bloques y Líneas o la

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 8


Distribución de Frecuencia y sus Representaciones Gráficas (Histograma y
Polígono de Frecuencia)
2- Utilizando las medidas descriptivas que hemos estudiado, evaluar:
• La semejanza o diferencias entre la media, la mediana y el modo.
• Si el rango intercuartil puede aproximarse a 1,33 veces la desviación
estándar (σ).
• Si el rango puede aproximarse a 6 veces la desviación estándar.
3- Determinar:
• Si cerca de dos tercios de las observaciones se encuentran entre la media +
una desviación estándar.
• Si el 95% de las observaciones se encuentran entre la media ± dos
desviaciones estándares.
4- Construir un Diagrama de Probabilidad Normal que es un gráfico Bidimensional
donde se colocan los valores observados en la ordenada y los cuartiles en la
abscisa.
En el Capítulo II se presentó la Mediana, que es el valor de la variable que divide
las observaciones ordenadas en dos partes iguales y los Cuartiles que dividen las
observaciones ordenadas en cuatro partes iguales. Además de estos valores se
pueden calcular los Deciles (que dividen las observaciones ordenadas en diez
partes) y los Percentiles (en cien partes). En general estas medidas son llamadas
Cuantiles y su cálculo nos permite construir el Diagrama de Probabilidad Normal.
Si los puntos en el gráfico siguen una línea recta imaginaria creciente o se
aproximan a ella, entones el conjunto de datos tienen una distribución normal
aproximada.

5.8.- Otras Distribuciones de Probabilidad

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 9


Además de las Distribuciones de Probabilidad que se han estudiado veremos tres modelos
más de probabilidad que se aplican para muestras pequeñas, están basados en la
distribución de probabilidad normal y se definen por el número de grados de libertad.
Grados de libertad: Es un concepto matemático que pertenece al álgebra lineal y está
relacionado con el nº de observaciones libres en una muestra. Aparece en el cálculo de la
variancia de una muestra cuyo numerador es: Σ (xi - x )2 En esta expresión el nº total de
cuadrados es n, pero sólo hay (n-1) cuadrados independientes, porque una vez calculados
los n-1 primeros, el valor del último queda determinado automáticamente.1
Definición de Grados de Libertad: Es el número de observaciones independientes de la
muestra. Es decir, si n es el tamaño de la muestra y k el nº de parámetros que deben ser
reemplazados por los valores de la muestra (estadísticos) entonces los grados de libertad
son n-k.

5.9.- Distribución de Probabilidad Chi- cuadrado (χ 2)

Si Y1 , Y2 , Y3, ……….Yv son variables aleatorias distribuidas independientemente ,


todas N (0,1) entonces la variable aleatoria

Σ Yi 2 = χ2v
se denomina variable chi- cuadrado con v grados de
libertad
Esta variable χ2 no puede ser negativa y la forma de su distribución depende de los grados
de libertad. Es asimétrica a la derecha y cuando el número de grados de libertad crece la
distribución se aproxima a una distribución normal.

Las tablas existentes suministran valores de probabilidad para diferentes grados de libertad.
P[χ 2 ≥ χ2v,α ] = α , dado v = 10 y α= 0,05 obtenemos P[ χ2 ≥ 18,307] = 0,05
(es decir un 5% del área total se encuentra a la derecha de 18,307)

1
La razón de esto es la presencia de x y el hecho de que Σ ( xi - x ) = 0. Esto representa una restricción que
debe cumplirse. Por ejemplo, si se tiene tres cuadrados y los valores de los dos primeros son:

(x1 – x )2 = 22 y (x2 - x )2 = 42 , si el tercero fuese independiente de estos, podría tomar cualquier


valor, por ejemplo 62. Esto no podría ser pues se tendría Σ (xi - x ) = 2 + 4 + 6 ≠ 0. Luego si los dos primeros
son 2 y 4 , necesariamente el tercero debe ser -6

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 10


5.10.- Distribución F de Snedecor

Si U1 y U2 son variables aleatorias independientes y se distribuyen cada una como


chi-cuadrado con v1 y v 2 grados de libertad respectivamente, entonces la distribución de
la razón:

Los grados de libertad son los únicos parámetros de la Distribución F. Para valores
pequeños de v1 y v2 la forma de la distribución es asimétrica a la derecha, pero a medida
que ellos aumentan tiende a la normalidad.

Para encontrar valores de probabilidad tabulados se plantea: si v1 = 12 y v2 = 15 y α = 0,05


P (F ≥ 2,48) = 0,05 Es decir un 5% de la distribución F se encuentra a la derecha de 2,48.

5.11.- Distribución t de Student

Si Y y U son variables aleatorias independientes, de las cuales Y está distribuida


normalmente N (0,1) y U se distribuye como χ2v entonces la distribución del cociente

La variable aleatoria t puede ser positiva ó negativa ya que la variable Y es normal. La


distribución t es continua y simétrica alrededor de t = 0 y el único parámetro de esta
distribución es el nº de grados de libertad v asociado con la variable χ2.

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 11


Para encontrar valores de probabilidad tabulados, la tabla que utilizamos nos da “los upper
quantiles “es decir la cola superior de la distribución, luego:
P (t > t15) = 0,05 → t15 = 1,7531

5. 12.-EJERCICIOS
5.12.0.- Para un proyecto del área de Extensión a la Comunidad se supone que el tiempo de
ejecución seguirá una distribución normal con un tiempo promedio de 30,17 semanas y un
desvío estándar de 0,958 semanas. Bajo este supuesto calcular:
a) ¿Cuál es la probabilidad de que el proyecto se concluya después de 32 semanas?
b) ¿Cuál es la probabilidad de que el proyecto pueda concluirse antes de 29 semanas?
c) ¿Cuál será el tiempo total de ejecución que debe especificarse para que exista un 90% de
probabilidad de que el proyecto se cumpla en menos de ese tiempo?
d) Si 8 regionales presentan proyectos en forma independiente cuál es la probabilidad de
que por lo menos 6 de éstos se terminen en el plazo establecido en el punto c)?

5.12.1.- El acero que se utiliza para tuberías de agua a menudo se recubre internamente con
un mortero de cemento para evitar la corrosión. Las especificaciones para este
recubrimiento son: espesor promedio 0.44 pulgadas con una desviación estándar de 0,06
pulgadas.
a) Suponiendo distribución normal para la variable espesor del recubrimiento de tuberías de
agua, ¿qué probabilidad hay de observar una tubería con un espesor superior a 0,52
pulgadas?
b) Si se eligen al azar 10 muestras de tuberías ¿qué probabilidad hay de que 2 o menos de
las 10, presenten un espesor superior a 0,52 pulgadas?

5.12.2.- Se cortan automáticamente varillas de plástico moldeadas por eyección.


Suponiendo que la variable aleatoria X: longitud de varillas en pulgadas tiene una
distribución de probabilidad normal con µ= 6 pulgadas y σ = 0.1 pulgadas
a) ¿Qué proporción de varillas está fuera de los límites de tolerancia de 5,8 a 6,2 pulgadas?
b) ¿A qué nivel habría que reducir la desviación estándar σ si el 99% de las varillas deben
encontrarse dentro de la tolerancia del punto a)
c) ¿Cuál es la longitud por debajo de la cual se encuentra el 10% de las varillas?
Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 12
d) Se extraen al azar 10 varillas del lote ¿Cuál es la probabilidad de que a lo sumo 1 de las
varillas esté fuera de los límites de tolerancia?

5.12.3.- El departamento técnico de la empresa asegura que la duración promedio (µ) de sus
cubiertas es de 40 mil Km con un desvío estándar (σ) de 2.400 Km. Si la distribución de
probabilidad de la duración de las cubiertas es normal:
¿Cuál es el porcentaje de cubiertas con una duración inferior a 38 mil Km?

5.12.4.- Se sabe que el tiempo de almacenamiento de los artículos sigue una distribución
normal con media µ = 5 semanas y σ = 4 semanas
a) ¿Cuál es la probabilidad de que un artículo elegido al azar haya estado almacenado entre
2 y 10 semanas?
b) ¿Cuál es el porcentaje de artículos con un tiempo de almacenamiento superior a 10
semanas?
c) Se sabe que el 5% de los artículos en el depósito tienen la fecha de almacenamiento
cumplida, si se extraen al azar 10 artículos ¿Cuál es la probabilidad de que a lo sumo 1 esté
vencidos?

5.12.5.- En una fábrica que produce resortes de acero se ha determinado que la resistencia
a la carga de los mismos se distribuye normalmente con un parámetro promedio µ = 450
Kg y un desvío estándar σ = 25 Kg
a) ¿Entre qué límites de resistencia se encuentra el 95% de los resortes? (considere un
intervalo simétrico respecto de µ )
b) ¿Cuál es la probabilidad de que un resorte tenga una resistencia inferior a 430 Kg?
c) ¿Qué valor de resistencia no es alcanzado por el 10% de los resortes?

5.12.6.- Una máquina expendedora de café está ajustada para servir en promedio 50ml de
líquido por vaso con una desviación estándar de 5ml. Si el vaso tiene una capacidad de 55
ml
a) ¿Cuál es la probabilidad de que se derrame el contenido?
b) ¿Cuál es la probabilidad de que se sirva menos de 40 ml?

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2020 Página 13

También podría gustarte