APUNTES 1 PyE
APUNTES 1 PyE
a) X1 – X2 = 10
b) X2 – X1 = 10
Ejemplo: Ejemplo:
- Monedas Urna en muestreo sin
- Dados remplazo.
- Urnas (muestreo con remplazo)
- Tiro al blanco
16
Clemente Castilleja Salas
Ejemplo:
LANZAMIENTOS DE UNA
MONEDA INTENTOS PROBABILIDAD
1 P(aguila1) = p(s)= ½
2 P(aguila2)=1/2 p(s1)=1/2
3 P(sol3)=1/2 p(a3)=1/2
¿Por qué?
● Son independientes
● Es un concepto intuitivo
● Reproducción teórica del fenómeno y se deduce que es así.
● Por experiencia se ha observado así.
● También por reproducción o repetición del experimento.
Fenómeno de independencia
2 Monedas
P (s1a2) = 1/4 = P (s1) p (a2) = ½*1/2 (Por definición clásica)
A₁ S₁
3 monedas
P (s1a2s3) =1/8 =p (s1) p (a2) p (s3) = (1/2)*(1/2)*(1/2)
=1/8
17
Clemente Castilleja Salas
S₃
A₃
S₁A₂S₃
S₂
A₂
A₁ S₁
N monedas
P(s1+a2s3…….An=1/2n=p(s1)p(a2)……..p(An)=(1/2)(1/2)……(1/2)=1/2n
PARA CUALQUIER EVENTO Ai i=1, 2,……., n
P (A1 A2 …….An) = p (A1) p (A2)………..p (An)
Siendo P (Ai) mayor o igual a 0 y menor o igual a 1, además son independientes
entre sí.
Demostración
𝑁(𝐴₁𝐴₂…𝐴𝑛 ) 1
P(A₁A₂…𝐴𝑛 )= =
𝑁(𝑆) 2𝑛
Para n monedas
1
P(A₁A₂…𝐴𝑛 )= ½ * ½ *… * ½ =
2𝑛
18
Clemente Castilleja Salas
La diferencia entre probabilidad clásica y probabilidad frecuencial radica en que
la primera se obtiene sin efectuar el experimento, y la segunda después de
haberlo efectuado un gran número de veces.
Ejemplo 1:
Sea un experimento de tiro al blanco con dos resultados posibles Acertar o Fallar.
2 3
P (Acertar en un intento) = ( ) P (Fallar en un intento) = ( )
5 5
x= Números de aciertos
La suma de las dos probabilidades
5
∑= ( ) = 1
5
Se realiza un experimento
2 experimentos
A₁ A₂ 4
P(A₁)P(A₂)= 2/5 * 2/5 =
25
F₁ F₂ 6
P(A₁)P(F₂)= 2/5 * 3/5 =
25
6
P(F₁)P(A₂)= 2/5 * 3/5 =
25
9
P(F₁)P(F₂)= 3/5 * 3/5 =
25
S₂
F₂
A₁A₂ F₁A₂
A₂
A₁ F₁
19
Clemente Castilleja Salas
numero de arreglos 𝑛! donde n es el número de objetos totales y x es el
𝐶𝑛,𝑥 =
𝑥!(𝑛−𝑥)!
numero de objetos que se tomaran
f(x=4)= 2 ^4 A=1
( )
5
X=3 F1 A2 A3 A4 (3/5) (2/5) (2/5) (2/5)= (3/5) (2/5) ^3
f(x=3)= 4 2 ^3 3 A=4
( ) ( )
5 5
A1 A2 F3 A4 (2/5) (2/5) (3/5) (2/5)= (3/5) (2/5) ^3
f(x=2)= 6 2 ^2 3 ^2 A=6
( ) ( )
5 5
F1 A2 F3 A4 (3/5) (2/5) (3/5) (2/5)= (2/5) ^2(3/5) ^2
20
Clemente Castilleja Salas
F1 F2 A3 F4 (3/5) (3/5) (2/5) (3/5) (2/5) (3/5) ^3
f(x=0) = 3 ^4 A=1
( )
5
VARIABLE ALEATORIA
¿Qué es una variable o fenómenos aleatorios y valor aleatorio?
El concepto de variable aleatoria proporciona un medio para relacionar cualquier
resultado con una medida cuantitativa.
Sea S un espacio muestral, y sea x una función de valor real definida sobre S, de
manera que transforme los resultados de S en punto sobre la recta de los reales,
se dice entonces que x es una variable aleatoria.
Se dice que x es aleatoria porque involucra la probabilidad de los resultados de
espacio muestral y x es una función definida sobre el espacio muestral, de manera
que transforma todos posibles resultados del espacio muestral en cantidades
numéricas.
● Ejemplo:
Para ilustrar la noción de variable aleatoria considérese el lanzamiento de una
moneda. El espacio muestral está constituido por dos posibles resultados, “cara” y
“cruz”.
Sea: X (cruz)=0 y X (cara)=1; Des esta manera se han transformado los dos
posibles resultados del espacio muestral en puntos sobre la recta de los reales.
21
Clemente Castilleja Salas
EJEMPLO CON UNA MONEDA
1 Moneda A S
P(X) =1/2
X=0, 1 N (S1) =2= 21
2 Monedas
S/1
C/0
0/c 1/s
1 21 1
61
2 22 2
62
3 23 3
63
N 2n n
6n
22
Clemente Castilleja Salas
Urnas (1 bola Negra, 10 bolas Blancas)
P (N) = 1/10 P (B) = 10/11
23
Clemente Castilleja Salas
Ejemplo:
¿Cuál es la probabilidad de sacar al azar una canica roja de una bolsa que
contiene 3 canicas negras, 5 amarillas y 2 rojas?
r = rojas
n = negras
a = amarillas
Suma de Probabilidades
Ejemplo:
Sea A el suceso de sacar un As de una baraja estándar de 52 cartas y B sacar un
Rey de corazón rojo. Calcular la probabilidad de sacar un As o un Rey de corazón
rojo en una sola extracción.
Solución:
A y B son sucesos mutuamente excluyentes porque no es posible obtener ambos
a la vez.
Las probabilidades son:
24
Clemente Castilleja Salas
Reemplazando los anteriores valores en la regla particular de la adición de
probabilidades para eventos exclusivos se obtiene:
Multiplicación de Probabilidades
25
Clemente Castilleja Salas
3.2 FORMULAS DE SUMA Y MULTIPLICACIÓN DE PROBABILIDADES
-A=∑𝑁
𝐼=1 Ai; A € S
-A П B= φ
Multiplicación de Probabilidades
26
Clemente Castilleja Salas
Formula de la Multiplicación de probabilidades.
Ejemplo:
LANZAMIENTOS DE UNA
1 P(aguila1) = p(s)= ½
27
Clemente Castilleja Salas
2 P(aguila2)=1/2 p(s1)=1/2
3 P(sol3)=1/2 p(a3)=1/2
Ejemplo: Ejemplo:
- Dados remplazo.
- Tiro al blanco
28
Clemente Castilleja Salas
Ejemplo:
80 20 80 20
M1 P (B)= 100: P(N)= 100 P (B₁)= 100 P (N₁)= 100
Salió N₁ Salió B₁
80 20 80 79
M2 P (B)= 100: P(N)= 100 P (B₂│N₁)= 99 P (B₂│B₁)= 99
19 20
P (N₂│N₁)= 99 P (N₂│B₁)= 99
Salió N₂ Salió B₂
80 20 80 20
M3 P (B)= 100: P(N)= 100 P (B₃│N₁ N₂)= 98 P (B₃│B₁ B₂)= 98
79 19
P (B₃│B₁ N₂)= 98 P (B₃│N₁ B₂)= 98
18 20
P (N₃│N₁ N₂)= 98 P (N₃│B₁ B₂)= 98
19 19
P (B₃│B₁ N₂)= 98 P (N₃│N₁ B₂)= 98
29
Clemente Castilleja Salas
En general:
𝑁(𝐴) 𝑁(𝐵)
P (A) =𝑁(𝑆) P (B) = 𝑁(𝑆)
B
A
A.B
Considerando que el evento “B” ocurrió, pudo haber sido en la intersección con A
de tal forma que la nueva probabilidad es (A│B) es:
𝑁(𝐴∩𝐵) 1
P (A│B)= si se divide por 𝑁(𝑆) numerador y denominador
𝑁(𝐵)
𝑁(𝐴∩𝐵)/𝑁(𝑆) 𝑃(𝐴∩𝐵)
P (A│B)= = (Formula General para determinar la
𝑁(𝐵)/𝑁(𝑆) 𝑃(𝐵)
Ejemplo 1:
30
Clemente Castilleja Salas
1) Encontrar la probabilidad P de que X llegue antes que Y.
INCISO 1
Y T2
t2 ------------
0 t1 T X-T1
Por ejemplo:
P (tren x llegue antes que el tren y)=P (y)= T2/2 / T2 = ½ o sea P1=1/2
31
Clemente Castilleja Salas
INCISO 2
Y T2
0 X-T1
B T
P[encuentro]=P
P (encuentro)=𝑃[(𝑥 − 𝑦) ≤ 𝑎) ∪ (𝑦 − 𝑥 ≤ 𝑏)]
𝑇 2 (𝑇 − 𝑎)2 𝑇 2 (𝑇 − 𝑏)2
[[ 2 − ] + [ 2 − ]]
2 2
𝑃(𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑜) =
𝑇2
32
Clemente Castilleja Salas
1 1 1 1
[[ ]+[ 2 ]] [[ ]+[ ]]
2(𝑇2 −(𝑇2 −2𝑇𝑎+𝑎2 )] 2[𝑇 −(𝑇2 −2𝑇𝑏+𝑏2 )] 2(2𝑇𝑎−𝑎2 ) 2(2𝑇𝑏−𝑏2 )
= =
𝑇2 𝑇2
INCISO 3
1 1
[ ] [ ]
𝑇2 (𝑇−𝑎)2 2[𝑇2 (𝑇2 −2𝑇𝑎+𝑎2 )] 2(2𝑇𝑎−𝑎2 ) 𝑎 𝑎2
DADO QUE: − = = = −
2 2 𝑇2 𝑇2 𝑇 2𝑇 2
FINALMENTE
33
Clemente Castilleja Salas
𝑎 𝑎2 2𝑎𝑇 − 𝑎2
−
𝑇 2𝑇 2 2𝑇 2
𝑥= 2 2 =
𝑎+𝑏 𝑎 +𝑏 2(𝑎 + 𝑏)𝑇 − (𝑎2 + 𝑏 2 )
− 2
𝑇 2𝑇 2𝑇 2
(2𝑎𝑇−𝑎2)
O sea P X llega antes ocurre =
2𝑇(𝑎+𝑏)−(𝑎2 +𝑏 2 )
qué y encuentro
Ejemplo 2:
34
Clemente Castilleja Salas
Determinar la probabilidad de que la esfera sea Negra
P (*N)=P () P (N│)
P (N│)=
==
P ()=
P (*B)=P () P (B│)
==
P (B│)=
P (*N) =P () P (N│)
===
P (N│)=
P ()=
P (*B) =P () P (B│)
===
P (B│)=
10000
∑=10000 = 1
*N *N
50 75 125
= 1000 + = 1000 = 0.125
1000
35
Clemente Castilleja Salas
Ejemplo 3
De probabilidad Condicional.
Urnas tipo A, B, y C que contienen esferas blancas y negras de acuerdo a lo
siguiente:
Urna A B C
Tipo 60 Urnas 30 Urnas 10 Urnas
Esferas Esferas Esferas Esferas Esferas Esferas
BlancNegra Blanca Negra Blanca Negra
90 10 95 5 99 1
Urna
Color A B C
Esfera 60 Urnas 30 Urnas 10 Urnas
B 90 95 99
N 10 5 1
36
Clemente Castilleja Salas
1ra Parte del experimento:
60 30 10
P (UA)= 100 P (UB)= 100 P (UC)= 100
Árbol de probabilidad:
A~
B~ P (N│) = 10/100
C~
P (B│) = 90/100
P () = 6/10
P (N│) = 5/100
P () = 3/10
P (B│) = 95/100
P (N│) = 1/100
P () = 1/10
P (B│) = 99/100
37
Clemente Castilleja Salas
N
*N *N *N S
(𝐴1 *N); (𝐴2 *N) y (𝐴3 *N) Son subconjuntos que entre si son:
● Exclusivos o
● Mutuamente excluyente
Por lo tanto:
N= (𝐴1 *N) + (𝐴2 *N) +(𝐴3 *N)
B= (𝐴1 *B) + (𝐴2 *B) +(𝐴3 *B)
● P(N) = P(𝐴1 *N)+P(𝐴2 *N)+P(𝐴3 *N)
En forma general:
P(N)=∑3𝑖=1 𝑃(Ai)*P (N│Ai) =∑3𝑖=1 𝑃(Ai*N)
38
Clemente Castilleja Salas
P (B)=∑3𝑖=1 𝑃(Ai) P (B│Ai) =∑3𝑖=1 𝑃(Ai*B)
O bien:
Si se tiene K tipos de urnas, denominadas A1, A2, A3,….. , AK, La expresión
general queda así:
Dado que:
𝑃(𝐴𝑖∗𝑁)
P (𝐴𝑖 │N) = 𝑃(𝐴𝑖 ∗ 𝑁)= P (𝐴𝑖 │N)*P(N)
𝑃(𝑁)
𝑃(𝐴𝑖∗𝑁)
P (N│𝐴𝑖 ) = 𝑃(𝐴𝑖 ∗ 𝑁)= P (N│𝐴𝑖 )*P(𝐴𝑖 )
𝑃(𝐴𝑖)
39
Clemente Castilleja Salas
6 10
𝑃(𝐴1)𝑃(𝑁│𝐴1) ∗ 60
P (A1│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000
3 5
𝑃(𝐴2)𝑃(𝑁│𝐴2) ∗ 15
P (A2│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000
1 1
𝑃(𝐴3)𝑃(𝑁│𝐴3) ∗ 1
P (A3│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000
76
∑3𝑖=1 𝑃(Ai│N)=P (N) =
1000
6 90
𝑃(𝐴1)𝑃(𝐵│𝐴1) ∗ 540
P (A1│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000
3 95
𝑃(𝐴2)𝑃(𝐵│𝐴2) ∗ 285
P (A2│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000
1 99
𝑃(𝐴3)𝑃(𝐵│𝐴3) ∗ 99
P (A3│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000
924
∑3𝑖=1 𝑃(Ai│B)=P (B)=
1000
1) F(X)≥0
2) ∑ 𝑓(𝑥) = 1 = 36/36
40
Clemente Castilleja Salas
FUNCION DE PROBABILIDAD DE VARIABLE ALEATORIA DISCRETA
Ejemplo:
Lanzando dos dados:
6- P {z=x1+x2}
5-
4-
3-
2-
1-
0- 1 2 3 4 5 6
z 2 3 4 5 6 7 8 9 10 11
12
P(z) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
P(z)
6/36-
5/36-
4/36-
3/36-
2/36-
1/36-
0- 2 3 4 5 6 7 8 9 10 11 12 z
En general:
{Z, P(z)} Es una F de P si, y solo si:
41
Clemente Castilleja Salas
1) P(z)≥ 2
𝑙𝑖𝑚𝑖𝑡𝑒 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟
2) ∑𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑃(𝑍) = 1
3) P[x1≤x≤x2]=∑𝑥2
𝑥1 𝑃(𝑧)
90®
0≤x≤360
X
0≤x≤2π
0® P(x=75°)=? Son probabilidades idénticas
360® 180®
P(x=328°)=?
270®
F(x)
1
--
2𝜋
+𝑥
∫−𝑥 𝑓(𝑥)𝑑𝑥=1
0 1π 2π x
0 180° 360°
42
Clemente Castilleja Salas
EN GENERAL
F(x) ≥0
+𝑥
∫−𝑥 𝑓(𝑥)𝑑𝑥=1
𝑥2
P (x1≤x≤x2) =∫𝑥1 𝑓(𝑥)𝑑𝑥
E [X] = ∑𝑥𝑥𝑙𝑖𝑚
𝑙𝑖𝑚 𝑆𝑢𝑝
𝑖𝑛𝑓 𝑥𝑖, 𝑃(𝑥) Con variable aleatoria discreta o entera.
+𝑥
E [x] = ∫−𝑥 𝑥 𝑓(𝑥)𝑑𝑥 Con variable aleatoria continua.
Ejemplo:
Para evidenciar su significado, considerar los siguientes juegos:
Y Varianza:
VAR [x1] = (0-5)2 * ½ + (10-5)2 * ½ = 25
VAR [x2] = (-5-0)2 * ½ + (5-0)2 * ½ = 25
VAR [x3] = (-10-(-5))2 * ½ + (0-(-5))2 * ½ = 25
43
Clemente Castilleja Salas
5.2 FORMULA DE BERNOULLI
DISTRIBUCIÓN BINOMIAL (BERNOULLI)
n experimentos:
x: número de aciertos(éxitos) x=0, 1, 2, …, n
P(E)=0.4 p
P(F)=0.6 q=1-p
∑ =1.0 ∑ =1
Ej. Numérico En general
n experimentos
x=0 𝑞1 𝑞2 … 𝑞𝑛 P (x = 0) = 𝑞 𝑛
x=1 𝑝1 𝑞2 … 𝑞𝑛
n 𝑞1 𝑝2 … 𝑞𝑛 P (x = 1) = 𝑛𝑝1 𝑞 𝑛−1
𝑞1 𝑞2 … 𝑝𝑛
x=k 𝐶𝑛,𝑘
x = n-1 𝑞1 𝑝2 … 𝑝𝑛
n 𝑝1 𝑞2 … 𝑝𝑛 P (x = n-1) = 𝑛𝑝𝑛−1 𝑞1
𝑝1 𝑝2 … 𝑞𝑛
x=n 𝑝1 𝑝2 … 𝑝𝑛 P (x = n) = 𝑝𝑛
44
Clemente Castilleja Salas
Esperanza de “x”:
E[x]=∑𝑛𝑥=0 𝑥 ∗ 𝑃(𝑥)
Primero se determina la probabilidad de tener, en n ensayos, x éxitos consecutivos
seguidos de n-x fracasos consecutivos
P * p … p * (1-p) (1-p) … (1-p) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
45
Clemente Castilleja Salas
La probabilidad de obtener exactamente x éxitos y n-x fracasos en cualquier otro
orden es la misma puesto que los factores p y (1-p) se reordenan de acuerdo con
el orden particular. Por lo tanto, la probabilidad de tener x éxitos y n-x fracasos en
cualquier orden, es el producto de 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 por el número de ordenes
distintos. Este último es el número de combinaciones de n objetos tomando x a la
vez
El nombre “distribución binomial” proviene del hecho de que los valores de P(n, x,
p) para x = 0, 1, 2… n son los términos sucesivos de la expansión binomial de
[(1 − 𝑝) + 𝑝]𝑛
𝑛(𝑛 − 1)
[(1 − 𝑝) + 𝑝]𝑛 = (1 − 𝑝)𝑛 + 𝑛(1 − 𝑝)𝑛−1 𝑝 + (1 − 𝑝)𝑛−2 𝑝2 + ⋯ + 𝑝𝑛
2!
𝑛 𝑛
𝑛!
∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 = ∑ 𝑃(𝑛, 𝑥, 𝑝)
(𝑛 − 𝑥)! 𝑥!
𝑥=0 𝑥=0
En donde se ha escrito la suma desde uno hasta n, dado que cuando x=0 el
primer término es cero y se cancela la x del numerador con la x en x! Factorizando
n y p, se tiene:
𝑛
𝑛!
𝐸[𝑥] = 𝑛𝑝 ∑ 𝑝 𝑥−1 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 1)!
𝑥=1
𝑚!
Si y = x-1 y m = n-1, entonces: 𝐸[𝑥] = 𝑛𝑝 ∑𝑚
𝑦=0 (𝑚−𝑦)!𝑦!
𝑝 𝑦 (1 − 𝑝)𝑛−𝑦
𝑚!
Pero P (y, m, p) =(𝑚−𝑦)!𝑦! 𝑝 𝑦 (1 − 𝑝)𝑚−𝑦 es la función de probabilidad de una
variable aleatoria binomial Y con parámetros m = n-1 y p; de esta manera
∑𝑚
𝑦=0 𝑃(𝑦, 𝑚, 𝑝) = 1
46
Clemente Castilleja Salas
Varianza
Para obtener la varianza, se necesita el segundo momento alrededor del cero, µ’ 2
𝑛
2]
𝐸[𝑥 =∑ 𝑥 2 𝑃(𝑛, 𝑥, 𝑝)
𝑥=0
𝑥2
Pero, en el término Se cancelara una sola x en el numerador, y la que resta
𝑥!
evitara que la suma se manipule de la misma forma en que se determinó la media.
La alternativa es escribir x2 como:
x2 = x(x – 1) + x
De esta manera se tiene: 𝐸[𝑥 2 ] = 𝐸[𝑥(𝑥 − 1)] + 𝐸[𝑥]
Dado que E[x] ya se ha determinado, puede usarse el mismo procedimiento para
evaluar
E [x(x – 1)]
𝑛
𝑛!
𝐸[𝑥(𝑥 − 1)] = ∑ 𝑥(𝑥 − 1) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!
𝑥=0
𝑛
𝑛!
=∑ 𝑥(𝑥 − 1) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!
𝑥=2
𝑛
𝑛!
∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 2)!
𝑥=2
𝑛
2
(𝑛 − 2)!
= 𝑛(𝑛 − 1)𝑝 ∑ 𝑝 𝑥−2 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 2)!
𝑥=2
Nótese que en los pasos anteriores se escribió la suma a partir de dos porque los
dos primeros términos son cero, se canceló x(x – 1), y se factorizo n(n – 1) p2.
Sea y = x-2 y m = n-2, entonces:
𝑚
2
𝑚!
𝐸[𝑥(𝑥 − 1)] = 𝑛(𝑛 − 1)𝑝 ∑ 𝑝 𝑦 (1 − 𝑝)𝑚−𝑦
(𝑚 − 𝑦)! 𝑦!
𝑦=0
𝑚
= 𝑛(𝑛 − 1)𝑝2
𝐸[𝑥 2 ] = µ′2 = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝
De esta manera, la varianza de una variable aleatoria binomial es:
47
Clemente Castilleja Salas
𝑉𝑎𝑟[𝑥] = µ′2 − µ2 = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝 − 𝑛2 𝑝2 = 𝑛𝑝[(𝑛 − 1)𝑝 + 1 − 𝑛𝑝] = 𝑛𝑝(1 − 𝑝)
Sea un experimento de tiro al blanco con dos resultados posibles Acertar o Fallar.
1 2
P (Acertar en un intento) = (3) P (Fallar en un intento) = (3)
x= Números de aciertos
Considerar n experimentos independientes
Si X=1 entonces:
Si x=n-1 entonces:
P(X,n) = P (n-1,n) = P1 P2 Pn … Pn-1 qn = {n.q.pn-1
Si x=n entonces:
48
Clemente Castilleja Salas
P(x,n)= P(n,n)= P1 P2 … Pn = pn
4. SE REALIZAN 5 TIROS
5! 0 5
2 5
𝑃(5,0,1/3) = (1/3) (2/3) = ( ) = 0.132
0! (5 − 0)! 3
5! 1 5−1
2 4
𝑃(5,1,1/3) = (1/3) (2/3) = 5 (1/3) ( ) = 0.329
1! (5 − 1)! 3
5! 2 5−2
1 2 2 3
𝑃(5,2,1/3) = (1/3) (2/3) = 10 ( ) ( ) = 0.329
2! (5 − 2)! 3 3
5! 2 2
𝑃(5,3,1/3) = (1/3)3 (2/3)5−3 = 10(1/3)3 ( ) = 0.165
3! (5 − 3)! 3
5! 2 1
𝑃(5,4,1/3) = (1/3)4 (2/3)5−4 = 5(1/3)4 ( ) = 0.041
4! (5 − 4)! 3
49
Clemente Castilleja Salas
5! 5 5−5 5
2 0
𝑃(5,5,1/3) = (1/3) (2/3) = (1/3) ( ) = 0.004
5! (5 − 5)! 3
∑ =1
Ejemplo :
1) B(n, x, p) ≥ 0 Vx; n ≥ 1
2) ∑𝑛𝑥=1 𝐵(𝑛, 𝑥, 𝑝) = 1
50
Clemente Castilleja Salas
p (1, 0)= C1,0 * p0q1 = q
n=1
(p+q)=1
51
Clemente Castilleja Salas
Es decir: B(n,x,p,) es una Función de Probabilidad que llamaremos por extensión
Función de Bernoulli.
𝑛!
Cn,x =
𝑋!(𝑛−𝑥)!
Por ejemplo:
52
Clemente Castilleja Salas
P (100, 0, 1/2) = (C100,0 (½)0 (1 - ½)100-0 = (1/2) 100
100! 1 𝑥 1 100−𝑥
P (40≤x≤60) = ∑60
𝑥=40 ( ) (1 − 2) = 0.95
𝑥!(100−𝑥)! 2
100! 1 𝑥 1 100−𝑥
P (35≤x≤65) = ∑65
𝑥=35 ( ) (1 − 2) = 0.99
𝑥!(100−𝑥)! 2
Ejemplo:
P (Acertar) = P = 0.4
P (Fallar) = q = 1 – p = 0.6
6!
P (6, 0, 0.4) = 0!(6−0)! (0 − 4)0 (1 − 0.4)(1 − 0.4)6−0 = 0.047
6!
P (6, 1, 0.4) = 1!(6−1)! (0 − 4)1 (1 − 0.4)(1 − 0.4)6−1 = 0.186
6!
P (6, 2, 0.4) = 2!(6−2)! (0 − 4)2 (1 − 0.4)(1 − 0.4)6−2 = 0.312
6!
P (6, 3, 0.4) = 3!(6−3)! (0 − 4)3 (1 − 0.4)(1 − 0.4)6−3 = 0.276
6!
P (6, 4, 0.4) = 4!(6−4)! (0 − 4)4 (1 − 0.4)(1 − 0.4)6−4 = 0.138
6!
P (6, 5, 0.4) = (0 − 4)5 (1 − 0.4)(1 − 0.4)6−5 = 0.037
5!(6−5)!
6!
P (6, 6, 0.4) = 6!(6−6)! (0 − 4)6 (1 − 0.4)(1 − 0.4)6−6 = 0.004
∑=1.000
53
Clemente Castilleja Salas
P(n,x,p)
0.4--
0.3--
0.2--
0.1--
0 0 1 2 3 4 5 6
𝑛!
Mx= np 𝜎𝑥 2 = 𝑛𝑝𝑞 Cu=
𝑥!(𝑛−𝑥)!
Experimento:
Mx = np = 10 (0.4) = 4
10!
P (10, 1, 0.4) = 1!(10−1)! (0.4)1 (0.6)9 = 0.0403
10!
P (10, 2, 0.4) = 2!(10−2)! (0.4)2 (0.6)8 = 0.1209
10!
P (10, 3, 0.4) = 3!(10−3)! (0.4)3 (0.6)7 = 0.2149
10!
P (10, 4, 0.4) = 4!(10−4)! (0.4)4 (0.6)6 = 0.2508
10!
P (10, 5, 0.4) = 5!(10−5)! (0.4)5 (0.6)5 = 0.2006
54
Clemente Castilleja Salas
10!
P (10, 6, 0.4) = 6!(10−6)! (0.4)6 (0.6)4 = 0.1114
10!
P (10, 7, 0.4) = 7!(10−7)! (0.4)7 (0.6)3 = 0.0424
10!
P (10, 8, 0.4) = 8!(10−8)! (0.4)8 (0.6)2 = 0.0106
10!
P (10, 9, 0.4) = 9!(10−9)! (0.4)9 (0.6)1 = 0.0015
10!
P (10, 10, 0.4) = (0.4)10 (0.6)0 = 0.0001
10!(10−10)!
TEOREMA DE POISSON
Si se tienen n experimentos de B:
B (n, x, p) = Cn,x px (1-p) n-x n sea muy grande y p muy pequeña tales que
sea factible establecer:
𝜆^𝑥
P (λ, x) = 𝑒^ − 𝜆
𝑥!
𝑛!
P (x, n, p) = 𝑛!(𝑛−𝑥)! 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑛 (𝑛−1)(𝑛−2)…(𝑛−𝑥+1) 𝑛 (𝑛−1)(𝑛−2)…(𝑛−𝑥+1) 𝜆𝑥
P(n, x, p) = (𝑛𝑝)𝑥 (1 − 𝑝)𝑛−𝑥 = (1 − 𝑝)𝑛−𝑥
𝑛𝑥 𝑥! 𝑛𝑥 𝑥!
1 2 𝑥−1
1 2 𝑥−1 𝜆𝑥 1 (1− ) (1− ) … (1− ) 𝜆𝑥
= 1 (1- 𝑛) (1- 𝑛)… (1- ) 𝑥! (1 − 𝑝)𝑛−𝑥 = 𝑛 𝑛 𝑛
(1 − 𝑝)𝑛
𝑛 (1−𝑝)𝑥 𝑥!
55
Clemente Castilleja Salas
1 𝑛 1
− −
Dado que: (1 − 𝑝)𝑛 = [(1 − 𝑝) 𝑝 ]𝑝 = [(1 − 𝑝) 𝑝 ]𝜆
1
Por definición: (1 + 𝑧)𝑧 = 𝑒
1
−
[(1 − 𝑝) 𝑝 ]−𝜆 = 𝑒𝜆
1 2 𝑥−1
Además (1 + 𝑛) (1 + 𝑛) … (1 + ) = 1 (1 + 𝑝)𝑥 = 𝑒
𝑛
𝑒 −𝜆 𝜆𝑥
Al sustituir en 𝑃(𝑛, 𝑥, 𝑝) = X = 0, 1, 2, …, ∞
𝑥!
MEDIA
𝑒 −𝜆 𝜆𝑥 𝜆𝑥 𝜆𝑥−1 𝜆𝑦
𝐸[𝑥] = ∑∞
𝑥=0 𝑥 = 𝑒 −𝜆 ∑∞
𝑥=1 = 𝜆𝑒 −𝜆 ∑∞
𝑥=1 = 𝜆𝑒 −𝜆 ∑∞
𝑦=0 =𝜆
𝑥! (𝑥−1)! (𝑥−1)! 𝑦!
y=x-1
VARIANZA
𝑒 −𝜆 𝜆𝑥 𝜆𝑥−2 𝜆𝑥
𝐸[𝑥(𝑥 − 1)] = ∑∞
𝑥=0 𝑥(𝑥 − 1) = 𝜆2 𝑒 −𝜆 ∑∞
𝑥=2 = 𝜆2 𝑒 −𝜆 ∑∞
𝑦=0 = 𝜆2 y
𝑥! (𝑥−2)! 𝑦!
=x-2
FÓRMULA DE POISSON
56
Clemente Castilleja Salas
p 0
𝑛! 𝜆𝑥
(𝑥!(𝑛−𝑥)!) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 =
𝑥!
𝑒 −𝜆
Y se representa:
𝜆𝑥 −𝜆
𝑃(𝜆, 𝑥) = 𝑒
𝑥!
Siendo λ=n•p
-Esperanza matemática
-Varianza
4) P (x = 3) =? P (1,3)=[(1)3/3!][e-1]=0.061
5) P (x = 4) =? P (1,4)= [(1)4/4!][e-1]=0.015
6) P (x = 5) =? P (1,5)= [(1)5/5!][e-1]=0.0030
57
Clemente Castilleja Salas
Ejemplo 2 n=105 experimentos independientes
p 0
λ=n•p=105(0.5x10-5)=0.5
(0.5)0 −0.5
𝑃(0.5,0) = 𝑒 = 0.607 𝑃(𝑐𝑒𝑟𝑜 é𝑥𝑖𝑡𝑜𝑠)
0!
(0.5)1 −0.5
𝑃(0.5,1) = 𝑒 = 0.303 𝑃(𝑢𝑛 é𝑥𝑖𝑡𝑜)
1!
(0.5)2 −0.5
𝑃(0.5,2) = 𝑒 = 0.076 𝑃(𝑑𝑜𝑠 é𝑥𝑖𝑡𝑜𝑠)
2!
(0.5)3 −0.5
𝑃(0.5,3) = 𝑒 = 0.013 𝑃(𝑡𝑟𝑒𝑠 é𝑥𝑖𝑡𝑜𝑠)
3!
(0.5)4 −0.5
𝑃(0.5,4) = 𝑒 = 0.002 𝑃(𝑐𝑢𝑎𝑡𝑟𝑜 é𝑥𝑖𝑡𝑜𝑠)
4!
2.- P (x≥3)=?
105
(0.5)𝑥 −0.5
𝑃(𝑥 ≥ 3) = ∑ 𝑒
𝑥!
𝑥=3
2
(0.5)𝑥 −0.5
=1−∑ 𝑒
𝑥!
𝑥=0
=1-0.607-0.303-0.076
=0.014
58
Clemente Castilleja Salas
3.- ¿Se puede aplicar Fórmula de Bernoulli?
Respuesta: si
105
105 ! 5−𝑥
𝑃(𝑥 ≥ 3) = ∑ 5
(10−5 • 0.5)𝑥 (1 − 0.5 • 10−5 )10
𝑥! (10 − 𝑥)!
𝑥=3
105 ! 5
𝑃(𝑥 = 0) = 5
(0.5 • 10−5 )0 (1 − 0.5 • 10−5 )10
0! 10 !
49999 100000
=( )
50000
Pero las operaciones matemáticas no son practicables.
En general:
𝜆𝑥
𝑃(𝜆, 𝑥) = 𝑒 −𝜆 𝐸[𝑥] = 𝑚𝑥 = 𝜆 = 𝑛𝑃 ; 𝑉𝐴𝑅[𝑥] = 𝜎𝑥 2 = 𝜆2 = (𝑛𝑃)2
𝑥!
𝑛𝑝 = 𝜆 = 𝑉𝑡
λ = Media mx de éxitos en el periodo de observación [0,T]
𝑉𝑡 𝑥 −(𝑉𝑡)
𝑃(𝜆, 𝑥) = 𝑒
𝑥!
Con x=0 𝑃(𝜆, 𝑥) = 𝑒 −(𝑉𝑡)
59
Clemente Castilleja Salas
5.5 FORMULA DE GAUSS (O FUNCION NORMAL)
1 2
1
𝐼 = 𝑓(𝑧) = 𝑒 −2 𝑧 ; 𝑓(𝑧) ≥ 0
√2𝜋
−𝑋 ≤ 𝑍 ≤ +𝑋
+𝑥
1. ∫−𝑥 𝑓(𝑧)𝑑𝑧 = 1
0 𝑥 1
∫−𝑥 𝑓(𝑧)𝑑𝑧 = ∫0 𝑓(𝑧)𝑑𝑧 = 2 = 0.5
+𝑥
3. 𝐸[𝑍] = ∫−𝑥 𝑍 𝑓(𝑧)𝑑𝑧 = 0
+𝑥
𝑉𝐴𝑅[𝑧] = ∫ (𝑧 − 𝑚𝑧)2 𝑓(𝑧)𝑑𝑧 = 1
−𝑥
𝑧
Tabla: ∫0 𝑓(𝑧)𝑑𝑧 ; 𝐼𝑛𝑡𝑒𝑔𝑟𝑎𝑛𝑑𝑜 𝑝𝑜𝑟 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑐𝑖𝑜𝑛 𝑛𝑒𝑚𝑒𝑟𝑖𝑐𝑎.
60
Clemente Castilleja Salas
Para sacar la altura máxima de F (z):
1 1
𝑧2
𝐹(𝑧) = 𝑒 −2
√2𝜋
𝑍 1
𝑧2
𝐹´(𝑧) = 𝑒 −2
√2𝜋
● Igualando a cero:
𝑍 1
𝑧2
0= 𝑒 −2
√2𝜋
● Cuando Z=0
1
−(0) 𝑧2
0= 𝑒 −2 0=0
√2𝜋
● Sustituyendo en f(z)
1 1
02
ℎ𝑚𝑎𝑥 = 𝑒 −2
√2𝜋
1
ℎ𝑚𝑎𝑥 =
√2𝜋
ℎ𝑚𝑎𝑥 = 0.3989
61
Clemente Castilleja Salas
Ejemplo:
1 1
𝑝(−1 ≤ 𝑧 ≤ 1) = ∫−1 𝑓(𝑧)𝑑𝑧 = 2 ∫0 𝑓(𝑧)𝑑𝑧 = 2(0.3413) = 0.6826
𝑥 𝑥 2
𝑝(𝑧 ≥ 2) = ∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 − ∫ 𝑓(𝑧)𝑑𝑧 = 0.5000 − 0.4772 = 0.0228
2 0 0
3 0 3
𝑝(−1.75 ≤ 𝑧 ≤ 3) = ∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 + ∫ 𝑓(𝑧)𝑑𝑧
−1.75 −1.75 0
= 0.4599 + 0.4987 = 0.9586
0 1.75
∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 = 0.4599
−1.75 0
3
∫ 𝑓(𝑧)𝑑𝑧 = 0.4987
0
Ejemplo 2:
Sea “X” una Variable Aleatoria (V.A.) que representa la vida útil de una pieza
industrial (una lámpara) y mx = 1100 hr y 𝜎𝑥 = 50 𝐻𝑅, la media y D.E. de la población
correspondiente. Suponer que “x” tiene un comportamiento normal:
- Tabla de frecuencia
- Histograma
- Polígono de frecuencias
62
Clemente Castilleja Salas
Sea “X”: La duración en horas de una lámpara tomada al azar.
1) 𝑃(1050 ≤ 𝑥 ≤ 1150) = ?
2) 𝑃(1000 ≤ 𝑥 ≤ 1200) = ?
1200 𝑍2
𝑃(1000 ≤ 𝑥 ≤ 1200) = ∫ 𝑓(𝑥)𝑑𝑥 → ∫ 𝑓(𝑧)𝑑𝑧
1000 𝑍1
2 2
∫ 𝑓(𝑧)𝑑𝑧 = 2 ∫ 𝑓(𝑧)𝑑𝑧 = 2(0.4772) = 0.9544
−2 0
3) 𝑃(950 ≤ 𝑥 ≤ 1250) = ?
1250 𝑍2
𝑃(950 ≤ 𝑥 ≤ 1250) = ∫ 𝑓(𝑥)𝑑𝑥 → ∫ 𝑓(𝑧)𝑑𝑧
950 𝑍1
3 3
∫ 𝑓(𝑧)𝑑𝑧 = 2 ∫ 𝑓(𝑧)𝑑𝑧 = 2(0.4987) = 0.9974
−3 0
63
Clemente Castilleja Salas
X tiene comportamiento normal
Y Desviación estándar 𝜎𝑥 = 50 𝐻𝑅
BERNOULLI: Donde
POISSON
64
Clemente Castilleja Salas
APROXIMACIÓN NORMAL DE LA FUNCIÓN BINOMIAL (O DE BERNOULLI)
Ejemplo: Determinar probabilidad con aproximación normal en el experimento del
lanzamiento de una moneda 100 veces.
N= 100; X: número de caras; P=0.5 Probabilidad de cara en un
lanzamiento.
Cálculo aproximado:
Por lo que debe hacerse una corrección a “x” para operarla como variable continua
44 45 46 los
valores son
X continúa
65
Clemente Castilleja Salas
44.5 45.5
Tiene un valor
𝐵(𝑛, 𝑥, 𝑝) = 𝑃(𝜆, 𝑥)
+
TEOREMA DE CHEBYSHEV
La desviación estándar “σ” de una función de densidad de probabilidad arbitraria,
es una medida de amplitud de expansión de la distribución, es decir, es una
medida de la concentración de la probabilidad en la vecindad de la media. Si “σ”
es pequeña, la probabilidad de obtener un valor cerca de la media es alta, si “σ” es
grande la probabilidad de obtener un valor separado de la media es
proporcionalmente más alta. Si una distribución de probabilidad tiene una ẋ y una
desviación estándar “σ”, la probabilidad de obtener un valor que se desvíe de la
media por más de K veces la desviación estándar, es menor que 1/K 2; es decir,
1
𝑃(|𝑥 − ẋ| ≥ 𝐾𝜎) ≤
𝐾2
Este límite no se puede reducir sin restringir la clase de funciones de densidad. Si
la función de densidad es simétrica con respecto a la media y tienen un punto
máximo único,
4
𝑃(|𝑥 − ẋ| ≥ 𝐾𝜎) ≤
9𝐾 2
66
Clemente Castilleja Salas
Desigualdad de chebysheb
La varianza es:
∞
2
𝜎 =∫ (𝑥 − ẋ)2 𝑃(𝑥)𝑑𝑥
−∞
𝜎2 ≥ ∫ (𝑥 − ẋ)2 𝑃(𝑥)𝑑𝑥
|𝑥−ẋ|>𝐾𝜎
𝜎2 ≥ ∫ 𝐾 2 𝜎 2 𝑃(𝑥)𝑑𝑥 = 𝐾 2 𝜎 2 ∫ 𝑃(𝑥)𝑑𝑥
|𝑥−ẋ|𝐾𝜎 |𝑥−ẋ|>𝐾𝜎
Simplificando,
𝐾2 ∫ 𝑃(𝑥)𝑑𝑥 ≤ 1
|𝑥−ẋ|>𝐾𝜎
67
Clemente Castilleja Salas
5.7 AREAS BAJO LA CURVA NORMAL
68
Clemente Castilleja Salas
6. DISTRIBUCIÓN MUESTRAL DE MEDIDAS
DISTRIBUCION DE MUESTREO X
Una de las estadísticas más importantes es la media de un conjunto de variables
aleatorias independientes e idénticamente distribuidas. Este estadístico tiene un
papel muy importante en problemas de toma de decisiones para medidas
poblacionales desconocidas. Sea x1,x2,…..xn = μ y Var (X1)= σ2 para toda i=
1,2,…..n.
Entonces la estadística:
X=(X1+x2+….xn)/n
Se define como le medida de las n variables aleatorias IID o, sencillamente, media
maestral. Nótese que una vez que se conocen las realizaciones x1,x2,…xn de
X1,X2,….XN, respectivamente, la realización de x de X se obtiene promediando
los datos muéstrales. Si en ai= 1/n, i =1, 2,…n. entonces el valor esperado y la
varianza de X son:
1
E(X)=∑𝑁
𝐼=1 μ = n (μ/n) =μ
𝑁
1
Var(X)= ∑𝑛𝑖=1 σ2 = n (σ2/n2) = σ2/n.
𝑛2
d. e (X)= σ /√𝑛
Ejemplo:
Supóngase que las estaturas de 3000 estudiantes de una universidad se
distribuyen normalmente con media 68.0 pulgadas y deviación típica 3.0 pulgadas.
Si se toman 80 muestras de 25 estudiantes cada una, ¿cuál será la media y'la
desviación típica esperada de la distribución maestral de medias resultante si el
muestreo se hizo (o) con remplazamiento, (b) sin remplazamiento?:
69
Clemente Castilleja Salas
F(x 25)
DMM
MDMM= MPOB=68
DMM=
DMM= == 3/5
MDMM=MPOB
∞ 𝑍2=∞ ∞
∫69.5 𝑓(𝑥)𝑑𝑥 ∍ ∫𝑍1= 69.5−68 𝐹(𝑍)𝐷𝑍 = ∫2.5 (𝐼)
3/5
∞ 2.50
= ∫0 − ∫0 𝐼 = 0.5 − 0.4938
70
Clemente Castilleja Salas
F(X 25)
69.5
2.5
X 25
Z
● Curva única:
XDMM
71
Clemente Castilleja Salas
0.68
0.95
0.9974
(c) Hay 5(5)=25 muestras de tamaño dos que pueden extraerse con
remplazamiento (puesto que cualquier de los cinco números de la primera
extracción puede asociarse con cualquiera de los cinco números de la segunda
extracción). Estas son:
72
Clemente Castilleja Salas
(2,2) (2,3) (2,6) (2,8) (2,11)
73
Clemente Castilleja Salas
distribución normal a medida que el número de variables aleatorias que se suman
sea más grande. De este modo si:
Y = X1 + X2 + … + Xn
En donde X1, X2, …, Xn son variables aleatorias independientes con funciones de
densidad Px1, Px2, … Pxn la función de densidad de la suma y es:
Py (y) = Px1 * Px2 * … * Pxn
Es un límite cuando n ∞, la función gaussiana de densidad limitante es:
2
1 /2𝜎2
𝑃𝑦(𝑌) ⟶ 𝑒 −(𝑦−𝑦)
√2𝜋𝜎
En el caso especial en donde las distribuciones componentes son idénticas, el
teorema del límite central se cumple si hay un segundo momento finito para la
distribución común.
7. ESTIMACIÓN ESTADÍSTICA
TEORIA DE ESTIMACION ESTADISTICA
DISTRIBUCION
MUESTRAL DE
MEDIAS
(DMM)
3 2 1 1 2 3
= MEDIA DE UNA
MUESTRA DE TAMAÑO N
TOMADA AL AZAR DE LA
POBLACION
74
Clemente Castilleja Salas
K=1 0.6828
𝑃(𝑚𝑃𝑂𝐵 𝐷𝑀𝑀 − 𝐾𝜎𝐷𝑀𝑀 ≤ 𝑋𝑁 ≤ 𝑚𝑃𝑂𝐵 𝐷𝑀𝑀 + Z𝐾𝜎𝐷𝑀𝑀 ) = K=2 0.9544
K=3 0.9972
𝑋𝑁 −𝑚𝐷𝑀𝑀
𝑍= 𝜎𝐷𝑀𝑀
K Z
∑ (𝑦 𝑡𝑒𝑜𝑟𝑖𝑐𝑎−𝑦 𝑚𝑒𝑑𝑖𝑎)2
r=√ (𝑦 𝑟𝑒𝑎𝑙−𝑦 𝑚𝑒𝑑𝑖𝑎)2
2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑎𝑚𝑝𝑙𝑖𝑓𝑖𝑐𝑎𝑑𝑎 ∑ (𝑌 𝑡𝑒𝑜𝑟𝑖𝑐𝑎 − 𝑌)
𝑟= =√ 2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑜𝑡𝑎𝑙 ∑ (𝑌 𝑟𝑒𝑎𝑙 − 𝑌)
ESTIMACION ESTADISTICA
En inferencia estadística se llama estimación al conjunto de técnicas que permiten
dar un valor aproximado de un parámetro de una población a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimación de la media de una
determinada característica de una población de tamaño N podría ser la media de
esa misma característica para una muestra de tamaño.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene
distintos métodos que se usan en función de las características y propósitos del
estudio:
● Estimación puntual:2
● Método de los momentos;
75
Clemente Castilleja Salas
● Método de la máxima verosimilitud;
● Método de los mínimos cuadrados;
● Estimación por intervalos.
● Estimación bayesiana.
Un estimador es una regla que establece cómo calcular una estimación basada en
las mediciones contenidas en una muestra estadística.
ESTIMACIÓN PUNTUAL
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido
de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un
estimador, es que sea un estimador eficiente. Es decir, que sea insesgado
(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Estimación puntual. Sea X una variable poblacional con distribución Fθ, siendo θ
desconocido. El problema de estimación puntual consiste en, seleccionada una
muestra X1, ..., Xn, encontrar el estadístico T(X1, ..., Xn) que mejor estime el
parámetro θ. Una vez observada o realizada la muestra, con valores x1, ..., xn, se
obtiene la estimación puntual de θ, T(x1, ..., xn) = ˆ θ .
Vemos a continuación dos métodos para obtener la estimación puntual de un
parámetro: método de los momentos y método de máxima verosimilitud. Método
de los momentos: consiste en igualar momentos poblacionales a momentos
muéstrales. Deberemos tener tantas igualdades como parámetros a estimar.
Momento poblacional de orden r αr = E (Xr) Momento muestral de orden r ar = Xn
i=1 Xr i n
Método de máxima verosimilitud: consiste en tomar como valor del parámetro
aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ...,
Xn es una muestra seleccionada de una población con distribución Fθ o densidad
fθ(x), la probabilidad de que ocurra una realización x1, ..., xn viene dada por:
Lθ(x1, ..., xn) = Yn i=1 fθ(xi)
A Lθ(x1, ..., xn) se le llama función de verosimilitud. (Credibilidad de la muestra
observada). Buscamos entonces el valor de θ que maximice la función de
verosimilitud, y al valor obtenido se le llama estimación por máxima verosimilitud
de θ. Nota: si la variable X es discreta, en lugar de fθ (xi) consideramos la función
masa de probabilidad pθ (xi).
Ejemplo 7.1: Sea X → N (µ, σ), con µ desconocido. Seleccionada una más. X1, ...,
Xn, con realización x1, ..., xn, estimamos el parámetro µ por ambos métodos.
Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se
76
Clemente Castilleja Salas
obtiene que ˆ µ = − x. Por el método de máxima verosimilitud: Lµ(x1, ..., xn) = Yn
i=1 fµ (xi) = = Yn i=1 1 √ 2πσ e − (xi−µ) 2 2σ
Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en
este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn
i=1 (xi − µ) 2 − n ln (√ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ
σ 2 = 0 ⇐⇒ ˆ µ = −
ESTIMACIÓN POR INTERVALOS
Consiste en la obtención de un intervalo dentro del cual estará el valor del
parámetro estimado con una cierta probabilidad. En la estimación por intervalos se
usan los siguientes conceptos:
INTERVALO DE CONFIANZA
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ
es el parámetro a estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo
cuando la muestra no garantiza un axioma o un equivalente circunstancial.
VARIABILIDAD DEL PARÁMETRO
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular el
tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como
medida de esta variabilidad la desviación típica poblacional y se denota σ.
ERROR DE LA ESTIMACIÓN
Es una medida de su precisión que se corresponde con la amplitud del intervalo
de confianza. Cuanta más precisión se desee en la estimación de un parámetro,
más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o
disminuir el error, más observaciones deberán incluirse en la muestra estudiada.
En caso de no incluir nuevas observaciones para la muestra, más error se comete
al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
LÍMITE DE CONFIANZA
Es la probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se
denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)
·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se
corresponden con valores α de 0,05 y 0,01 respectivamente.
VALOR Α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de
fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de
77
Clemente Castilleja Salas
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del
95%, el valor α es (100-95)/100 = 0,05
VALOR CRÍTICO
Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución
que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
Normalmente los valores críticos están tabulados o pueden calcularse en función
de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del
siguiente modo: se busca en la tabla de la distribución ese valor (o el más
aproximado), bajo la columna "Área"; se observa que se corresponde con -1,28.
Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ
para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen
restando y sumando, respectivamente, la mitad del error, para obtener el intervalo
de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en
nuestra estimación, es decir, un mayor nivel de confianza.
Otros usos del término
El término estimación también se utiliza en ciencias aplicadas para hacer
referencia a un cálculo aproximado, que normalmente se apoya en la herramienta
estadística aunque puede no hacerlo. En este sentido, un ejemplo clásico son los
poco conocidos pero útiles en economía problemas de Fermi.
EJEMPLO:
En un conjunto de 42 personas, tomadas al azar de la ciudad, cuantas llamadas
realizaron durante la semana pasada desde su teléfono móvil a un fijo. La ciudad
cuenta con 130 mil habitantes. El resultado es el siguiente:
7 4 6 2 8 3 5
6 7 3 3 5 2 7
8 7 5 3 3 5 5
4 5 5 7 5 1 3
1 1 2 3 6 7 3
4 3 7 1 3 7 7
78
Clemente Castilleja Salas
Por término medio:
Lo primero que nos interesa es encontrar cuál es el número medio semanal
de llamadas a fijos que realizan en la ciudad desde un teléfono móvil. Se trata de
estimar la media aritmética poblacional, para lo que necesitamos la media de la
muestra (estimador), la desviación tipo, la distancia estandarizada que representa
la seguridad y el tamaño de la muestra. Pongamos que, por llevar la contraria a Sir
Ronald y porque tampoco se nos ocurre qué problema serio puede derivarse de
nuestro posible error, utilizaremos una seguridad del 90%.
Lo primero es observar si podemos suponer que la distribución muestral de
medias
De la que proviene nuestra muestral es normal. Podemos suponerlo, puesto que
n=42≥30.
Lo siguiente es traducir la seguridad a una distancia estandarizada, utilizando la
Curva normal estandarizada. Según la tabla que tenemos en el monográfico
La curva normal, un área centrada del 90% se corresponde con una puntuación
tipo de valor 1,645. Acto seguido, nos falta el estimador y la desviación tipo. Lo
resolvemos mediante una tabla de frecuencias (donde d2 es la distancia
cuadrática a la media):
TABLA DE FRECUENCIAS
Xi fi Xifi d2*fi
1 4 4.00 49.00
2 3 6.00 18.75
3 10 30.00 22.50
4 3 12.00 0.75
5 8 40.00 2.00
6 3 18.00 6.75
8 2 16.00 24.50
SUMA 42 189.00 180.50
Media: 189/42 = 4.5
Varianza: 180.5/42 = 4.298
Desviación tipo: Raíz (4.298) = 2.073
Con esta información:
𝑆 2,2.73
𝑒𝑝 = 𝑍 = 1,645 = 0,053
√𝑛−1 √42−1
79
Clemente Castilleja Salas
Luego, con una seguridad del 90%, afirmamos que la gente de la ciudad realiza
semanalmente entre 3,97 y 5,03 llamadas de móvil a fijo por término medio.
Pongamos un porcentaje:
¿Qué porcentaje de personas en la ciudad realizan no menos de 5 llamadas de
móvil a fijo durante una semana? Utiliza una probabilidad de errar del 5%.En la
muestra, 8+3+9+2=22 personas realizaron no menos de 5 llamadas de ese tipo, lo
que significa un 22/42*100 = 52,38% de la muestra. Al consultar la tabla de la
curva normal estandarizada, el área centrada del 95% se corresponde con una
distancia estandarizada de 1,96. Podemos consultar sin problemas esta tabla,
puesto que es asumible que la distribución muestral de proporciones es normal.
Utilizando p como criterio (pues carecemos del valor de π):
np = 42·0,5238=22≥5 n (1−p) = 42·0,4762 = 20 ≥ 5
Así pues:
80
Clemente Castilleja Salas
Para la media:
𝑆 2,073
𝑒𝑝 = 𝑍 = 2,17 = 0,70
√𝑛 − 1 √42 − 1
Si cada persona realiza entre 3,8 y 5,2 llamadas de móvil a fijo semanales, las 130
mil realizarán entre 3,8*130000= 494 mil y 5,2*130000= 676 mil de este tipo de
llamadas a la semana. Respecto a la proporción:
desviación típica esperadas serán muy próximas a las de la distribución teórica. Así
se tiene,
que es ligeramente menor que 0.6 pulgadas y puede, por tanto, para todo propósito
práctico, considerarse la misma que en el muestreo con remplazamiento.
81
Clemente Castilleja Salas
Así, pues, cabría esperar que la distribución muestral experimental de medias se
distribuya aproximadamente normal con media 68,0 pulgadas y desviación típica
0.6 pulgadas.
EJEMPLO: Las medidas de los diámetros de una muestra de 200 cojinetes de bolas
hechos por una determinada máquina durante una semana dieron una media de
0.824 pulgadas y una desviación típica de 0.042 pulgadas. Hallar los límites de
confianza del (a) 95% y (b)99% para el diámetro medio de todos los cojinetes.
82
Clemente Castilleja Salas
8. DECISIONES ESTADÍSTICAS
DMM (Distribución destral de medias)
𝜎𝐷𝑀𝑀 7
𝜎𝐷𝑀𝑀 = = = 1.4
√𝑁 √25
SOLUCIÓN
1.1
110 UT
83
Clemente Castilleja Salas
1.2
Corresponde a la población
84
Clemente Castilleja Salas
𝑚𝐷𝑀𝑀 = 𝑚𝐷𝑀𝑀 = 110
1.4 suponiendo que el nuevo material NO es efectivo (esto implica que los
parámetros del proceso original siguen siendo válidos: mDMM y σDMM). ¿Cuál es la
probabilidad de aceptar el nuevo material?
85
Clemente Castilleja Salas
2.- Si el nuevo producto si incrementa la duración media hasta 114.5 UT. ¿Cuál es
la probabilidad de rechazar el nuevo producto (N.P)?
ERROR TIPO 1
4.- ¿Cuál es la probabilidad de rechazar el nuevo material cuando en realidad SÍ
es efectivo?
𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑁. 𝑀𝐴𝑇𝐸𝑅𝐼𝐴𝐿) = 𝑃(ẋ25 𝑁𝑃 ≤ 113.2) = 0.1762
ERROR TIPO II
86
Clemente Castilleja Salas
1) Si el valor de z es mayor que 2.33 los resultados son significativos al nivel de
0.01 y Ho es rechazada.
2) De otro modo Ho es aceptada
Que es mayor que 2.33. De aquí se deduce que los resultados son altamente
significativos y la aspiración de mejora debe ser admitida.
87
Clemente Castilleja Salas
Ejemplo 1 CALIFICACIONES: y=a0 + a1X
Alumnos Y X horas xy X2
calificación de estudio
1 4.6 1.8 8.28 3.24
2 5.2 1.7 8.84 2.89
3 6.2 1.2 7.44 1.44
4 6.9 3.9 26.41 15.21
5 7.5 3.3 24.75 10.89
6 8.0 4.7 37.60 22.09
7 8.9 4.3 38.27 18.49
8 7.6 5.5 41.80 30.25
9 5.8 3.9 22.62 15.21
10 = N 8.9 7 62.30 49.00
Σ 69.6 37.3 278.81 168.71
88
Clemente Castilleja Salas
TEORIA DE CORRELACION ESTADISTICA
Recta de mínimos cuadrados
La recta de aproximación por mínimos cuadrados del conjunto de puntos (X1, Y1),
(X2, Y2), …, (XN, YN) tiene la ecuación
Y = a0 + a1X (1)
Donde las constantes 𝑎0 y 𝑎1 se determinan mediante el sistema de ecuaciones
∑ 𝑌 = 𝑎0 𝑁 + 𝑎1 ∑ 𝑋∑ 𝑋𝑌 = 𝑎0 ∑ 𝑋 + 𝑎1 ∑ 𝑋2 (2)
Que son las llamadas ecuaciones normales para la recta de mínimos cuadrados
(1)
Las constantes 𝑎0 y 𝑎1 pueden sacarse de (2), obteniéndose las formulas
(∑ 𝑌)(∑ 𝑋 2 )−(∑ 𝑋)(∑ 𝑋𝑌) 𝑁∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
𝑎0 = 𝑎1 = (3)
𝑁∑ 𝑋 2 −(∑ 𝑋)2 𝑁∑ 𝑋 2 −(∑ 𝑋)2
89
Clemente Castilleja Salas
𝑁𝑎0 + 𝑎1 ∑ 𝑋−∑ 𝑌=0 𝑎0 ∑ 𝑋 − 𝑎1 ∑ 𝑋2 − ∑ 𝑋𝑌 = 0
90
Clemente Castilleja Salas
𝑌𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
𝑌̂
𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜
𝑌̂
𝑖= 𝛼 + 𝛽𝑋𝑖
𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
(𝑒𝑖 )2 = (𝑌𝑖 − 𝑌̂𝑖 )2
Tenemos que minimizar:
𝑛
∑ 2
(𝑒𝑖 ) = ∑ (𝑌𝑖 − 𝑌̂𝑖 )2
𝑖=1
𝜕𝑓
=∑ − 2(𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0
𝜕𝛼
∑ 𝑌𝑖 − ∑ ∝ −∑ 𝛽𝑋𝑖 = 0
∑ 𝑌𝑖 − 𝛼 ∑ 1−𝛽∑ 𝑋𝑖 = 0
∑ 𝑌𝑖 − 𝛼𝑁 − 𝛽 ∑ 𝑋𝑖 = 0
𝛼𝑁 + 𝛽 ∑ 𝑋𝑖 = ∑ 𝑌𝑖 … … … … … … … … … … … … … … … … . . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 1
91
Clemente Castilleja Salas
𝜕𝑓
=∑ − 2𝑋𝑖 (𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0
𝜕𝛽
∑ 𝑋𝑖 (𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0
∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝛼𝑋𝑖 − ∑ 𝛽𝑋 2 𝑖 = 0
∑ 𝑋𝑖 𝑌𝑖 − 𝛼 ∑ 𝑋𝑖 − 𝛽 ∑ 𝑋2𝑖 = 0
∑ 𝑋𝑖 𝑌𝑖 = 𝛼 ∑ 𝑋𝑖
+𝛽∑ 𝑋 2 𝑖 … … … … … … … … … … … … … … … … … … . . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 2
(𝑁 ∑ 𝑋𝑖 ∑ 𝑋𝑖 ∑ 𝑋 2 𝑖 ) (𝛼 𝛽 ) = (∑ 𝑌𝑖 ∑ 𝑋𝑖 𝑌𝑖 )
(𝑁 ∑ 𝑋𝑖 ∑ 𝑋𝑖 ∑ 𝑋2𝑖 ) = 𝑁 ∑ 𝑋 2 𝑖 − (∑ 𝑋𝑖 )
Calculado para β
(𝑁 ∑ 𝑌𝑖 ∑ 𝑋𝑖 ∑ 𝑋𝑖 𝑌𝑖 ) = 𝑁 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑌𝑖 ∑ 𝑋𝑖
92
Clemente Castilleja Salas
Por lo tanto
𝑁∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑌𝑖 ∑ 𝑋𝑖
𝛽= 2
𝑁∑ 𝑋 2 𝑖 − (∑ 𝑋𝑖 )
𝛼𝑁 + 𝛽 ∑ 𝑋𝑖 = ∑ 𝑌𝑖
𝛽∑ 𝑋𝑖 ∑ 𝑌𝑖
𝛼+ = … … … … … … … … … … … . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 3
𝑁 𝑁
∑ 𝑋𝑖
𝑋=
𝑁
∑ 𝑌𝑖
𝑌=
𝑁
Por lo tanto la Ecuación 3 toma la siguiente forma
𝛼 + 𝛽𝑋 = 𝑌
𝛼 = 𝑌 − 𝛽𝑋
9.2 AJUSTE DE CURVAS Y METODO DE MINIMOS CUADRADOS
Teoría de correlación estadística
OBSERVACIONES X Y
REALES
1 X1 Y1
2 X2 Y2
3 X3 Y3
. . .
. . .
. . .
n Xn Yn
93
Clemente Castilleja Salas
dn
Y=f (t) PUNTO
d5
(OBCERVACIONN REAL)
d3
d1
d4 RECTA
(TEORICA)
d2
VALORES REALES
VALORES OBSERVADOS
y=f(x) Función matemática cualquiera: MODELO TEORICO (infinidad de
posibilidades matemáticas)
MODELO: LINEA RECTA: y= a0 + a1x
A partir de “n” observaciones reales obtener un modelo matemático teórico.
METODO DE MINIMOS CUADRADOS
Recta de ajuste máximo: min( ∑𝑛𝑖=1 𝑑𝑖 2 )
y= a0 + a1 x di = y teórica i – y real i
𝑑𝑖 2 = (Y real i + (a0 + a1 xi ))2
Donde a0, a1 xi son valores teóricos
A ∑𝑛𝑖=1 𝑑𝑖 2 = ( - y1 + (a0 + a1 x1 )) 2 + ( - y2 + (a0 + a1 x2 )) 2 + … + ( - yn + (a0 +
a1 xn ) 2
EL MINIMO SE DARA CUANDO:
I ꝺ di/ ꝺ a0 = 0 II ꝺ di/ ꝺ a1 = 0
I.- 2( - y1 + a0 + a1 x1 ) + 2( - y2 + a0 + a1 x2 ) + … + 2( - yn + a0 + a1 xn )= 0
II.- 2( - y1 + a0 + a1 x1 ) X1 + 2( - y2 + a0 + a1 x2 ) X2 + … + 2( - y1 + a0 + a1 xn ) Xn
=0
94
Clemente Castilleja Salas
Ecuación
I. ∑y = N a0 + a1 ∑X
II. ∑ Xy = a0 ∑ X + a1 ∑ X2
Dónde: X, Y = Son valores constantes observados (o REALES)
a0 , a1 = Son las incógnitas.
∑ y = K2 ; ∑ xy = K3
∑ X = K1 ; ∑ X2 = K4
1.- K2 = N a0 + K1a1 (K1)
2.- K3 = K1 a0 + K4a1 (-N)
3.- -K3N = -N K1 a0 - K4a1
4. - K1K2 = N K1 a2 + K12 a1
- K3 N + K1 K2 = a1 ( K12 - N K4 )
𝐾1 𝐾2 − 𝑁𝐾3 − ∑ 𝑥∑𝑦 + 𝑁 ∑ 𝑥𝑦
𝑎1 = =
𝐾12 − 𝑁𝐾4 −∑ 𝑥2 + 𝑁 ∑ 𝑥2
1. - K4 𝐾2 𝐾4 = 𝑁𝐾4 𝑎0 + 𝐾1 𝐾4 𝑎1
2. - -K1 −𝐾1 𝐾3 = −𝐾12 𝑎0 −𝐾1 𝐾4 𝑎1
𝐾2 𝐾4 − 𝐾1 𝐾3 = 𝑎0 (𝑁𝐾4 − 𝐾12 )
(∑ 𝑥𝑦) − (∑ 𝑥) − (∑ 𝑥)(∑ 𝑦)
𝑎1 =
𝑁(∑ 𝑥 2 ) − (∑ 𝑥)2
95
Clemente Castilleja Salas
9.3 APLICACIONES
Ejemplo 2:
DATOS ESTADISTICOS:
N=12
Y=a0+a1X
∑ 𝑦∑ 𝑥2−∑ 𝑥∑ 𝑥𝑦 1850(53792)−802(124258)
A0 = = (12)(53792)−(802)2
=
𝑁∑ 𝑥2−(∑ 𝑥)2
−60.747
𝑁∑𝑥𝑦−∑𝑥∑𝑦 12(124258)−(802)(1850)
A1 = = = 3.215
𝑁∑𝑥2−(∑𝑥)2 12(53794)−(802)2
96
Clemente Castilleja Salas
ANALISIS DE LA PRODUCCION DE MAIZ EN MEXICO.
SERIES DE TIEMPO
97
Clemente Castilleja Salas
2009- 33.67060 194.4409
10 29.614 100 296.14 97.7646338
2011 99 89
2012- 36.45943 279.9946
11 35.489 121 390.379 248.459559
2014 96 13
2015- 39.24826 381.1033
12 42.401 144 508.812 514.137485
2017 92 78
∑=2046.2 ∑=1449.35
N=13 ∑=78 ∑=256.444 ∑=650
31 322
19.726461
p= 6
5
=2.99348352
INDICE DE CORRELACIÓN
𝑉. 𝐸
𝑟=√ =
𝑉. 𝑇
∑ 𝑦 165.66
𝑌= = = 16.566
𝑁 10
98
Clemente Castilleja Salas
CORRELACION MATEMATICA
Y
194.43755 42.85535
5.78231319
71 3 19.7264 13.18
124.43976 59.23457
8.57114286
19 3 19.7264 12.03
69.997108 51.64434
11.3599725
65 5 19.7264 12.54
31.109597 58.77368
14.1488022
24 9 19.7264 12.06
7.7772276 10.80042
16.9376319
93 5 19.7264 16.44
3.78698E- 343.2274
19.7264615
09 97 19.7264 1.2
7.7779141 3.191224
22.5152912
74 96 19.7264 17.94
31.110970 0.527656
25.3041209
21 96 19.7264 19
69.999168 0.728632
28.0929505
1 96 19.7264 20.58
124.44250 18.00814
30.8817802
78 1 19.7264 23.97
194.44098 97.76463
33.6706099
95 38 19.7264 29.614
279.99461 248.4595
36.4594396
29 59 19.7264 35.489
381.10337 514.1374
39.2482692
83 85 19.7264 42.401
1516.6307 1449.353
sumatoria
94 22
INDICE DE CORRELACIÓN
99
Clemente Castilleja Salas
2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑋𝑃𝐿𝐼𝐶𝐼𝑇𝐴 = ∑ (𝑌𝑇𝑒𝑜𝑟𝑖𝑐𝑎 − 𝑌) =1449.35322
100
Clemente Castilleja Salas
ANEXO
PERMUTACIONES Y COMBINACIONES
10.1 COMBINATORIA
P (n, x, p) = C n,x Px (1 - p)n-x QUE SE DENOMINA COMO FORMULA DE
BERNOULLI
COMBINACIONES DE “n” OBJETOS TOMADOS “X” A LA VEZ.
SUPONER QUE SE TIENEN 3 OBJETOS (SIMBOLOS)
S = {a, b ,c}
SE TOMAN 2 a la vez {a,b}
a P2,1 = 2
b P 2, 1=2
ab COMBINACIONES
ac C3,2 = 3 {B} DE LA SELECCIÓN NO IMPORTA EL ORDEN. SOLO
IMPORTAN LOS OBJETOS
bc
101
Clemente Castilleja Salas
acb bca P3,3 = 6 = 3!/ (3-3)! = 3! = 6
cab cba
abc REGLA B: COMBINACIONES C3,3 = 1
1.- SUPONER QUE SE TIENEN “n” OBJETOS SE TOMAN “n” A LA VEZ.
𝑚𝑢𝑙𝑡𝑖𝑝𝑖𝑐𝑎𝑛𝑑𝑜𝑠 𝑛 (𝑛 − 1) (𝑛 − 2) 3 2 1
( ) ∗ ∗ ∗…∗ ∗ ∗
𝑛𝑢𝑚 𝑑𝑒 𝑜𝑟𝑑𝑒𝑛 1𝑜𝑏𝑗 2𝑜𝑏𝑗 3𝑜𝑏𝑗 (𝑛 − 2)𝑜𝑏𝑗 (𝑛 − 1)𝑜𝑏𝑗 𝑛 𝑜𝑏𝑗
= 𝑃𝑛, 𝑛
Pn,n = n! ARREGLOS.
2.- SE TIENEN “n” Y SE TOMAN “X” A LA VEZ
𝑛 (𝑛 − 1) (𝑛 − 2) (𝑛 − 𝑥 + 2) (𝑛 − 𝑥 + 1)
∗ ∗ ∗…∗ ∗
1𝑜𝑏𝑗 2𝑜𝑏𝑗 3𝑜𝑏𝑗 (𝑥 − 1)𝑜𝑏𝑗 𝑥 𝑜𝑏𝑗
De cuantas formas diferentes se pueden tomar x objetos de un total de n objetos?
Pn,x = 𝑛 (𝑛 − 1)(𝑛 − 2) … (𝑛 − 𝑥 + 1)
𝑛 − 𝑥 (𝑛 − 𝑥 − 1) (𝑛 − 𝑥 − 2) 3.2.1
1= ∗ ∗ …
(𝑛 − 𝑥) (𝑛 − 𝑥 − 1) (𝑛 − 𝑥 − 2) 3.2.1
𝑛!
𝑃𝑛, 𝑥 = 𝑓𝑜𝑟𝑚𝑢𝑙𝑎 𝑑𝑒 𝑝𝑒𝑟𝑚𝑢𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
(𝑛 − 𝑥)!
APLICACIÓN DE PERMUTACIONES
1.- SI SE TIENEN n = 20 OBJ Y SE TOMAN X = 7 A LA VEZ ¿Cuántas permutas
se pueden formar?
20! 20!
1.1.- 𝑃20,7 = (20−7)! = 13! = 20.19.18.17.16.15.14 = 390,700,800
20 19 18 17 16 15 14
1.2.-(1 𝑑𝑒 7)( 2 𝑑𝑒 7) (3 𝑑𝑒 7) (4 𝑑𝑒 7) (5 𝑑𝑒 7) (6 𝑑𝑒 7) (7 𝑑𝑒 7)
¿Y EL NUMERO DE COMBINACIONES?
REGLA B: COMBINACIONES: IMPORTAN SOLO LOS OBJETOS
SELECCIONADOS. NO IMPORTA EL ORDEN EN EL QUE APARESCAN.
SI DE “n” OBJETOS SE TOMAN”X” A LA VEZ.
102
Clemente Castilleja Salas
𝑛!
𝑃𝑛, 𝑥 (𝑛 − 𝑥)! 𝑛!
𝐶𝑛, 𝑥 = = =
𝑃𝑥, 𝑥 𝑥! 𝑥! (𝑛 − 𝑥)!
(𝑥 − 𝑥)!
𝑛!
𝐶𝑛, 𝑥 =
𝑥! (𝑛 − 𝑥)!
103
Clemente Castilleja Salas
La frecuencia relativa que se denota por fr.
La frecuencia acumulada que se denota por Fi.
La frecuencia relativa acumulada que se denota Fr.
Frecuencia es el número de veces que se repite la misma observación. Se simboliza
con fi.
R = Xn – X1
Xn = valor mayor
X1 = valor menor
No existe alguna ley que defina cómo obtener el número de clases; pero la
experiencia recomienda que no sea menor que 5 ni mayor de 20, esto es:
5 ≤ k ≤ 20
k = número de clases
104
Clemente Castilleja Salas
K = 1 + 3.322 (log n)
Dónde:
k = número de intervalos
n = tamaño de la muestra
Log = logaritmo en base 10
Una vez definido el número de clases (k), para obtener la amplitud de clase (A)
aplicamos la siguiente ecuación:
K
A=R
La marca de clase es el valor del punto que se localiza a la mitad del intervalo de
cada clase o intervalo real de clase.
Cuando la variable es discreta sabemos que entre estos valores no hay ninguna
información que se pierda; pero ¿qué pasa si la variable es continua?, en estos
casos si hay la posibilidad que entre el 25 y 26 se pierdan los valores comprendidos
como es 25.1, 25.3, 25.6, etcétera.
105
Clemente Castilleja Salas
Frecuencia acumulada (Fi)
Es la que se obtiene sumando las frecuencias de las clases anteriores con la
frecuencia de ésta.
Su definición matemática es:
Si queremos determinar el número mayor que, lo que tenemos que hacer es des
acumular la frecuencia y para ello en lugar de sumar restamos al número de
observaciones (n) la frecuencia de la clase (fi) correspondiente.
106
Clemente Castilleja Salas
12,5- 0,16 - 183,9603
13-15 15,5 14 6 0,125 8 40 7 84 13,5632 13,5632 9
15,5- 0,37 -9,5632 91,45479
16-18 18,5 17 10 0,208 18 30 5 170 9,5632 4
18,5- 0,70 -3,5632 12,69639
19-21 21,5 20 16 0,333 34 14 8 320 3,5632 4
21,5- 0,87 - 133,7075
22-24 24,5 23 8 0,167 42 6 5 184 11,5632 11,5632 9
24,5- 0,97 - 212,0867
25-27 27,5 26 5 0,104 47 1 9 130 14,5632 14,5632 9
27,5- - 344,5923
28-30 30,5 29 1 0,021 48 0 1 29 18,5632 18,5632 9
TOT
AL 48 1 939 88,9424 1286,96
Calculamos el rango para ello determinamos los valores mayor y menor de las
puntuaciones.
Xn = 29 R = Xn – X1 = 29 – 10 = 19 R = 19
Xi = 10
Calculamos el número de clases (K), para ello determinamos (n)
N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7
Determinamos la amplitud de cada clase
𝑋𝑠 + 𝑋𝐼 10 + 12
𝑀1 = 𝑀1 = = 11
2 2
107
Clemente Castilleja Salas
Determinando la frecuencia relativa para la primera clase.
2
𝐹𝑟 = 48=0.0416 =0.042
48
( −18)
2
𝑀𝑒 = 19 + 3 = 20.125
16
Me = 20.125
108
Clemente Castilleja Salas
La media de datos agrupados.
Para el cálculo de la media en los datos agrupados, realizaremos el producto de la
frecuencia por la marca de clase
Determinando la media.
939
= 19.562
48
A = Intervalo de clase.
Lr = Límite real inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de clase anterior a la modal.
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente.
109
Clemente Castilleja Salas
Calculamos A. Para el cálculo de A se resta al límite superior de cualquier clase, el
límite inferior y al resultado se le suma la unidad. Para la clase modal de nuestro
ejemplo.
A = 12 – 10 + 1 = 2 + 1 = 3
Aplicando la formula
6
𝑀𝑜 = 18.5 + 3 (6+8) = 19.785
La Desviación Media
La desviación (di) que hay de cada observación (Xi) con respecto a la media ( X )
se obtiene mediante la siguiente ecuación:
Este valor D = 0 no nos ayuda en el cálculo; para evitar que la suma sea igual a
cero, se toma el valor absoluto de cada desviación y la
ecuación (12) se transforma en:
110
Clemente Castilleja Salas
La desviación media (DM) es la suma de los valores absolutos de todas las
desviaciones dividido entre el número de datos u observaciones.
889424
𝐷𝑚 = = 18529.666
48
La Varianza
Desviación Estándar.
Es una medida de dispersión que es igual a la raíz cuadrada de la varianza
2
𝑆 = √27.382 = 5.2
111
Clemente Castilleja Salas
1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus límites
reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas en
que ocurre la variable.
2. Por los límites reales superior e inferior de cada clase se trazan barras verticales
que se cortan mediante una horizontal que se traza a la altura del punto
Correspondiente a la frecuencia de cada clase.
Histograma
112
Clemente Castilleja Salas
113
Clemente Castilleja Salas
114
Clemente Castilleja Salas
Bibliografía.
Colegio de bachilleres.
Fascículo 1 y 2 de Estadística descriptiva e inferencia
http://www.conevyt.org.mx/index.php?option=com_content&view=article&id=531&It
emid=1089
Ejemplo:
La duración de llantas en miles de kilómetros se muestra en la siguiente tabla:
40.1 42.1 44.2 48.9 40.6 43.9 49.1 42.8 43.7 41.8
47.5 42.6 41.3 42.3 46.9 46.7 46.1 39.1 41.5 45.5
46.9 41.9 48.2 44.4 46.7 44.7 50.8 37.4 43.3 48.3
45.8 43.9 49.8 47.7 44.5 43.6 51.2 40.7 43.9 44.8
47.2 46.7 47.9 47.7 43.4 4631 44.1 39.6 47.0 45.0
45.2 50.2 42.6 45.5 40.4 43.1 42.9 48.8 52.0 46.0
115
Clemente Castilleja Salas
Construir la tabla de frecuencia, con solo 5 intervalos, elaborar Histograma y
polígono de Frecuencias.
116
Clemente Castilleja Salas
37.25 – 38.75 3 3 116.25 40.32 120.96
40.25
40.25 - 41.75 14 17 584.50 11.22 157.08
43.25
43.25 – 44.75 21 38 939.75 0.12 2. 52
46.25
46.25 - 47.75 17 55 811.75 7.02 119.34
49.52
49.25 – 50.75 5 60 253.75 31.92 159.00
52.25
∑𝑛 ∑𝑘 𝑛
Media 𝑥= 𝑖=1 𝑥𝑖 𝑖=1 𝑥𝑖 𝑓𝑖 𝑀𝑥 𝑀𝑧
𝑥= +∞ +∞
𝒙 𝑛 ∑𝑘
𝑖=1 𝑓𝑖 𝑀𝑥 = ∑ 𝑥𝑖 𝑃(𝑥𝑖 )
𝑖=1
=∫ 𝑥𝑓(𝑥)𝑑𝑥
=∫ (𝑧)𝑓(𝑧)𝑑𝑧
−∞ −∞
=0
117
Clemente Castilleja Salas
Varian ∑𝑛𝑖=1 (𝑥𝑖 − 𝑥)2
2
2
∑𝑛𝑖=1 (𝑥𝑖 − 𝑀𝑋 )2 𝑃(𝑥𝑖 ) 𝜎 2 = 𝜎 2=
za 2
𝑆 = 𝑠 𝑆 = +∞ +∞
𝑛 𝑛 ∫−∞ (𝑥 − ∫−∞ (𝑧)2 𝑓(𝑧)𝑑𝑧 =
𝑺𝟐 ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥)2 𝑀𝑥)2 𝑓(𝑥)𝑑𝑥 1
=
∑𝑘𝑖=1 𝑓𝑖
Ejemplo:
La duración de llantas en miles de kilómetros se muestra en la siguiente tabla:
40.1 42.1 44.2 48.9 40.6 43.9 49.1 42.8 43.7 41.8
47.5 42.6 41.3 42.3 46.9 46.7 46.1 39.1 41.5 45.5
46.9 41.9 48.2 44.4 46.7 44.7 50.8 37.4 43.3 48.3
45.8 43.9 49.8 47.7 44.5 43.6 51.2 40.7 43.9 44.8
47.2 46.7 47.9 47.7 43.4 4631 44.1 39.6 47.0 45.0
45.2 50.2 42.6 45.5 40.4 43.1 42.9 48.8 52.0 46.0
118
Clemente Castilleja Salas
10.3 PARAMETROS
Medi ∑𝑛
𝑖 =1 𝑥𝑖 𝑥= 𝑀𝑥 𝑀𝑥 𝑀𝑧
𝑥= 𝑛 +∞ +∞
a 𝑛 ∑𝑘 =1 𝑥𝑖 𝑓𝑖
𝑖
𝒙 𝑘
∑𝑖 = 𝑓𝑖 =∑ 𝑥𝑖 𝑃(𝑥𝑖 ) =∫ 𝑥𝑓(𝑥)𝑑𝑥
=∫ (𝑧)𝑓(𝑧)𝑑𝑧
−∞ −∞
𝑖=1 =0
𝑓(𝑥; 𝛼, 𝛽) =
0 PARA CUALQUIER OTRO VALOR
119
Clemente Castilleja Salas
1
𝛤(𝛼 + 𝛽) 𝛼−1 𝛤(𝛼 + 𝛽) 1
∫ 𝑥 (1 − 𝑥)𝛽−1 𝑑𝑥 = ∫ 𝑥 𝛼−1 (1 − 𝑥)𝛽−1 𝑑𝑥
0 𝛤(𝛼)𝛤(𝛽) 𝛤(𝛼)𝛤(𝛽) 0
𝛤(𝛼 + 𝛽)
= 𝐵(𝛼, 𝛽) = 1
𝛤(𝛼)𝛤(𝛽)
𝛼 𝛼𝛽
De manera similar: 𝐸[𝑥] = 𝛼+𝛽 𝑉𝐴𝑅[𝑥] = (𝛼+𝛽)2 (𝛼+𝛽+1)
Función GAMMA
𝛼
Primera presentación: 𝛤(𝑛) = ∫0 𝑒 −𝑥 𝑥 𝑛−1 𝑑𝑥 para: n >0 x
∈ (0, α)
Considerando que: Si: 𝑢 = 𝑒 −𝑥 𝑑𝑣 = 𝑥 𝑛−1 𝑑𝑥
1
𝑑(𝑢𝑣) = 𝑢𝑑𝑣 + 𝑣𝑑𝑢 𝑑𝑢 = −𝑒 −𝑥 𝑑𝑥 𝑣 = 𝑛 𝑥𝑛
1
𝑢𝑣 = ∫ 𝑢𝑑𝑣 + ∫ 𝑣𝑑𝑢 Entonces: 𝛤(𝑛) = 𝑛 𝑥 𝑛 𝑒 −𝑥 ]𝛼0 +
𝛼 1
∫0 𝑥 𝑛 𝑒 −𝑥 𝑑𝑥
𝑛
Entonces:
120
Clemente Castilleja Salas
𝛼 𝛼 𝛼
1 𝑥 1 1
∫ 𝑥 𝛼−1 𝑒 −𝜃 𝑑𝑥 = ∫ 𝑥 𝛼−1 𝑒 𝜇 𝜃𝑑𝜇 = ∫ 𝜇 𝛼−1 𝑒 𝜇 𝑑𝜇 = 1
𝛤(𝛼)𝜃 𝛼 0 𝛤(𝛼)𝜃 𝛼 0 𝛤(𝛼) 0
121
Clemente Castilleja Salas
O = Datos observados e = Datos esperados/ Teóricos
Distribución Chi-cuadrado
Sea el estadístico
𝑁𝑠 2 (𝑋1 −𝑋)2 (𝑋2 −𝑋)2 +⋯+(𝑋𝑛 −𝑋)2
𝑥2 = = donde x es la letra griega chi y x2 se lee chi
𝜎2 𝜎2
cuadrado
Se consideran muestras de tamaño N extraídas de una población con desviación
típica 𝜎, donde se calcula el valor de x2 para obtener la distribución muestral para
x2
Bondad de ajuste
Utilizar la prueba de Chi-cuadrado para determinar la bondad de ajuste de los datos
del siguiente problema
Resultados obtenidos al realizar 1000 series de lanzamientos de una moneda (5 por
serie)
122
Clemente Castilleja Salas
En la tabla se han obtenido estas probabilidades, así como frecuencias (teóricas) y
las observadas. El ajuste se observa que es bueno
Distribución hipergeométrica
Sea N el número total de objetos en una población finita, de manera tal que k de
estos es de un tipo y N – k de otros. Si se selecciona una muestra aleatoria de la
población constituida por n objetos de la probabilidad de que x sea de un tipo y n –
x sea del otro, está dada por la función de probabilidad hipergeométrica
(𝑘 𝑥 )(𝑁−𝑘 𝑛−𝑥 )
P(x; N, n, k) = (𝑁 𝑛 )
, x = 0, 1, 2, …, n; x ≤ k, n –
x ≤ N – k;
0 N, n, k enteros positivos, para cualquier otro valor
123
Clemente Castilleja Salas
ninguno de los motores presenta serios problemas, el fabricante acepta el lote; de
otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, ¿Cuál es
la probabilidad de que sea aceptado?
Sea X el número de motores defectuosos en la muestra. Para N = 40, n = 8 y k = 2,
la probabilidad de aceptación es
(2 0 )(38 8 )
𝑃(0; 40,8,2) = = 0.6359
(40 8 )
N Núm. de objetos k Tienen la característica “A”
N – k Tienen la característica “B”
N Muestra aleatoria X Tienen la característica “A”
Del conjunto N n – x Tienen la característica “B”
Determina la probabilidad de que X tengan la característica “A” y (n – x) la
característica “B”. Considerando que la muestra “n” es sin remplazo, lo cual implica
que los eventos no tienen independencia
𝐶𝑁,𝑛 Número total de arreglos de N objetos tomados n a la vez
𝐶𝑘,𝑥 Numero total de arreglos de los k objetos con la característica “A” tomados x
a la vez
𝐶(𝑁−𝑘),(𝑛−𝑥) Numero total de arreglos de los (N – k) objetos con la característica
“B” tomados (n – x) a la vez
Por tanto, la probabilidad de obtener “x” con característica “A” en la muestra “n” es
igual a:
𝐶𝑘,𝑥 ∙ 𝐶(𝑁−𝑘),(𝑛−𝑥)
𝑃(𝑥; 𝑛, 𝑁, 𝑘) =
𝐶𝑁,𝑛
Piezas industriales que se surten en lotes de 60 unidades
Cierto comprador acostumbra inspeccionar con detenimiento una muestra de 10
unidades. Si encuentra uno o más defectuosos rechaza el lote de 60 en su totalidad
Analizar la probabilidad de que ese comprador acepte lotes que contengan r
DEFECTUOSOS, con r = 1, 2, 3, etc. y x = 0 en cada muestra de 10
1.- r = 1
Datos: N = 60 TOT. k = 1 en el lote de 60 n = 10 Muestral x
=0
𝐶𝑘,𝑥 ∙ 𝐶(𝑁−𝑘),(𝑛−𝑥)
𝑃(𝑥; 𝑛, 𝑁, 𝑘) =
𝐶𝑁,𝑛
124
Clemente Castilleja Salas
𝐶1,0 ∙ 𝐶59,10
𝑃(0; 10,60,1) =
𝐶60,10
En este caso: Característica “A” es “DEFECTUOSO”
Característica “B” es “NO DEFECTUOSO”
1! 59!
0! (1 − 0)! 10! (59 − 10)! 6.282 𝑥1010
𝑃(0; 10,60,1) = = = 0.8332
60! 7.539𝑥1010
10! (60 − 10)!
2.- r = 2
Datos: N = 60 k=2 n = 10 x=0
2! 58!
𝐶2,0 ∙𝐶58,10 0!(2−0)!10!(58−10)! 5.217𝑥1010
𝑃(0; 10,60,2) = = 60! = = 0.6921
𝐶60,10 7.539𝑥1010
10!(60−10)!
125
Clemente Castilleja Salas
VI.- EXAMEN COMO TAREA
VII.- De las funciones de Bernoulli y Poisson hacer una comparación con los datos:
Número de experimentos (n=30)
Con una probabilidad de éxitos independientes (P=0.1)
Obtener:
P(ẋ)=?
mx=?
σx2=?
Y graficar P(ẋ)
N=20
P=0.24
Graficar, E(esperanza
matemática,
Var(varianza).
N=100 405
P=0.01 X=0123,4
N= 100/50
IX.- Curva Normal σx= 3
σx2=9
126
Clemente Castilleja Salas
XI.- Nivel de confianza de (99%, 95%, 90%) con (n= 400) y (P=0.5 ½ )
127
Clemente Castilleja Salas