0% encontró este documento útil (0 votos)
89 vistas112 páginas

APUNTES 1 PyE

El documento presenta conceptos básicos de probabilidad como variables aleatorias discretas y continuas, eventos independientes, fórmulas de probabilidad para eventos independientes y un ejemplo numérico para calcular la probabilidad de varios arreglos posibles en lanzamientos de monedas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
89 vistas112 páginas

APUNTES 1 PyE

El documento presenta conceptos básicos de probabilidad como variables aleatorias discretas y continuas, eventos independientes, fórmulas de probabilidad para eventos independientes y un ejemplo numérico para calcular la probabilidad de varios arreglos posibles en lanzamientos de monedas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

|X1 –X2| <= 10

a) X1 – X2 = 10
b) X2 – X1 = 10

P (A) = N (A)/N(S) VAIABLE DISCRETA.

P (A) = AREA (A)/AREA (S) VARIABLE CONTINUA.

AREA SOMBREADA = AREA TOTAL – 2 ((50 X 50)/2)

= (60 X 60) – 2500 = 1100

P (ENCUENTRO) = AREA SOMBREADA/ AREA TOTAL =1100/3600 = 11/36

3.1 INDEPENDENCIA Y EXCLUSIVIDAD

Eventos independientes Eventos Dependientes


El evento A y el evento B son El evento A y el B son
Independientes si la ocurrencia dependientes si la
ocurrencia
De "A" no afecta la probabilidad de de "A" si afecta la
probabilidad de
que ocurra B y viceversa. que B si ocurra.

Ejemplo: Ejemplo:
- Monedas Urna en muestreo sin
- Dados remplazo.
- Urnas (muestreo con remplazo)
- Tiro al blanco

16
Clemente Castilleja Salas
Ejemplo:

LANZAMIENTOS DE UNA
MONEDA INTENTOS PROBABILIDAD

1 P(aguila1) = p(s)= ½

2 P(aguila2)=1/2 p(s1)=1/2

3 P(sol3)=1/2 p(a3)=1/2

¿Por qué?
● Son independientes
● Es un concepto intuitivo
● Reproducción teórica del fenómeno y se deduce que es así.
● Por experiencia se ha observado así.
● También por reproducción o repetición del experimento.
Fenómeno de independencia
2 Monedas
P (s1a2) = 1/4 = P (s1) p (a2) = ½*1/2 (Por definición clásica)

A₁S₂ S₁S₂ 𝑁(𝐴₁𝐴₂) 1


S₂ P(A₁A₂)= =4
𝑁(𝑆)
A₁A₂ S₁A₂
A₂

A₁ S₁

3 monedas
P (s1a2s3) =1/8 =p (s1) p (a2) p (s3) = (1/2)*(1/2)*(1/2)
=1/8

17
Clemente Castilleja Salas
S₃
A₃

S₁A₂S₃
S₂

A₂

A₁ S₁

N monedas
P(s1+a2s3…….An=1/2n=p(s1)p(a2)……..p(An)=(1/2)(1/2)……(1/2)=1/2n
PARA CUALQUIER EVENTO Ai i=1, 2,……., n
P (A1 A2 …….An) = p (A1) p (A2)………..p (An)
Siendo P (Ai) mayor o igual a 0 y menor o igual a 1, además son independientes
entre sí.

Demostración
𝑁(𝐴₁𝐴₂…𝐴𝑛 ) 1
P(A₁A₂…𝐴𝑛 )= =
𝑁(𝑆) 2𝑛

Cuando son 2 monedas


1
P(A₁)P(A₂)= ½ *½=
22
Para 3 monedas
1
P(A₁)P(A₂)P(A₃)= ½ * ½ * ½ =
23

Para n monedas
1
P(A₁A₂…𝐴𝑛 )= ½ * ½ *… * ½ =
2𝑛

A₁ y A₂ son eventos independientes si la ocurrencia de A₁ no afecta la


probabilidad de ocurrencia de A₂ y viceversa.
Si A₁A₂…𝐴𝑛 son eventos cualesquiera y son independientes, entonces,
P (A₁A₂…𝐴𝑛 )=∏𝑛𝑖=1 𝑃(𝐴𝑖 )
P(⋂𝑛𝑖=1 𝐴𝑖 )= ∏𝑛𝑖=1 𝑃(𝐴𝑖 ) Formula de multiplicación de probabilidad para
eventos independientes

18
Clemente Castilleja Salas
La diferencia entre probabilidad clásica y probabilidad frecuencial radica en que
la primera se obtiene sin efectuar el experimento, y la segunda después de
haberlo efectuado un gran número de veces.

Ejemplo 1:
Sea un experimento de tiro al blanco con dos resultados posibles Acertar o Fallar.

2 3
P (Acertar en un intento) = ( ) P (Fallar en un intento) = ( )
5 5

x= Números de aciertos
La suma de las dos probabilidades
5
∑= ( ) = 1
5

Se realiza un experimento

Acertar (A₁) Fallar(F₁)

2 experimentos

A₁ A₂ 4
P(A₁)P(A₂)= 2/5 * 2/5 =
25

F₁ F₂ 6
P(A₁)P(F₂)= 2/5 * 3/5 =
25
6
P(F₁)P(A₂)= 2/5 * 3/5 =
25
9
P(F₁)P(F₂)= 3/5 * 3/5 =
25

S₂
F₂
A₁A₂ F₁A₂
A₂

A₁ F₁

19
Clemente Castilleja Salas
numero de arreglos 𝑛! donde n es el número de objetos totales y x es el
𝐶𝑛,𝑥 =
𝑥!(𝑛−𝑥)!
numero de objetos que se tomaran

x=número de éxitos 0,1,2,3,4

x= variable aleatoria, discreta o entera, y positiva

Hay que considerar que se hacen 4 intentos: n=4

Xi Resultados posibles (P) de cada serie de resultados


Arreglos

X=4 A1 A2 A3 A4 (2/5) (2/5) ((2/5) (2/5)= (2/5) ^4

f(x=4)= 2 ^4 A=1
( )
5
X=3 F1 A2 A3 A4 (3/5) (2/5) (2/5) (2/5)= (3/5) (2/5) ^3

A1 F2 A3 A4 (2/5) (3/5) (2/5) (2/5)= (3/5) (2/5) ^3

f(x=3)= 4 2 ^3 3 A=4
( ) ( )
5 5
A1 A2 F3 A4 (2/5) (2/5) (3/5) (2/5)= (3/5) (2/5) ^3

A1 A2 A3 F4 (2/5) (2/5) (2/5) (3/5)= (3/5) (2/5) ^3

X=2 F1 F2 A3 A4 (3/5) (3/5) (2/5) (2/5)= (2/5) ^2(3/5) ^2

A1 F2 F3 A4 (2/5) (3/5) (3/5) (2/5)= (2/5) ^2(3/5) ^2

A1 A2 F3 F4 (2/5) (2/5) (3/5) (3/5)= (2/5) ^2(3/5) ^2

f(x=2)= 6 2 ^2 3 ^2 A=6
( ) ( )
5 5
F1 A2 F3 A4 (3/5) (2/5) (3/5) (2/5)= (2/5) ^2(3/5) ^2

A1 F2 A3 F4 (2/5) (3/5) (2/5) (3/5) = (2/5) ^2(3/5) ^2

F1 A2 A3 F4 (3/5) (2/5) (2/5) (3/5) = (2/5) ^2(3/5) ^2

X=1 A1 F2 F3 F4 (2/5) (3/5) (3/5) (2/5) (2/5) (3/5) ^3

F1 A2 F3 F4 (3/5) (2/5) (3/5) (3/5) (2/5) (3/5) ^3 f(x=1) = 4 2


( )
5
3
( )^3 A=4
5

20
Clemente Castilleja Salas
F1 F2 A3 F4 (3/5) (3/5) (2/5) (3/5) (2/5) (3/5) ^3

F1 F2 F3 A4 (3/5) (3/5) () 3/5) (2/5) (2/5) (3/5) ^3

X=0 F1 F2 F3 F4 (3/5) (3/5) (3/5) (3/5) (3/5) ^4

f(x=0) = 3 ^4 A=1
( )
5

Siempre que Ai sea INDEPENDIENTE


2 𝑥 3 4−𝑥
P (X aciertos en 4 intentos) = K (5) (5)

¿Cómo determinar el valor de K considerando N intentos?

VARIABLE ALEATORIA
¿Qué es una variable o fenómenos aleatorios y valor aleatorio?
El concepto de variable aleatoria proporciona un medio para relacionar cualquier
resultado con una medida cuantitativa.
Sea S un espacio muestral, y sea x una función de valor real definida sobre S, de
manera que transforme los resultados de S en punto sobre la recta de los reales,
se dice entonces que x es una variable aleatoria.
Se dice que x es aleatoria porque involucra la probabilidad de los resultados de
espacio muestral y x es una función definida sobre el espacio muestral, de manera
que transforma todos posibles resultados del espacio muestral en cantidades
numéricas.
● Ejemplo:
Para ilustrar la noción de variable aleatoria considérese el lanzamiento de una
moneda. El espacio muestral está constituido por dos posibles resultados, “cara” y
“cruz”.

Sea: X (cruz)=0 y X (cara)=1; Des esta manera se han transformado los dos
posibles resultados del espacio muestral en puntos sobre la recta de los reales.

Por P(X=0) se entenderá la probabilidad de que la variable aleatoria tome el valor


de 0 de manera equivalente, la probabilidad de que caiga cruz se lance la
moneda.

21
Clemente Castilleja Salas
EJEMPLO CON UNA MONEDA

1 Moneda A S
P(X) =1/2
X=0, 1 N (S1) =2= 21

2 Monedas

S/1
C/0
0/c 1/s

P(X1, X2) = X1=X2=0, 1


P (C1, S2) = ¼
N (S2) =4= 22

Determinación de los espacios muéstrales


Numero Numero de
Monedas Dimensión de S Dados
Dimensión de S.

1 21 1
61
2 22 2
62
3 23 3
63
N 2n n
6n

22
Clemente Castilleja Salas
Urnas (1 bola Negra, 10 bolas Blancas)
P (N) = 1/10 P (B) = 10/11

P (N) = 1/100. P (B) = 100/1011


P (N) = 1/1000 P (B) = 1000/1001

El posible valor de la variable aleatoria es finito. Sin embargo, se pueden definir


variables aleatorias cuyos valores sean contables o no.
Es una caracterización cuantitativa de los resultados de un espacio muestral, esta
posee intrínsecamente la naturaleza discreta o continua de este espacio.
Se dice que una variable aleatoria X es continua si sus valores consisten en uno o
más intervalos de la recta de los reales.
Se dice que una variable aleatoria X es continua si sus valores consisten en uno o
más intervalos de la recta de los reales.
Ejemplos:
Espacio de eventos del lanzamiento de un dado. S: 1, 2, 3, 4, 5, 6.
Espacio de un evento del lanzamiento de una moneda. S: Águila o sol.

Se llama evento simple o elemental de un experimento, a cada uno de los


elementos que constituyen un espacio de eventos.
El lanzamiento de una moneda al aire tiene dos posibles resultados, o dos eventos
simples: que caiga Águila o que caiga sol.

Fórmula para obtener la probabilidad clásica o teórica:

23
Clemente Castilleja Salas
Ejemplo:
¿Cuál es la probabilidad de sacar al azar una canica roja de una bolsa que
contiene 3 canicas negras, 5 amarillas y 2 rojas?
r = rojas
n = negras
a = amarillas

Suma de Probabilidades

Si A y B son dos eventos mutuamente excluyentes (eventos no intersectan tés),


es decir, si la ocurrencia de cualquiera de ellos excluye la del otro, no pueden
ocurrir a la vez, o cuando no tienen ningún punto muestral en común entonces
se aplica la siguiente regla para calcular dicha probabilidad:

P(A o B) = P(A) + P (B) o = Unión

Ejemplo:
Sea A el suceso de sacar un As de una baraja estándar de 52 cartas y B sacar un
Rey de corazón rojo. Calcular la probabilidad de sacar un As o un Rey de corazón
rojo en una sola extracción.

Solución:
A y B son sucesos mutuamente excluyentes porque no es posible obtener ambos
a la vez.
Las probabilidades son:

24
Clemente Castilleja Salas
Reemplazando los anteriores valores en la regla particular de la adición de
probabilidades para eventos exclusivos se obtiene:

Ejemplo 2: Que caiga dos veces la misma cantidad


P(a1)=1/36 P(a1+a2)=3/16=p(a1)+p(a2)
P (a2)=2/36 p (a1)= (a1+a2+a3)=6/36=p (a1)+p (a2)+p (a3)
Axiomas de Suma de Probabilidades
-P(A)= i=1£n P(A)
-A=∑𝑁
𝐼=1 𝐴𝑖; A € S
-A П B= φ

Multiplicación de Probabilidades

Se dice que dos sucesos aleatorios son independientes entre sí cuando


la probabilidad de cada uno de ellos no está influida porque el otro suceso
ocurra o no, es decir, cuando ambos sucesos no están relacionados.
La probabilidad independiente se obtiene cuando se experimenta un gran número
de veces el mismo fenómeno en condiciones semejantes, pero no afectando su
probabilidad de ocurrencia entre sí.
Formula de la Multiplicación de probabilidades.

Ejemplo: El siguiente es el registro de los lanzamientos de una moneda realizados


por tres equipos para obtener Águilas, y la probabilidad frecuencia de cada serie
de lanzamientos.

25
Clemente Castilleja Salas
3.2 FORMULAS DE SUMA Y MULTIPLICACIÓN DE PROBABILIDADES

Ejemplo 2: Que caiga dos veces la misma cantidad

P (a1)=1/36 P (a1+a2)=3/16=p (a1)+p (a2)

P (a2)=2/36 p (a1)= (a1+a2+a3)=6/36=p (a1)+p (a2)+p (a3)

Axiomas de Suma de Probabilidades

-P(A)= i=1£n P(A)

-A=∑𝑁
𝐼=1 Ai; A € S

-A П B= φ

Multiplicación de Probabilidades

Se dice que dos sucesos aleatorios son independientes entre sí cuando


la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra
o no, es decir, cuando ambos sucesos no están relacionados.

La probabilidad independiente se obtiene cuando se experimenta un gran número


de veces el mismo fenómeno en condiciones semejantes, pero no afectando su
probabilidad de ocurrencia entre sí.

26
Clemente Castilleja Salas
Formula de la Multiplicación de probabilidades.

Ejemplo: El siguiente es el registro de los lanzamientos de una moneda realizados


por tres equipos para obtener Águilas, y la probabilidad frecuencial de cada serie de
lanzamientos.

Ejemplo:

LANZAMIENTOS DE UNA

MONEDA INTENTOS PROBABILIDAD

1 P(aguila1) = p(s)= ½

27
Clemente Castilleja Salas
2 P(aguila2)=1/2 p(s1)=1/2

3 P(sol3)=1/2 p(a3)=1/2

4.1 PROBABILIDAD CONDICIONAL

Eventos independientes Eventos Dependientes

El evento A y el evento B son El evento A y el B son

Independientes si la ocurrencia dependientes si la ocurrencia

de A no afecta la probabilidad de de A si afecta la probabilidad de

que ocurra B y viceversa. que B si ocurra.

Ejemplo: Ejemplo:

- Monedas Urna en muestreo sin

- Dados remplazo.

- Urnas (muestreo con remplazo)

- Tiro al blanco

28
Clemente Castilleja Salas
Ejemplo:

Sea una urna o caja negra con:

20 esferas Negras y 80 Esferas Blancas.

Muestreo con remplazo: Muestreo sin remplazo

80 20 80 20
M1 P (B)= 100: P(N)= 100 P (B₁)= 100 P (N₁)= 100

Salió N₁ Salió B₁

80 20 80 79
M2 P (B)= 100: P(N)= 100 P (B₂│N₁)= 99 P (B₂│B₁)= 99

19 20
P (N₂│N₁)= 99 P (N₂│B₁)= 99

Salió N₂ Salió B₂

80 20 80 20
M3 P (B)= 100: P(N)= 100 P (B₃│N₁ N₂)= 98 P (B₃│B₁ B₂)= 98

79 19
P (B₃│B₁ N₂)= 98 P (B₃│N₁ B₂)= 98

18 20
P (N₃│N₁ N₂)= 98 P (N₃│B₁ B₂)= 98

19 19
P (B₃│B₁ N₂)= 98 P (N₃│N₁ B₂)= 98

29
Clemente Castilleja Salas
En general:

Sean A y B dos eventos independientes cualquiera y S el universo al que pertenece,


representados a continuación mediante un diagrama de VENN:

𝑁(𝐴) 𝑁(𝐵)
P (A) =𝑁(𝑆) P (B) = 𝑁(𝑆)

B
A

A.B

Considerando que el evento “B” ocurrió, pudo haber sido en la intersección con A
de tal forma que la nueva probabilidad es (A│B) es:

𝑁(𝐴∩𝐵) 1
P (A│B)= si se divide por 𝑁(𝑆) numerador y denominador
𝑁(𝐵)

𝑁(𝐴∩𝐵)/𝑁(𝑆) 𝑃(𝐴∩𝐵)
P (A│B)= = (Formula General para determinar la
𝑁(𝐵)/𝑁(𝑆) 𝑃(𝐵)

Probabilidad de Eventos Dependientes)

Ejemplo 1:

PROBLEMA DEL ENCUENTRO

El tren X llega a cierta estación al azar en el intervalo de tiempo (0,T) se detiene A


minutos y continúa su viaje. El tren Y arriba al azar, independientemente durante el
mismo intervalo (0,T), se detiene B minutos y se retira.

30
Clemente Castilleja Salas
1) Encontrar la probabilidad P de que X llegue antes que Y.

2) Encontrar la probabilidad P2 de que los trenes X e Y se encuentren en la


estación.

3) Suponiendo que hay encuentro, encontrar la probabilidad de que X llegue


antes que Y

INCISO 1

Y T2

T X: hora de llagada del tren X

X˂Y Y: hora de llegada del tren Y

X llega antes que Y si X˂Y

t2 ------------

0 t1 T X-T1

Por ejemplo:

Si X=t1 y Y=t2; X˂Y

Y en general el triángulo superior G1 es X˂Y por lo tanto:

P (tren x llegue antes que el tren y)=P (y)= T2/2 / T2 = ½ o sea P1=1/2

31
Clemente Castilleja Salas
INCISO 2

Y T2

VT X ≤Y; X llega antes, espera “a” minutos y se


retira.

Y≤X; Y llega antes espera “b” minutos y se


retira

0 X-T1

B T

En general X-Y≤ a y Y-X≤ b

Si X llega antes: x-y≤a

P[encuentro]=P

Si Y llega antes: y-x≤b

P (encuentro)=𝑃[(𝑥 − 𝑦) ≤ 𝑎) ∪ (𝑦 − 𝑥 ≤ 𝑏)]

𝑇 2 (𝑇 − 𝑎)2 𝑇 2 (𝑇 − 𝑏)2
[[ 2 − ] + [ 2 − ]]
2 2
𝑃(𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑜) =
𝑇2

32
Clemente Castilleja Salas
1 1 1 1
[[ ]+[ 2 ]] [[ ]+[ ]]
2(𝑇2 −(𝑇2 −2𝑇𝑎+𝑎2 )] 2[𝑇 −(𝑇2 −2𝑇𝑏+𝑏2 )] 2(2𝑇𝑎−𝑎2 ) 2(2𝑇𝑏−𝑏2 )
= =
𝑇2 𝑇2

P= (encuentro)= [Ta-1/2 a2 +Tb-1/2 b2]/T2= [a+b/T]-[a2+b2]/ [2T2]

INCISO 3

Suponiendo que hay encuentro encontrar la probabilidad P 3 de que llegue X antes


que Y.

P [x llega antes que y│ocurre encuentro]=P [x≤y│-a≤x-y≤b]

Si x llega antes: x-y≤a

Dado que: P (encuentro)= =P (-a≤x-y≤b)

Si y llega antes: y-x≤b

P (x˂y│-a≤x-y≤b)= [P [x˂y] ∩ [-a≤x-y≤b]/P (-a≤x-y≤b)

P [(x˂y) ∩ (-a≤x-y≤b)]=a/T-a2/2T2 FRANJA SUPERIOR DEL ÁREA DE


ENCUENTRO

1 1
[ ] [ ]
𝑇2 (𝑇−𝑎)2 2[𝑇2 (𝑇2 −2𝑇𝑎+𝑎2 )] 2(2𝑇𝑎−𝑎2 ) 𝑎 𝑎2
DADO QUE: − = = = −
2 2 𝑇2 𝑇2 𝑇 2𝑇 2

FINALMENTE

33
Clemente Castilleja Salas
𝑎 𝑎2 2𝑎𝑇 − 𝑎2

𝑇 2𝑇 2 2𝑇 2
𝑥= 2 2 =
𝑎+𝑏 𝑎 +𝑏 2(𝑎 + 𝑏)𝑇 − (𝑎2 + 𝑏 2 )
− 2
𝑇 2𝑇 2𝑇 2

(2𝑎𝑇 − 𝑎2 )2𝑇 2 (2𝑎𝑇 − 𝑎2)


=
[2𝑇(𝑎 + 𝑏) − (𝑎2 + 𝑏 2 )]2𝑇 2 2𝑇(𝑎 + 𝑏) − (𝑎2 + 𝑏 2 )

(2𝑎𝑇−𝑎2)
O sea P X llega antes ocurre =
2𝑇(𝑎+𝑏)−(𝑎2 +𝑏 2 )

qué y encuentro

Ejemplo 2:

Sean 25 urnas tipo “A” y 75 urnas tipo “B”


La urna “A” contienen 20 esferas Negras y 80 esferas Blancas.
La urna “B” contienen 10 esferas Negras y 90 esferas Blancas.

Se realiza el siguiente experimento:


1) Se toma una urna al azar.
2) Se toma una esfera al azar de esa urna

34
Clemente Castilleja Salas
Determinar la probabilidad de que la esfera sea Negra

P (*N)=P () P (N│)
P (N│)=
==

P ()=
P (*B)=P () P (B│)

==
P (B│)=

P (*N) =P () P (N│)

===

P (N│)=
P ()=

P (*B) =P () P (B│)

===
P (B│)=

10000
∑=10000 = 1

Paso 1: Tomar una urna Paso 2: Tomar una esfera


S
B

*N *N

P(N)= P (UA*N)+P (UB*N)= P (UA) P (N│UA)+P (UB) P (N│UB)

50 75 125
= 1000 + = 1000 = 0.125
1000

35
Clemente Castilleja Salas
Ejemplo 3
De probabilidad Condicional.
Urnas tipo A, B, y C que contienen esferas blancas y negras de acuerdo a lo
siguiente:

Urna A B C
Tipo 60 Urnas 30 Urnas 10 Urnas
Esferas Esferas Esferas Esferas Esferas Esferas
BlancNegra Blanca Negra Blanca Negra

90 10 95 5 99 1

Total 100 100 100


P(N)=P(𝑈𝐴 ∗ 𝑁)+P(𝑈𝐵 ∗ 𝑁)
Experimento:
1) Se toma una urna al azar
2) Se toma esfera al azar de la Urna seleccionada
3) ¿Cuál es P(N)?
4) Si se tomó una esfera al azar, de una urna al azar, y resulto
esfera negra, ¿Cuál es la probabilidad de que la urna
seleccionada haya sido la urna A, P (𝑈𝐴 │N)?

Urna
Color A B C
Esfera 60 Urnas 30 Urnas 10 Urnas

B 90 95 99

N 10 5 1

∑ 100 100 100

36
Clemente Castilleja Salas
1ra Parte del experimento:
60 30 10
P (UA)= 100 P (UB)= 100 P (UC)= 100

2da Parte del experimento:


10 5 1
P (UA)= 100 P (UB)= 100 P (UC)= 100
90 95 99
O bien: P (B│UA)= 100 P (B│UB)= 100 P (B│UC)= 100

Árbol de probabilidad:

A~

B~ P (N│) = 10/100

C~

P (B│) = 90/100
P () = 6/10

P (N│) = 5/100

P () = 3/10

P (B│) = 95/100

P (N│) = 1/100

P () = 1/10

P (B│) = 99/100

1ra Parte 2ra Parte

37
Clemente Castilleja Salas
N

*N *N *N S

(𝐴1 *N); (𝐴2 *N) y (𝐴3 *N) Son subconjuntos que entre si son:
● Exclusivos o
● Mutuamente excluyente

Por lo tanto:
N= (𝐴1 *N) + (𝐴2 *N) +(𝐴3 *N)
B= (𝐴1 *B) + (𝐴2 *B) +(𝐴3 *B)
● P(N) = P(𝐴1 *N)+P(𝐴2 *N)+P(𝐴3 *N)

=P (𝐴1 ) P (N│𝐴1 ) + P (𝐴2 ) P (N│𝐴2 ) + P(𝐴3 ) P (N│𝐴3 )


6 10 3 5 1 1 60+15+1 76
=10 ∗ 100 + 10 ∗ 100 + 10 ∗ 100 = = 1000
1000

● P(B) = P(𝐴1 *B)+P(𝐴2 *B)+P(𝐴3 *B)

=P (𝐴1 ) P (B│𝐴1 ) + P (𝐴2 ) P (B│𝐴2 ) + P(𝐴3 ) P (B│𝐴3 )


6 90 3 95 1 99 540+285+99 924
=10 ∗ 100 + 10 ∗ 100 + 10 ∗ 100 = = 1000
1000
76 924 1000
P(N) + P (B)=1; 1000 + 1000 = 1000 = 1

En forma general:
P(N)=∑3𝑖=1 𝑃(Ai)*P (N│Ai) =∑3𝑖=1 𝑃(Ai*N)

38
Clemente Castilleja Salas
P (B)=∑3𝑖=1 𝑃(Ai) P (B│Ai) =∑3𝑖=1 𝑃(Ai*B)
O bien:
Si se tiene K tipos de urnas, denominadas A1, A2, A3,….. , AK, La expresión
general queda así:

P(N)=∑𝑘𝑖=1 𝑃(Ai)*P (N│Ai) Formula de probabilidad


O bien: total para eventos
P (B)=∑𝑘𝑖=1 𝑃(Ai)*P (B│Ai) condicionados.

4.2 FORMULA DE BAYES


La segunda pregunta es: ¿P (𝐴𝑖 │N)?
𝑃(𝐴𝑖∗𝑁) 𝑃(𝐴𝑖)∗𝑃(𝑁│𝐴𝑖)
P (𝐴𝑖 │N) = = ∑𝑘
𝑃(𝑁) 𝑖=1 𝑃(𝐴𝑖)∗𝑃(𝑁│𝐴𝑖)

Dado que:
𝑃(𝐴𝑖∗𝑁)
P (𝐴𝑖 │N) = 𝑃(𝐴𝑖 ∗ 𝑁)= P (𝐴𝑖 │N)*P(N)
𝑃(𝑁)

𝑃(𝐴𝑖∗𝑁)
P (N│𝐴𝑖 ) = 𝑃(𝐴𝑖 ∗ 𝑁)= P (N│𝐴𝑖 )*P(𝐴𝑖 )
𝑃(𝐴𝑖)

P(N)= ∑𝑛𝑖=1 𝑃(𝐴𝑖) ∗ 𝑃(𝐴𝑖)


𝑃(𝐴𝑗)∗𝑃(𝑁│𝐴𝑗)
P (𝐴𝑖 │N)=
∑𝑛
𝑖=1 𝑃(𝐴𝑖)∗𝑃(𝑁│𝐴𝑖)

Si se generaliza la pregunta para 𝐴𝑖 entonces la formula general es:


𝑃(𝐴𝑖)∗𝑃(𝑁│𝐴𝑖)
P (𝐴𝑖 │N) =
∑𝑘
𝑖=1 𝑃(𝐴𝑖)∗𝑃(𝑁│𝐴𝑖)

Y si el condicionante es esfera blanca o B:


𝑃(𝐴𝑖)∗𝑃(𝐵│𝐴𝑖)
P (𝐴𝑖 │B) =
∑𝑘
𝑖=1 𝑃(𝐴𝑖)∗𝑃(𝐵│𝐴𝑖)

Que son denominadas fórmulas de BAYES.

39
Clemente Castilleja Salas
6 10
𝑃(𝐴1)𝑃(𝑁│𝐴1) ∗ 60
P (A1│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000

3 5
𝑃(𝐴2)𝑃(𝑁│𝐴2) ∗ 15
P (A2│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000

1 1
𝑃(𝐴3)𝑃(𝑁│𝐴3) ∗ 1
P (A3│N) = = 10 100
76 =
∑𝑃(𝐴𝑖)𝑃(𝑁│𝐴𝑖) 760
1000

76
∑3𝑖=1 𝑃(Ai│N)=P (N) =
1000
6 90
𝑃(𝐴1)𝑃(𝐵│𝐴1) ∗ 540
P (A1│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000

3 95
𝑃(𝐴2)𝑃(𝐵│𝐴2) ∗ 285
P (A2│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000

1 99
𝑃(𝐴3)𝑃(𝐵│𝐴3) ∗ 99
P (A3│B) = = 10 100
924 =
∑𝑃(𝐴𝑖)𝑃(𝐵│𝐴𝑖) 924
1000

924
∑3𝑖=1 𝑃(Ai│B)=P (B)=
1000

5.1 FUNCIONES DE PROBABILIDAD


Es una función de probabilidad
F(x)= {x, P(x)} » Función de Probabilidad si:

1) F(X)≥0
2) ∑ 𝑓(𝑥) = 1 = 36/36

40
Clemente Castilleja Salas
FUNCION DE PROBABILIDAD DE VARIABLE ALEATORIA DISCRETA

Ejemplo:
Lanzando dos dados:

6- P {z=x1+x2}
5-
4-
3-
2-
1-
0- 1 2 3 4 5 6

z 2 3 4 5 6 7 8 9 10 11
12
P(z) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

P(z)
6/36-
5/36-
4/36-
3/36-
2/36-
1/36-
0- 2 3 4 5 6 7 8 9 10 11 12 z

En general:
{Z, P(z)} Es una F de P si, y solo si:

41
Clemente Castilleja Salas
1) P(z)≥ 2
𝑙𝑖𝑚𝑖𝑡𝑒 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟
2) ∑𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑃(𝑍) = 1

3) P[x1≤x≤x2]=∑𝑥2
𝑥1 𝑃(𝑧)

En correspondencia Con los Axiomas de Probabilidad:


P (0)= 0 P(S)=1 0 ≤ P(A) ≤ 1

FUNCION DE PROBABILIDAD DE VARIABLE ALEATORIA CONTINUA


Ejemplo 2:

90®
0≤x≤360
X
0≤x≤2π
0® P(x=75°)=? Son probabilidades idénticas
360® 180®
P(x=328°)=?

270®
F(x)

1
--
2𝜋
+𝑥
∫−𝑥 𝑓(𝑥)𝑑𝑥=1

0 1π 2π x
0 180° 360°

42
Clemente Castilleja Salas
EN GENERAL
F(x) ≥0
+𝑥
∫−𝑥 𝑓(𝑥)𝑑𝑥=1
𝑥2
P (x1≤x≤x2) =∫𝑥1 𝑓(𝑥)𝑑𝑥

ESPERANZA Y VARIANZA MATEMATICA

E [X] = ∑𝑥𝑥𝑙𝑖𝑚
𝑙𝑖𝑚 𝑆𝑢𝑝
𝑖𝑛𝑓 𝑥𝑖, 𝑃(𝑥) Con variable aleatoria discreta o entera.
+𝑥
E [x] = ∫−𝑥 𝑥 𝑓(𝑥)𝑑𝑥 Con variable aleatoria continua.

VAR [x] = ∑𝑛𝑖=1 (𝑥𝑖 − 𝑚𝑥)2 P (xi) Variable aleatoria discreta


+𝑥
VAR [x] = ∫−𝑥 (𝑥 − 𝑚𝑥)2 f(x) dx Variable aleatoria continua

Ejemplo:
Para evidenciar su significado, considerar los siguientes juegos:

X P(x) Juego 1 Juego 2 Juego 3


0 ½ 0 -5 -10
1 ½ +10 +5 0

{X, P(x)} = Función de Probabilidad.


E [x1] = ½ (0) + ½ (+10) = +5 por juego
E [x2]= ½ (-5) + ½ (+5) = 0 por juego
E [x3] = ½ (-10) + ½ (0) = -5 por juego

Y Varianza:
VAR [x1] = (0-5)2 * ½ + (10-5)2 * ½ = 25
VAR [x2] = (-5-0)2 * ½ + (5-0)2 * ½ = 25
VAR [x3] = (-10-(-5))2 * ½ + (0-(-5))2 * ½ = 25

43
Clemente Castilleja Salas
5.2 FORMULA DE BERNOULLI
DISTRIBUCIÓN BINOMIAL (BERNOULLI)
n experimentos:
x: número de aciertos(éxitos) x=0, 1, 2, …, n
P(E)=0.4 p
P(F)=0.6 q=1-p
∑ =1.0 ∑ =1
Ej. Numérico En general
n experimentos
x=0 𝑞1 𝑞2 … 𝑞𝑛 P (x = 0) = 𝑞 𝑛
x=1 𝑝1 𝑞2 … 𝑞𝑛
n 𝑞1 𝑝2 … 𝑞𝑛 P (x = 1) = 𝑛𝑝1 𝑞 𝑛−1
𝑞1 𝑞2 … 𝑝𝑛
x=k 𝐶𝑛,𝑘

𝐶𝑛,𝑘 𝑎𝑟𝑟𝑒𝑔𝑙𝑜𝑠 P (x = k) = 𝐶𝑛,𝑘 𝑝𝑘 𝑞 𝑛−𝑘

x = n-1 𝑞1 𝑝2 … 𝑝𝑛
n 𝑝1 𝑞2 … 𝑝𝑛 P (x = n-1) = 𝑛𝑝𝑛−1 𝑞1
𝑝1 𝑝2 … 𝑞𝑛
x=n 𝑝1 𝑝2 … 𝑝𝑛 P (x = n) = 𝑝𝑛

P (n, k, p) = 𝐶𝑛,𝑘 𝑝𝑘 𝑞 𝑛−𝑘

Ejemplo de tiro al blanco p=0.4; q=0.6; n=8


Determinar P(x), P(x=0), P(x=1), …, P(x=8)
𝑛!
P (n, x, p) = 𝐶𝑛,𝑥 𝑝 𝑥 𝑞 𝑛−𝑥 𝐶𝑛,𝑥 =
𝑥!(𝑛−𝑥)!

44
Clemente Castilleja Salas
Esperanza de “x”:
E[x]=∑𝑛𝑥=0 𝑥 ∗ 𝑃(𝑥)
Primero se determina la probabilidad de tener, en n ensayos, x éxitos consecutivos
seguidos de n-x fracasos consecutivos
P * p … p * (1-p) (1-p) … (1-p) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥

45
Clemente Castilleja Salas
La probabilidad de obtener exactamente x éxitos y n-x fracasos en cualquier otro
orden es la misma puesto que los factores p y (1-p) se reordenan de acuerdo con
el orden particular. Por lo tanto, la probabilidad de tener x éxitos y n-x fracasos en
cualquier orden, es el producto de 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 por el número de ordenes
distintos. Este último es el número de combinaciones de n objetos tomando x a la
vez
El nombre “distribución binomial” proviene del hecho de que los valores de P(n, x,
p) para x = 0, 1, 2… n son los términos sucesivos de la expansión binomial de
[(1 − 𝑝) + 𝑝]𝑛
𝑛(𝑛 − 1)
[(1 − 𝑝) + 𝑝]𝑛 = (1 − 𝑝)𝑛 + 𝑛(1 − 𝑝)𝑛−1 𝑝 + (1 − 𝑝)𝑛−2 𝑝2 + ⋯ + 𝑝𝑛
2!
𝑛 𝑛
𝑛!
∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 = ∑ 𝑃(𝑛, 𝑥, 𝑝)
(𝑛 − 𝑥)! 𝑥!
𝑥=0 𝑥=0

Pero dado que [(1 − 𝑝) + 𝑝]𝑛 = 1 y P(n, x, p) es una función de probabilidad


MEDIA
El primer momento alrededor del cero de la variable aleatoria binomial x es el valor
esperado de x
𝑛 𝑛
𝑛! 𝑛!
𝐸[𝑥] = ∑ 𝑥 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 = ∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥! (𝑛 − 𝑥)! 𝑥!
𝑥=0 𝑥=1
𝑛
𝑛!
∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 1)!
𝑥=1

En donde se ha escrito la suma desde uno hasta n, dado que cuando x=0 el
primer término es cero y se cancela la x del numerador con la x en x! Factorizando
n y p, se tiene:
𝑛
𝑛!
𝐸[𝑥] = 𝑛𝑝 ∑ 𝑝 𝑥−1 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 1)!
𝑥=1
𝑚!
Si y = x-1 y m = n-1, entonces: 𝐸[𝑥] = 𝑛𝑝 ∑𝑚
𝑦=0 (𝑚−𝑦)!𝑦!
𝑝 𝑦 (1 − 𝑝)𝑛−𝑦

𝑚!
Pero P (y, m, p) =(𝑚−𝑦)!𝑦! 𝑝 𝑦 (1 − 𝑝)𝑚−𝑦 es la función de probabilidad de una
variable aleatoria binomial Y con parámetros m = n-1 y p; de esta manera
∑𝑚
𝑦=0 𝑃(𝑦, 𝑚, 𝑝) = 1

La media de una variable aleatoria binomial es: 𝐸[𝑥] = µ = 𝑛𝑝

46
Clemente Castilleja Salas
Varianza
Para obtener la varianza, se necesita el segundo momento alrededor del cero, µ’ 2
𝑛
2]
𝐸[𝑥 =∑ 𝑥 2 𝑃(𝑛, 𝑥, 𝑝)
𝑥=0

𝑥2
Pero, en el término Se cancelara una sola x en el numerador, y la que resta
𝑥!
evitara que la suma se manipule de la misma forma en que se determinó la media.
La alternativa es escribir x2 como:
x2 = x(x – 1) + x
De esta manera se tiene: 𝐸[𝑥 2 ] = 𝐸[𝑥(𝑥 − 1)] + 𝐸[𝑥]
Dado que E[x] ya se ha determinado, puede usarse el mismo procedimiento para
evaluar
E [x(x – 1)]
𝑛
𝑛!
𝐸[𝑥(𝑥 − 1)] = ∑ 𝑥(𝑥 − 1) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!
𝑥=0
𝑛
𝑛!
=∑ 𝑥(𝑥 − 1) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! 𝑥!
𝑥=2
𝑛
𝑛!
∑ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 2)!
𝑥=2
𝑛
2
(𝑛 − 2)!
= 𝑛(𝑛 − 1)𝑝 ∑ 𝑝 𝑥−2 (1 − 𝑝)𝑛−𝑥
(𝑛 − 𝑥)! (𝑥 − 2)!
𝑥=2

Nótese que en los pasos anteriores se escribió la suma a partir de dos porque los
dos primeros términos son cero, se canceló x(x – 1), y se factorizo n(n – 1) p2.
Sea y = x-2 y m = n-2, entonces:
𝑚
2
𝑚!
𝐸[𝑥(𝑥 − 1)] = 𝑛(𝑛 − 1)𝑝 ∑ 𝑝 𝑦 (1 − 𝑝)𝑚−𝑦
(𝑚 − 𝑦)! 𝑦!
𝑦=0
𝑚

= 𝑛(𝑛 − 1)𝑝2 ∑ 𝑃(𝑦, 𝑚, 𝑝)


𝑦=0

= 𝑛(𝑛 − 1)𝑝2
𝐸[𝑥 2 ] = µ′2 = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝
De esta manera, la varianza de una variable aleatoria binomial es:

47
Clemente Castilleja Salas
𝑉𝑎𝑟[𝑥] = µ′2 − µ2 = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝 − 𝑛2 𝑝2 = 𝑛𝑝[(𝑛 − 1)𝑝 + 1 − 𝑛𝑝] = 𝑛𝑝(1 − 𝑝)

Sea un experimento de tiro al blanco con dos resultados posibles Acertar o Fallar.

1 2
P (Acertar en un intento) = (3) P (Fallar en un intento) = (3)

x= Números de aciertos
Considerar n experimentos independientes

Sea X: número de aciertos (éxitos) {p= 1/3 y q = 1- p = 2/3 ∑ =1


Son experimentos de Bernoulli aquellos que tienen solo dos resultados posibles:
Éxito con probabilidad “P” y fracaso con probabilidad “q^n=1-P”
Considerando experimentos independientes:

Si X=0 y se realiza “n” experimentos, entonces:

P(x,n)= P (0,n)= q1 q2 q3… qn =qn

Si X=1 entonces:

P(x,n)=P (1,n)= q1 q2 q3… qn-1 pn= {n qn-1.pn-1


……..
……..
……..

Si x=n-1 entonces:
P(X,n) = P (n-1,n) = P1 P2 Pn … Pn-1 qn = {n.q.pn-1

Si x=n entonces:

48
Clemente Castilleja Salas
P(x,n)= P(n,n)= P1 P2 … Pn = pn

SI SE PRESENTAN “X” ACIERTOS y “n - X” FALLAS EN “n” EXPERIMENTOS


entonces:
𝑛!
K= C n,x = y la expresión general quedaría
𝑥!(𝑛−𝑥)!

P (n,x,p) = C n,x Px (1 - p)n-x {QUE SE DENOMINA COMO FORMULA DE


BERNOULLI

5.3 EJEMPLOS DE BERNOULLI

EJEMPLO: PROBABILIDAD DE TIRO AL BLANCO.

1. P= PROB. ACERTAR = ÉXITO = 1/3

2. q = PROB. FALLAR = FRACASO = 2/3

3. LOS TIROS O EXPERIMENTOS SON INDEPENDIEMTES

4. SE REALIZAN 5 TIROS

5. X NUM DE EXITOS (X= 0,1,2,3,4,5) DE n=5 TOTAL

5! 0 5
2 5
𝑃(5,0,1/3) = (1/3) (2/3) = ( ) = 0.132
0! (5 − 0)! 3
5! 1 5−1
2 4
𝑃(5,1,1/3) = (1/3) (2/3) = 5 (1/3) ( ) = 0.329
1! (5 − 1)! 3
5! 2 5−2
1 2 2 3
𝑃(5,2,1/3) = (1/3) (2/3) = 10 ( ) ( ) = 0.329
2! (5 − 2)! 3 3
5! 2 2
𝑃(5,3,1/3) = (1/3)3 (2/3)5−3 = 10(1/3)3 ( ) = 0.165
3! (5 − 3)! 3
5! 2 1
𝑃(5,4,1/3) = (1/3)4 (2/3)5−4 = 5(1/3)4 ( ) = 0.041
4! (5 − 4)! 3

49
Clemente Castilleja Salas
5! 5 5−5 5
2 0
𝑃(5,5,1/3) = (1/3) (2/3) = (1/3) ( ) = 0.004
5! (5 − 5)! 3

∑ =1

Ejemplo :

Para los experimentos de BERNOULLI:

B(n, x, p)= Cn, x px qn-x P=1-q

B(n, x, p) es una Función de Probabilidad discreta p+q=1

1) B(n, x, p) ≥ 0 Vx; n ≥ 1

2) ∑𝑛𝑥=1 𝐵(𝑛, 𝑥, 𝑝) = 1

50
Clemente Castilleja Salas
p (1, 0)= C1,0 * p0q1 = q

n=1
(p+q)=1

p (1, 1)= C1,1 * p1q0 = p

P (2, 0) = C2,0 * p0q2 = 1 q2

n=2 p (2, 1) = C2,1 * p1q1 = 2 p*q (p2+2pq+q2) = (p+q) 2=1

P (2, 2) = C2,2 * p2q0 = 1 p2

P (3, 0) = C3,0 * p0q3 = 1 q3

n=3 p (3, 1) = C3,1 * p1q2 = 3 p*q2 (p+q) 3=1

P (3, 2) = C3,2 * p2q1 = 1 p2*q

p (3, 3)= C3,3 * p3q0 = 1 p3

n (p+q)n=1 ∑𝑛𝑥=0 𝐵(𝑛, 𝑥, 𝑝) = 1

51
Clemente Castilleja Salas
Es decir: B(n,x,p,) es una Función de Probabilidad que llamaremos por extensión
Función de Bernoulli.

Formula de Bernoulli o Binomial

P(n,x,p) = Cn,x P^x (1-P) ^ n-x

Probabilidad de obtener “X” éxitos en “n” intentos experimentos de Bernoulli, siendo


“P” la probabilidad de éxitos en u solo intento:

𝑛!
Cn,x =
𝑋!(𝑛−𝑥)!

Requisitos para aplicar la fórmula:

1- Cada experimento tiene solo dos resultados posibles: Éxito o Fracaso.

2- Los “n” experimentos son independientes.

3- Los arreglos Cn,x son eventos exclusivos.

4- P (Éxitos) = P ; P(Fracaso) = q = 1-P

Parámetros de la distribución Binomial:

E [x] = ∑𝑛𝑥=0 𝑥 𝑝(𝑛, 𝑥, 𝑝) = 𝑚𝑥 = 𝑛𝑝 MEDIA DE LA DISTRIBUCION.

VAR [x] = ∑𝑛𝑥=0 (𝑥 − 𝑚𝑥)2 𝑝(𝑛, 𝑥, 𝑝) = 𝜎𝑥 2 = 𝑛 − 𝑝(1 − 𝑝) VARIANZA DE LA


DISTRIBUCIO.

Por ejemplo:

Considerar lanzar una moneda:

N: Numero de lanzamientos = 100

X: Numero de Caras (0, 1, 2,……, 100)

52
Clemente Castilleja Salas
P (100, 0, 1/2) = (C100,0 (½)0 (1 - ½)100-0 = (1/2) 100

100! 1 𝑥 1 100−𝑥
P (40≤x≤60) = ∑60
𝑥=40 ( ) (1 − 2) = 0.95
𝑥!(100−𝑥)! 2

100! 1 𝑥 1 100−𝑥
P (35≤x≤65) = ∑65
𝑥=35 ( ) (1 − 2) = 0.99
𝑥!(100−𝑥)! 2

Ejemplo:

Considerar 6 tiros al blanco

P (Acertar) = P = 0.4

P (Fallar) = q = 1 – p = 0.6

6!
P (6, 0, 0.4) = 0!(6−0)! (0 − 4)0 (1 − 0.4)(1 − 0.4)6−0 = 0.047

6!
P (6, 1, 0.4) = 1!(6−1)! (0 − 4)1 (1 − 0.4)(1 − 0.4)6−1 = 0.186

6!
P (6, 2, 0.4) = 2!(6−2)! (0 − 4)2 (1 − 0.4)(1 − 0.4)6−2 = 0.312

6!
P (6, 3, 0.4) = 3!(6−3)! (0 − 4)3 (1 − 0.4)(1 − 0.4)6−3 = 0.276

6!
P (6, 4, 0.4) = 4!(6−4)! (0 − 4)4 (1 − 0.4)(1 − 0.4)6−4 = 0.138

6!
P (6, 5, 0.4) = (0 − 4)5 (1 − 0.4)(1 − 0.4)6−5 = 0.037
5!(6−5)!

6!
P (6, 6, 0.4) = 6!(6−6)! (0 − 4)6 (1 − 0.4)(1 − 0.4)6−6 = 0.004

∑=1.000

53
Clemente Castilleja Salas
P(n,x,p)

0.4--

0.3--

0.2--

0.1--

0 0 1 2 3 4 5 6

Experimento tiro al blanco 2:

P (n,x,p) = Cu, x px qn-x

𝑛!
Mx= np 𝜎𝑥 2 = 𝑛𝑝𝑞 Cu=
𝑥!(𝑛−𝑥)!

Experimento:

N=10 p=0.4 q=0.6

Mx = np = 10 (0.4) = 4

𝜎X2= 10(0.4) (0.6) = 2.4

10!
P (10, 1, 0.4) = 1!(10−1)! (0.4)1 (0.6)9 = 0.0403

10!
P (10, 2, 0.4) = 2!(10−2)! (0.4)2 (0.6)8 = 0.1209

10!
P (10, 3, 0.4) = 3!(10−3)! (0.4)3 (0.6)7 = 0.2149

10!
P (10, 4, 0.4) = 4!(10−4)! (0.4)4 (0.6)6 = 0.2508

10!
P (10, 5, 0.4) = 5!(10−5)! (0.4)5 (0.6)5 = 0.2006

54
Clemente Castilleja Salas
10!
P (10, 6, 0.4) = 6!(10−6)! (0.4)6 (0.6)4 = 0.1114

10!
P (10, 7, 0.4) = 7!(10−7)! (0.4)7 (0.6)3 = 0.0424

10!
P (10, 8, 0.4) = 8!(10−8)! (0.4)8 (0.6)2 = 0.0106

10!
P (10, 9, 0.4) = 9!(10−9)! (0.4)9 (0.6)1 = 0.0015

10!
P (10, 10, 0.4) = (0.4)10 (0.6)0 = 0.0001
10!(10−10)!

5.4 FORMULA DE POISSON

TEOREMA DE POISSON

Si se tienen n experimentos de B:

B (n, x, p) = Cn,x px (1-p) n-x n sea muy grande y p muy pequeña tales que
sea factible establecer:

(𝑛, 𝑥, 𝑝)1 Entonces la formula B. se transforma en

𝜆^𝑥
P (λ, x) = 𝑒^ − 𝜆
𝑥!

𝑛!
P (x, n, p) = 𝑛!(𝑛−𝑥)! 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥

Al multiplicar el numerador y el denominador por 𝑛 𝑥 , sustituir

n! (n-x)! = n (n-1) (n-2) … (n-x+1)!

Entonces la demostración del teorema de Poisson, donde λ = n*p

𝑛 (𝑛−1)(𝑛−2)…(𝑛−𝑥+1) 𝑛 (𝑛−1)(𝑛−2)…(𝑛−𝑥+1) 𝜆𝑥
P(n, x, p) = (𝑛𝑝)𝑥 (1 − 𝑝)𝑛−𝑥 = (1 − 𝑝)𝑛−𝑥
𝑛𝑥 𝑥! 𝑛𝑥 𝑥!

1 2 𝑥−1
1 2 𝑥−1 𝜆𝑥 1 (1− ) (1− ) … (1− ) 𝜆𝑥
= 1 (1- 𝑛) (1- 𝑛)… (1- ) 𝑥! (1 − 𝑝)𝑛−𝑥 = 𝑛 𝑛 𝑛
(1 − 𝑝)𝑛
𝑛 (1−𝑝)𝑥 𝑥!

55
Clemente Castilleja Salas
1 𝑛 1
− −
Dado que: (1 − 𝑝)𝑛 = [(1 − 𝑝) 𝑝 ]𝑝 = [(1 − 𝑝) 𝑝 ]𝜆

1
Por definición: (1 + 𝑧)𝑧 = 𝑒

Mediante el cambio de variable z= -p

1

[(1 − 𝑝) 𝑝 ]−𝜆 = 𝑒𝜆
1 2 𝑥−1
Además (1 + 𝑛) (1 + 𝑛) … (1 + ) = 1 (1 + 𝑝)𝑥 = 𝑒
𝑛

𝑒 −𝜆 𝜆𝑥
Al sustituir en 𝑃(𝑛, 𝑥, 𝑝) = X = 0, 1, 2, …, ∞
𝑥!

MEDIA

Si x es una variable aleatoria de Poisson, su valor esperado es:

𝑒 −𝜆 𝜆𝑥 𝜆𝑥 𝜆𝑥−1 𝜆𝑦
𝐸[𝑥] = ∑∞
𝑥=0 𝑥 = 𝑒 −𝜆 ∑∞
𝑥=1 = 𝜆𝑒 −𝜆 ∑∞
𝑥=1 = 𝜆𝑒 −𝜆 ∑∞
𝑦=0 =𝜆
𝑥! (𝑥−1)! (𝑥−1)! 𝑦!

y=x-1

VARIANZA

𝑒 −𝜆 𝜆𝑥 𝜆𝑥−2 𝜆𝑥
𝐸[𝑥(𝑥 − 1)] = ∑∞
𝑥=0 𝑥(𝑥 − 1) = 𝜆2 𝑒 −𝜆 ∑∞
𝑥=2 = 𝜆2 𝑒 −𝜆 ∑∞
𝑦=0 = 𝜆2 y
𝑥! (𝑥−2)! 𝑦!

=x-2

Entonces: 𝐸[𝑥 2 ] = µ′2 = 𝜆2 + 𝜆

Y la varianza de x es: 𝑉𝑎𝑟[𝑥] = µ′2 − µ2 = 𝜆2 + 𝜆 − 𝜆2 = 𝜆

De esta manera, una característica distintiva de la variable aleatoria de Poisson es


que su media es igual a su varianza

FÓRMULA DE POISSON

COMO YA SE MENCIONÓ SI LA FUNCIÓN P(n,x,p)= Cn,xpxqn-x

Se lleva al límite cuándo n x

56
Clemente Castilleja Salas
p 0

𝑛! 𝜆𝑥
(𝑥!(𝑛−𝑥)!) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 =
𝑥!
𝑒 −𝜆

Y se representa:

𝜆𝑥 −𝜆
𝑃(𝜆, 𝑥) = 𝑒
𝑥!
Siendo λ=n•p

-Esperanza matemática

𝐸[𝑥] = ∑ 𝑥 • 𝑝(𝜆, 𝑥) = 𝜆 = 𝑛 • 𝑝 = 𝑚𝑥 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 "𝑥"


𝑥=0

-Varianza

𝑉𝐴𝑅[𝑥] = ∑ (𝑥 − 𝑚𝑥 )2 𝑝(𝜆, 𝑥) = 𝜆2 = (𝑛 • 𝑝)2 = 𝜎𝑥 2 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 "𝑥"


𝑥=0

Ejemplo 1 n=105 experimentos independientes p=10-5

1) P(x=0)=? P (λ=1,x=0)= [(1)0/0!][e-1]=0.368

2) P(x=1)=? P (1,1)= [(1)1/1!][e-1]=0.368

3) P(x=2)=? P (1,2)= [(1)2/2!][e-1]=0.184

4) P (x = 3) =? P (1,3)=[(1)3/3!][e-1]=0.061

5) P (x = 4) =? P (1,4)= [(1)4/4!][e-1]=0.015

6) P (x = 5) =? P (1,5)= [(1)5/5!][e-1]=0.0030

57
Clemente Castilleja Salas
Ejemplo 2 n=105 experimentos independientes

P=0.5x10-5 probabilidad de éxito en un solo experimento

Dado que n x Se aplica la fórmula de Poisson dónde

p 0

λ=n•p=105(0.5x10-5)=0.5

1.- P (λ.X)= (λX/X!) (e-λ) X!: Número de éxitos en “n” experimentos.

(0.5)0 −0.5
𝑃(0.5,0) = 𝑒 = 0.607 𝑃(𝑐𝑒𝑟𝑜 é𝑥𝑖𝑡𝑜𝑠)
0!
(0.5)1 −0.5
𝑃(0.5,1) = 𝑒 = 0.303 𝑃(𝑢𝑛 é𝑥𝑖𝑡𝑜)
1!
(0.5)2 −0.5
𝑃(0.5,2) = 𝑒 = 0.076 𝑃(𝑑𝑜𝑠 é𝑥𝑖𝑡𝑜𝑠)
2!
(0.5)3 −0.5
𝑃(0.5,3) = 𝑒 = 0.013 𝑃(𝑡𝑟𝑒𝑠 é𝑥𝑖𝑡𝑜𝑠)
3!
(0.5)4 −0.5
𝑃(0.5,4) = 𝑒 = 0.002 𝑃(𝑐𝑢𝑎𝑡𝑟𝑜 é𝑥𝑖𝑡𝑜𝑠)
4!

2.- P (x≥3)=?

105
(0.5)𝑥 −0.5
𝑃(𝑥 ≥ 3) = ∑ 𝑒
𝑥!
𝑥=3
2
(0.5)𝑥 −0.5
=1−∑ 𝑒
𝑥!
𝑥=0

=1-0.607-0.303-0.076

=0.014

58
Clemente Castilleja Salas
3.- ¿Se puede aplicar Fórmula de Bernoulli?

Respuesta: si

105
105 ! 5−𝑥
𝑃(𝑥 ≥ 3) = ∑ 5
(10−5 • 0.5)𝑥 (1 − 0.5 • 10−5 )10
𝑥! (10 − 𝑥)!
𝑥=3

105 ! 5
𝑃(𝑥 = 0) = 5
(0.5 • 10−5 )0 (1 − 0.5 • 10−5 )10
0! 10 !
49999 100000
=( )
50000
Pero las operaciones matemáticas no son practicables.

En general:

𝜆𝑥
𝑃(𝜆, 𝑥) = 𝑒 −𝜆 𝐸[𝑥] = 𝑚𝑥 = 𝜆 = 𝑛𝑃 ; 𝑉𝐴𝑅[𝑥] = 𝜎𝑥 2 = 𝜆2 = (𝑛𝑃)2
𝑥!

𝑛𝑝 = 𝜆 = 𝑉𝑡
λ = Media mx de éxitos en el periodo de observación [0,T]

Vt = Promedio de éxitos por unidad de tiempo

𝑉𝑡 𝑥 −(𝑉𝑡)
𝑃(𝜆, 𝑥) = 𝑒
𝑥!
Con x=0 𝑃(𝜆, 𝑥) = 𝑒 −(𝑉𝑡)

Si “t” contenido en [0;T] es el momento en que ocurre el primer éxito:

𝑝(𝑥 ≥ 1) = 1 − 𝑒 −𝑉𝑡 = 𝑝(𝑡, 𝑥) ; 𝑥 ≥ 1


𝑑
[1 − 𝑒 −𝑉𝑡 ] = 𝑉𝑒 −𝑉𝑡 = 𝐹(𝑉, 𝑡) = 𝐸(𝑉, 𝑡)
𝑑𝑡
𝐹(𝑉, 𝑡) = 𝑉𝑒 −𝑉𝑡 𝐸𝑠 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑎 𝑓𝑢𝑛𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙.

59
Clemente Castilleja Salas
5.5 FORMULA DE GAUSS (O FUNCION NORMAL)

La función de densidad de probabilidad de la distribución normal, la cual fue


descubierta por DeMoivre en 1733 como una forma límite de la función de
probabilidad binomial; después la estudio Laplace. También se conoce como
distribución Gaussiana porque Gauss la cito en un artículo que publicó en 1809.
Durante el siglo XIX se empleó de manera extensa por científicos que habían notado
que los errores, al llevar a cabo mediciones físicas, frecuentemente seguían un
patrón que sugería la distribución normal.

1 2
1
𝐼 = 𝑓(𝑧) = 𝑒 −2 𝑧 ; 𝑓(𝑧) ≥ 0
√2𝜋

−𝑋 ≤ 𝑍 ≤ +𝑋

+𝑥
1. ∫−𝑥 𝑓(𝑧)𝑑𝑧 = 1

2. 𝑆𝑖𝑚𝑒𝑡𝑟𝑖𝑐𝑎 𝑅𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎𝑙 𝑒𝑗𝑒 𝑣𝑒𝑟𝑡𝑖𝑐𝑎𝑙

0 𝑥 1
∫−𝑥 𝑓(𝑧)𝑑𝑧 = ∫0 𝑓(𝑧)𝑑𝑧 = 2 = 0.5

+𝑥
3. 𝐸[𝑍] = ∫−𝑥 𝑍 𝑓(𝑧)𝑑𝑧 = 0

+𝑥
𝑉𝐴𝑅[𝑧] = ∫ (𝑧 − 𝑚𝑧)2 𝑓(𝑧)𝑑𝑧 = 1
−𝑥

4. 𝑓(𝑧) 𝑒𝑠 𝑢𝑛𝑎 𝑓𝑢𝑛𝑐𝑖𝑜𝑛 𝑐𝑜𝑛 𝑖𝑛𝑡𝑒𝑔𝑟𝑎𝑙 𝑖𝑛𝑑𝑒𝑓𝑖𝑛𝑖𝑑𝑎.

5. 𝐸𝑠 𝑢𝑛𝑎 𝑐𝑢𝑟𝑣𝑎 𝑢𝑛𝑖𝑐𝑎.

𝑧
Tabla: ∫0 𝑓(𝑧)𝑑𝑧 ; 𝐼𝑛𝑡𝑒𝑔𝑟𝑎𝑛𝑑𝑜 𝑝𝑜𝑟 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑐𝑖𝑜𝑛 𝑛𝑒𝑚𝑒𝑟𝑖𝑐𝑎.

60
Clemente Castilleja Salas
Para sacar la altura máxima de F (z):

1 1
𝑧2
𝐹(𝑧) = 𝑒 −2
√2𝜋

𝑍 1
𝑧2
𝐹´(𝑧) = 𝑒 −2
√2𝜋

● Igualando a cero:

𝑍 1
𝑧2
0= 𝑒 −2
√2𝜋

● Cuando Z=0

1
−(0) 𝑧2
0= 𝑒 −2 0=0
√2𝜋

● Sustituyendo en f(z)

1 1
02
ℎ𝑚𝑎𝑥 = 𝑒 −2
√2𝜋
1
ℎ𝑚𝑎𝑥 =
√2𝜋
ℎ𝑚𝑎𝑥 = 0.3989

61
Clemente Castilleja Salas
Ejemplo:

1 1
𝑝(−1 ≤ 𝑧 ≤ 1) = ∫−1 𝑓(𝑧)𝑑𝑧 = 2 ∫0 𝑓(𝑧)𝑑𝑧 = 2(0.3413) = 0.6826

𝑥 𝑥 2
𝑝(𝑧 ≥ 2) = ∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 − ∫ 𝑓(𝑧)𝑑𝑧 = 0.5000 − 0.4772 = 0.0228
2 0 0
3 0 3
𝑝(−1.75 ≤ 𝑧 ≤ 3) = ∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 + ∫ 𝑓(𝑧)𝑑𝑧
−1.75 −1.75 0
= 0.4599 + 0.4987 = 0.9586
0 1.75
∫ 𝑓(𝑧)𝑑𝑧 = ∫ 𝑓(𝑧)𝑑𝑧 = 0.4599
−1.75 0

3
∫ 𝑓(𝑧)𝑑𝑧 = 0.4987
0

Ejemplo 2:

Sea “X” una Variable Aleatoria (V.A.) que representa la vida útil de una pieza
industrial (una lámpara) y mx = 1100 hr y 𝜎𝑥 = 50 𝐻𝑅, la media y D.E. de la población
correspondiente. Suponer que “x” tiene un comportamiento normal:

El comportamiento normal se confirma y/o comprueba con datos estadísticos


mediante:

- Tabla de frecuencia

- Histograma

- Polígono de frecuencias

- Polígono de frecuencias por correlación determina la curva normal.

62
Clemente Castilleja Salas
Sea “X”: La duración en horas de una lámpara tomada al azar.

1) 𝑃(1050 ≤ 𝑥 ≤ 1150) = ?

1050 − 1100 1150 − 1100


𝑍1 = = −1 ; 𝑍2 = = +1
50 50
1150 𝑍2
𝑃(1050 ≤ 𝑥 ≤ 1150) = ∫ 𝑓(𝑥)𝑑𝑥 → ∫ 𝑓(𝑧)𝑑𝑧
1050 𝑍1
1 1
∫ 𝑓(𝑧)𝑑𝑧 = 2 ∫ 𝑓(𝑧)𝑑𝑧 = 2(0.3413) = 0.6826
−1 0

2) 𝑃(1000 ≤ 𝑥 ≤ 1200) = ?

1000 − 1200 1200 − 1000


𝑍1 = = −2 ; 𝑍2 = = +2
50 50

1200 𝑍2
𝑃(1000 ≤ 𝑥 ≤ 1200) = ∫ 𝑓(𝑥)𝑑𝑥 → ∫ 𝑓(𝑧)𝑑𝑧
1000 𝑍1
2 2
∫ 𝑓(𝑧)𝑑𝑧 = 2 ∫ 𝑓(𝑧)𝑑𝑧 = 2(0.4772) = 0.9544
−2 0

3) 𝑃(950 ≤ 𝑥 ≤ 1250) = ?

950 − 1250 1250 − 1100


𝑍1 = = −3 ; 𝑍2 = = +3
50 50

1250 𝑍2
𝑃(950 ≤ 𝑥 ≤ 1250) = ∫ 𝑓(𝑥)𝑑𝑥 → ∫ 𝑓(𝑧)𝑑𝑧
950 𝑍1
3 3
∫ 𝑓(𝑧)𝑑𝑧 = 2 ∫ 𝑓(𝑧)𝑑𝑧 = 2(0.4987) = 0.9974
−3 0

63
Clemente Castilleja Salas
X tiene comportamiento normal

Considerando que Con media poblacional mx=1100 HR

Y Desviación estándar 𝜎𝑥 = 50 𝐻𝑅

5.6 FORMULA DE GAUSS (2)

FUNCIONES DE PROBABILIDAD (Desarrollo histórico)

CURVA NORMAL O DE GAUSS (De moivre)

BERNOULLI: Donde

POISSON

64
Clemente Castilleja Salas
APROXIMACIÓN NORMAL DE LA FUNCIÓN BINOMIAL (O DE BERNOULLI)
Ejemplo: Determinar probabilidad con aproximación normal en el experimento del
lanzamiento de una moneda 100 veces.
N= 100; X: número de caras; P=0.5 Probabilidad de cara en un
lanzamiento.

1.- Cálculo exacto: con B (100,x,0.5)


Cálculo aproximado: con normal:

Cálculo aproximado:

2.- Pero debe recordarse que:


X: es una variable aleatoria discreta o entera
z= es una variable aleatoria continua [-x;x]

Por lo que debe hacerse una corrección a “x” para operarla como variable continua

44 45 46 los
valores son
X continúa

65
Clemente Castilleja Salas
44.5 45.5

Representados por los


Discreta campos (por
ejemplo:
44 45 46 45=campo de 44.5 a 45.5
Los valores son
representados

Tiene un valor

𝐵(𝑛, 𝑥, 𝑝) = 𝑃(𝜆, 𝑥)
+

TEOREMA DE CHEBYSHEV
La desviación estándar “σ” de una función de densidad de probabilidad arbitraria,
es una medida de amplitud de expansión de la distribución, es decir, es una
medida de la concentración de la probabilidad en la vecindad de la media. Si “σ”
es pequeña, la probabilidad de obtener un valor cerca de la media es alta, si “σ” es
grande la probabilidad de obtener un valor separado de la media es
proporcionalmente más alta. Si una distribución de probabilidad tiene una ẋ y una
desviación estándar “σ”, la probabilidad de obtener un valor que se desvíe de la
media por más de K veces la desviación estándar, es menor que 1/K 2; es decir,
1
𝑃(|𝑥 − ẋ| ≥ 𝐾𝜎) ≤
𝐾2
Este límite no se puede reducir sin restringir la clase de funciones de densidad. Si
la función de densidad es simétrica con respecto a la media y tienen un punto
máximo único,
4
𝑃(|𝑥 − ẋ| ≥ 𝐾𝜎) ≤
9𝐾 2

66
Clemente Castilleja Salas
Desigualdad de chebysheb
La varianza es:

2
𝜎 =∫ (𝑥 − ẋ)2 𝑃(𝑥)𝑑𝑥
−∞

Como el integrando de esta integral es no negativo

𝜎2 ≥ ∫ (𝑥 − ẋ)2 𝑃(𝑥)𝑑𝑥
|𝑥−ẋ|>𝐾𝜎

Sobre el rango de la integración


(𝑥 − ẋ|)2 > 𝐾 2 𝜎 2
De esta manera

𝜎2 ≥ ∫ 𝐾 2 𝜎 2 𝑃(𝑥)𝑑𝑥 = 𝐾 2 𝜎 2 ∫ 𝑃(𝑥)𝑑𝑥
|𝑥−ẋ|𝐾𝜎 |𝑥−ẋ|>𝐾𝜎

Simplificando,

𝐾2 ∫ 𝑃(𝑥)𝑑𝑥 ≤ 1
|𝑥−ẋ|>𝐾𝜎

La integral anterior es la probabilidad de que x esté fuera del rango ẋ-Kσ<x<ẋ+Kσ;


por consiguiente
1
𝑃(|𝑥 − ẋ|) ≥ 𝐾𝜎) ≤
𝐾2

67
Clemente Castilleja Salas
5.7 AREAS BAJO LA CURVA NORMAL

68
Clemente Castilleja Salas
6. DISTRIBUCIÓN MUESTRAL DE MEDIDAS
DISTRIBUCION DE MUESTREO X
Una de las estadísticas más importantes es la media de un conjunto de variables
aleatorias independientes e idénticamente distribuidas. Este estadístico tiene un
papel muy importante en problemas de toma de decisiones para medidas
poblacionales desconocidas. Sea x1,x2,…..xn = μ y Var (X1)= σ2 para toda i=
1,2,…..n.
Entonces la estadística:
X=(X1+x2+….xn)/n
Se define como le medida de las n variables aleatorias IID o, sencillamente, media
maestral. Nótese que una vez que se conocen las realizaciones x1,x2,…xn de
X1,X2,….XN, respectivamente, la realización de x de X se obtiene promediando
los datos muéstrales. Si en ai= 1/n, i =1, 2,…n. entonces el valor esperado y la
varianza de X son:
1
E(X)=∑𝑁
𝐼=1 μ = n (μ/n) =μ
𝑁
1
Var(X)= ∑𝑛𝑖=1 σ2 = n (σ2/n2) = σ2/n.
𝑛2

Respectivamente, en donde μ y σ2 son la medida de la varianza de la distribución


de la población a partir de la cual se obtuvo una muestra. Con respecto a este
resultado, lo importante es recordar que es válido sin importar la distribución de
probabilidad de la población de interés siempre y cuando la varianza tenga un
valor infinito. A partir de la desviación estándar de X es:

d. e (X)= σ /√𝑛
Ejemplo:
Supóngase que las estaturas de 3000 estudiantes de una universidad se
distribuyen normalmente con media 68.0 pulgadas y deviación típica 3.0 pulgadas.
Si se toman 80 muestras de 25 estudiantes cada una, ¿cuál será la media y'la
desviación típica esperada de la distribución maestral de medias resultante si el
muestreo se hizo (o) con remplazamiento, (b) sin remplazamiento?:

X= estudiantes de una muestra cualquiera tomada al azar.


X25= Media estandar. De una muestra cualquiera (o tomada al azar), de 25
estudiantes (seleccionados al azar).

69
Clemente Castilleja Salas
F(x 25)
DMM

MDMM= MPOB=68
DMM=
DMM= == 3/5

MDMM=MPOB

P(X 25 > 69.5) =?

∞ 𝑍2=∞ ∞
∫69.5 𝑓(𝑥)𝑑𝑥 ∍ ∫𝑍1= 69.5−68 𝐹(𝑍)𝐷𝑍 = ∫2.5 (𝐼)
3/5

∞ 2.50
= ∫0 − ∫0 𝐼 = 0.5 − 0.4938

70
Clemente Castilleja Salas
F(X 25)

P(X 25 > 69.5) = 0.0062(1)


(2)
DMM= 3/5

69.5
2.5

X 25
Z

FORMULA DE LA DISTRIBUCION MUESTRAL DE MEDIAS (DMM)


F (XDMM)

● Curva única:
XDMM

71
Clemente Castilleja Salas
0.68

0.95

0.9974

𝑚𝑃𝑂𝐵 = 𝑚𝐷𝑀𝑀 = 𝑋𝑀𝑈𝐸𝑆 ± 𝑍𝜎𝐷𝑀𝑀


ESTIMADOR DE LA MEDIA DE UNA POBLACION DESCONOCIDA, A PARTIR
DE LA MEDIA DE UNA MUESTRA.

DISTRIBUCION MUESTRAL DE MEDIAS (PROBLEMA):


Una población se compone de los cinco números 2, 3, 6, 8, 11. Considerar todas
las muestras posibles de tamaño de dos que puedan extraerse con
remplazamiento de esta población. Hallar:
a) La media de la población.
b) La desviación típica de la población.
c) La media de la distribución muestral de medias
d) La desviación típica de la distribución muestral de medias, es decir, el error
típico de medias.
2+3+6+8+11 30
(a) 𝜇 = = = 6.0
5 5
(2−6)2 +(3−6)2 (6−6)2 +(8−6)2 (11−6)2 16+9+0+4+25
(b) 𝜎 = = = 10.8 𝑦 𝜎 = 3.29
5 5

(c) Hay 5(5)=25 muestras de tamaño dos que pueden extraerse con
remplazamiento (puesto que cualquier de los cinco números de la primera
extracción puede asociarse con cualquiera de los cinco números de la segunda
extracción). Estas son:

72
Clemente Castilleja Salas
(2,2) (2,3) (2,6) (2,8) (2,11)

MUESTRAS (3,2) (3,3) (3,6) (3,8) (3,11)


DE 2 (6,2) (6,3) (6,6) (6,8) (6,11)
ELEMENTO
S (8,2) (6,3) (8,6) (8,8) (8,11)
(11,2) (11,3) (11,6) (11,8) (11,11)

Las correspondientes medias muestrales son:


2,0 2,5 4,0 5,0 6,5
2,5 3,0 4,5 5,5 7,0
4,0 4,5 6,0 7,0 8,5
5,0 5,5 7,0 8,0 9,5
6,5 7,0 8,5 9,5 11,0
Y la media de la distribución muestral de medias es:
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 150
𝜇𝑥 = = = 6.0
25 25

Comprobándose que: 𝜇𝑥 = 𝜇 mDM= mPOB


2
(d) La varianza 𝜎 𝑥 de la distribución muestral de medias se obtiene restando el
valor de la media 6 de cada numero, elevándolo al cuadrado cada diferencia,
sumando los 25 numeros asi obtenidos y dividiendo por 25. El resultado final es:
2 135
𝜎 = = 5.40 𝑑𝑒 𝑚𝑜𝑑𝑜 𝑞𝑢𝑒: 𝜎𝑥 = √5.40 = 2.32
𝑥 25
Esto pone de manifiesto el hecho de que para poblaciones finitas en las que se
2
efectúa muestreo con remplazamiento (o poblaciones finitas), 𝜎 = 𝜎 2 /𝑁,puesto
𝑥
que el segundo numero e: 10.8/2=5.40 de acuerdo con el valor anterior.

TEOREMA DEL LIMITE CENTRAL


El teorema del límite central establece que, bajo condiciones muy generales, la
distribución de la suma de un gran número de variables aleatorias independientes
es asintóticamente normal, sin tener en cuenta la distribución de las variables
individuales. Asintóticamente normal significa que la suma se aproximara a una

73
Clemente Castilleja Salas
distribución normal a medida que el número de variables aleatorias que se suman
sea más grande. De este modo si:
Y = X1 + X2 + … + Xn
En donde X1, X2, …, Xn son variables aleatorias independientes con funciones de
densidad Px1, Px2, … Pxn la función de densidad de la suma y es:
Py (y) = Px1 * Px2 * … * Pxn
Es un límite cuando n ∞, la función gaussiana de densidad limitante es:
2
1 /2𝜎2
𝑃𝑦(𝑌) ⟶ 𝑒 −(𝑦−𝑦)
√2𝜋𝜎
En el caso especial en donde las distribuciones componentes son idénticas, el
teorema del límite central se cumple si hay un segundo momento finito para la
distribución común.

7. ESTIMACIÓN ESTADÍSTICA
TEORIA DE ESTIMACION ESTADISTICA

DISTRIBUCION
MUESTRAL DE
MEDIAS
(DMM)

3 2 1 1 2 3

= MEDIA DE UNA
MUESTRA DE TAMAÑO N
TOMADA AL AZAR DE LA
POBLACION

74
Clemente Castilleja Salas
K=1 0.6828
𝑃(𝑚𝑃𝑂𝐵 𝐷𝑀𝑀 − 𝐾𝜎𝐷𝑀𝑀 ≤ 𝑋𝑁 ≤ 𝑚𝑃𝑂𝐵 𝐷𝑀𝑀 + Z𝐾𝜎𝐷𝑀𝑀 ) = K=2 0.9544

K=3 0.9972

𝑋𝑁 −𝑚𝐷𝑀𝑀
𝑍= 𝜎𝐷𝑀𝑀

K Z

Suponer que la población es desconocida y 𝑋𝑁 (es una muestra cualquiera tomada


al azar de esa población) es conocida.
Modelo matemático ¿Calidad? (Sirve para estimar 99% la realidad.
Índice de correlación “r”:

∑ (𝑦 𝑡𝑒𝑜𝑟𝑖𝑐𝑎−𝑦 𝑚𝑒𝑑𝑖𝑎)2
r=√ (𝑦 𝑟𝑒𝑎𝑙−𝑦 𝑚𝑒𝑑𝑖𝑎)2

2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑎𝑚𝑝𝑙𝑖𝑓𝑖𝑐𝑎𝑑𝑎 ∑ (𝑌 𝑡𝑒𝑜𝑟𝑖𝑐𝑎 − 𝑌)
𝑟= =√ 2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑜𝑡𝑎𝑙 ∑ (𝑌 𝑟𝑒𝑎𝑙 − 𝑌)

ESTIMACION ESTADISTICA
En inferencia estadística se llama estimación al conjunto de técnicas que permiten
dar un valor aproximado de un parámetro de una población a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimación de la media de una
determinada característica de una población de tamaño N podría ser la media de
esa misma característica para una muestra de tamaño.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene
distintos métodos que se usan en función de las características y propósitos del
estudio:
● Estimación puntual:2
● Método de los momentos;

75
Clemente Castilleja Salas
● Método de la máxima verosimilitud;
● Método de los mínimos cuadrados;
● Estimación por intervalos.
● Estimación bayesiana.
Un estimador es una regla que establece cómo calcular una estimación basada en
las mediciones contenidas en una muestra estadística.
ESTIMACIÓN PUNTUAL
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido
de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un
estimador, es que sea un estimador eficiente. Es decir, que sea insesgado
(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Estimación puntual. Sea X una variable poblacional con distribución Fθ, siendo θ
desconocido. El problema de estimación puntual consiste en, seleccionada una
muestra X1, ..., Xn, encontrar el estadístico T(X1, ..., Xn) que mejor estime el
parámetro θ. Una vez observada o realizada la muestra, con valores x1, ..., xn, se
obtiene la estimación puntual de θ, T(x1, ..., xn) = ˆ θ .
Vemos a continuación dos métodos para obtener la estimación puntual de un
parámetro: método de los momentos y método de máxima verosimilitud. Método
de los momentos: consiste en igualar momentos poblacionales a momentos
muéstrales. Deberemos tener tantas igualdades como parámetros a estimar.
Momento poblacional de orden r αr = E (Xr) Momento muestral de orden r ar = Xn
i=1 Xr i n
Método de máxima verosimilitud: consiste en tomar como valor del parámetro
aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ...,
Xn es una muestra seleccionada de una población con distribución Fθ o densidad
fθ(x), la probabilidad de que ocurra una realización x1, ..., xn viene dada por:
Lθ(x1, ..., xn) = Yn i=1 fθ(xi)
A Lθ(x1, ..., xn) se le llama función de verosimilitud. (Credibilidad de la muestra
observada). Buscamos entonces el valor de θ que maximice la función de
verosimilitud, y al valor obtenido se le llama estimación por máxima verosimilitud
de θ. Nota: si la variable X es discreta, en lugar de fθ (xi) consideramos la función
masa de probabilidad pθ (xi).
Ejemplo 7.1: Sea X → N (µ, σ), con µ desconocido. Seleccionada una más. X1, ...,
Xn, con realización x1, ..., xn, estimamos el parámetro µ por ambos métodos.
Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se

76
Clemente Castilleja Salas
obtiene que ˆ µ = − x. Por el método de máxima verosimilitud: Lµ(x1, ..., xn) = Yn
i=1 fµ (xi) = = Yn i=1 1 √ 2πσ e − (xi−µ) 2 2σ
Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en
este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn
i=1 (xi − µ) 2 − n ln (√ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ
σ 2 = 0 ⇐⇒ ˆ µ = −
ESTIMACIÓN POR INTERVALOS
Consiste en la obtención de un intervalo dentro del cual estará el valor del
parámetro estimado con una cierta probabilidad. En la estimación por intervalos se
usan los siguientes conceptos:
INTERVALO DE CONFIANZA
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ
es el parámetro a estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo
cuando la muestra no garantiza un axioma o un equivalente circunstancial.
VARIABILIDAD DEL PARÁMETRO
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular el
tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como
medida de esta variabilidad la desviación típica poblacional y se denota σ.
ERROR DE LA ESTIMACIÓN
Es una medida de su precisión que se corresponde con la amplitud del intervalo
de confianza. Cuanta más precisión se desee en la estimación de un parámetro,
más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o
disminuir el error, más observaciones deberán incluirse en la muestra estudiada.
En caso de no incluir nuevas observaciones para la muestra, más error se comete
al aumentar la precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
LÍMITE DE CONFIANZA
Es la probabilidad de que el verdadero valor del parámetro estimado en la
población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se
denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)
·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se
corresponden con valores α de 0,05 y 0,01 respectivamente.
VALOR Α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de
fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de

77
Clemente Castilleja Salas
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del
95%, el valor α es (100-95)/100 = 0,05
VALOR CRÍTICO
Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución
que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
Normalmente los valores críticos están tabulados o pueden calcularse en función
de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del
siguiente modo: se busca en la tabla de la distribución ese valor (o el más
aproximado), bajo la columna "Área"; se observa que se corresponde con -1,28.
Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no
coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ
para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen
restando y sumando, respectivamente, la mitad del error, para obtener el intervalo
de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en
nuestra estimación, es decir, un mayor nivel de confianza.
Otros usos del término
El término estimación también se utiliza en ciencias aplicadas para hacer
referencia a un cálculo aproximado, que normalmente se apoya en la herramienta
estadística aunque puede no hacerlo. En este sentido, un ejemplo clásico son los
poco conocidos pero útiles en economía problemas de Fermi.
EJEMPLO:
En un conjunto de 42 personas, tomadas al azar de la ciudad, cuantas llamadas
realizaron durante la semana pasada desde su teléfono móvil a un fijo. La ciudad
cuenta con 130 mil habitantes. El resultado es el siguiente:

7 4 6 2 8 3 5
6 7 3 3 5 2 7
8 7 5 3 3 5 5
4 5 5 7 5 1 3
1 1 2 3 6 7 3
4 3 7 1 3 7 7

78
Clemente Castilleja Salas
Por término medio:
Lo primero que nos interesa es encontrar cuál es el número medio semanal
de llamadas a fijos que realizan en la ciudad desde un teléfono móvil. Se trata de
estimar la media aritmética poblacional, para lo que necesitamos la media de la
muestra (estimador), la desviación tipo, la distancia estandarizada que representa
la seguridad y el tamaño de la muestra. Pongamos que, por llevar la contraria a Sir
Ronald y porque tampoco se nos ocurre qué problema serio puede derivarse de
nuestro posible error, utilizaremos una seguridad del 90%.
Lo primero es observar si podemos suponer que la distribución muestral de
medias
De la que proviene nuestra muestral es normal. Podemos suponerlo, puesto que
n=42≥30.
Lo siguiente es traducir la seguridad a una distancia estandarizada, utilizando la
Curva normal estandarizada. Según la tabla que tenemos en el monográfico
La curva normal, un área centrada del 90% se corresponde con una puntuación
tipo de valor 1,645. Acto seguido, nos falta el estimador y la desviación tipo. Lo
resolvemos mediante una tabla de frecuencias (donde d2 es la distancia
cuadrática a la media):

TABLA DE FRECUENCIAS
Xi fi Xifi d2*fi
1 4 4.00 49.00
2 3 6.00 18.75
3 10 30.00 22.50
4 3 12.00 0.75
5 8 40.00 2.00
6 3 18.00 6.75
8 2 16.00 24.50
SUMA 42 189.00 180.50
Media: 189/42 = 4.5
Varianza: 180.5/42 = 4.298
Desviación tipo: Raíz (4.298) = 2.073
Con esta información:
𝑆 2,2.73
𝑒𝑝 = 𝑍 = 1,645 = 0,053
√𝑛−1 √42−1

µ ∈ {𝑋 ± 𝑒𝑝 } ⟶ µ ∈ {4,5 ± 0,53}0.90 = {3,97 ; 5,03}0.90

79
Clemente Castilleja Salas
Luego, con una seguridad del 90%, afirmamos que la gente de la ciudad realiza
semanalmente entre 3,97 y 5,03 llamadas de móvil a fijo por término medio.
Pongamos un porcentaje:
¿Qué porcentaje de personas en la ciudad realizan no menos de 5 llamadas de
móvil a fijo durante una semana? Utiliza una probabilidad de errar del 5%.En la
muestra, 8+3+9+2=22 personas realizaron no menos de 5 llamadas de ese tipo, lo
que significa un 22/42*100 = 52,38% de la muestra. Al consultar la tabla de la
curva normal estandarizada, el área centrada del 95% se corresponde con una
distancia estandarizada de 1,96. Podemos consultar sin problemas esta tabla,
puesto que es asumible que la distribución muestral de proporciones es normal.
Utilizando p como criterio (pues carecemos del valor de π):
np = 42·0,5238=22≥5 n (1−p) = 42·0,4762 = 20 ≥ 5
Así pues:

𝑝−(1−𝑝) 52,38 ∗ 47,62


𝑒𝑝 = 𝑍√ = 1,96√ = 15
𝑛 42

𝜋 ∈ {𝑝 ± 𝑒𝑝 } seg ⟶ 𝜋 ∈ {52,38% ± 15%} 0.95 =


{37,38% ; 67,38%}.095
Luego, con una seguridad del 95% podemos concluir que entre un 37% y un 67%
de la gente de la ciudad realiza no menos de 5 llamadas de móvil a fijo en una
semana. Observa que he utilizado valores de porcentaje en lugar de proporciones.
Esto es intrascendente. Puedo hacer los cálculos con proporciones y multiplicar
finalmente por 100, o arrastrar los porcentajes desde cuando quiera.
En total…
Y, por último, a partir de los resultados anteriores queremos conocer cuántas
llamadas de móvil a fijo se hacen en la ciudad y cuánta gente hace no menos de 5
llamadas, ambos semanalmente. Como sabemos que la ciudad alberga a 130 mil
habitantes, podemos responder a estas dos inquietudes. No obstante, al tratarse
de dos conclusiones realizadas con niveles diferentes de seguridad, no van a ser
comparables. Para evitarlo, vamos a repetir los cálculos y, ya puestos, variando
también la seguridad. Esta vez vamos a responder a ambas preguntas a través de
un riesgo de equivocarnos
del 3%.
Al consultar la tabla para un área centrada del 97% de seguridad, el valor
estandarizado correspondiente es 2,17. Luego:

80
Clemente Castilleja Salas
Para la media:
𝑆 2,073
𝑒𝑝 = 𝑍 = 2,17 = 0,70
√𝑛 − 1 √42 − 1

𝜋 ∈ {𝑝 ± 𝑒𝑝 } seg ⟶ 𝜋 ∈ {4,5 ± 0,7%} 0.97 = {3,8 ; 5,2, } 0.97

Si cada persona realiza entre 3,8 y 5,2 llamadas de móvil a fijo semanales, las 130
mil realizarán entre 3,8*130000= 494 mil y 5,2*130000= 676 mil de este tipo de
llamadas a la semana. Respecto a la proporción:

𝑝(1 − 𝑝) 52,38 ∗ 47,62


𝑒𝑝 = 𝑍√ = 2,17 √ 16,72
𝑛 42

𝜋 ∈ {𝑝 ± 𝑒𝑝 } seg ⟶ 𝜋 ∈ {52,38% ± 16,72%} 0.97 =


{37,66% ; 69,10%}.097
Si esto ocurre en una población de 130 mil personas, podemos concluir con una
Seguridad del 97% que entre 130000*0,3566= 46358 y 130000*0,691=89830 de
ellas realizan no menos de cinco llamadas de móvil a fijo a la semana.
EJEMPLO: Supóngase que las estaturas de 3000 estudiantes de una universidad
se distribuyen normalmente con media 68.0 pulgadas y deviación típica 3.0
pulgadas. Si se toman 80 muestras de
25 estudiantes cada una, ¿cuál será la media y la desviación típica esperada de la
distribución muestral de medias resultante si el muestreo se hizo (a) con
remplazamiento, (b) sin remplazamiento?
El número de muestras de tamaño 25 que teóricamente pueden obtenerse de un
grupo de 3000 estudiantes con y sin remplazamiento son (3000)²⁵ y ₃₀₀₀C₂₅, que
son muchas más de 80. De aquí que con 80 no se obtenga realmente una
distribución muestral de medias, sino solamente una distribución muestral
experimental. Sin embargo, puesto que el número de muestras es grande, habría
mucha aproximación entre las dos distribuciones muestrales. Por ello, la media y

desviación típica esperadas serán muy próximas a las de la distribución teórica. Así
se tiene,
que es ligeramente menor que 0.6 pulgadas y puede, por tanto, para todo propósito
práctico, considerarse la misma que en el muestreo con remplazamiento.

81
Clemente Castilleja Salas
Así, pues, cabría esperar que la distribución muestral experimental de medias se
distribuya aproximadamente normal con media 68,0 pulgadas y desviación típica
0.6 pulgadas.

EJEMPLO: Las medidas de los diámetros de una muestra de 200 cojinetes de bolas
hechos por una determinada máquina durante una semana dieron una media de
0.824 pulgadas y una desviación típica de 0.042 pulgadas. Hallar los límites de
confianza del (a) 95% y (b)99% para el diámetro medio de todos los cojinetes.

EJEMPLO: Al medir el tiempo de reacción, un sicólogo estima que la deviación típica


del mismo es de 0.05 segundos. ¿Cuál es el número de medidas que deberá hacer
para que sea del (a) 96% y (b)99% La confianza de que el error de su estima no
exceda de 0.01 segundos?

(a) Los límites de confianza del 95% son ⴟ+-1.96𝜎/√𝑛


Siendo el error de la estima 1.96𝜎/√𝑛
Tomando 𝜎 = 𝑠 = 0.05 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
Se tiene que el error será igual a 0.01 si (1.96)(0.05)/ √𝑛 = 0.01, es decir,
√𝑛 =(1.96)(0.06)/0.01 = 9.8 o n = 96.04. Así, pues, se puede estar en la
confianza del 95% de que el error de la estima será menor de 0.01 si n es 97
o mayor.
(b) Los límites de confianza del 99% son X +- 2.58 𝜎/√𝑛. Entonces
(2.58)(0.05)/ √𝑛 = 0.01,
O n=166.4. Así, pues, se tiene la confianza del 99% de que el error de la
estima será menor de 0.01 solamente si n es 167 o mayor.

82
Clemente Castilleja Salas
8. DECISIONES ESTADÍSTICAS
DMM (Distribución destral de medias)

𝜎𝐷𝑀𝑀 7
𝜎𝐷𝑀𝑀 = = = 1.4
√𝑁 √25

𝑚𝐷𝑀𝑀 = 𝑚𝑃𝑂𝐵 = 110


Ejemplo 1. Las lámpara de marca “A “por especificaciones de producción deben
tener una vida media de 110 unidades de tiempo y una desviación estándar de
7 unidades de tiempo. Es decir:
mPOB=110 UT
POB “A”
σPOB=7 UT

La empresa comercializa el producto en paquetes de 25 unidades; es decir, cada


paquete puede considerarse como una muestra aleatoria de N=25 unidades.
Encontrar la probabilidad de que un paquete comercial cualquiera tenga una
media superior a 114 UT, es decir P (X25≥114).
Determinar probabilidad:
1.- Para un paquete comercial (25 lámparas).
1.1 P(X25 ≥ 114) =? Y comparar con
1.2 P(X1 ≥ 114) =?

SOLUCIÓN

1.1

110 UT
83
Clemente Castilleja Salas
1.2
Corresponde a la población

1.3 Considerar que se ensaya un nuevo material para fabricar la resistencia


eléctrica de la lámpara. Diseñar una regla de decisión para aceptar o rechazar el
nuevo material, con un nivel de confianza de 99%( o nivel de significación de
0.01).

Nivel de confianza es 0.99


99% NC=0.99 es un Xlim
equivalente a nivel de 0.5 0.49 0.1
significación de 1-
NC=0.1

84
Clemente Castilleja Salas
𝑚𝐷𝑀𝑀 = 𝑚𝐷𝑀𝑀 = 110

0.5 0.49 Zlim=2.33

1.3.1 SI LA MUESTRA ES DE 25:

1.3.2 SI LA MUESTRA ES DE 64:


REGLA DE DECISIÓN: Si la media de N artículos (25 o 64) es superior a Xlim
(113.2 o 112.0) el nuevo material se considera eficientemente con un nivel de
confianza de 99%

1.4 suponiendo que el nuevo material NO es efectivo (esto implica que los
parámetros del proceso original siguen siendo válidos: mDMM y σDMM). ¿Cuál es la
probabilidad de aceptar el nuevo material?

Probabilidad de aceptar una hipótesis


Que debe rechazarse. ERROR DE TIPO 1

85
Clemente Castilleja Salas
2.- Si el nuevo producto si incrementa la duración media hasta 114.5 UT. ¿Cuál es
la probabilidad de rechazar el nuevo producto (N.P)?

P (Rechazo del N.P.)=


113.2−114.5
113.2 𝑧= =−0.93
1.4
𝑃(ẋ25 𝑁𝑃 ≤ 113.2) = ∫ 𝑓(𝑥𝑁𝑃 )𝑑𝑥 ∈ ∫ 𝑓(𝑧)𝑑𝑧
−∝ −∝
∝ 0.93
=∫ 𝑓(𝑧)𝑑𝑧 − ∫ 𝑓(𝑧)𝑑𝑧 = 0.5 − 0.1762
0 0

3.- ¿Probabilidad de aceptar el nuevo material cuando en realidad no es efectivo?


113.2
𝑃(ẋ25 ≤ 𝑥𝑙𝑖𝑚 ) = 𝑃(ẋ25 ≤ 113.2) = ∫ 𝑓(ẋ𝑝𝑟𝑜𝑐𝑒𝑑.𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 )𝑑𝑥
−∝

ERROR TIPO 1
4.- ¿Cuál es la probabilidad de rechazar el nuevo material cuando en realidad SÍ
es efectivo?
𝑃(𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑁. 𝑀𝐴𝑇𝐸𝑅𝐼𝐴𝐿) = 𝑃(ẋ25 𝑁𝑃 ≤ 113.2) = 0.1762
ERROR TIPO II

EJEMPLO: La resistencia a la rotura de los cables producidos por un fabricante


tienen una media de 1800 libras y una desviación típica de 100 libras. Mediante una
nueva técnica en el proceso de fabricación se aspira a que esta resistencia pueda
ser incrementada. Para ensayar esta aspiración, se ensaya una muestra de 50
cables y se encuentra que su resistencia media es de 1850 libras. ¿Puede
mantenerse que, en efecto, hay un aumento de resistencia al nivel de significación
del 0.01?
Se tiene que decidir entre las dos hipótesis:
Ho: μ=1800 libras, y realmente no hay cambio en la resistencia
H1: μ>1800 libras, y hay un cambio en la
resistencia
Aquí debe emplearse un ensayo unilateral (figura
7.4). Al nivel de significación del 0.01 la regla de
decisión es:

86
Clemente Castilleja Salas
1) Si el valor de z es mayor que 2.33 los resultados son significativos al nivel de
0.01 y Ho es rechazada.
2) De otro modo Ho es aceptada

Bajo la hipótesis de que Ho es cierta se tiene:

Que es mayor que 2.33. De aquí se deduce que los resultados son altamente
significativos y la aspiración de mejora debe ser admitida.

9.1 FORMULAS DE MINIMOS CUADRADOS


OBTENCIÓN DE LAS ECUACIONES NORMALES DE LA RECTA DE MÍNIMOS
CUADRADOS
Sea la ecuación de la recta de mínimos cuadrados pedida Y=a 0+a1X2 . Los valores
de Y en esta recta correspondientes a X=X1,X2,. . . . XN son a0+a1X1,a1X2, . . .
. a0+a1XN, mientras que los valores reales son Y1, Y2, . . . YN, respectivamente.
Entonces la recta de mínimos cuadrados es tal, que:
S= (a0+a1X1-Y1)2 + (a0+a1X2-Y2)2 +. . . + (a0+a1XN-YN)2 es mínimo pero S es
mínimo cuando las derivadas parciales de S con respecto a a 0 y a1 sean cero.
Entonces:

=2((a0+a1X1-Y1) + (a0+a1X2-Y2) +. . . + (a0+a1XN-YN)=0

=2((a0+a1X1-Y1) X1+ (a0+a1X2-Y2) X2+. . . + (a0+a1XN-YN)XN)=0


Y de aquí se obtienen la ecuaciones normales pedidas, que son
Na0 + a1ΣX – ΣY=0
a0 ΣX + a1ΣX2 – ΣXY=0

87
Clemente Castilleja Salas
Ejemplo 1 CALIFICACIONES: y=a0 + a1X

Alumnos Y X horas xy X2
calificación de estudio
1 4.6 1.8 8.28 3.24
2 5.2 1.7 8.84 2.89
3 6.2 1.2 7.44 1.44
4 6.9 3.9 26.41 15.21
5 7.5 3.3 24.75 10.89
6 8.0 4.7 37.60 22.09
7 8.9 4.3 38.27 18.49
8 7.6 5.5 41.80 30.25
9 5.8 3.9 22.62 15.21
10 = N 8.9 7 62.30 49.00
Σ 69.6 37.3 278.81 168.71

88
Clemente Castilleja Salas
TEORIA DE CORRELACION ESTADISTICA
Recta de mínimos cuadrados
La recta de aproximación por mínimos cuadrados del conjunto de puntos (X1, Y1),
(X2, Y2), …, (XN, YN) tiene la ecuación
Y = a0 + a1X (1)
Donde las constantes 𝑎0 y 𝑎1 se determinan mediante el sistema de ecuaciones

∑ 𝑌 = 𝑎0 𝑁 + 𝑎1 ∑ 𝑋∑ 𝑋𝑌 = 𝑎0 ∑ 𝑋 + 𝑎1 ∑ 𝑋2 (2)
Que son las llamadas ecuaciones normales para la recta de mínimos cuadrados
(1)
Las constantes 𝑎0 y 𝑎1 pueden sacarse de (2), obteniéndose las formulas
(∑ 𝑌)(∑ 𝑋 2 )−(∑ 𝑋)(∑ 𝑋𝑌) 𝑁∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
𝑎0 = 𝑎1 = (3)
𝑁∑ 𝑋 2 −(∑ 𝑋)2 𝑁∑ 𝑋 2 −(∑ 𝑋)2

Las ecuaciones normales (2) se recuerdan fácilmente, observando la primera


ecuación puede obtenerse formalmente en ambos miembros de (1), es decir,
∑ 𝑌=∑ (𝑎0 + 𝑎1 𝑋) = 𝑎0 𝑁 + 𝑎1 ∑ 𝑋, mientras que la segunda ecuación
se obtiene formalmente multiplicando primeramente los dos miembros de (1) por X
y después sumando, es decir, ∑ 𝑋𝑌 = ∑ 𝑋(𝑎0 + 𝑎1 𝑋) = 𝑎0 ∑ 𝑋+
𝑎1 ∑ 𝑋 2 . Nótese que esto no es una derivación de las ecuaciones normales,
sino sencillamente una forma de recordarlas. Para una derivación, empleando
cálculo:
Obtención de las ecuaciones normales de la recta de mínimos cuadrados
Sea la ecuación de la recta de mínimos cuadrados pedida Y = a 0 + a1X. Los
valores de Y en esta recta correspondientes a X = X1, X2, …, XN son a0 + a1X1, a0
+ X2, …, a0 + a1XN, mientras que los valores reales son Y1, Y2, …, YN,
respectivamente. Entonces, la recta de mínimos cuadrados es tal, que
𝑆 = (𝑎0 + 𝑎1 𝑋1 − 𝑌1 )2 + (𝑎0 + 𝑎1 𝑋2 − 𝑌2 )2 + ⋯ + (𝑎0 + 𝑎1 𝑋𝑁 − 𝑌𝑁 )2 Es mínimo
Pero S es mínimo cuando las derivadas parciales de S con respecto a a0 y a1 sean
cero. Entonces
𝜕𝑆
= 2{(𝑎0 + 𝑎1 𝑋1 − 𝑌1 ) + (𝑎0 + 𝑎1 𝑋2 − 𝑌2 ) + ⋯ + (𝑎0 + 𝑎1 𝑋𝑁 − 𝑌𝑁 )} = 0
𝜕𝑎0
𝜕𝑆
= 2{(𝑎0 + 𝑎1 𝑋1 − 𝑌1 )𝑋1 + (𝑎0 + 𝑎1 𝑋2 − 𝑌2 )𝑋2 + ⋯ + (𝑎0 + 𝑎1 𝑋𝑁 − 𝑌𝑁 )𝑋𝑁 } = 0
𝜕𝑎1
Y de aquí se obtienen las ecuaciones normales pedidas, que son

89
Clemente Castilleja Salas
𝑁𝑎0 + 𝑎1 ∑ 𝑋−∑ 𝑌=0 𝑎0 ∑ 𝑋 − 𝑎1 ∑ 𝑋2 − ∑ 𝑋𝑌 = 0

Nótese también que en (2) y (3) se ha empleado la notación ∑ 𝑋, ∑ 𝑋𝑌,


etc., en lugar de ∑𝑁
𝑗=1 𝑋𝑗 , ∑𝑁
𝑗=1 𝑋𝑗 𝑌𝑗 , etc.

El trabajo necesario para encontrar una recta de mínimos cuadrados puede a


veces simplificarse transformando los datos, de forma que 𝑥 = 𝑋 − 𝑋 e 𝑦 = 𝑌 − 𝑌.
La ecuación de la recta de mínimos cuadrados puede escribirse
∑ 𝑥𝑦 ∑ 𝑥𝑌
𝑦=( )𝑥 𝑜 𝑦=( )𝑥 (4)
∑ 𝑥2 ∑ 𝑥2

En particular, si X es tal que ∑ 𝑋 = 0, es decir, 𝑋 = 0, se convierte en


∑ 𝑋𝑌
𝑌 =𝑌+( )𝑋 (5)
∑ 𝑋2

De estas ecuaciones se deduce inmediatamente que la recta de mínimos


cuadrados pasa por el punto (𝑋, 𝑌), que es el centro de gravedad de los datos

Demostración formula de mínimos cuadrados

90
Clemente Castilleja Salas
𝑌𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜

𝑌̂
𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜

𝑌̂
𝑖= 𝛼 + 𝛽𝑋𝑖

𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
(𝑒𝑖 )2 = (𝑌𝑖 − 𝑌̂𝑖 )2
Tenemos que minimizar:
𝑛

∑ 2
(𝑒𝑖 ) = ∑ (𝑌𝑖 − 𝑌̂𝑖 )2
𝑖=1

Pero sabemos que: 𝑌̂


𝑖= 𝛼 + 𝛽𝑋𝑖

Por lo tanto ∑ (𝑒𝑖 )2 = ∑𝑛𝑖=1 (𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )2 = 𝑓(𝛼, 𝛽)


Resolviendo la derivada parcial para α

𝜕𝑓
=∑ − 2(𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0
𝜕𝛼

Dividiremos toda la expresión entre ´´-2´´ resultando:

∑ 𝑌𝑖 − ∑ ∝ −∑ 𝛽𝑋𝑖 = 0

∑ 𝑌𝑖 − 𝛼 ∑ 1−𝛽∑ 𝑋𝑖 = 0

Si sumamos 1 ´n´ veces nos queda:

∑ 𝑌𝑖 − 𝛼𝑁 − 𝛽 ∑ 𝑋𝑖 = 0

Por lo tanto no queda que:

𝛼𝑁 + 𝛽 ∑ 𝑋𝑖 = ∑ 𝑌𝑖 … … … … … … … … … … … … … … … … . . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 1

Resolviendo la derivada parcial para β

91
Clemente Castilleja Salas
𝜕𝑓
=∑ − 2𝑋𝑖 (𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0
𝜕𝛽

Dividiremos toda la expresión entre ´´-2´´ resultando:

∑ 𝑋𝑖 (𝑌𝑖 − 𝛼 − 𝛽𝑋𝑖 )1 = 0

∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝛼𝑋𝑖 − ∑ 𝛽𝑋 2 𝑖 = 0

∑ 𝑋𝑖 𝑌𝑖 − 𝛼 ∑ 𝑋𝑖 − 𝛽 ∑ 𝑋2𝑖 = 0

Por lo tanto nos queda que=

∑ 𝑋𝑖 𝑌𝑖 = 𝛼 ∑ 𝑋𝑖

+𝛽∑ 𝑋 2 𝑖 … … … … … … … … … … … … … … … … … … . . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 2

Resolveremos el sistema de ecuaciones formado con algebra de matrices

(𝑁 ∑ 𝑋𝑖 ∑ 𝑋𝑖 ∑ 𝑋 2 𝑖 ) (𝛼 𝛽 ) = (∑ 𝑌𝑖 ∑ 𝑋𝑖 𝑌𝑖 )

Calculando la determinante general


2

(𝑁 ∑ 𝑋𝑖 ∑ 𝑋𝑖 ∑ 𝑋2𝑖 ) = 𝑁 ∑ 𝑋 2 𝑖 − (∑ 𝑋𝑖 )

Calculado para β

(𝑁 ∑ 𝑌𝑖 ∑ 𝑋𝑖 ∑ 𝑋𝑖 𝑌𝑖 ) = 𝑁 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑌𝑖 ∑ 𝑋𝑖

92
Clemente Castilleja Salas
Por lo tanto

𝑁∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑌𝑖 ∑ 𝑋𝑖
𝛽= 2
𝑁∑ 𝑋 2 𝑖 − (∑ 𝑋𝑖 )

Para α tomaremos la ecuación 1

𝛼𝑁 + 𝛽 ∑ 𝑋𝑖 = ∑ 𝑌𝑖

Dividiremos todo entre N

𝛽∑ 𝑋𝑖 ∑ 𝑌𝑖
𝛼+ = … … … … … … … … … … … . 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛 3
𝑁 𝑁

Pero sabemos que:

∑ 𝑋𝑖
𝑋=
𝑁
∑ 𝑌𝑖
𝑌=
𝑁
Por lo tanto la Ecuación 3 toma la siguiente forma
𝛼 + 𝛽𝑋 = 𝑌

𝛼 = 𝑌 − 𝛽𝑋
9.2 AJUSTE DE CURVAS Y METODO DE MINIMOS CUADRADOS
Teoría de correlación estadística

OBSERVACIONES X Y
REALES

1 X1 Y1
2 X2 Y2
3 X3 Y3
. . .
. . .
. . .
n Xn Yn

93
Clemente Castilleja Salas
dn
Y=f (t) PUNTO
d5
(OBCERVACIONN REAL)
d3

d1
d4 RECTA
(TEORICA)
d2

VALORES REALES
VALORES OBSERVADOS
y=f(x) Función matemática cualquiera: MODELO TEORICO (infinidad de
posibilidades matemáticas)
MODELO: LINEA RECTA: y= a0 + a1x
A partir de “n” observaciones reales obtener un modelo matemático teórico.
METODO DE MINIMOS CUADRADOS
Recta de ajuste máximo: min( ∑𝑛𝑖=1 𝑑𝑖 2 )
y= a0 + a1 x di = y teórica i – y real i
𝑑𝑖 2 = (Y real i + (a0 + a1 xi ))2
Donde a0, a1 xi son valores teóricos
A ∑𝑛𝑖=1 𝑑𝑖 2 = ( - y1 + (a0 + a1 x1 )) 2 + ( - y2 + (a0 + a1 x2 )) 2 + … + ( - yn + (a0 +
a1 xn ) 2
EL MINIMO SE DARA CUANDO:
I ꝺ di/ ꝺ a0 = 0 II ꝺ di/ ꝺ a1 = 0
I.- 2( - y1 + a0 + a1 x1 ) + 2( - y2 + a0 + a1 x2 ) + … + 2( - yn + a0 + a1 xn )= 0
II.- 2( - y1 + a0 + a1 x1 ) X1 + 2( - y2 + a0 + a1 x2 ) X2 + … + 2( - y1 + a0 + a1 xn ) Xn
=0

94
Clemente Castilleja Salas
Ecuación
I. ∑y = N a0 + a1 ∑X
II. ∑ Xy = a0 ∑ X + a1 ∑ X2
Dónde: X, Y = Son valores constantes observados (o REALES)
a0 , a1 = Son las incógnitas.
∑ y = K2 ; ∑ xy = K3
∑ X = K1 ; ∑ X2 = K4
1.- K2 = N a0 + K1a1 (K1)
2.- K3 = K1 a0 + K4a1 (-N)
3.- -K3N = -N K1 a0 - K4a1
4. - K1K2 = N K1 a2 + K12 a1
- K3 N + K1 K2 = a1 ( K12 - N K4 )

𝐾1 𝐾2 − 𝑁𝐾3 − ∑ 𝑥∑𝑦 + 𝑁 ∑ 𝑥𝑦
𝑎1 = =
𝐾12 − 𝑁𝐾4 −∑ 𝑥2 + 𝑁 ∑ 𝑥2

1. - K4 𝐾2 𝐾4 = 𝑁𝐾4 𝑎0 + 𝐾1 𝐾4 𝑎1
2. - -K1 −𝐾1 𝐾3 = −𝐾12 𝑎0 −𝐾1 𝐾4 𝑎1
𝐾2 𝐾4 − 𝐾1 𝐾3 = 𝑎0 (𝑁𝐾4 − 𝐾12 )

(∑ 𝑦)(∑ 𝑥 2 ) − (∑ 𝑥)(∑ 𝑥𝑦)


𝑎0 =
𝑁(∑ 𝑥 2 ) − (∑ 𝑥)2

(∑ 𝑥𝑦) − (∑ 𝑥) − (∑ 𝑥)(∑ 𝑦)
𝑎1 =
𝑁(∑ 𝑥 2 ) − (∑ 𝑥)2

95
Clemente Castilleja Salas
9.3 APLICACIONES
Ejemplo 2:
DATOS ESTADISTICOS:

ALTURA PESO Y X^2 XY Y (Yt-Y)^2 (Yr-2)2


X TEORICA
70 155 4900 10850 163.9 94.1 0.6
63 150 3960 9450 141.4 163.8 17.6
72 180 5184 12960 170.3 259.2 665.6
60 135 3600 8100 131.8 501.7 368.6
66 156 4356 10296 151.1 9.6 3.2
70 168 4900 11760 163.9 94.1 190.4
74 178 5476 13172 176.7 506.2 566.4
65 160 4225 10400 147.9 39.7 33.6
62 132 3844 8184 138.2 256.0 492.8
67 145 4489 9715 154.3 0.0 84.6
65 139 4225 9035 147.9 39.7 231.0
68 152 4624 10336 157.5 10.9 4.8
∑ x= 802 ∑ y =1850 53792 124258 ….. ∑ = 1975 ∑=2659.2
X = 66.8 Y = 154.2

N=12
Y=a0+a1X

∑ 𝑦∑ 𝑥2−∑ 𝑥∑ 𝑥𝑦 1850(53792)−802(124258)
A0 = = (12)(53792)−(802)2
=
𝑁∑ 𝑥2−(∑ 𝑥)2
−60.747
𝑁∑𝑥𝑦−∑𝑥∑𝑦 12(124258)−(802)(1850)
A1 = = = 3.215
𝑁∑𝑥2−(∑𝑥)2 12(53794)−(802)2

96
Clemente Castilleja Salas
ANALISIS DE LA PRODUCCION DE MAIZ EN MEXICO.
SERIES DE TIEMPO

PRODUCC Y´TEORI VARIACI


PERIOD IÓN (Y) CA ÓN VARIACIÓ
AÑO X2 XY
O (X) MIL-TON EXPLÍCI N TOTAL
(YR) YT TA
1980- 5.782313 194.4375
0 13.18 0 0 42.855353
1981 19 57
1982- 8.571142 124.4397
1 12.03 1 12.03 59.234573
1984 86 62
1985- 11.35997 69.99710
2 12.54 4 25.08 51.644345
1987 25 87
1988- 14.14880 31.10959
3 12.06 9 36.18 58.773689
1990 22 72
1991- 16.93763 7.777227
4 16.44 16 65.74 10.800425
1993 19 69
1994- 19.72646 3.787E-
5 1.2 25 91.02 343.227497
1996 15 09
1997- 22.51529 7.777914
6 17.94 36 107.63 3.19122496
1999 12 17
2000- 25.30412 31.11097
7 19 49 132.97 0.52765696
2002 09 02
2003- 28.09295 69.99916
8 20.58 64 164.6 0.72863296
2005 05 81
2006- 30.88178 124.4425
9 23.97 81 215.65 18.008141
2008 02 08

97
Clemente Castilleja Salas
2009- 33.67060 194.4409
10 29.614 100 296.14 97.7646338
2011 99 89
2012- 36.45943 279.9946
11 35.489 121 390.379 248.459559
2014 96 13
2015- 39.24826 381.1033
12 42.401 144 508.812 514.137485
2017 92 78
∑=2046.2 ∑=1449.35
N=13 ∑=78 ∑=256.444 ∑=650
31 322
19.726461
p= 6
5

=2.99348352

𝑁(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌)


𝑎1 = =2.78882967
𝑁(∑ 𝑋 2 )−(∑ 𝑋)2

Y´TEORICA=a0 +a1x= 2.99348352+2.78882967(x)

INDICE DE CORRELACIÓN

𝑉. 𝐸
𝑟=√ =
𝑉. 𝑇

𝑉𝐴𝑅𝐼𝐴𝐶𝐼Ó𝑁 𝐸𝑋𝑃𝐿𝐼𝐶𝐼𝑇𝐴 ∑(𝑌𝑇 − 𝑌)2


𝑟=√ =√
𝑉𝐴𝑅𝐼𝐴𝐶𝐼Ó𝑁 𝑇𝑂𝑇𝐴𝐿 ∑(𝑌𝑅 − 𝑌)2

∑ 𝑦 165.66
𝑌= = = 16.566
𝑁 10

98
Clemente Castilleja Salas
CORRELACION MATEMATICA

Y
194.43755 42.85535
5.78231319
71 3 19.7264 13.18
124.43976 59.23457
8.57114286
19 3 19.7264 12.03
69.997108 51.64434
11.3599725
65 5 19.7264 12.54
31.109597 58.77368
14.1488022
24 9 19.7264 12.06
7.7772276 10.80042
16.9376319
93 5 19.7264 16.44
3.78698E- 343.2274
19.7264615
09 97 19.7264 1.2
7.7779141 3.191224
22.5152912
74 96 19.7264 17.94
31.110970 0.527656
25.3041209
21 96 19.7264 19
69.999168 0.728632
28.0929505
1 96 19.7264 20.58
124.44250 18.00814
30.8817802
78 1 19.7264 23.97
194.44098 97.76463
33.6706099
95 38 19.7264 29.614
279.99461 248.4595
36.4594396
29 59 19.7264 35.489
381.10337 514.1374
39.2482692
83 85 19.7264 42.401
1516.6307 1449.353
sumatoria
94 22

INDICE DE CORRELACIÓN

𝑉. 𝐸 ∑(𝑌𝑇 − (𝑌)2 (1516.63)2


𝑟=√ =√ = √ = 1.046
𝑉. 𝑇 ∑(𝑌𝑅 − 𝑦)2 (1449.35)2
2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑜𝑡𝑎𝑙 = ∑ (𝑌𝑟𝑒𝑎𝑙 − 𝑌) =1449.35322

99
Clemente Castilleja Salas
2
𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑋𝑃𝐿𝐼𝐶𝐼𝑇𝐴 = ∑ (𝑌𝑇𝑒𝑜𝑟𝑖𝑐𝑎 − 𝑌) =1449.35322

−1 ≤ 𝑟 ≤ 1 Se acostumbra tomar el lado


positivo
0≤𝑟≤1
𝑟 = 1 𝑀𝑎𝑥𝑖𝑚𝑜 𝑎𝑗𝑢𝑠𝑡𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒
𝑟 = 0 𝑀𝑖𝑛𝑖𝑚𝑜 𝑎𝑗𝑢𝑠𝑡𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒

100
Clemente Castilleja Salas
ANEXO
PERMUTACIONES Y COMBINACIONES
10.1 COMBINATORIA
P (n, x, p) = C n,x Px (1 - p)n-x QUE SE DENOMINA COMO FORMULA DE
BERNOULLI
COMBINACIONES DE “n” OBJETOS TOMADOS “X” A LA VEZ.
SUPONER QUE SE TIENEN 3 OBJETOS (SIMBOLOS)
S = {a, b ,c}
SE TOMAN 2 a la vez {a,b}
a P2,1 = 2
b P 2, 1=2

Si se tienen dos objetos (o símbolos) los arreglos posibles son:


Sean {a,b} los objetos o símbolos:
ab ba PERMUTACIONES = 2
Criterio a seguir para contabilizarlos:
1.- Importan tanto los objetos tomados como el orden en que se presentan:
P(n,k)= P2,2=2
2.- Importa solo los objetos tomando no el orden, con este criterio el número de
arreglos es
C(n,k)= C2,2 = 1

ab COMBINACIONES
ac C3,2 = 3 {B} DE LA SELECCIÓN NO IMPORTA EL ORDEN. SOLO
IMPORTAN LOS OBJETOS
bc

SE TOMAN TRES OBJETOS ALA VEZ.


abc bac REGLA A: PERMUTACIONES

101
Clemente Castilleja Salas
acb bca P3,3 = 6 = 3!/ (3-3)! = 3! = 6
cab cba
abc REGLA B: COMBINACIONES C3,3 = 1
1.- SUPONER QUE SE TIENEN “n” OBJETOS SE TOMAN “n” A LA VEZ.
𝑚𝑢𝑙𝑡𝑖𝑝𝑖𝑐𝑎𝑛𝑑𝑜𝑠 𝑛 (𝑛 − 1) (𝑛 − 2) 3 2 1
( ) ∗ ∗ ∗…∗ ∗ ∗
𝑛𝑢𝑚 𝑑𝑒 𝑜𝑟𝑑𝑒𝑛 1𝑜𝑏𝑗 2𝑜𝑏𝑗 3𝑜𝑏𝑗 (𝑛 − 2)𝑜𝑏𝑗 (𝑛 − 1)𝑜𝑏𝑗 𝑛 𝑜𝑏𝑗
= 𝑃𝑛, 𝑛
Pn,n = n! ARREGLOS.
2.- SE TIENEN “n” Y SE TOMAN “X” A LA VEZ
𝑛 (𝑛 − 1) (𝑛 − 2) (𝑛 − 𝑥 + 2) (𝑛 − 𝑥 + 1)
∗ ∗ ∗…∗ ∗
1𝑜𝑏𝑗 2𝑜𝑏𝑗 3𝑜𝑏𝑗 (𝑥 − 1)𝑜𝑏𝑗 𝑥 𝑜𝑏𝑗
De cuantas formas diferentes se pueden tomar x objetos de un total de n objetos?
Pn,x = 𝑛 (𝑛 − 1)(𝑛 − 2) … (𝑛 − 𝑥 + 1)
𝑛 − 𝑥 (𝑛 − 𝑥 − 1) (𝑛 − 𝑥 − 2) 3.2.1
1= ∗ ∗ …
(𝑛 − 𝑥) (𝑛 − 𝑥 − 1) (𝑛 − 𝑥 − 2) 3.2.1
𝑛!
𝑃𝑛, 𝑥 = 𝑓𝑜𝑟𝑚𝑢𝑙𝑎 𝑑𝑒 𝑝𝑒𝑟𝑚𝑢𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
(𝑛 − 𝑥)!
APLICACIÓN DE PERMUTACIONES
1.- SI SE TIENEN n = 20 OBJ Y SE TOMAN X = 7 A LA VEZ ¿Cuántas permutas
se pueden formar?
20! 20!
1.1.- 𝑃20,7 = (20−7)! = 13! = 20.19.18.17.16.15.14 = 390,700,800
20 19 18 17 16 15 14
1.2.-(1 𝑑𝑒 7)( 2 𝑑𝑒 7) (3 𝑑𝑒 7) (4 𝑑𝑒 7) (5 𝑑𝑒 7) (6 𝑑𝑒 7) (7 𝑑𝑒 7)

2.- CON LOS MISMOS DATOS ¿Cuántos combinaciones se pueden formar?


20! 20!
2.1.- 𝐶20,7 = 7!(20−7)! = = 77,520 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑐𝑖𝑜𝑛𝑒𝑠
7!13!

¿Y EL NUMERO DE COMBINACIONES?
REGLA B: COMBINACIONES: IMPORTAN SOLO LOS OBJETOS
SELECCIONADOS. NO IMPORTA EL ORDEN EN EL QUE APARESCAN.
SI DE “n” OBJETOS SE TOMAN”X” A LA VEZ.

102
Clemente Castilleja Salas
𝑛!
𝑃𝑛, 𝑥 (𝑛 − 𝑥)! 𝑛!
𝐶𝑛, 𝑥 = = =
𝑃𝑥, 𝑥 𝑥! 𝑥! (𝑛 − 𝑥)!
(𝑥 − 𝑥)!
𝑛!
𝐶𝑛, 𝑥 =
𝑥! (𝑛 − 𝑥)!

REGLA A: PERMUTACIONES: IMPORTAN TANTO LOS OBJETOS


SELECCIONADOS, COMO EL ORDEN EN QUEAPARECEN.

10.2 ESTADÍSTICA DESCRIPTIVA


Estadística descriptiva.

Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la


antigüedad de sus trabajadores, por lo que le indica al gerente de personal que
realice un análisis del problema.

El gerente de personal recabó de los expedientes la siguiente información sobre los


años de antigüedad:

13, 19, 22, 14, 13, 16, 19, 21


23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
Los datos agrupados en tablas, nos permiten ver con facilidad el número de
observaciones iguales o comprendidos en un intervalo, a este número de
repeticiones iguales de la variable se llama frecuencia y se denota por fi. Otros
valores relacionados con la frecuencia son:

103
Clemente Castilleja Salas
La frecuencia relativa que se denota por fr.
La frecuencia acumulada que se denota por Fi.
La frecuencia relativa acumulada que se denota Fr.
Frecuencia es el número de veces que se repite la misma observación. Se simboliza
con fi.

Otro parámetro importante es la frecuencia relativa que simbolizaremos con “fr”,


ésta se obtiene dividiendo la frecuencia absoluta (fi) entre el número de elementos
de la muestra que simbolizaremos con (n).

La definición matemática es:


Rango (R) es el intervalo en que se distribuyen los datos en observaciones de una
muestra y se determina restándole al mayor valor el menor valor.
La definición matemática del rango es:

R = Xn – X1

Xn = valor mayor
X1 = valor menor

No existe alguna ley que defina cómo obtener el número de clases; pero la
experiencia recomienda que no sea menor que 5 ni mayor de 20, esto es:

5 ≤ k ≤ 20

k = número de clases

Otra forma de determinar el número de intervalos de clase (k) es mediante la


ecuación
De Sturges y ésta es:

104
Clemente Castilleja Salas
K = 1 + 3.322 (log n)
Dónde:
k = número de intervalos
n = tamaño de la muestra
Log = logaritmo en base 10
Una vez definido el número de clases (k), para obtener la amplitud de clase (A)
aplicamos la siguiente ecuación:
K
A=R

La marca de clase es el valor del punto que se localiza a la mitad del intervalo de
cada clase o intervalo real de clase.

Su definición matemática es:

Limites reales de clase.

Cuando la variable es discreta sabemos que entre estos valores no hay ninguna
información que se pierda; pero ¿qué pasa si la variable es continua?, en estos
casos si hay la posibilidad que entre el 25 y 26 se pierdan los valores comprendidos
como es 25.1, 25.3, 25.6, etcétera.

Para evitar este error, si la variable es continua, entonces después de haber


determinado los límites de clase, se fijan otros límites que inician medio punto antes
y medio punto Después; de esta forma no hay posibilidad de perder información. A
cada uno de estos nuevos límites se le llama “límite real de clase”.

105
Clemente Castilleja Salas
Frecuencia acumulada (Fi)
Es la que se obtiene sumando las frecuencias de las clases anteriores con la
frecuencia de ésta.
Su definición matemática es:

Al calcular la frecuencia acumulada (Fi) podemos determinar su


frecuencia relativa acumulada (Fr) en la forma ya explicada mediante la
ecuación (1), esto es:

Si queremos determinar el número mayor que, lo que tenemos que hacer es des
acumular la frecuencia y para ello en lugar de sumar restamos al número de
observaciones (n) la frecuencia de la clase (fi) correspondiente.

1. Ordenamos los datos en sentido creciente:


10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,
22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.
Frecuencia
acumulada
Clase Limites P. fre Frec F F Fr (M1)(f1 (Xi -X |(xi- x (xi- x
s reales Medio c relativ meno Mayo ) testada) testada) testada)^
de (fi) a (fr) r que r que | 2
clase
(m1)
0,04 - 308,4659
10-12 9,5-12,5 11 2 0,042 2 46 2 22 17,5632 17,5632 9

106
Clemente Castilleja Salas
12,5- 0,16 - 183,9603
13-15 15,5 14 6 0,125 8 40 7 84 13,5632 13,5632 9
15,5- 0,37 -9,5632 91,45479
16-18 18,5 17 10 0,208 18 30 5 170 9,5632 4
18,5- 0,70 -3,5632 12,69639
19-21 21,5 20 16 0,333 34 14 8 320 3,5632 4
21,5- 0,87 - 133,7075
22-24 24,5 23 8 0,167 42 6 5 184 11,5632 11,5632 9
24,5- 0,97 - 212,0867
25-27 27,5 26 5 0,104 47 1 9 130 14,5632 14,5632 9
27,5- - 344,5923
28-30 30,5 29 1 0,021 48 0 1 29 18,5632 18,5632 9
TOT
AL 48 1 939 88,9424 1286,96

Calculamos el rango para ello determinamos los valores mayor y menor de las
puntuaciones.
Xn = 29 R = Xn – X1 = 29 – 10 = 19 R = 19
Xi = 10
Calculamos el número de clases (K), para ello determinamos (n)
N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7
Determinamos la amplitud de cada clase

Se han redondeado los valores de K y A porque el número de clases y la amplitud


de la clase nunca serán fraccionarios.

Determinamos la marca de clase para la primera clase.

𝑋𝑠 + 𝑋𝐼 10 + 12
𝑀1 = 𝑀1 = = 11
2 2

107
Clemente Castilleja Salas
Determinando la frecuencia relativa para la primera clase.

2
𝐹𝑟 = 48=0.0416 =0.042

CALCULO DE LA MEDIANA Y DE LA MEDIANA DE DATOS AGRUPASO.

Es el valor de la variable aleatoria que se encuentra en el centro de un conjunto


ordenado de datos
Para determinar el valor de la mediana (Me) de un conjunto con (n) datos, si n es
impar, entonces aplicamos la fórmula:

La mediana (Me) de un conjunto de observaciones, agrupados en una tabla de


distribución de frecuencias, se puede determinar aplicando la ecuación:

48
( −18)
2
𝑀𝑒 = 19 + 3 = 20.125
16
Me = 20.125

L = límite inferior de la clase modal = 19 A = amplitud del intervalo de clase


=3
n = número de observaciones de la muestra =48
F = frecuencia acumulada hasta la clase anterior a la clase modal = 18
f = frecuencia absoluta de la clase modal = 16

Para determinar la media aritmética o promedio de n datos, se suman y el


resultado se divide entre n. Esta expresión indica que el numerador del segundo
miembro existe una suma de la variable X, el subíndice ( i ) indica que el valor de X
es la variable y la anotación abajo y arriba de Σ indica que el subíndice (i) toma
valores desde i = 1 hasta i = n, es decir; la suma se hace desde X = X 1 hasta X =
X n.

108
Clemente Castilleja Salas
La media de datos agrupados.
Para el cálculo de la media en los datos agrupados, realizaremos el producto de la
frecuencia por la marca de clase

Determinando la media.

939
= 19.562
48

La Moda De Datos Agrupados. Es el dato que se repite con mayor frecuencia.

A = Intervalo de clase.
Lr = Límite real inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de clase anterior a la modal.
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente.

Determinamos el límite real inferior de la clase modal Lr = 18.5


Calculamos d1 = 16-10 = 6
Calculamos d2 = 16 – 8 =8

109
Clemente Castilleja Salas
Calculamos A. Para el cálculo de A se resta al límite superior de cualquier clase, el
límite inferior y al resultado se le suma la unidad. Para la clase modal de nuestro
ejemplo.

A = 12 – 10 + 1 = 2 + 1 = 3

Aplicando la formula
6
𝑀𝑜 = 18.5 + 3 (6+8) = 19.785

La Desviación Media
La desviación (di) que hay de cada observación (Xi) con respecto a la media ( X )
se obtiene mediante la siguiente ecuación:

Di = Desviación de cada observación con respecto a la media


La desviación es negativa para valores Xi < X y positiva para valores Xi > X. La
suma de todas las desviaciones es igual a cero y se simboliza mediante la siguiente
ecuación:

Este valor D = 0 no nos ayuda en el cálculo; para evitar que la suma sea igual a
cero, se toma el valor absoluto de cada desviación y la
ecuación (12) se transforma en:

110
Clemente Castilleja Salas
La desviación media (DM) es la suma de los valores absolutos de todas las
desviaciones dividido entre el número de datos u observaciones.

889424
𝐷𝑚 = = 18529.666
48

La Varianza

Es una medida de dispersión, en cuyo cálculo interviene el cuadrado de las


desviaciones de cada puntuación. Para obtener su valor, calculamos la sumatoria
de los cuadrados de las desviaciones y el resultado lo dividimos entre n−1 o N.
Xi = i- décimo elemento de la muestra
X = media de las observaciones
n = número de elementos de la
muestra
𝑆2 =
1286.96436
= 27.382
47

Desviación Estándar.
Es una medida de dispersión que es igual a la raíz cuadrada de la varianza

2
𝑆 = √27.382 = 5.2

Histograma y polígono de frecuencias.


El histograma es la forma más usual para analizar las características observables
de una variable continua.
Para trazar el histograma, la secuencia de operaciones es:

111
Clemente Castilleja Salas
1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con sus límites
reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas en
que ocurre la variable.

2. Por los límites reales superior e inferior de cada clase se trazan barras verticales
que se cortan mediante una horizontal que se traza a la altura del punto
Correspondiente a la frecuencia de cada clase.

2. Por la naturaleza continua de la variable, los rectángulos se trazan


adyacentes, toda vez que en esta forma se debe dividir el eje horizontal.

3. El área representada por cada barra es equivalente a la proporción de la


frecuencia del intervalo de clase correspondiente con respecto al total.

Histograma

112
Clemente Castilleja Salas
113
Clemente Castilleja Salas
114
Clemente Castilleja Salas
Bibliografía.
Colegio de bachilleres.
Fascículo 1 y 2 de Estadística descriptiva e inferencia
http://www.conevyt.org.mx/index.php?option=com_content&view=article&id=531&It
emid=1089
Ejemplo:
La duración de llantas en miles de kilómetros se muestra en la siguiente tabla:

40.1 42.1 44.2 48.9 40.6 43.9 49.1 42.8 43.7 41.8
47.5 42.6 41.3 42.3 46.9 46.7 46.1 39.1 41.5 45.5
46.9 41.9 48.2 44.4 46.7 44.7 50.8 37.4 43.3 48.3
45.8 43.9 49.8 47.7 44.5 43.6 51.2 40.7 43.9 44.8
47.2 46.7 47.9 47.7 43.4 4631 44.1 39.6 47.0 45.0
45.2 50.2 42.6 45.5 40.4 43.1 42.9 48.8 52.0 46.0

115
Clemente Castilleja Salas
Construir la tabla de frecuencia, con solo 5 intervalos, elaborar Histograma y
polígono de Frecuencias.

Interval Límite Limite Marc Frecuen Frecuen Frecuen Frec.


os inferio Superi a de cia fi cia cia Real
r or Clase Relativa acumula acumula
f i* da Fi da Fi*

1 37.4 40.4 38.9 5 8.3% 5 8.3%


2 40.4 43.4 41.9 15 25.0% 20 33.3%
3 43.4 46.4 44.9 19 31.7% 39 65.0%
4 46.4 49.4 47.9 16 26.7% 55 91.7%
5 49.4 52.4 50.9 5 8.3% 60 100%
SUMA 60 100.0%

Distribuciones empíricas de una variable estadística descriptiva.


Captación, ordenación, representación y el análisis de datos.
Dato: Una unidad de información.

INTEVA MARCA FRECUE FRECUE Xi . Fi (Xi - Fi(Xi -


LO DE DE NCIA DE NCIA XM)^2 XM)^2
CLASE CLASE CLASE ACUMEL
ADA

116
Clemente Castilleja Salas
37.25 – 38.75 3 3 116.25 40.32 120.96
40.25
40.25 - 41.75 14 17 584.50 11.22 157.08
43.25
43.25 – 44.75 21 38 939.75 0.12 2. 52
46.25
46.25 - 47.75 17 55 811.75 7.02 119.34
49.52
49.25 – 50.75 5 60 253.75 31.92 159.00
52.25

🡺 HISTOGRAMA DE FRECUENCIA SIMPLE.


🡺 POLIGONO DE FRECUENCIA.

Datos no Datos Variable discreta Variable momentos


agrupados agrupados continua

∑𝑛 ∑𝑘 𝑛
Media 𝑥= 𝑖=1 𝑥𝑖 𝑖=1 𝑥𝑖 𝑓𝑖 𝑀𝑥 𝑀𝑧
𝑥= +∞ +∞
𝒙 𝑛 ∑𝑘
𝑖=1 𝑓𝑖 𝑀𝑥 = ∑ 𝑥𝑖 𝑃(𝑥𝑖 )
𝑖=1
=∫ 𝑥𝑓(𝑥)𝑑𝑥
=∫ (𝑧)𝑓(𝑧)𝑑𝑧
−∞ −∞
=0

117
Clemente Castilleja Salas
Varian ∑𝑛𝑖=1 (𝑥𝑖 − 𝑥)2
2
2
∑𝑛𝑖=1 (𝑥𝑖 − 𝑀𝑋 )2 𝑃(𝑥𝑖 ) 𝜎 2 = 𝜎 2=
za 2
𝑆 = 𝑠 𝑆 = +∞ +∞
𝑛 𝑛 ∫−∞ (𝑥 − ∫−∞ (𝑧)2 𝑓(𝑧)𝑑𝑧 =
𝑺𝟐 ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥)2 𝑀𝑥)2 𝑓(𝑥)𝑑𝑥 1
=
∑𝑘𝑖=1 𝑓𝑖

Ejemplo:
La duración de llantas en miles de kilómetros se muestra en la siguiente tabla:

40.1 42.1 44.2 48.9 40.6 43.9 49.1 42.8 43.7 41.8
47.5 42.6 41.3 42.3 46.9 46.7 46.1 39.1 41.5 45.5
46.9 41.9 48.2 44.4 46.7 44.7 50.8 37.4 43.3 48.3
45.8 43.9 49.8 47.7 44.5 43.6 51.2 40.7 43.9 44.8
47.2 46.7 47.9 47.7 43.4 4631 44.1 39.6 47.0 45.0
45.2 50.2 42.6 45.5 40.4 43.1 42.9 48.8 52.0 46.0

Construir la tabla de frecuencia, con solo 5 intervalos, elaborar Histograma y


polígono de Frecuencias.

Interval Límite Limite Marc Frecuen Frecuen Frecuen Frec.


os inferio Superi a de cia fi cia cia Real
r or Clase Relativa acumula acumula
f i* da Fi da Fi*

1 37.4 40.4 38.9 5 8.3% 5 8.3%


2 40.4 43.4 41.9 15 25.0% 20 33.3%
3 43.4 46.4 44.9 19 31.7% 39 65.0%
4 46.4 49.4 47.9 16 26.7% 55 91.7%
5 49.4 52.4 50.9 5 8.3% 60 100%
SUMA 60 100.0%

118
Clemente Castilleja Salas
10.3 PARAMETROS

Datos no Datos Variable Variable momentos


agrupados agrupados discreta continua

Medi ∑𝑛
𝑖 =1 𝑥𝑖 𝑥= 𝑀𝑥 𝑀𝑥 𝑀𝑧
𝑥= 𝑛 +∞ +∞
a 𝑛 ∑𝑘 =1 𝑥𝑖 𝑓𝑖
𝑖
𝒙 𝑘
∑𝑖 = 𝑓𝑖 =∑ 𝑥𝑖 𝑃(𝑥𝑖 ) =∫ 𝑥𝑓(𝑥)𝑑𝑥
=∫ (𝑧)𝑓(𝑧)𝑑𝑧
−∞ −∞
𝑖=1 =0

Vari ∑𝑛𝑖=1 (𝑥𝑖 2− 𝑥)


2 ∑𝑛𝑖=1 (𝑥𝑖 − 𝑀𝑋 )2𝜎𝑃(𝑥
2
= 𝑖) 𝜎 2=
anza 2
𝑆 = 𝑠 𝑆2 = +∞ +∞
𝑛 𝑛 ∫−∞ (𝑥 − ∫−∞ (𝑧)2 𝑓(𝑧)𝑑𝑧 =
𝑺𝟐 ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥)2 𝑀𝑥)2 𝑓(𝑥)𝑑𝑥 1
=
∑𝑘𝑖=1 𝑓𝑖

10.4 OTRAS FUNCIONES DE PROBABILIDAD


Función BETA
Se dice que una variable aleatoria x tiene una distribución beta, si su función de
densidad de probabilidad está dada por:
𝛤(𝛼+𝛽)
𝑥 𝛼−1 (1 − 𝑥)𝛽−1 Con: 0 < x < 1 α, β > 0
𝛤(𝛼)𝛤(𝛽)

𝑓(𝑥; 𝛼, 𝛽) =
0 PARA CUALQUIER OTRO VALOR

En tanto que, la función beta, se encuentra definida por: 𝐵(𝛼, 𝛽) =


1
∫0 𝑥 𝛼−1 (1 − 𝑥)𝛽−1 𝑑𝑥
𝛤(𝛼+𝛽)
Las funciones beta y gamma tienen la siguiente relación: 𝐵(𝛼, 𝛽) = [𝛤(𝛼)𝛤(𝛽)]−1

Con lo anterior, es obvio que 𝑓(𝑥; 𝛼, 𝛽) es una F. de P. Esto es:

119
Clemente Castilleja Salas
1
𝛤(𝛼 + 𝛽) 𝛼−1 𝛤(𝛼 + 𝛽) 1
∫ 𝑥 (1 − 𝑥)𝛽−1 𝑑𝑥 = ∫ 𝑥 𝛼−1 (1 − 𝑥)𝛽−1 𝑑𝑥
0 𝛤(𝛼)𝛤(𝛽) 𝛤(𝛼)𝛤(𝛽) 0
𝛤(𝛼 + 𝛽)
= 𝐵(𝛼, 𝛽) = 1
𝛤(𝛼)𝛤(𝛽)
𝛼 𝛼𝛽
De manera similar: 𝐸[𝑥] = 𝛼+𝛽 𝑉𝐴𝑅[𝑥] = (𝛼+𝛽)2 (𝛼+𝛽+1)

Función GAMMA
𝛼
Primera presentación: 𝛤(𝑛) = ∫0 𝑒 −𝑥 𝑥 𝑛−1 𝑑𝑥 para: n >0 x
∈ (0, α)
Considerando que: Si: 𝑢 = 𝑒 −𝑥 𝑑𝑣 = 𝑥 𝑛−1 𝑑𝑥
1
𝑑(𝑢𝑣) = 𝑢𝑑𝑣 + 𝑣𝑑𝑢 𝑑𝑢 = −𝑒 −𝑥 𝑑𝑥 𝑣 = 𝑛 𝑥𝑛
1
𝑢𝑣 = ∫ 𝑢𝑑𝑣 + ∫ 𝑣𝑑𝑢 Entonces: 𝛤(𝑛) = 𝑛 𝑥 𝑛 𝑒 −𝑥 ]𝛼0 +
𝛼 1
∫0 𝑥 𝑛 𝑒 −𝑥 𝑑𝑥
𝑛

∫ 𝑣𝑑𝑢 = 𝑢𝑣 − ∫ 𝑣𝑑𝑢 𝛤(𝑛) = 0 + 𝛤(𝑛 + 1)/𝑛

En conclusión: 𝛤(𝑛 + 1) = 𝑛𝛤(𝑛) = 𝑛(𝑛 − 1)𝛤(𝑛 − 1) = 𝑛(𝑛 − 1)(𝑛 −


2)𝛤(𝑛 − 2)
= 𝑛(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) … 3 ∙ 2 ∙ 1 = 𝑛!
Características principales:
1.- 𝛤(𝑛 + 1) = 𝑛! n entero positivo
2.- 𝛤(𝑛 + 1) = 𝑛 𝛤(𝑛) n>0
1
3.- 𝛤 (2) = √𝜋

Segunda presentación: Se dice que la variable aleatoria x tiene una distribución


gamma, si su función de densidad de probabilidad está dada por:
𝑥
1
𝑓(𝑥; 𝛼, 𝛽) = 𝑥 𝛼−1 𝑒 −𝜃 Con: x >0 α, θ > 0
𝛤(𝛼)𝜃𝛼

0 PARA CUALQUIER OTRO VALOR


Demostración de que es una F. de P.
𝑥
Sea: 𝜇=𝜃 ; 𝑥 = 𝜇𝜃 ; 𝑑𝑥 = 𝜃𝑑𝜇

Entonces:

120
Clemente Castilleja Salas
𝛼 𝛼 𝛼
1 𝑥 1 1
∫ 𝑥 𝛼−1 𝑒 −𝜃 𝑑𝑥 = ∫ 𝑥 𝛼−1 𝑒 𝜇 𝜃𝑑𝜇 = ∫ 𝜇 𝛼−1 𝑒 𝜇 𝑑𝜇 = 1
𝛤(𝛼)𝜃 𝛼 0 𝛤(𝛼)𝜃 𝛼 0 𝛤(𝛼) 0

De manera similar: 𝐸[𝑥] = 𝛼𝜃 ; 𝑉𝐴𝑅[𝑥] = 𝛼𝜃 2

Distribución binomial negativa


Sea x+k, el número de ensayos independientes necesarios para alcanzar, de
manera exacta, k éxitos en un experimento binomial en donde la probabilidad de
éxito en cada ensayo es p. se dice entonces que x es una variable binomial negativa
con la función de probabilidad
P(x; k, p) = (𝑘 + 𝑥 − 1 𝑘 − 1 )𝑝𝑘 (1 − 𝑝)𝑥 x = 0, 1, 2, … k = 1, 2,

0 0 ≤ p ≤ 1, PARA CUALQUIER OTRO VALOR
Ejemplo: En un artículo se demuestra que el número de anotaciones de seis puntos
por equipo en el futbol colegial se describe de manera apropiada mediante una
distribución binomial negativa. Para determinar de manera teórica la probabilidad
de ocurrencia, es necesario tener estimaciones de los valores de los parámetros k
yp
𝐸[𝑥] 𝐸 2 [𝑥]
𝑝= , y 𝑘=
𝑉𝐴𝑅[𝑥] 𝑉𝐴𝑅[𝑥]−𝐸[𝑥]

Probabilidades básicas de la distribución binomial negativa

Función de probabilidad Parámetros


𝑃(𝑥; 𝑘, 𝑝) = (𝑘 + 𝑥 − 1 𝑘 − 1 )𝑝𝑘 (1 k, k > 0 (distribución de Pascal si k es
𝑥 un entero positivo)
− 𝑝)
x = 0, 1, 2, … p, 0 ≤ p ≤ 1
Media Varianza Coeficiente de Curtosis relativa
asimetría
𝑘(1 − 𝑝) 𝑘(1 − 𝑝) 2−𝑝 (𝑝2 − 6𝑝 + 6)
1 3+
𝑝 𝑝2 𝑘(1 − 𝑝)
[𝑘(1 − 𝑝)]2

Definición de Chi-cuadrado (x2)


Una unidad de medida de la discrepancia existente de frecuencias observadas y
esperadas es suministrada por el estadístico x2 dado por:
𝑘
2
(𝑂1 − 𝑒1 )2 (𝑂2 − 𝑒2 )2 (𝑂𝑘 − 𝑒𝑘 )2 (𝑂𝑗 − 𝑒𝑗 )2
𝑥 = + +⋯+ =∑
𝑒1 𝑒2 𝑒𝑘 𝑒𝑗
𝑗=1

121
Clemente Castilleja Salas
O = Datos observados e = Datos esperados/ Teóricos

Distribución Chi-cuadrado
Sea el estadístico
𝑁𝑠 2 (𝑋1 −𝑋)2 (𝑋2 −𝑋)2 +⋯+(𝑋𝑛 −𝑋)2
𝑥2 = = donde x es la letra griega chi y x2 se lee chi
𝜎2 𝜎2
cuadrado
Se consideran muestras de tamaño N extraídas de una población con desviación
típica 𝜎, donde se calcula el valor de x2 para obtener la distribución muestral para
x2

Bondad de ajuste
Utilizar la prueba de Chi-cuadrado para determinar la bondad de ajuste de los datos
del siguiente problema
Resultados obtenidos al realizar 1000 series de lanzamientos de una moneda (5 por
serie)

Numero de caras Numero de series (Frecuencias)


0 38
1 144
2 342
3 287
4 164
5 25

Solución: Se tiene P {x cara en una serie de lanzamientos} = 𝑃(𝑥) = 5𝐶𝑥 𝑝 𝑥 𝑞 5−𝑥


donde p y q son las probabilidades respectivas de cara y cruz en un solo
lanzamiento de la moneda. Por el problema anterior, la media del número de caras
es 𝜇 = 𝑁𝑝 = 5𝑝. Para la distribución de frecuencias observadas, la media del
número de caras es:

∑ 𝑓𝑥 38(0) + 144(1) + 342(2) + 287(3) + 164(4) + 25(5) 2470


= = = 2.47
∑ 𝐹 1000 1000

Igualando las medias teóricas y real se tiene 5p = 2.47 o p = 0.494


Así pues, la distribución binomial ajustado viene dada por 𝑃(𝑥) =
5𝐶𝑥 (0.494)𝑥 (0.506)5−𝑥

122
Clemente Castilleja Salas
En la tabla se han obtenido estas probabilidades, así como frecuencias (teóricas) y
las observadas. El ajuste se observa que es bueno

N° de caras P {x caras} Frecuencia Frecuencia


esperada observada
0 0.0332 33.2 o 33 38
1 0.1619 161.9 o 162 144
2 0.3162 316.2 o 316 342
3 0.3087 308.7 o 309 287
4 0.1507 150.7 o 151 164
5 0.0294 29.4 o 29 25

Con base en los datos anteriores se tiene


(38 − 33.2)2 (144 − 161.9)2 (342 − 316.2)2 (287 − 308.7)2
𝑥2 = + + +
33.2 161.9 316.2 308.7
(164 − 150.7)2 (25 − 29.4)2
+ + = 7.54
150.7 29.4
Puesto que el número de parámetros utilizados para estimar las frecuencias
esperadas es m = 1 (que es el parámetro p de la distribución binomial), v = k – 1 –
m=6–1–1=4
2
Para v = 4, 𝑥0.95 = 9.49. De aquí el ajuste de los datos sea bueno
2
Para v = 4, 𝑥0.05 = 0.711. Así, puesto que 7.54 > 0.711 el ajuste no es tan bueno
como pudiera creerse

Distribución hipergeométrica
Sea N el número total de objetos en una población finita, de manera tal que k de
estos es de un tipo y N – k de otros. Si se selecciona una muestra aleatoria de la
población constituida por n objetos de la probabilidad de que x sea de un tipo y n –
x sea del otro, está dada por la función de probabilidad hipergeométrica
(𝑘 𝑥 )(𝑁−𝑘 𝑛−𝑥 )
P(x; N, n, k) = (𝑁 𝑛 )
, x = 0, 1, 2, …, n; x ≤ k, n –
x ≤ N – k;
0 N, n, k enteros positivos, para cualquier otro valor

Ejemplo: Considérese un fabricante de automóviles que compra los motores a una


compañía donde se fabrican bajo estrictas especificaciones. El fabricante recibe un
lote de 40 motores. Selecciona 8 de manera aleatoria y los somete a prueba. Si

123
Clemente Castilleja Salas
ninguno de los motores presenta serios problemas, el fabricante acepta el lote; de
otra forma lo rechaza. Si el lote contiene dos motores con serios defectos, ¿Cuál es
la probabilidad de que sea aceptado?
Sea X el número de motores defectuosos en la muestra. Para N = 40, n = 8 y k = 2,
la probabilidad de aceptación es
(2 0 )(38 8 )
𝑃(0; 40,8,2) = = 0.6359
(40 8 )
N Núm. de objetos k Tienen la característica “A”
N – k Tienen la característica “B”
N Muestra aleatoria X Tienen la característica “A”
Del conjunto N n – x Tienen la característica “B”
Determina la probabilidad de que X tengan la característica “A” y (n – x) la
característica “B”. Considerando que la muestra “n” es sin remplazo, lo cual implica
que los eventos no tienen independencia
𝐶𝑁,𝑛 Número total de arreglos de N objetos tomados n a la vez

𝐶𝑘,𝑥 Numero total de arreglos de los k objetos con la característica “A” tomados x
a la vez
𝐶(𝑁−𝑘),(𝑛−𝑥) Numero total de arreglos de los (N – k) objetos con la característica
“B” tomados (n – x) a la vez
Por tanto, la probabilidad de obtener “x” con característica “A” en la muestra “n” es
igual a:
𝐶𝑘,𝑥 ∙ 𝐶(𝑁−𝑘),(𝑛−𝑥)
𝑃(𝑥; 𝑛, 𝑁, 𝑘) =
𝐶𝑁,𝑛
Piezas industriales que se surten en lotes de 60 unidades
Cierto comprador acostumbra inspeccionar con detenimiento una muestra de 10
unidades. Si encuentra uno o más defectuosos rechaza el lote de 60 en su totalidad
Analizar la probabilidad de que ese comprador acepte lotes que contengan r
DEFECTUOSOS, con r = 1, 2, 3, etc. y x = 0 en cada muestra de 10
1.- r = 1
Datos: N = 60 TOT. k = 1 en el lote de 60 n = 10 Muestral x
=0
𝐶𝑘,𝑥 ∙ 𝐶(𝑁−𝑘),(𝑛−𝑥)
𝑃(𝑥; 𝑛, 𝑁, 𝑘) =
𝐶𝑁,𝑛

124
Clemente Castilleja Salas
𝐶1,0 ∙ 𝐶59,10
𝑃(0; 10,60,1) =
𝐶60,10
En este caso: Característica “A” es “DEFECTUOSO”
Característica “B” es “NO DEFECTUOSO”

1! 59!
0! (1 − 0)! 10! (59 − 10)! 6.282 𝑥1010
𝑃(0; 10,60,1) = = = 0.8332
60! 7.539𝑥1010
10! (60 − 10)!
2.- r = 2
Datos: N = 60 k=2 n = 10 x=0
2! 58!
𝐶2,0 ∙𝐶58,10 0!(2−0)!10!(58−10)! 5.217𝑥1010
𝑃(0; 10,60,2) = = 60! = = 0.6921
𝐶60,10 7.539𝑥1010
10!(60−10)!

10.5 TAREAS Y TRABAJOS


LISTA DE TAREAS
I.- Lanzamiento de 3 dados donde el espacio de es N(S)= Z= X1+X2+X3, Calcular:
P(Z) y graficar [Z, P(Z)]
II.- Lanzamientos e un juego de tiro al blanco, obtener:
Los eventos posibles y sus probabilidades.
III.- Hacer un árbol de probabilidades con dos ramas y determinar probabilidades.
P(N) y P(B) Crear árbol de probabilidad y de eventos.
IV.- Problema del encuentro, con:
(e1= , e2=15)
V.- Aplicación de la función de Bernoulli, para:
Probabilidad de aciertos (P=2/3), con un número total de éxitos de (n=9)
Graficar.

125
Clemente Castilleja Salas
VI.- EXAMEN COMO TAREA
VII.- De las funciones de Bernoulli y Poisson hacer una comparación con los datos:
Número de experimentos (n=30)
Con una probabilidad de éxitos independientes (P=0.1)
Obtener:
P(ẋ)=?
mx=?
σx2=?
Y graficar P(ẋ)

VII.- De la función de Poisson:

N=20
P=0.24
Graficar, E(esperanza
matemática,
Var(varianza).
N=100 405

P=0.01 X=0123,4

N= 100/50
IX.- Curva Normal σx= 3
σx2=9

X.- Hacer el resumen de las funciones:


Binomial
Poisson
Gauss (fórmulas, media, varianza)
Y demostrar cada una.

126
Clemente Castilleja Salas
XI.- Nivel de confianza de (99%, 95%, 90%) con (n= 400) y (P=0.5 ½ )

XII.- EXÁMEN 2 COMO TAREA


XIII.- Estimación media de la población.
XIV.- Problema de decisión- P(ETI)
NC(Nivel de Confianza)=95%
MONEDA
N(Número de tiros)= 400
XV.- Demostración de Mínimos Cuadrados.

XVI.- Problema de decisión con mP(Media de la Población)= 50


NC=99% σp(Desviación Estándar)= 1.2

1) Diseñar R.D y P(ETI)


2) P(ETI)= ? Si mp= 51.5

127
Clemente Castilleja Salas

También podría gustarte