ESTADÍSTICA
“Ciencia para descubrir conocimiento y tomar
decisiones.”
Docente: Mg. Carlos A. Sánchez Torres
[email protected] Mg. Carlos A. Sánchez Torres 1
Sesión I y II:
Introducción a la estadística y al análisis de
datos.
Distribuciones de Probabilidad: Normal y T
Student, Chi-Cuadrado y F de Fisher.
Uso de tablas Estadísticas.
Competencia de la experiencia curricular
Desarrolla competencias investigativas en y para la investigación, generando
conocimientos que propician en el estudiante procesos de formación permanente.
Mg. Carlos A. Sánchez Torres 2
DEFINICIONES PRELIMINARES
Mg. Carlos A. Sánchez Torres 3
¿QUÉ ES LA ESTADÍSTICA?
Es una ciencia que nos ofrece un
conjunto de métodos y técnicas
para: recolectar, clasificar, ¿
procesar, analizar e interpretar y
presentar un conjunto de datos
con la finalidad de conocer el ?
problema para tomar decisiones y
organizarse de manera correcta y
con fundamento.
Mg. Carlos A. Sánchez Torres 4
VARIACIÓN E INCERTIDUMBRE
La estadística inferencial generó un número enorme de herramientas, métodos
estadísticos que utilizan los profesionales de la estadística. Las herramientas o
métodos estadísticos se diseñan para contribuir al proceso de realizar juicios
científicos (análisis) frente a la variación y a la incertidumbre.
LA VARIACIÓN O VARIABILIDAD EN LOS DATOS
La variabilidad de procesos y productos es un hecho real en los sistemas científicos
y de ingeniería: el control o la reducción de la variabilidad de un proceso a menudo
es una fuente de mayores dificultades. Cada vez más ingenieros y administradores
de procesos están aprendiendo que la calidad del producto y, como resultado, las
utilidades que se derivan de los productos manufacturados es, con mucho, una
función de la variabilidad del proceso.
En consecuencia, gran parte de los temas posteriores se dedica al análisis de datos y
a los procedimientos de modelado en los que la variabilidad de la muestra
desempeña un papel significativo.
Mg. Carlos A. Sánchez Torres 5
Caso 01:
• En un estudio se desea comprar entre dos grupos, cual presenta
datos superiores, para cual se hizo la medición de 30 datos
obteniendo los siguientes resultados:
64.4 56.6 62.3 59.4 65.1 67.2 67.5 62.9 67.4 63.9 58.3 59.7 60 63.6 65.4
M1
63.4 62.2 58 61.4 63.4 63.3 69.5 62.2 61 73.1 63.4 66.4 61 59.1 57.3
56.2 63.1 54.5 58.4 58.2 70.5 56.1 53.9 77.5 58.4 64.3 53.8 50 46.5 58.3
M2
55 56.2 63.1 61.9 65.9 66.6 57.4 66.3 59.4 68.1 51.3 61.7 58.8 62.5 58.5
• De estos datos tenemos el promedio y desviación estándar:
M1 M2
Promedio 62.93 59.75
Desviación estándar 3.75 6.44
• Con estas medidas estadísticas podemos responder, ¿Qué grupo
presenta datos mayores?
Mg. Carlos A. Sánchez Torres 6
Gráfico N°01: Análisis de la Variabilidad
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
M1 M2
• No podemos concluir que alguno de los dos grupos tiene mayores
datos sin tomar en cuenta la variabilidad de la muestra.
• De hecho, parece que la variabilidad dentro de la muestra 2 es mayor
que la de la muestra 1.
Mg. Carlos A. Sánchez Torres 7
INCERTINDUMBRE
Mg. Carlos A. Sánchez Torres 8
PROBABILIDAD
• ¿A qué nos referimos cuando hacemos afirmaciones como “Juan probablemente ganará el
partido de tenis”, o “tengo 50% de probabilidades de obtener un número par cuando
lanzo un dado”, o “la selección no tiene posibilidades de ganar el juego de fútbol esta
noche”, o “la mayoría de nuestros graduados probablemente estarán casados dentro de
tres años”?. En cada caso expresamos un resultado del cual no estamos seguros, pero
con base en la experiencia, o a partir de la comprensión de la estructura del
experimento, confiamos hasta cierto punto en la validez de nuestra afirmación.
• Esto llevo al ser humano al desarrollo de la teoría de la probabilidad en un esfuerzo por
cuantificar nuestra incertidumbre. Lo que llevo a algunos matemáticos a proporcionar
estrategias.
• Algunos de los matemáticos que brindaron tales estrategias fueron Pascal, Leibniz, Fermat
y James Bernoulli. Como resultado de este desarrollo inicial de la teoría de la
probabilidad, la inferencia estadística, con todas sus predicciones y generalizaciones, ha
rebasado el ámbito de los juegos de azar para abarcar muchos otros campos asociados con
los eventos aleatorios, como la política, los negocios, el pronóstico del clima y la
investigación científica. Para que estas predicciones y generalizaciones sean
razonablemente precisas, resulta esencial la comprensión de la teoría básica de la
probabilidad. 9
ANALICEMOS
“Juan probablemente ganará el partido de tenis”
1. Aquí la acción o hecho (experimento aleatorio) es jugar un
partido de tenis. Y este hecho tiene varias posibilidades
antes de ocurrir.
2. ¿Cuántas posibles posibilidades?. Pues como sabemos en
un juego tenemos solo 03 situaciones: ganar, perder o
empatar. (espacio muestral)
3. Pero a nosotros solo nos interesa si gana Juan. (evento)
4. Por lo que la posibilidad de ganar es 1/3
“Tengo 50% de probabilidades de obtener un número par cuando lanzo un dado”
1. Aquí la acción o hecho (experimento aleatorio) es lanzar un
dado. Y este hecho tiene varias posibilidades antes de ocurrir.
2. ¿Cuántas posibles posibilidades?. Pues como sabemos en un
juego tenemos solo 06 posibilidades: 1, 2, 3, 4, 5, y 6 (espacio
muestral)
3. Pero a nosotros solo nos interesa los números pares.
(evento). Esto es: 2, 4 y 6.
4. Por lo que la posibilidad de obtener un número par es 3/6. 10
ENTONCES:
• La probabilidad expresa el grado de certeza de que ocurrirá un
determinado EVENTO (en lo estamos interesados que pase) al hacer un
determinado experimento aleatorio (todas las posibilidades de un hecho).
• Entonces, dado un evento A, escribimos su probabilidad como:
𝑁º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑁º 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠
𝑃 𝐴 = =
𝑁º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑙 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑢𝑛 ℎ𝑒𝑐ℎ𝑜
Por ejemplo:
Para el experimento E: Lanzar tres monedas
Calcular
a. La probabilidad de que salga una cara.
b. La probabilidad de que salga tres sellos. Estos son los eventos
c. La probabilidad de que dos sean cara.
Solución:
Espacio Muestral Ω = {CCC,CCS,CSC,CSS,SCC,SCS,SSC,SSS}
A = {CSS,SCS} P (A) = 2/8
B = {SSS} P (B) = 1/8
C = {CCS,CSC,SCC} P (C) = 3/8
11
• La probabilidad de la ocurrencia de un evento que resulta de tal experimento
estadístico se evalúa utilizando un conjunto de números reales denominados
pesos o probabilidades, que van de 0 a 1.
• Para todo punto (suceso) en el espacio muestral asignamos una probabilidad tal
que la suma de todas las probabilidades es 1.
• En muchos experimentos, como lanzar una moneda o un dado, todos los puntos
muestrales (sucesos) tienen la misma oportunidad de ocurrencia, por lo tanto, se
les asignan probabilidades iguales. Pero esto no siempre es así.
• Pero que pasa si el experimento o hecho nos da infinita posibilidades de
ocurrencia. Como por ejemplo:
Observar el tiempo de vida en meses de una computadora, y nuestro interés es
conocer si la computadora dura menos de 15 meses. ¿Cuál sería el numerador y
denominador?
• Pues esto ya no es tan fácil de determinar porque se tratan de hechos cuyas
posibilidades de ocurrencia son innumerables y están determinadas por intervalos
y ya no un solo valor.
12
Mg. Carlos A. Sánchez Torres
ANALICEMOS
“Juan probablemente ganará el partido de tenis”
1. Aquí la acción o hecho (experimento aleatorio) es
jugar un partido de tenis. Y este hecho tiene varias
posibilidades antes de ocurrir.
2. ¿Cuántas posibles posibilidades?. Pues como sabemos
en un juego tenemos solo 03 situaciones: ganar, perder 1
o empatar. (espacio muestral) 𝑃 𝐴 = 3
3. Pero a nosotros solo nos interesa si gana Juan.
(evento)
4. Por lo que la posibilidad de ganar es 1/3
“Juan probablemente pese más de 70 kg”
1. Aquí la acción o hecho (experimento aleatorio) es
medir o tomarse el peso. Y este hecho tiene varias
posibilidades antes de ocurrir.
2. ¿Cuántas posibles posibilidades?. Pues como sabemos ¿?
𝑃 𝐴 =
al pesarse Juan tiene las situaciones: 70.1 kg; 70.111 kg; ¿?
70.21 kg; 70.212 kg; … (espacio muestral)
3. Pero a nosotros solo nos interesa si Juan pesa más de
70 kg (evento) 70 kg
4. Por lo que la posibilidad de pesar más de 70 kg es ¿? 13
De esto podemos concluir que para poder determinar la probabilidad de un
intervalo vamos a tener que recurrir a tener que conocer cual es área de ese
intervalo.
¿Y como se mide el área de un intervalo?
y
x
70 kg
x
70 kg
x
70
Mg. Carlos A. Sánchez Torres 14
¿Y COMO SE MIDE EL ÁREA DE UN INTERVALO?
Pues utilizaremos el calculo de integrales, recordemos que esta
herramienta es parte de las matemáticas se utiliza principalmente para el
cálculo de áreas y volúmenes de regiones.
Pero sabemos que para integrar algo, necesitamos una función f(x), cuales
serían esta funciones. Pues en la teoría estadística estas funciones se les
llama:
Distribuciones de probabilidad de variables continuas.
Sin embargo no hay que olvidar que si existen variables discretas, existen
Distribución de probabilidad de variables discretas.
Pero que rol juegan las distribuciones de probabilidad en el calculo de
probabilidades, pues veamos un ejemplo primero con una variable discreta
para así seguir con nuestro
15
Mg. Carlos A. Sánchez Torres
Hagamos más “Juan jugará 03 partidos de tesis, que tan
“Juan probablemente ganará el amplio este probable es que gané 02 partidos”
partido de tenis” evento:
ESQUEMA DE ARBOL DISTRIBUCIÓN MULTINOMIAL
G 1/3*1/3*1/3
G P 1/3*1/3*1/3
E 1/3*1/3*1/3
G 1/3*1/3*1/3
G (1/3) P P n= 3 partidos
E X1i = partidos ganados
G 1/3*1/3*1/3 X2i = partidos perdidos
E P X3i = partidos empatados
E p1 = probabilidad de ganar partido
G 1/3*1/3*1/3 𝟗 𝟏 p2 = probabilidad de perder partido
=
G P 𝟐𝟕 𝟑 p3 = probabilidad de empatar partido
E
P
G 1/3*1/3*1/3
P P 𝟑! 𝟏 𝟐 𝟏 𝟎 𝟏 𝟎
E 𝟐! 𝟎! 𝟎! 𝟑 𝟑 𝟑
G 1/3*1/3*1/3
G P
E 𝟏 𝟏
𝟑 𝟏 𝟏 =
G 1/3*1/3*1/3 𝟗 𝟑
E P P
E
G
E P Mg. Carlos A. Sánchez Torres 16
E
Distribuciones de Probabilidad de Variables Discretas:
Entre las distribuciones de probabilidades discretas mas conocidas tenemos:
• Distribución de Bernoulli
• Distribución binomial
• Distribución binomial negativa f(x)
• Distribución geométrica
• Distribución hipergeométrica f(x)=
• Distribución de Poisson
• Distribución uniforme discreta f(x)=
• Distribución zeta f(x)= 17
Mg. Carlos A. Sánchez Torres
Como se dijo, conocer o asociar correctamente las distribuciones con la
naturaleza del experimento, nos permitirá calcular probabilidades reduciendo
considerablemente los cálculos.
Entonces por definición al experimento de lanzar una moneda podemos decir
que la variable aleatoria para este experimento sigue una distribución Bernoulli
Al experimento de lanzar una moneda tres veces, por definición podemos
asociar una distribución BINOMIAL. Entonces veamos un ejemplo de cálculo
de probabilidades:
a.- ¿Cuál es la probabilidad de obtener 2 caras?
b.- ¿Cuál es la probabilidad de obtener 1 cara?
Mg. Carlos A. Sánchez Torres 18
DISTRIBUCION DE PROBABILIDAD CONTINUA
Una variable aleatoria continua tiene una probabilidad 0 de adoptar
exactamente cualquiera de sus valores. En consecuencia, su distribución de
probabilidad no se puede presentar en forma tabular (un solo valor).
Ejemplo:
Consideremos una variable aleatoria cuyos valores son las estaturas de los
estudiantes de estadística aplicada de ingeniería ambiental.
Querer calcular alguna probabilidad de la estatura, por ejemplo, una estatura
exactamente de 164.3 cm, es complicado por los argumentos antes mencionados.
Sin embargo entre dos valores, digamos 163.5 y 164.5 centímetros, o incluso valores
superiores a 164.5 o inferiores a 163.5 centímetros, hay un número infinito de
estaturas, una de las cuales es 164 centímetros.
En conclusión, la probabilidad de seleccionar al azar a un estudiante que tenga
exactamente 164 centímetros de estatura en lugar de una del conjunto infinitamente
grande de estaturas tan cercanas a 164 centímetros que humanamente no sea posible
medir la diferencia es remota, por consiguiente, asignamos una probabilidad 0 a tal
evento.
19
Sin embargo, esto no ocurre si nos referimos a la probabilidad de seleccionar a un
estudiante que mida al menos 163 centímetros pero no más de 165 centímetros de
estatura. Aquí nos referimos a un intervalo en vez de a un valor puntual de nuestra
variable aleatoria.
Nos interesamos por el cálculo de probabilidades para varios intervalos de variables
aleatorias continuas como:
P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b) = P(a ≤ X ≤ b)
P(X > a) = P(X ≥ a)
P(X < a) = P(X ≤ a)
Es decir, no importa si incluimos o no un extremo del intervalo. Sin embargo, esto
no es cierto cuando X es discreta.
Aunque la distribución de probabilidad de una variable aleatoria continua no se
puede representar de forma tabular (valor único), sí es posible plantearla como una
fórmula, la cual necesariamente será función de los valores numéricos de la variable
aleatoria continua X, y como tal se representará mediante la notación funcional f(x).
Cuando se trata con variables continuas, a f(x) por lo general se le llama función de
densidad de probabilidad, o simplemente función de densidad de X. 20
¿Cuál es función continua que necesitamos para calcular
probabilidades?
Una función que cumple los requisitos necesarios que se necesitan para ser una
función que permita calcular probabilidades es la función gaussiana, distribución de
gauss o distribución NORMAL.
∞
𝑃 𝑋 > 𝑎 = න 𝑓 𝑥 𝑑𝑥
𝑎
21
LA DISTRIBUCIÓN NORMAL
•La distribución normal, llamada también Curva de Gauss (en recuerdo al
científico que lo descubrió), es la distribución de probabilidad más importancia
en la Estadística y por ende del Cálculo de Probabilidades.
•Esta distribución de probabilidad es importante porque las variables aleatorias
continuas (peso, edad, talla, producción, gasto en publicidad, temperatura, ventas,
PBI, ganancias, las mediciones físicas en áreas como los experimentos
meteorológicos, estudios de la precipitación pluvial y mediciones de partes
fabricadas, etc) que son variables que más se evalúan en una investigación
científica o investigación de mercados se aproximan a esta distribución de
probabilidad.
•También es importante porque se utiliza como aproximación de las
distribuciones discretas tales como: la Binomial, la Poisson, etc
22
Mg. Carlos A. Sánchez Torres
CARACTERÍSTICAS
1. Tiene como parámetros a y
2. Su función densidad está dada por:
1 1 𝒙−𝜇 2
𝑓 𝑥 = 𝑒2 𝜎
2𝜋𝜎 2
𝑑𝑜𝑛𝑑𝑒 − ∞ < 𝒙 < +∞, −∞ < 𝜇 < +∞, 𝜎 > 0
3. Su función de densidad nos da la
siguiente gráfica.
4. Esta función de probabilidad es
asintótica con respecto al eje X, (es decir
tiene recorrido infinito, la curva nunca
toca el eje X); además es unimodal y es
simétrica con respecto a la media .
5. El área total bajo esta función o curva es
1 ó 100%, 23
LA DISTRIBUCIÓN NORMAL ESTÁNDAR
1.Es una distribución a la cual se le ha modificado la escala original; esta
modificación se ha logrado restando la media al valor de la variable original
(X) y dividiendo este resultado por (desviación estándar), la nueva variable se
denota por Z y recibe el nombre de variable estandarizada
X −
z=
2. La modificación de la escala ha permitido elaborar una tabla para el
cálculo de las probabilidades; si esto no hubiera sido posible, sería
necesario construir una tabla para cada valor de y .
3. La función de densidad de la variable estandarizada es:
1 𝟏 𝒙−𝜇 2
−
𝑓 𝒛 = 𝑒 𝟐 𝜎
2𝜋
24
4. El promedio es cero (=0) y la varianza es 1 (2=1) de la distribución Z.
5. Notación:
•Si X es v.a. continua distribuida normalmente con media y varianza 2 ,
la denotamos por : X → N( , 2).
•Aplicando esta notación a la variable normal estandarizada Z, escribimos:
Z → N(0 , 1) , esto se interpreta como, Z tiene distribución normal con
media 0 y varianza 1.
6. La superficie bajo la curva normal Z estandarizada también es igual a 1.
Por consiguiente, las probabilidades pueden representarse como áreas bajo
la curva normal escandalizada entre dos valores.
7. Debido a que la distribución normal es simétrica muchas de las tablas
disponibles contienen solo probabilidades para valores positivos de Z.
25
Mg. Carlos A. Sánchez Torres
CÁLCULO DE PROBABILIDADES CON LA FUNCIÓN
DE DISTRIBUCIÓN
Es justamente para el cálculo de probabilidades que se puede apreciar la utilidad de
la función de distribución. En la actualidad existen tablas estadísticas y software que
ya tienen incluida las sumatorias o integrales, permitiendo calcular las
probabilidades.
Es decir, si por ejemplo queremos saber P(X 5), y conocemos la función de
distribución, no necesitaremos hacer ninguna sumatoria ni integral, porque el
resultado es directamente contrastarlo con tablas estadísticas.
26
USO DE TABLA:
Si se conoce el comportamiento de una variable es decir se sabe que tienen una
distribución normal, para calcular las diferentes probabilidades se tiene que
estandarizar la variable. Una vez estandarizada la variable, recién utilizar la tabla
de la distribución normal estandarizada o tabla Z.
FÓRMULAS:
Recordar que existen tablas solo para valores positivos o acumulan a la derecha
por lo tanto las formulas aquí presentadas se ajustan solo a nuestra tabla.
𝑥−𝜇 𝑎−𝜇 𝑎−𝜇
𝑃(𝑥 ≤ 𝑎) = 𝑃 ≤ =𝑃 𝑍≤
𝜎 𝜎 𝜎
𝑥−𝜇 𝑎−𝜇 𝑎−𝜇
𝑃(𝑥 ≥ 𝑎) = 1 − 𝑃(𝑥 ≤ 𝑎) = 1 − 𝑃 ≤ =1−𝑃 𝑍 ≤
𝜎 𝜎 𝜎
𝑏−𝜇 𝑎−𝜇
𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = 𝑃(𝑥 ≤ 𝑏) − 𝑃(𝑥 ≤ 𝑎) = 𝑃 𝑍 ≤ −𝑃 𝑍≤
𝜎 𝜎
Mg. Carlos A. Sánchez Torres 27
EJERCICIOS
1. Dada una distribución normal estándar, calcule el área bajo la curva que está
a. a la izquierda de z = –1.39
b. a la izquierda de z = 1.43
c. a la derecha de z = 1.96
d. a la derecha de z = – 0.89
e. entre z = –2.16 y z = – 0.65
f. entre z = – 0.48 y z = 1.74
28
Mg. Carlos A. Sánchez Torres
EJERCICIOS
2. Calcule el valor de z si el área bajo una curva normal estándar
a. a la derecha de z es 0.3632;
b. a la izquierda de z es 0.1131;
c. entre 0 y z0, con z > 0, es 0.4838;
d. entre –z y z0, con z > 0, es 0.9500.
29
Mg. Carlos A. Sánchez Torres
EJERCICIOS
3. Dada una distribución normal estándar, calcule el valor de Z0 tal que
a. P(Z > Z0) = 0.2946;
b. P(Z < Z0) = 0.0427;
c. P(−0.93 < Z < Z0) = 0.7235.
30
Mg. Carlos A. Sánchez Torres
EJERCICIOS
4. En estudio realizados años anteriores en el mercado la Hermelinda –Trujillo sobre
material particulado, nos dio un promedio de 155.1 mg/m3 y una varianza de 7.0
(mg/m3)2. Actualmente se va a realizar un estudio en el mismo mercado y se demostró que
los datos siguen una distribución normal, cual es la probabilidad:
a. Las concentraciones sean mayores que 160
b. Las concentraciones sean menores que 140.2
c. Las concentraciones estén entre 140.5 y 148.4
d. Las concentraciones estén entre 150.5 y 161.5
31
Mg. Carlos A. Sánchez Torres
Distribuciones de Probabilidad de Variables Continuas:
Aunque la distribución normal se puede utilizar para resolver muchos problemas de
ingeniería y ciencias, aún hay numerosas situaciones que requieren diferentes tipos
de funciones de densidad.
• Distribución Beta
• Distribución exponencial f(x)=
• Distribución F de Snedecor f(x)=
• Distribución Gamma
• Distribución ji cuadrado f(x)=
• Distribución normal o Gaussiana f(x)=
• Distribución t de Student f(x)=
Mg. Carlos A. Sánchez Torres 32
LA DISTRIBUCIÓN JI CUADRADO
•En estadística, la distribución χ² (de Pearson), llamada Ji cuadrado, es una
distribución de probabilidad continua con un parámetro k que representa los
grados de libertad de la variable aleatoria:
donde Zi son variables aleatorias normales independientes de media cero y
varianza uno. El que la variable aleatoria X tenga esta distribución se representa
habitualmente así: X XK2 .
•Es conveniente tener en cuenta que la letra griega χ se transcribe a otros
idiomas (como el latín,el inglés o el alemán) como chi. En cualquier caso, la
pronunciación en castellano es ji.
Mg. Carlos A. Sánchez Torres 33
CARACTERÍSTICAS
1. Tiene como parámetro a k que representa los grados de libertad. Y la
distribución gamma ()
2. Su función densidad está dada por:
f(x)=
3. Su función de densidad nos da la
siguiente gráfica.
4. Esta función de probabilidad no es
simétrica. Tiene cola estrechas que se
extienden a la derecha; esto es, están
sesgadas a la derecha. No tiene sentido
para valores negativos de x.
5. El área total bajo esta función o curva es
1 ó 100%, Mg. Carlos A. Sánchez Torres 34
EJERCICIOS CHI CUADRADA
Sea χ² ( Chi Cuadrado) una v. a. que se distribuye como una “χ0²” con “v” grados
de libertad, luego:
a. Si 1- α = 0.995 está derecha con v= 10 , hallar χ0²
b. Si 1-α = 0.95 está a la izquierda con, hallar χ0²
c. Si α = 0.001, v= 6 , hallar χ0²
d. Si χ0² = 23.21, v = 10 encontrar α y 1 – α
e. Si χ0² = 10.83, v = 1 encontrar α y 1 – α.
35
Mg. Carlos A. Sánchez Torres
LA DISTRIBUCIÓN T DE STUDENT
•Uno de los inconvenientes de la distribución normal es que cuando la muestra
es pequeña no permite realizar buenas estimaciones, ante este problema surge la
distribución t (de Student ).
•La distribución t de Student es la distribución de probabilidad que se obtiene
del cociente:
donde : Z: tiene una distribución normal de media nula y varianza 1
V: tiene una distribución ji-cuadrado con v grados de libertad
Z y V son independientes
•Es utilizada para realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir
de los datos de una muestra. Mg. Carlos A. Sánchez Torres 36
CARACTERÍSTICAS
1. Tiene como parámetro a v que representa los grados de libertad, es decir que no
depende y , lo que en la práctica esto es de gran utilidad.
2. Su función densidad está dada por:
3. Su función de densidad nos da la
siguiente gráfica.
4. Esta función de probabilidad es
asintótica con respecto al eje X, (es decir
tiene recorrido infinito, la curva nunca
toca el eje X); además es unimodal y es
simétrica con respecto a la media .
5. El área total bajo esta función o curva es
1 ó 100%, Mg. Carlos A. Sánchez Torres 37
EJERCICIOS T STUDENT
Sea T una v. a. que se distribuye como una “t” con “v” grados de libertad,
calcular:
a. P [-1.7531≤ t ≤ 2.9467]; v = 15.
b. El valor to, si 1- α = 0.995 está a la izquierda, v= 15.
c. El valor to, si α = 0.05 está a la derecha, v= 15
d. Si to = 12.71, v = 1 encontrar α y 1 – α
e. Si to = 0.142, v = 2 encontrar α y 1 – α.
38
Mg. Carlos A. Sánchez Torres
LA DISTRIBUCIÓN F
•Usada en teoría de probabilidad y estadística, la distribución F es una
distribución de probabilidad continua. También se le conoce como distribución
F de Snedecor (por George Snedecor) o como distribución F de Fisher-
Snedecor.
•Una variable aleatoria de distribución F se construye como el siguiente
cociente:
donde
U1 y U2 siguen una distribución chi-cuadrado con d1 y d2 grados de libertad
respectivamente, y U1 y U2 son estadísticamente independientes.
• La distribución F aparece frecuentemente como la distribución nula de una
prueba estadística, especialmente en el análisis de varianza
Mg. Carlos A. Sánchez Torres 39
CARACTERÍSTICAS
1. Tiene como parámetro a d1 y d2 que representa los grados de libertad.
2. Su función densidad está dada por:
f(x)=
3. Su función de densidad nos da la
siguiente gráfica.
4. Esta función de probabilidad no es
simétrica. Tiene cola estrechas que se
extienden a la derecha; esto es, están
sesgadas a la derecha. No tiene sentido
para valores negativos de x.
5. El área total bajo esta función o curva es
1 ó 100%, Mg. Carlos A. Sánchez Torres 40
EJERCICIO
Calcular los valores de F0:
a. P (F (n1; n2 )≥ F0)=0.01 donde n1 =20; n2=10
b. P (F (n1 ; n2 )≤ F0)=0.10 donde n1 =12; n2=4
c. P (F (n1 ; n2 )> F0)=0.25 donde n1 =2; n2=7.
41
Mg. Carlos A. Sánchez Torres
EJERCICIO
Si X ~ F (n1, n2), hallar el valor de c tal que:
a. P(X>c) = 0.05, cuando n1 =2 , n2=3
b. P(X>c) = 0.95, cuando n1 =15 , n2=15
c. P(X>c) = 0.95, cuando n1 = 15, n2= 15.
42
Mg. Carlos A. Sánchez Torres
DISTRIBUCIONES EN EXCEL
Si queremos las áreas o probabilidades de función z, utilizamos la función:
=DISTR.NORM.ESTAND.N(z,1)
Devuelve la función de distribución normal estándar (tiene una media de 0 (cero) y
una desviación estándar de uno).
Si queremos los valores “z” utilizamos la función:
= INV.NORM.ESTAND(probabilidad)
Devuelve el inverso de la distribución normal estándar acumulativa. La distribución
tiene una media de cero y una desviación estándar de uno.
Si queremos los valores “t”, utilizamos la función:
=DISTR.T.(1-probabilidad,grados_de_libertad)
• Probabilidad : Obligatorio. La probabilidad asociada con la distribución t de
Student - f(t). Evalúa cola derecha.
• Grados_de_libertad : Obligatorio. El número de grados de libertad que
caracteriza la distribución.
Mg. Carlos A. Sánchez Torres 43
DISTRIBUCIONES EN EXCEL
Si queremos las áreas o probabilidades de una función “t”, utilizamos la
función:
=DISTR.T.CD (t , grados_de_libertad)
Devuelve el inverso de la distribución t de Student de cola derecha.
• t : Obligatorio. Es el valor numérico al que debe evaluar la distribución. Es el
valor “t” buscado.
• Grados_de_libertad: Obligatorio. Es el número de grados de libertad que
caracteriza la distribución.
Si queremos los valores “x2”, utilizamos la función:
= INV.CHICUAD.CD (probabilidad, grados_de_libertad)
• Devuelve el inverso de una probabilidad dada, de una cola derecha, en una
distribución chi cuadrado.
• Probabilidad Obligatorio. Una probabilidad asociada con la distribución chi
cuadrado – f(x2). Evalúa cola derecha.
• Grados_de_libertad Obligatorio. El número de grados de libertad.
Mg. Carlos A. Sánchez Torres 44
DISTRIBUCIONES EN EXCEL
Si queremos las áreas o probabilidades de una función “x2”, utilizamos la
función:
= DISTR.CHICUAD.CD(x2;grados_de_libertad)
Devuelve la probabilidad de cola derecha de la distribución chi cuadrado
• X2 Obligatorio: El valor en el que se desea evaluar la distribución.
• Grados_de_libertad : Obligatorio. El número de grados de libertad.
Si queremos los valores “F”, utilizamos la función:
= INV.F.CD(probabilidad,grados_de_libertad1,grados_de_libertad2)
Devuelve el inverso de la distribución de probabilidad F (de cola derecha). Si p =
DISTR.F.CD(x,...), INV.F(p,...) = x. La distribución F se puede usar en una prueba
F que compare el grado de variabilidad en dos conjuntos de datos.
• Probabilidad: Obligatorio. Es una probabilidad asociada a la distribución
acumulativa F.
• Grados_de_libertad1: Obligatorio. Es el número de grados de libertad del
numerador.
• Grados_de_libertad2: Obligatorio. Es el número de grados de libertad del
denominador.
Mg. Carlos A. Sánchez Torres 45
Si queremos las áreas o probabilidades de una función “F”, utilizamos la
función:
= DISTR.F.CD(x,grados_de_libertad1,grados_de_libertad2)
Devuelve la distribución de probabilidad F (grado de diversidad) (de cola derecha)
de dos conjuntos de datos. Use esta función para determinar si dos conjuntos de
datos tienen diferentes grados de diversidad.
X: Obligatorio. Es el valor en el que desea evaluar la función.
Grados_de_libertad1: Obligatorio. Es el número de grados de libertad del
numerador.
Grados_de_libertad2: Obligatorio. Es el número de grados de libertad del
denominador.
Mg. Carlos A. Sánchez Torres 46
Mg. Carlos A. Sánchez Torres 47
REFERENCIAS BIBLIOGRAFICAS
1) Walpole, R. ; Raymond, M.; Sharon, M.; Keying, Y. (2012). Probabilidad y
estadística para ingeniería y ciencias. México: Pearson Educación.
2) http://hyperphysics.phy-astr.gsu.edu/hbasees/intpol.html
3) https://www.youtube.com/watch?v=XIdM2oxPttQ
4) https://es.wikipedia.org/wiki/Funci%C3%B3n_error
Mg. Carlos A. Sánchez Torres 48