UNIVERSIDAD
NACIONAL DE
INGIENERÍA
T-STUDENT, CHI CUADRADO,
INTEGRANTE FISHER
S:
MACEDO BARTOLOME JOHANN
FERNANDO
ASTO VILLANUEVA CESAR
HERRERA FLORESARMANDO
CARLOS
SANTOS ARIAS JUNIORS
QUISPEEDSON
RAMOS GUSTAVO
ALDAIR
DOCENTE: OSORIO MAZA MERCEDES
AÍDA
T-STUDENT
T STUDENT
¿Cuándo usar esta distribución?
Si al aplicar muestreo no es posible extraer muestras mayores a
30 elementos, la utilización de la distribución normal presenta
grandes riesgos estadísticos. Para ello, la teoría de pequeñas
muestras presenta como alternativa a la distribución t-
student, en el entendido de que conforme el tamaño de la
muestra tienda a 30 elementos, la distribución t-student tiende a
la distribución normal. Por ello, toda inferencia estadística que
se desee realizar con muestras pequeñas tiene más validez si se
hace con la distribución t-student.
T STUDENT
FÓRMULAS
Función densidad
v 1
Función densidad
v 1
2
1
f ( x)f (x) v
2
*
1
*
k 1
k 1
v * v x
2 2
2 * vv 1 x 2 2
2 v 1
F ( x) f ( x) dx Tabulada
Forma de la curva de esta distribución según v.
T STUDENT
¿Cómo usar las tablas?
Las tablas de la distribución t de student dan valores
acumulados de izquierda a derecha. Para valores negativos
no olvidar la simetría de esta distribución, tal que el valor de
probabilidad a la derecha de t, es igual al valor de
probabilidad a la izquierda de –t.
Para extraer valores de probabilidad de esta tabla se sigue el
siguiente procedimiento:
1. Calcular los valores de la desviación estándar y el promedio
y determinar el valor del promedio para el que se desea
calcular la probabilidad.
T STUDENT
¿Cómo usar las tablas?
2. Determinar los grados de libertad (v) tal que v=n-1.
3. Calcular el valor de t=(xbarra-)/(s/n-1).
4. Localizar en tablas el valor de la probabilidad asociada a los
valores de t y de v. Los valores de t pueden ser negativos o
positivos. Contrario a la tabla de la distribución normal
aquí los valores de t están dentro de la tabla y los valores de
probabilidad en la parte superior de la misma. En algunos
casos puede ser necesario interpolar para encontrar el valor
exacto buscado, de lo contrario se escoge el que más se
aproxime.
T STUDENT
¿Cómo usar las tablas?
Por ejemplo si t es igual 0.92 con 5 grados de libertad,
el valor de la probabilidad es 0.80 pues se localiza en la
dirección vertical en la parte superior tal y como se
muestra a continuación.
La tabla se puede usar también al revés, sea dada una
probabilidad se determina el valor de t que le
corresponde.
PROBLEMA T-
STUDENT
El profesor de estadística afirma que la calificación promedio de
su curso es de 7.9, si en este semestre inicia con un grupo de 28
estudiantes que tuvieron una calificación promedio de 7.5 y
desviación típica muestral de 2.3 en el curso anterior.
Determine si la afirmación del profesor de estadística es correcta,
utilizando un nivel de confianza de 80%
Definimos Hipótesis
𝐻 𝑂 = 𝐻𝑖𝑝 ó 𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 (𝐻 𝑂= 𝜇) El promedio del curso es 7.9
𝐻 1= 𝐻𝑖𝑝 ó 𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎 ( 𝐻 1 ≠ 𝜇) El promedio del curso es diferente de 7.9
Cálculos con Geogebra
Identificamos los datos
𝑛=28
𝑔
.𝑙 =𝑛 −1 𝑔 .𝑙 =27
𝑁𝑖𝑣𝑒𝑙
𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎=80 %
𝛼 ′=1 −80 % 𝛼 ′=20 % 𝛼 ′=0.2
20 %
𝛼 = 𝛼 =10 % 𝛼 =0.1
2
Hallamos el valor “t”
𝜒− 𝜇 7.5− 7.9
𝑡 =
𝑆𝑋
𝑡 = 𝑡 =−0.9203
2.3
√𝑛 √ 28
Distribución “T-student”
Gráfica con Geogebra
CHI-CUADRADO
Karl Pearson nació el 27 de marzo de 1857 en Londres,
ciudad en la que falleció en 27 de abril de 1936. Es uno
de los nombres vinculados a las aplicaciones de la
estadística a la biología y al nacimiento de la
bioestadística, aunque con ello tuvo que poner en
marcha nuevos conceptos de la propia estadística.
Y es en 1890, con 33 años y sin haber nunca estudiado la estadística.
Y este interés es debido a Francis Galton, quien publica su
libro Natural Inheritance en 1889. A esto se le añade la llegada de un
nuevo profesor a su universidad, Weldon, un zoólogo. Pearson,
animado por Weldon, se interesa por las matemáticas que describen
los procesos de la herencia y la evolución, y publica una serie de
artículos sobre el análisis de regresión, coeficiente de correlación e
introduce el test del chi-cuadrado.
“En Cambridge estudié Matemáticas, pero leía las obras de Spinoza”.
Se debe recordar que la prueba Chi-cuadrado (x2) o Ji-cuadrado fue sugerida por Carl Pearson
como una forma de valorar la bondad del ajuste de unos datos a una distribución de probabilidad
conocida, y se ha establecido como el procedimiento de elección para el contraste de hipótesis. Esta
prueba estadística se emplea en el análisis de dos o más grupos, y de dos o más variables. Desde
entonces, se ha convertido en una prueba muy aceptada y aplicable a múltiples usos, cuando se
dispone de datos independientes de tipo nominal. Ella ofrece un test general sobre la existencia de
diferencias entre las categorías que agrupan a los datos de la variable dependiente.
TEORÍA DE LA CHICUADRADO
El chi cuadrado se utiliza especialmente para variables cualitativas, variables que carecen de unidad
donde sus valores no pueden expresarse numéricamente. La prueba chi cuadrada puede emplearse
para determinar que también se ajusta una distribución teórica como por ejemplo una distribución
normal o distribución binomial, a una distribución empírica (distribución obtenida a partir de datos
muéstrales); es decir mide la discrepancia entre una distribución observada y otra teórica. Es
denotado con la letra griega:[Link] la administración se emplea el chi cuadrado para determinar
cómo se aproxima los datos experimentales a los valores esperados. Las dos aplicaciones más
comunes del chi cuadrado son: Prueba de bondad de ajuste y Prueba de independencia.
• INTRODUCCIÓN
La es una prueba de libre distribución (no paramétrica) que mide la discrepancia entre una
distribución de frecuencias observadas y esperadas. Dentro de sus características generales, la prueba
toma valores entre cero e infinito y no tiene valores negativos porque es la suma de valores elevados al
cuadrado (1). Existen tres usos relevantes de la prueba : – Prueba de bondad de ajuste (una variable)
– Prueba de independencia (dos variables) – Prueba de homogeneidad (dos variables) En esta
publicación, vamos a realizar mayor énfasis al uso que se da a la como prueba de independencia (2).
• SUPUESTOS
• USO DE LA PRUEBA
– Se considera que los datos
Investigar la diferencia en valores de provienen de una muestra aleatoria
frecuencias cuando se clasifica una muestra extraída de la población de interés.
“n” por un atributo “A” y después se realiza – La muestra debe ser lo
una nueva clasificación de “A” por un suficientemente grande
segundo atributo “B”(3)
• PRUEBA ESTADÍSTICA
• HIPÓTESIS
Ho: No hay asociación entre las variables A|B Donde:
(Las variables son independientes) : Valor observado
H1: Si hay asociación entre las variables A|B : Valor esperado
(Las variables no son independientes)
GRADO DE LIBERTAD
• DISTRIBUCIÓN DE LA PRUEBA ESTADÍSTICA
Cuando Ho es verdadera, sigue una distribución con (r-1)(k-1)
grados de libertad. (r: número de filas y k: número de columnas en
la tabla de contingencia)
• LIMITACIONES
La muestra debe ser lo suficientemente grande. Si menos del
20% de las celdas de la tabla de contingencia, presentan valores
esperados ≤5 no se recomienda aplicar la prueba X2 y optar por
la alternativa del test exacto de Fisher(4).
VALOR DEL PARAMETRO P
NIVEL DE SIGNIFICANCIA= α
PARA CALCULAR EL VALOR DE P SE REALIZA
𝜶
TABLA DE DISTRIBUCIÓN CHI- CUADRADO
ROBLEMA CHI-CUADRADO(I)
Ejercicio
Para conocer la opinión de los ciudadanos sobre la actuación del alcalde de una determinada ciudad, se realiza
una encuesta a 404 personas, cuyos resultados se recogen en la siguiente tabla:
Contrastar, con un nivel de significación del 5%, que no existen diferencias de opinión entre hombres y
mujeres ante la actuación del alcalde.
Solucion:
Se trata de un contraste de homogeneidad en el que se desea comprobar si las muestras proceden de
poblaciones distintas.
Se tienen dos muestras clasificadas en tres niveles, donde se desea conocer si los hombres y mujeres proceden
de la misma población, es decir, si se comportan de manera semejante respecto a la opinión de la actuación del
alcalde.
La hipótesis nula: 0 H : 'No existe diferencia entre hombres y mujeres respecto a la opinión'
REGIÓN DE RECHAZO DE LA
HIPÓTESIS NULA:
forma una tabla de contingencia 2 x 3: En cada frecuencia observada
Se en
la tabla de contingencia se tiene una frecuencia teórica o esperada que se calcula mediante la
expresión, donde son las probabilidades de que un elemento tomado de la muestra presente
las modalidades xi de X e de Y.
199 𝑥 140 199 𝑥 62
𝑒 = 199 𝑥 202 =99.5 𝑒 12= =68.96 𝑒 13 = =30.53
11
404 404 404
205 𝑥 202 205 𝑥 140 205 𝑥 62
𝑒 21= =102.5 𝑒 22= 𝑒
=71.03 23 = =31.46
404 404 404
El estadístico de contraste: , con lo que,
Remplazando en la formula:
= + =9.76
sigue una con dos grados de libertad si es cierta la hipótesis nula con i, j ; en caso contrario sería necesario
agrupar filas o columnas contiguas.
El estadístico de contraste:
=
El estado teórico es:
Con se cumple la región de rechazo, concluyendo que las muestras no son homogéneas, es decir, no
proceden de la misma población, hombres y mujeres no opinan lo mismo.
PROBLEMA CHI-
CUADRADO(II)
En un laboratorio se analizo 10 veces una misma muestra en intervalos aleatorios, considerando estas muestras como
una poblacion normal con varianza , Calcule la probabilidad de que esta poblacion tenga una varianza muestral:
a) Mayor a 7.1
b) Entre 4.27 y 11.333
FISHER
PROBLEMA FISHER(I)
En una empresa se tienen dos tornos de diferente antigüedad, lo que hace pensar que las varianzas no son iguales. ¿Cuál
es la probabilidad de que la relación entre las varianzas sea igual a 3? Se sabe que los grados de libertad son iguales a
10.
𝑎
𝑎 +𝑏 𝑎 2
𝑎 −1
{ ( )( ) 2
𝑟 𝑥
2 𝑏
𝑓 𝑥= 𝑎+ 𝑏
; 𝑥 >0
𝑎 𝑏 𝑎
𝑟 ( ) ( )(
2
𝑟
2
1+
𝑏
𝑥 ) 2
𝑋 =3 𝑎 =10 𝑏= 10
𝑎 +𝑏 10 +10
𝑟 ( 2
=𝑟 ) ( 2 )
=𝑟 ( 10 ) = 9 !
𝑎 10
𝑎 10
( )
𝑎
𝑏
2
=
10( 10
) 2
=1 =1
5
− 1 −1
𝑥 2
=3 2
=34 =81