Aplicaciones de análisis exploratorio de datos y transformaciones.
Los siguientes datos corresponden a mediciones del recuento de células muertas por
campo, y el crecimiento bacteriano ¿Determinar si las variables presentan Normalidad?.
Crecimiento bacteriano Recuento celular
15 5
203 6
500 7
2740 0
10544 0
45896 0
63236 7
7015548 2
14897231 20
14
0
4
9
27
0
8
Recodificación de variables
A continuación se dan los resultados obtenidos con una muestra de 20 universitarios la
característica es el tiempo en seg. de reacción ante un estímulo auditivo:
0.110 0.110 0.126 0.112 0.117 0.113 0.140 0.107
0.113 0.100 0.122 0.105 0.103 0.119 0.100 0.117
0.124 0.118 0.132 0.108 0.115 0.120 0.107 0.123
0.117 0.111 0.112 0.101 0.112 0.111 0.119 0.103
Determinar los estadísticos para la variable medida y hacer las interpretaciones
respectivas.
Además Realizar su tabla de distribución de frecuencias a partir de los siguientes
intervalos de clase:
0.100-0.109
0.110-0.119
0.120-0.129
0.130-0.139
0.140-0.149
Aplicaciones de diseños comparativos:
Un inspector de control de contaminación sospechaba que una comunidad ribereña
estaba descargando aguas servidas no-tratadas en el río y eso cambiaba el nivel de
oxígeno disuelto en el río. Para probar esto, obtuvo 5 muestras aleatorias de agua del río
en una zona río arriba del pueblo, y otras 5 muestras en una zona río abajo del pueblo.
Se midieron los niveles de oxígeno disuelto, en ppm. ¿Proveen los datos evidencia de
un contenido menor de oxígeno río abajo?.
Río arriba Río abajo
5.8 5.0
5.2 4.7
5.0 4.9
4.9 4.8
5.1 4.9
Aplicación para nivel de investigación comparativa
En un estudio con niños menores de 2 años se evaluó el nivel de desarrollo
psicomotor con la aplicación de 2 cuestionarios que utilizan la escala de
evaluación del desarrollo psicomotor (EEDP) y la prueba de DENVER II, se
pretende conocer si el nivel de desarrollo psicomotor es medido por igual con
ambos cuestionarios.
INSTRUMENTO
NIVEL DE
DESARROLLO EEDP1 DENVER II2
PSICOMOTOR Nº % Nº %
Normal(1) 47 78.33 28 46.67
Riesgo y/o Dudoso 2 11 18.33 14 23.33
Retraso y/o 2 3.34 18 30.00
Anormal3
TOTAL 60 100.00 60 100.00
Aplicaciones de diseños pre-experimentales:
Se realizó un experimento para probar el efecto del extracto de Pleurotus ostreatus en
los valores de glucosa en sangre para lo cual se utilizaron 9 ratas, a las cuales se les
midió los valores de glucosa antes y después de la aplicación del extracto siendo los
valores:
Valores de Valores de
glucosa (mg/dl) glucosa (mg/dl)
Antes del tratamiento Después del tratamiento
95
95
92 90
98 94
108 100
106 107
110 103
86 79
93 95
89 85
Se pretende saber si hay diferencia entre los valores iniciales y finales de glucosa en
ratas.
*Se realiza un estudio para determinar los efectos de poner fin a un bloqueo renal en
pacientes cuya función renal está deteriorada a causa de una metástasis maligna
avanzada de causa no urológica. Se mide la tensión arterial de cada paciente antes y
después de la operación. Se obtienen los siguientes resultados:
Tensión arterial
Antes 150 132 130 116 107 100 101 96 90 78
Después 90 102 80 82 90 94 84 93 89 75
¿Se puede concluir que la intervención quirúrgica tiene efecto la tensión arterial?
Aplicaciones de diseños cuasi-experimentales:
En el siguiente cuadro se detalla la Evaluación de la Producción Neta en kg. de uva
(Vitis vinifera cv. Cardinal) por cada planta después de la cosecha, tanto para las Plantas
de Vitis vinifera cv. Cardinal con Dispositivos de reflexión Solar (tratamiento para
evitar el contacto de las aves con dichas plantas), como también para las plantas sin
Dispositivos de reflexión Solar (control), dichos valores se calcularon utilizando el peso
en kg. de bayas en buen estado y el peso en kg. del escobajo de cada racimo por cada
planta, sin considerar el peso en kg. de las bayas dañadas. Se desea saber si existe
diferencias en la producción neta entre ambos grupos.
Plantas con Dispositivo Plantas sin Dispositivo
de reflexión Solar de reflexión Solar
Producción Neta Producción Neta
(kg/planta) (kg/planta)
7.00 1.84 2.30 0.50
4.60 4.80 1.28 0.56
2.80 3.60 1.24 0.52
7.00 5.24 1.78 1.80
4.90 2.22 2.24 2.12
8.50 1.84 0.58 2.10
5.40 3.60 0.80 1.90
6.40 3.94 2.16 1.30
2.88 2.24 1.54 0.60
1.38 1.84 2.66 1.66
5.34 8.10 1.00 1.40
2.55 2.30 0.86 1.04
En el siguiente cuadro se muestra el diámetro de los halos de inhibición en el cultivo
bacteriano de Staphylococcus aureus, después de la aplicación de un extracto de
Erythroxylum coca “coca”. ¿Se pretende determinar si los diámetros de los halos de
inhibición es menor con la aplicación del extracto de salvia en comparación al grupo
control que corresponde a un antibiótico ya conocido?
Diámetro de los halos de inhibición Diámetro de los halos de inhibición
Grupo control (mm) con extracto de “salvia” (mm)
22.57 16.57
22.28 14.00
16.86 11.00
14.00 11.00
25.23 8.28
19.54 7.86
13.58 14.29
10.89 19.33
15.25 17.56
17.84 24.58
Transformar
En los resultados van los datos reales
Recodificar
Si es q no se tiene intervalor se calcula: REGLA DE STANONES
Limite superior
Promedio + 0.75x SD
Limite inferior
Promedio + 0.75x SD
Escala de Liker??
T para una muestra
El promedio debe ser mayor a la desviacion estandar
El valor de significancia se divide entre 2 por q la hippotesis es unilateral
H0: promedio mayor o igual 4.9
Hi: promedio menor 4.9
T para dos muestras
El grado de significancia se divide en 2 cuando se habla de hipótesis unilateral, e usa
defrente cuando se habla de bilateral.
CHI-CUADRADO
Se pondera solo cuando ya se tiene la tabla de frecuencias.}
REGRESION Y CORRELACION
Se hace
Se hace la estimacion curvilinea para saber a que ecuacion se asemeja lo que voy hacer,
pero siempre se escoje la lineal por ser mas simple.
Modelo de regresió n y
correlació n mú ltiple
ANOVAa
Modelo Suma de gl Media F Sig.
cuadrados cuadrática
Regresión 85.020 3 28.340 21.062 .007b
1 Residual 5.382 4 1.346
Total 90.402 7
a. Variable dependiente: xilitol
b. Variables predictoras: (Constante), sulfato, cloruro, cascara
HAY RELACION DEPENDIENTE
Resumen del modelo
Modelo R R cuadrado R cuadrado Error típ. de la
corregida estimación
1 .970a .940 .896 1.15998
a. Variables predictoras: (Constante), sulfato, cloruro, cascara
Relación fuerte entre las independites con las dependientes.
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
tipificados
B Error típ. Beta
(Constante) 23.989 1.626 14.750 .000
cascara .251 .082 .424 3.081 .037
1
cloruro .208 .111 .236 1.876 .134
sulfato 1.085 .222 .654 4.877 .008
a. Variable dependiente: xilitol
Y= 23.989+0.251+0.208+1.085
El sulfato permite una mayor producción de xilol
CHI CUADRADO 2
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
a
Chi-cuadrado de Pearson 8.469 2 .014
Razón de verosimilitudes 10.108 2 .006
Asociación lineal por lineal .106 1 .745
N de casos válidos 62
a. 2 casillas (33.3%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es 1.45.
si hay relación
Medidas simétricas
Valor Sig. aproximada
Nominal por nominal Coeficiente de contingencia .347 .014
N de casos válidos 62
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.
Si se acerca a 1 . la relación es mayor, si esta lejos no hay relación.
DISEÑO EXPERIMENTAL. EJEMPLO DE CO2
Variable agrupación
Dunnet es cuando comparas con el control
Se pone ultimo porque el
control esta al ultimo
Tukey te compara los valores con el mayor valor. (Laboratorio).
Duncan te compara con todos los valores. (En campo).
ANOVA de un factor
Frecuenciarespiratoria
Suma de gl Media F Sig.
cuadrados cuadrática
Inter-grupos 898.333 3 299.444 17.842 .000
Intra-grupos 335.667 20 16.783
Total 1234.000 23
Mientras mas se
aleje de 1, las
diferencias son
mayores
Comparaciones múltiples
Variable dependiente: Frecuenciarespiratoria
(I) Tratamiento (J) Tratamiento Diferencia de Error típico Sig. Interv
medias (I-J) Límite
T2 .500 2.365 .997
T1 T3 10.333* 2.365 .002
Control -6.833* 2.365 .042
T1 -.500 2.365 .997
T2 T3 9.833* 2.365 .003
Control -7.333* 2.365 .027
HSD de Tukey
T1 -10.333* 2.365 .002
T3 T2 -9.833* 2.365 .003
Control -17.167* 2.365 .000
T1 6.833* 2.365 .042
Control T2 7.333* 2.365 .027
T3 17.167* 2.365 .000
T1 Control -6.833* 2.365 .024
t de Dunnett (bilateral)b T2 Control -7.333* 2.365 .015
T3 Control -17.167* 2.365 .000
*. La diferencia de medias es significativa al nivel 0.05.
b. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los demás grupos.
El valor del estadístico de Fisher (F=17.84) de la prueba estadística de comparación de
ANOVA muestra diferencias altamente significativas (P<0.01) en la frecuencia
respiratoria en Rattus norvegicus con la exposición a tres niveles de CO.
La prueba estadística de contraste múltiple de Tukey, muestra que con la exposición
de 3614 ppm de CO por 4 hrs de inhalación sobre Rattus norvegicus, se presenta la
menor frecuencia respiratoria promedio. (INTERPRETACION).
DBCA
PONEMOS EFECTOS PRINCIPALES PORQUE SOLO QUEREMOS EL EFCTO DE
LOS BLOQUES Y LOS TRATAMIENTOS.
SE ESCOGE UNIVARIANTE NO MULTIVARIANTE
Pruebas de los efectos inter-sujetos
Variable dependiente: FR
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III
Modelo corregido 933.500a 5 186.700 517.015 .000
Intersección 14560.333 1 14560.333 40320.923 .440
Bloques 55.167 2 27.583 .943 0.440
Tratamientos 878.333 3 292.778 810.769 .000
Error 2.167 6 .361
Total 15496.000 12
Total corregida 935.667 11
a. R cuadrado = .998 (R cuadrado corregida = .996)
EN BLOQUES COMO F ESTA CERCA A 1 NOS DICE QUE NO HAY
DIFERENCIA ENTRE EDAD DE LOS RATONES.
CUANDO ES MAYOR A 0.05 NO HAY DIFERENCIA.
Los valores del estadístico de Fisher (F=76.38) y (F=810.77) de la prueba estadística de
comparación de ANOVA para un diseño DBCA, muestran diferencias altamente
significativas (P<0.01) en la frecuencia respiratoria de Rattus norvegicus para los tres
bloques de edad y con la exposición a tres niveles de CO respectivamente.
La prueba estadística de contraste múltiple de Tukey, muestra que en el grupo de
ratas viejas, se presenta la menor frecuencia respiratoria promedio.
La prueba estadística de contraste múltiple de Tukey, muestra que con la exposición
de 3614 ppm de CO por 4 hrs de inhalación sobre Rattus norvegicus, se presenta la
menor frecuencia respiratoria promedio.
CUADRADO LATINO
Pruebas de los efectos inter-sujetos
Variable dependiente: FR1
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III
Modelo corregido 836.000a 9 92.889 16.889 .001
Intersección 34969.000 1 34969.000 6358.000 .000
Variedad 259.000 3 86.333 15.697 .003
Procedencia 26.500 3 8.833 1.606 .284
Tratamientoss 550.500 3 183.500 33.364 .000
Error 33.000 6 5.500
Total 35838.000 16
Total corregida 869.000 15
a. R cuadrado = .962 (R cuadrado corregida = .905)
Menor a 0.05 si hay diferencia. Como la procedencia no afecta, hubiera sido mejor
haber hecho bloques.
Los valores del estadístico de Fisher (F=15.69) –( de variedad)y (F=33.36)-(de
tratamiento) de la prueba estadística de comparación de ANOVA para un diseño DCL,
muestran diferencias altamente significativas (P<0.01) en la frecuencia respiratoria de
Rattus norvegicus para las cuatro variedades y para la exposición a tres niveles de CO
respectivamente, mientras que para las cuatro procedencias de las ratas no se muestran
diferencias estadísticas significativas (P>0.05) .
La prueba estadística de contraste múltiple de Tukey, muestra que en la variedad IV,
se presenta la menor frecuencia respiratoria promedio con 40.50 (resp./min.).
La prueba estadística de contraste múltiple de Tukey, muestra que con la exposición
de 3614 ppm de CO por 4 hrs de inhalación sobre Rattus norvegicus, se presenta la
menor frecuencia respiratoria promedio con 37.75 (resp./min.).
FACTORIAL
UNIVARINATE PORQUE ESTAMOS EVALUANDO UNA SOLA VARIABLE
RESPUESTA.
FACTORES ALEATORIOS SE INTRODUZEN LOS DATOS DE TU PRUEBA
PILOTO Y TE DICEN QUE VARIABLES INFLUENSIAN MAS.
SE DEJA EN FACORIAL COMPLETO PORQUE ES DCR CON ARREGLO
FACTORIAL CUALQUIERA QUE SEA. 2X3,2X4
SE ELIGE PERSONALIZADO CUANDO APLICAS DCBR
DUNCAN PORQUE NOS E CONTROLAN TODOS LOS FACTORES
PROMEDIOS Y DESVIACIONES ESTANDAR DE CADA CONBINACION
EN DISEÑO FACTORIAL NO HAY PRUEBAS DE ESPECIFICIDAD. SE
TRABAJA CON GRAFICOS DE INTERACCION
CUANDO ALLA VAIABLE CUANTITATIVAS PONERLAS EN HORIZONTAL, E
INSECTIVCIDAD COMO SON CATEGORICAS EN DISTINTAS LINEAS.
.
Pruebas de los efectos inter-sujetos
Variable dependiente: produccion
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III
Modelo corregido 202.041a 3 67.347 24.508 .000
Intersección 9552.470 1 9552.470 3476.259 .000
riego 90.256 1 90.256 32.845 .000
Insecticida 95.147 1 95.147 34.625 .000
riego * Insecticida 16.638 1 16.638 6.055 .039
Error 21.983 8 2.748
Total 9776.495 12
Total corregida 224.024 11
a. R cuadrado = .902 (R cuadrado corregida = .865)
TODOS LOS TRATAMIENTOS SON SIGNIFICATIVOS
Estadísticos descriptivos
Variable dependiente: produccion
riego Insecticida Media Desviación N
típica
B1 27.1100 .64281 3
A1 B2 23.8333 1.04615 3
Total 25.4717 1.95551 6
A2 B1 34.9500 3.06580 3
B2 26.9633 .29143 3
Total 30.9567 4.78849 6
B1 31.0300 4.72912 6
Total B2 25.3983 1.84684 6
Total 28.2142 4.51285 12
EL RIEGO A2 ES MEJOR. EL ISNECTICIDA B1 ES MEJOR POR SU PROMEDIO
TOTAL.
A2B1 (200mm de riego y Insecticida Biológico)
VER SI HAY NORMALIDAD
NO SALE DUNCAN PORQUE SOLO HAY DOS NIVELES, NECESITA MAS
NIVELES PARA QUE SALGA DUNCAN.
Los valores del estadístico de Fisher (F=32.85), (F=34.63) de la prueba estadística de
comparación de ANOVA factorial, muestran diferencias altamente significativas
(P<0.01) en el rendimiento del cultivo de tomate con la aplicación de dos volúmenes de
riego y con la aplicación de dos tipos de insecticida respectivamente, mientras que
(F=6.06) indica un efecto significativo (P<0.05) en el rendimiento del cultivo de tomate
con la aplicación de los volúmenes de riego y los tipos de insecticida a la vez.
Se muestra una interacción positiva entre los factores volumen de riego alcanzándose
el mayor efecto en el rendimiento del cultivo de tomate con 200mm de riego y la
aplicación de insecticida biológico con 34.95 kg/hta,además se muestra que a medida
que aumenta los milímetros de riego suministrado, aumenta el rendimiento,
independientemente del tipo de insecticida. Igualmente muestra que la aplicación de
insecticida biológico se incrementa el rendimiento independientemente del volumen de
riego.
TRUCO
EN ANOVA SI SE PUEDE REALIZAR PRUEBA DE NORMALIDAD PERO CON
EL TRUO REALIZADO ANTES. NORMALIDAD DE LOS DATOS DEL
TRATAMIENTO.
DFBA
Pruebas de los efectos inter-sujetos
Variable dependiente: produccionB
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III
Modelo corregido 210.045a 5 42.009 18.031 .001
Intersección 9552.470 1 9552.470 4100.046 .000
Bloques 8.004 2 4.002 1.718 .257
riegoB 90.256 1 90.256 38.739 .001
insecticidaB 95.147 1 95.147 40.838 .001
riegoB * insecticidaB 16.638 1 16.638 7.141 .037
Error 13.979 6 2.330
Total 9776.495 12
Total corregida 224.024 11
a. R cuadrado = .938 (R cuadrado corregida = .886)
Los bloques no afectan.(mayor a 0.05)
produccionB
Duncan
Bloques N Subconjunto
BII 4 27.0675
BIII 4 28.6675
BI 4 28.9075
Sig. .151
Se muestran las medias de los grupos
de subconjuntos homogéneos.
Basadas en las medias observadas.
El término de error es la media
cuadrática(Error) = 2.330.
a. Usa el tamaño muestral de la media
armónica = 4.000
b. Alfa = .05.
TODOS LOS BLOQUES SON A, SALE DUNCAN PORQUE SON TRES NIVELES.
Los valores del estadístico de Fisher (F=38.74), (F=40.84) de la prueba estadística de
comparación de ANOVA factorial, muestran diferencias altamente significativas
(P<0.01) en el rendimiento del cultivo de tomate con la aplicación de dos volúmenes de
riego y con la aplicación de dos tipos de insecticida respectivamente, mientras que
(F=7.14) indica un efecto significativo (P<0.05) en el rendimiento del cultivo de tomate
con la aplicación de los volúmenes de riego y los tipos de insecticida a la vez. El valor
de (F=1.72) indica que no existe diferencias significativas entre los bloques para el
rendimiento del cultivo de tomate.
Se muestra una interacción positiva entre los factores volumen de riego alcanzándose
el mayor efecto en el rendimiento del cultivo de tomate con 200mm de riego y la
aplicación de insecticida biológico en los tres bloques, además se muestra que a medida
que aumenta los milímetros de riego suministrado, aumenta el rendimiento,
independientemente del tipo de insecticida. Igualmente muestra que la aplicación de
insecticida biológico se incrementa el rendimiento independientemente del volumen de
riego.
MEDIDAS REPETIDAS
CONTROL
Contrastes multivariadosa
Efecto Valor F Gl de la hipótesis Gl del error Sig.
Traza de Pillai .999 6659.089b 4.000 21.000 .00
.000(dife
ncia de
contecnt
Lambda de Wilks .001 6659.089b 4.000 21.000
Tiempo de evaluacion cion d
cadmio e
el tiemp
Traza de Hotelling 1268.398 6659.089b 4.000 21.000 .00
b
Raíz mayor de Roy 1268.398 6659.089 4.000 21.000 .00
Traza de Pillai 1.126 1.880 20.000 96.000 .02
.000(si h
efecto e
el tiempo
Lambda de Wilks .126 3.069 20.000 70.599
factor1 * CONCENTRACION en l
concetra
one
Traza de Hotelling 5.119 4.991 20.000 78.000 .00
c
Raíz mayor de Roy 4.770 22.897 5.000 24.000 .00
a. Diseño: Intersección + CONCENTRACION
Diseño intra-sujetos: factor1
b. Estadístico exacto
c. El estadístico es un límite superior para la F el cual ofrece un límite inferior para el nivel de significación.
Los estadísticos de análisis multivariado se interpretan de manera idéntica, el estadístico
má comúnmente interpretado es el Lambda de Wilks, así para la aplicación se concluye
que:
La longitud total de Eleocharis montevidensis presenta diferencias altamente
significativas (P<0.01) en las evaluaciones realizadas al cabo de 28 días. También se
observa que el Lambda de Wilks para la Interacción evaluaciones*
CONCENTRACION permite concluir que la aplicación de las concentraciones de Cd
en las diferentes evaluación se presentan diferencias significativas (P<0.01).
Prueba de esfericidad de Mauchlya
Medida: MEASURE_1
Efecto intra-sujetos W de Mauchly Chi-cuadrado gl Sig. Epsilonb
aprox. Greenhouse- Huynh-Feldt L
Geisser
factor1 .003 127.464 9 .000 .346 .437
Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional a
identidad.
a. Diseño: Intersección + CONCENTRACION
Diseño intra-sujetos: factor1
b. Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las pruebas corregidas se m
tabla Pruebas de los efectos inter-sujetos.
ES COMO LA PRUEBA DE HOMOGENEIDAD DE VARIANZAS.
La prueba de esfericidad muestra una significancia de (P<0.01), lo indica que se
presenta homogeneidad de varianzas en las evaluaciones realizas para los tratamientos
así esto nos lleva a poder interpretar los resultados de la tabla de estadísticos
multivariados o poder utilizar la tabla de aproximación univariada aplicando un índice
de corrección Epsilon (que es el grado con que se alejan los datos de la esfericidad o
homogeneidad de varianzas).
Pruebas de efectos intra-sujetos.
Medida: MEASURE_1
Origen Suma de gl Media cuadrática F
cuadrados tipo III
Esfericidad asumida 1411.803 4 352.951 1367.921
Greenhouse-Geisser 1411.803 1.384 1019.848 1367.921
factor1
Huynh-Feldt 1411.803 1.748 807.716 1367.921
Límite-inferior 1411.803 1.000 1411.803 1367.921
Esfericidad asumida 50.279 20 2.514 9.743
Greenhouse-Geisser 50.279 6.922 7.264 9.743
factor1 * CONCENTRACION
Huynh-Feldt 50.279 8.739 5.753 9.743
Límite-inferior 50.279 5.000 10.056 9.743
Esfericidad asumida 24.770 96 .258
Greenhouse-Geisser 24.770 33.224 .746
Error(factor1)
Huynh-Feldt 24.770 41.949 .590
Límite-inferior 24.770 24.000 1.032
CUANDO HAY ESFERICIDD ME FIJO EN AMARILLO.
SI HAY EFECTO DEL CADMIO EN LA ALTURA EN BASE AL TIEMPO.
Pruebas de los efectos inter-sujetos
Medida: MEASURE_1
Variable transformada: Promedio
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III
Intersección 35403.368 1 35403.368 3484.592 .000
CONCENTRACION 4689.735 5 937.947 92.318 .000
Error 243.839 24 10.160
LA CONCETRACION SI AFECTA.
MEASURE_1
DHS de Tukey
CONCENTRACION N Subconjunto
1 2 3 4 5
4 5 7.0300
2 5 10.4504
1 5 14.0101
0.5 5 18.1552
0.25 5 18.5556
control 5 23.9768
Sig. 1.000 1.000 1.000 .998 1.000
Se muestran las medias de los grupos de subconjuntos homogéneos.
Basadas en las medias observadas.
El término de error es la media cuadrática(Error) = 2.032.
a. Usa el tamaño muestral de la media armónica = 5.000
b. Los tamaños de los grupos son distintos. Se empleará la media armónica de los tamaños de
los grupos. No se garantizan los niveles de error tipo I.
c. Alfa = .05.
ANALISIS DE COMPONENTES PRINCIPALES
Varianza total explicada
Componente Autovalores iniciales Sumas de las saturaciones al cuadrado de la
extracción
Total % de la varianza % acumulado Total % de la varianza % acumulado
1 11.627 83.052 83.052 11.627 83.052 83.052
2 1.640 11.715 94.767 1.640 11.715 94.767
3 .733 5.233 100.000
4 6.442E-016 4.601E-015 100.000
5 3.219E-016 2.299E-015 100.000
6 2.980E-016 2.129E-015 100.000
7 1.169E-016 8.349E-016 100.000
8 7.506E-017 5.362E-016 100.000
9 7.601E-018 5.429E-017 100.000
10 -5.487E-017 -3.919E-016 100.000
11 -1.284E-016 -9.168E-016 100.000
12 -1.963E-016 -1.402E-015 100.000
13 -3.006E-016 -2.147E-015 100.000
14 -5.524E-016 -3.946E-015 100.000
Método de extracción: Análisis de Componentes principales.
Amaillo dos componentes explican la varianza en mayoría, lo demás es insignificante.
Rojo.
Matriz de componentesa
Componente
1 2
Profundidad .841 .281
Anchocauce .795 .566
Velocidadcorriente .554 -.800
Caudal .863 .503
Turbidez .950 .052
Tº -.953 -.273
pH .958 -.287
OD .900 -.039
NNH3 -.984 .174
NH3 -.984 .174
NH4 -.984 .174
PO43 -.984 .174
DBO5 -.985 .172
Habitat .923 .192
Método de extracción: Análisis de
componentes principales.
a. 2 componentes extraídos
Por ejemplo los amarillos, esos datos están aun mas relacionados.
Los mas cercanos a 1 tienen mayor correlacion.
Las variables mas cercanas a una o otra componente lo se porque su valor se acerca a
uno.
INTERPRETACION EN DIAPOSITIVAS.
ANALISIS DE CORRESPONDENCIA
PARA VARIABLES CATEGORICAS, DONDE PRIMERO SE HACE UN
PRUEBA DE CHI PARA VER SI HAY RELACION.
Tabla de correspondencias
Severidad de la enfermedad Grupo sanguineo ABO
A B AB O Margen activo
Ausente 5 4 23 44 76
Moderada 15 13 30 100 158
Severa 15 13 10 40 78
Margen activo 35 30 63 184 312
Resumen
Dimensión Valor propio Inercia Chi-cuadrado Sig. Proporción de inercia Confianza para
Explicada Acumulada Desviación típica
1 .237 .056 .899 .899 .057
2 .079 .006 .101 1.000 .058
a
Total .063 19.515 .003 1.000 1.000
a. 6 grados de libertad
REGRESION LOGISTICA
Es la primera porqu es el menor valor de la codificacion
Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)
Paso 0 Constante -.960 .277 11.989 1 .001 .383
Es significativa, todas infleuncian.
Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)
Paso 1a fuma(1) -2.075 .972 4.553 1 .033 6.01
bebe(1) -1.863 .816 5.208 1 .022 7.01
acf(1) -.335 .865 .150 1 .699 .716
edad .156 .063 6.107 1 .013 1.169
sexo(1) -.362 .890 .165 1 .684 .696
clso 1.039 2 .595
clso(1) .239 1.019 .055 1 .815 1.270
clso(2) -1.039 1.466 .503 1 .478 .354
Constante -7.899 3.551 4.949 1 .026 .000
a. Variable(s) introducida(s) en el paso 1: fuma, bebe, acf, edad, sexo, clso.
Amarillo indica que fumar en 6 veces mas riesgoso que te de efermedad coronaria.
MODELOS PROBIT
Covarianzas y correlaciones de estimaciones de los
parámetros
Dosis Respuesta
natural
Dosis .863 .857
PROBIT
Respuesta natural .119 .022
Covarianzas (abajo) y correlaciones (arriba).
Amarillo probabilida de muerte.
Límites de confianza
Probabilidad Límites de confianza al 95% para Dosis Límites de confianza al 95% para log(Do
Estimación Límite inferior Límite superior Estimación Límite inferior Límite
PROBIT .010 1.359 .330 2.406 .133 -.481
.020 1.577 .429 2.674 .198 -.368
.030 1.734 .506 2.859 .239 -.296
.040 1.861 .573 3.007 .270 -.242
.050 1.972 .634 3.134 .295 -.198
.060 2.072 .691 3.246 .316 -.161
.070 2.163 .745 3.347 .335 -.128
.080 2.248 .797 3.441 .352 -.099
.090 2.329 .847 3.529 .367 -.072
.100 2.405 .896 3.612 .381 -.048
.150 2.750 1.131 3.977 .439 .054
.200 3.059 1.361 4.296 .486 .134
.250 3.352 1.594 4.592 .525 .202
.300 3.638 1.836 4.877 .561 .264
.350 3.925 2.092 5.159 .594 .321
.400 4.219 2.367 5.446 .625 .374
.450 4.524 2.665 5.742 .656 .426
.500 4.845 2.993 6.054 .685 .476
.550 5.190 3.358 6.389 .715 .526
.600 5.565 3.768 6.759 .745 .576
.650 5.981 4.237 7.178 .777 .627
.700 6.454 4.780 7.670 .810 .679
.750 7.005 5.418 8.280 .845 .734
.800 7.675 6.179 9.089 .885 .791
.850 8.538 7.101 10.277 .931 .851
.900 9.761 8.258 12.285 .990 .917
.910 10.082 8.534 12.872 1.004 .931
.920 10.443 8.833 13.560 1.019 .946
.930 10.855 9.161 14.379 1.036 .962
.940 11.333 9.527 15.374 1.054 .979
.950 11.905 9.947 16.621 1.076 .998
.960 12.614 10.446 18.247 1.101 1.019
.970 13.544 11.071 20.507 1.132 1.044
.980 14.887 11.930 24.011 1.173 1.077
.990 17.278 13.369 30.908 1.237 1.126
a. Base del logaritmo = 10.
Si aplico amarillo tengo un 10% de muerte.
Estimaciones de los parámetros
Parámetro Estimación Error típico Z Sig. Intervalo de confianza al 95%
Límite inferior Límite superior
Dosis (B) 4.213 .929 4.535 .000 2.392 6.034
PROBITa
Intersección -2.887 .878 -3.288 .001 -3.766 -2.009
a. Modelo PROBIT: PROBIT(p) = Intersección + BX (Las covariables X se transforman utilizando el logaritmo en base
10.000.)
X= es la concetracion.
PROBIT= osea en probabilidad.
MANOVA DE TAREA.