ESTADISTICA APLICADA A LA INVESTIGACION
TRABAJO ACADEMICO N° 3
NOMBRES Y APELLIDOS: SEDE:
CODIGO: FECHA:
SEMANA_9
1) Con los datos de la siguiente tabla sobre las temperaturas, calcule el
coeficiente de correlación de Pearson e interprete el resultado.
1° Calculamos la media aritmética de ambas variables
x̄= ∑ x1 Para y:
n
180 138
x̄= 12 Y y=
12
x̄= 15 Y y = 11.5
Y y=y-Y
Nº x y X̄ x=x-X̄ X2 x.y Y2
1 18 13 15 11.50 3 1.50 9 4.50 2.25
2 17 15 15 11.50 2 3.50 4 7.00 12.25
3 15 14 15 11.50 0 2.50 0 0.00 6.25
4 16 13 15 11.50 1 1.50 1 1.50 2.25
5 14 9 15 11.50 -1 -2.50 1 2.50 6.25
6 12 10 15 11.50 -3 -1.50 9 4.50 2.25
7 9 8 15 11.50 -6 -3.50 36 21.00 12.25
8 15 13 15 11.50 0 1.50 0 0.00 2.25
9 16 12 15 11.50 1 0.50 1 0.50 0.25
10 14 13 15 11.50 -1 1.50 1 -1.50 2.25
11 16 10 15 11.50 1 -1.50 1 -1.50 2.25
12 18 8 15 11.50 3 -3.50 9 -10.50 12.25
TOTA
L 180 138 72 28.00 63
r=
∑ xy
√ (∑ 2 )(∑ 2)
x y
28
r= =0.416
√ ( 72 ) ( 63 )
Existe una correlación moderada
2) La siguiente tabla muestra las calificaciones de 8 estudiantes en las
asignaturas de matemáticas y física. Calcule el coeficiente de correlación
de Pearson, asi como del coeficiente de determinación e interprete los
resultados
1° Calculamos la media aritmética de ambas variables
Para x Para y
x̄= ∑ x1 Y y=
63
n 8
57
x̄= 8 Y y = 7.88
x̄= 7.13
Nº x y x̄ Y x=x-x̄ y=y-Y X2 x.y Y2
1 10 8 7.13 7.87 2.87 0.13 8 0.37 0.02
2 9 6 7.13 7.88 1.87 -1.88 3 -3.52 3.53
3 8 10 7.13 7.88 0.87 2.12 1 1.84 4.49
4 7 9 7.13 7.88 -0.13 1.12 0 -0.15 1.25
5 7 8 7.13 7.88 -0.13 0.12 0 -0.02 0.01
6 6 7 7.13 7.88 -1.13 -0.88 1 0.99 0.77
7 6 6 7.13 7.88 -1.13 -1.88 1 2.12 3.53
8 4 9 7.13 7.88 -3.13 1.12 10 -3.51 1.25
TOTAL 57 63 25 -1.85 14.88
r=
∑ xy
√ (∑ 2 )(∑ 2)
x y
−1.87
r= = -0.005
√ ( 25 ) ( 14.88 )
Existe una correlación negativa muy baja en las calificaciones de los 8
estudiantes.
3) Observe el siguiente video, e indique que formulas o funciones se usan en
Excel para calcular el coeficiente de correlación de Pearson, así como del
coeficiente de determinación.
- Coeficiente de correlación de Pearson:
Su fórmula es: =[Link](primera variable; segunda variable).
Si sale -1< r <0 vendría hacer una correlación negativa perfecta.
- Coeficiente de determinación:
Su fórmula es: (= (el resultado de coeficiente de correlación ^ 2)
ese sería su resultado para el coeficiente de determinación, si es bajo 0, se
podría decir que no hay una relación lineal.
4) Observe el siguiente video y explique:
a) Los pasos que se deben seguir para procesar los datos. de las variables
en el programa excel
1. Primero que tenemos que hacer es ver cómo es la distribución de estos
datos para esto lo que vamos a hacer es sombrear nuestros datos y
aplicar lo que es un gráfico de dispersión.
2. Antes de analizar para ver mejor los datos vamos a hacer unos
pequeños ajustes que también a ustedes les es importante aprender
cómo se realiza.
3. Si el grafico se aproxima a una línea recta entonces esta es una primera
idea de que, si existe cierta relación en que los datos, pero si nos
quedamos solamente con el análisis gráfico podríamos estar
cometiendo el error de aceptar como una relación algunos datos son
simplemente por casualidad una relación casual no es todo lo que nos
corresponde.
b) ¿Cuáles son los pasos que se siguen en SPSS para hallar la normalidad?
1. Haz clic en Analizar -> Estadísticas descriptivas -> Explorar …
2. Mueve la variable de interés del cuadro de la izquierda al cuadro de
Lista de dependientes a la derecha.
3. Haz clic en el botón Gráficos con pruebas de normalidad.
4. Haz clic en Continuar y luego en Aceptar.
5. Aparecerá el resultado: consulta la sección Pruebas de normalidad.
c) ¿Qué pruebas de normalidad se encuentran en el SPSS y cuáles son sus
diferencias?
1. las pruebas de Kolmogorov Smirnov es para cuando tú tienes en tu base
de datos 50 o más observaciones en cambio sí pierdo Shapiro - wilk es
cuando tenemos una base de datos con un tamaño de observaciones
menor a 50.
2. Segundo lo que nos interesa es la significación bilateral en este caso nos
interesa que los valores para determinar si es o no es, si son o no son
nuestros datos o si tienen o no tienen una distribución normal estos
datos deben ser mayores a 0 05 las significaciones.
d) ¿Cómo sé que mis datos tienen una distribución normal?
Simplemente representando la distribución de la variable con un histograma
podemos ver si la variable sigue una distribución normal. En el histograma, los
datos se dividen en un número predeterminado de grupos llamados bins o
cajas.
Es decir, para toda variable con distribución normal, entre -1 σ y +1 σ
(unidades de desviación estándar).
Para toda variable con distribución normal, entre -2 σ y +2 σ (unidades de
desviación estándar).
e) ¿Qué pasos se siguen para hallar la correlación de Pearson en SPSS?
1. Primero, vamos a ‘analizar’ > ‘correlaciones’ > ‘bivariadas’
2. Luego nos aparece un cuadro de diálogo. Aquí ingresamos las variables
que vamos a utilizar, seleccionándolas de la lista de variables del costado
izquierda, y apretando el botón que contiene una flecha para ingresarlas al
análisis.
3. Ahora, dentro de las opciones posibles, marcamos dentro de los
coeficientes de correlación la casilla que dice ‘Pearson’. En prueba de
significación marcamos ‘bilateral’, lo que quiere decir que nuestra prueba de
significación sobre nuestro coeficiente de correlación será de dos colas, sin
especificar la dirección del efecto de la correlación que vamos a encontrar,
pueden encontrarse valores extremos hacia ambas direcciones, al contrario de
la opción ‘unilateral’. Además, marcamos la casilla de ‘marcar las correlaciones
significativas’, que añade un asterisco en la tabla de frecuencias de los
resultados cuando la significación de la correlación sea bajo 0,05, y dos
asteriscos cuando sea 0,01, lo que permite saber más rápidamente si es que
existe correlación.
f) ¿Cómo debe ser la significación bilateral para que haya relación entre
ambas variables?
1. Para llevar a cabo el análisis es muy similar el procedimiento. Vamos a
analizar > correlaciones > bivariadas.
2. Luego en el cuadro que se nos abre, seleccionamos la casilla
‘Spearman’, y el resto lo dejamos tal como en Pearson.
Damos clic en el botón ‘pegar’, y seleccionamos la sintaxis de la
ventana de sintaxis, y damos clic en el botón ‘ejecutar’. La sintaxis
debiese ser la siguiente:
NONPAR CORR
/VARIABLES=MBP02 MBP18_29
/PRINT=SPEARMAN TWOTAIL NOSIG /MISSING=PAIRWISE.
Y sale un cuadro.
5) OBSERVE EL VIDEO Y EXPLIQUE COMO SE INTERPRETA EL COEFICIENTE DE
CORRELACION DE PEARSON
Lo de R de Pearson: Importante saber el nivel de significancia.
Mide el grado de relación entre las variables
El p-valor varia de -1 a 1.
Si el p-valor es “0” la relación es Nula.
Cuanto más se acerca el valor a +1 se asume mayor correlación
Si el p-valor es positivo: relación Directa
Si el p-valor es negativo: relación Inversa.
De esta tabla algún resultado de esto es un poco difícil de encontrar
Una interpretación del resultado del ejemplo del video es:
El valor del estadístico r de Pearson es de 0.882, además esta correlación es
muy significativa. Por l que se puede afirmar con un 99% de confianza, que en
el ámbito del estudio hay una correlación positiva muy alta entre la Variable
Actividades Lúdicas y la Variable Socialización, porque el valor del Sig.
(bilateral) es de 0.000, que se encuentra por debajo del 0.01 requerido.
SEMANA_10
6) La siguiente tabla muestra calificaciones de 8 alumnos universitarios en las
asignaturas de Matemáticas y Estadística. Calcule el coeficiente de
correlación de spearman e interprete su resultado.
Primero tenemos que sacar el rango de Y y X
RANGO RANGO
Nº ESTUDIANTE MATEMATICA ESTADISTICA (Y) (X) d=Y-X d2
1 Dyana 10 8 1 4.5 -3.5 12.25
2 Elizabeth 9 6 2 7.5 -5.5 30.25
3 Mario 8 10 3 1 2 4
4 Orlando 7 9 4.5 2.5 2 4
5 Mathias 7 8 4.5 4.5 0 0
6 Josue 6 7 6.5 6.0 0.5 0.25
7 Anita 6 6 6.5 7.5 -1 1
8 Lucia 4 9 8 2.5 5.5 30.25
TOTAL 82
2
6Σ ⅆ
r s=1−
n ( n2 −1 )
r 6.82
s=1−
8 ( 8 −1 )
2
492
r s=1−
504
504−492
r s=
504
r 12
s=¿ =0.024¿
504
Existe una correlación positiva muy baja.
7) Se tiene los siguientes resultados de pacientes de Fisioterapia (X) y días
de ventilación (Y). Se pide verificar si existe correlación entre las
variables e interprete el coeficiente.
PACIENTE X Y JERARQUIA X JERARQUIA Y d=Y-X d2
1 10 13 2 17 -15 225
2 55 38 19 20 -1 1
3 45 1 14 7 7 49
4 13 35 6 19 -13 169
5 45 0 15 1 14 196
6 35 4 13 10 3 9
7 68 0 21 2 19 361
8 47 0 17 3 14 196
9 68 0 22 4 18 324
10 24 5 11 11 0 0
11 6 12 1 16 -15 225
12 45 0 16 5 11 121
13 17 9 7 13 -6 36
14 47 1 18 8 10 100
15 10 9 3 14 -11 121
16 20 5 8 12 -4 16
17 23 3 9 9 0 0
18 67 9 20 15 5 25
19 82 0 23 6 17 289
20 10 54 4 22 -18 324
21 24 78 12 23 -11 121
22 23 27 10 18 -8 64
23 10 38 5 21 -16 256
Las jerarquías 2,3,4 y 5) y se dividen en el número de observaciones, así:
2+ 3+4 +5
=3.5
4
De esta forma, a las jerarquías 2, 3, 4 y 5, se les asigna el valor 3.5
2
6Σ ⅆ
r s=1−
n ( n −1 )
2
r s=¿ 6 (3276) ¿
1−
23 ( 529−1 )
19656
r s=1−
12144
r s=¿1−1.61857708¿
r s=¿0.62 ¿
Dado que el valor calculado de rs = es menor que el valor crítico para Rho de
Spearman, en un nivel de significancia 0,05, que es, se rechaza la hipótesis
nula.
Interpretación:
Se concluye que las dos variables están inversamente relacionadas, en una
correlación negativa considerable.
8) Observe el siguiente video e indique:
¿Qué funciones se usan en excel para agilizar las operaciones del
cálculo de la correlación de Spearman?
Se pone: =1- (6x la sumatoria de las diferencias al cuadrado/ (N*(potencia (n
al cuadrado)-1)))
SEMANA_11
9) En un estudio se quiere analizar si existe correlación lineal entre las
variables ‘’Depresión’’ y Maltrato Previo, con dos niveles (Si – No).
En primer lugar, se procede a calcular el valor de las proporciones de maltrato
(p) y no maltrato(q) teniendo en cuenta que la muestra total es de 8.
5
P : =0 ⋅625
8
3
q : =0.375
8
A continuación, se calculan los valores de la media de la variable Xp para los 5
casos de la modalidad 1.
10+ 8+6+22+13
xP =
5
x P =11.8
Seguidamente se calculan los valores de la media de la variable Xq.
12+14+ 9
x q=
3
x q=11.67
Posteriormente se halla la desviación típica de la variable continua (X. Primero
calculando la media de la misma.
94
x= =11.75
8
Sx
¿
√∑ X2
N
−x 2
Sx
¿
√ 1274
8
−138.06
Sx=4.60
A partir de estos valores se está en disposición de calcular el coeficiente de correlación
biserial puntual aplicando una de las expresiones de cálculo de rbp.
11.8−11.67
rbp= . √ 0.625 .0 .375
4.60
rbp= 0.01
Interpretación:
El valor de rbp no puede ser mayor que 1 ni menor que -1 Es decir, rige por el
estándar de la correlación de Pearson. Cuanto mayor sea la distancia entre la media de
los sujetos que presentan la primera modalidad y la media del total de sujetos, más
próximo a 1 ó -1 será el coeficiente de correlación que se obtenga.
Al comparar las medias de ambas modalidades, tanto de “p” como de “q”, se podrá
inferir que la media más alta en caso de “p” indicará que a puntuaciones altas de X
corresponde pertenecer a la categoría cuya proporción es p, mientras que a
puntuaciones bajas de X corresponde pertenecer a la categoría cuya proporción es q.
Por otra parte, al ser “q” la media más alta indicara que a puntuaciones altas de X
corresponde pertenecer a la categoría cuya proporción es q, mientras que a
puntuaciones bajas de X corresponde pertenecer a la categoría cuya proporción es p.
10) En un aula de psicología de 10 alumnos, los resultados obtenidos en una
prueba evaluativa de rendimiento (variable Y) y el sexo de los alumnos
(variable X), son los que aparecen recogidos en la siguiente tabla, se ha
decido determinar la correlación existente entre ambas variables. El sexo
de los individuos se ha codificado como 0 cuando se trata de alumnos y 1
cuando se trata de alumnas. Determine la correlación Biserial puntual.
𝑛0 = Número de respuestas del primer grupo es 5
𝑛1 = Número de respuestas del segundo grupo es 5
𝑥̅𝑝= Media de la muestra de respuestas del primer grupo.
Σ x1 ⋅ y
xP=
η1
106
xP=
5
x P =21.20
𝑥̅𝑞= Media de la muestra de respuestas del segundo grupo.
Σy−Σ 1 ⋅ y
x q=
n0
218−106
x q=
5
x q=22.40
𝑦̅= Media de los puntajes en la variable “y”.
Σy 218
y= = =21.80
N 10
σy = Desvío estándar de los puntajes totales perteneciente a la muestra con
los valores de la variable continua “y”.
√
2
∑( y)
σ y= −y2
N
σ y=
√ 4798
10
2
−¿ ( 21.80 ) =2.14 ¿
p = Proporción de casos/respuestas del primer grupo.
n1 5
p= = =0.50
N 10
q = Proporción de casos/respuestas del segundo grupo.
n0 5
q= = =0.50
N 10
rbp = Correlación Biseral Puntual.
x p−x q
r bp = ⋅ √ p−q
σy
21.20−22.40
r bp= ⋅ √ 0.50 x 50
2.14
−120
r bp = ⋅0.25
2.14
r bp=−0.56 x 0.50
r bp=−0.28
Se toma en cuenta qué tan grande es la distancia entre la media de los sujetos del primer
grupo y la media total de todos los sujetos, dando estos valores entre +1 o -1. Biserial
puntual es una derivación del coeficiente de correlación de Pearson, por ende, se
interpreta por el mismo estándar de Pearson, lo que cambia en el análisis es la
consideración del signo ya que el mismo en este coeficiente no se interpreta. Solo se
toma en cuenta el módulo indistintamente del signo que el mismo tenga.
En el caso del ejercicio se aprecia que existe una relación baja de -0,28 entre las
puntuaciones obtenidas del test y el sexo de los alumnos. Lo que indica que los sujetos
pertenecientes a la categoría de sexo masculino tienen puntuaciones más bajas en
comparación a los sujetos pertenecientes a la categoría de sexo femenino.
11) Determine la existencia de alguna asociación que se puede establecer
entre el sexo de un grupo de niños de una comunidad rural y la
preferencia de dicho grupo por el estudio de la Matemática o el español,
si al observar las dos variables se obtuvo el resultado siguiente:
Utilice el coeficiente de correlación PHI
MATEMATICA ESPAÑOL TOTAL
MASCULINO 27 15 42
FEMENINO 2 24 26
TOTAL 29 39 68
|B ⋅C− A ⋅ D|
∅=
√ ( A + B ) ( A+ C ) ( C+ D )( B+ D )
|2 x 15−27 x 24|
∅=
√ ( 27+2 ) ( 27+15 ) ( 15+24 )( 2+24 )
618
∅=
1.111
∅=0.556
12) Determine la existencia de alguna asociación que se puede establecer
entre el sexo de un grupo de tabaqueros que laboran en una fábrica de
tabacos en la capital y la cantidad de tabacos de alta calidad que
confeccionan en un día, si al observar las dos variables se obtuvo el
resultado siguiente:
Determine el coeficiente de correlación Biserial Puntual.
P= 42/68= 0.6176
Q= 26/68= 0.3823
x p−x q
r bp = ⋅ √ p−q
σy
42−26
r bp = ⋅ √0.6176−0.3823
68
16
r bp = ⋅0.4850
68
r bp=0.1141
13) Tenemos las puntuaciones totales de 10 sujetos que han contestado a
una prueba objetiva (X) y además sabemos si han acertado (1) o fallado
(0) un ítem Y. Tenemos, por tanto, una variable cuantitativa y otra
dicotómica.
Determine el coeficiente de correlación Biserial Puntual
En primer lugar, se procede a calcular el valor de las proporciones de acertados (p) y
fallados (q) teniendo en cuenta que la muestra total es de 10.
7
P: =0.7
10
3
q: =0.3
10
A continuación, se calculan los valores de la media de la variable Xp para los 10
casos de la modalidad 1.
2+3+ 4+ 6+6+ 8+10
xP =
10
x P =3.9
Seguidamente se calculan los valores de la media de la variable Xq.
1+2+2
x q=
10
x q=0.5
Posteriormente se halla la desviación típica de la variable continua (X. Primero
calculando la media de la misma.
43
x= =4.3
10
Sx
¿
√∑ X2
N
−x 2
Sx
¿
√ 1274
10
−18.49
Sx=10.43
A partir de estos valores se está en disposición de calcular el coeficiente de
correlación biserial puntual aplicando una de las expresiones de cálculo de
rbp.
3.9−0.5
rbp= . √0.7 x 0.3
10.43
rbp= 1.7652
SEMANA_12
14) En una muestra de 10 personas se les pregunto cuál era su ingreso al mes
y cuál era su peso y se colocó en la tabla anexa. Calcular la correlación
tetracorica, que existe entre las personas gordas y flacas con las ricas y
pobres. Tomando como punto de corte 75 kg y 8.500 bfs respectivamente.
Pasos iníciales:
1. Identificar en la tabla los sujetos que estén por arriba y por debajo de las variables
según su punto de corte. En este caso las variables son ingresos y peso y esta fueron
divididas en rico y pobre y gordo y flaco respectivamente.
- Variable ingresos:
Ricos: 4
Pobres. 6
- Variable peso:
Gordos: 4
Flacos: 6
Agrupar en una tabla de doble entrada las frecuencias en que un sujeto es: pobre y
flaco, rico y flaco, pobre y gordo y rico y gordo.
POBRE RICO
FLACO 4 2
GORDO 2 2
Pasos a seguir con el primer método: usando la fórmula de coseno
1. Identificar las celdas a, b, c y d
2. Sustituir los datos en la formula
Rt= cos (180º/1+√ad/cb)
Rt= cos (180º/1+√4x2 /2x2)
3. Multiplicar 4 por 2 que da 8 y 2 por 2 que da 4
4. El resultado de la multiplicación de ad se divide entre la multiplicación de cb y da 2
5. A ese resultado se le saca la raíz cuadrada y da 1.41
6.A ese resultado se le suma el número 1 y da 2.41
7. 180º se divide entre el resultado de las operaciones anteriores dando como
resultado 74º69
8. A ese resultado se le saca el coseno usando la calculadora y pulsando la palabra
“cos” seguido del número al que desea sacar coseno y pulsando “igual” lo que da
como resultado 0,26 que es el resultado final.
15) En un estudio realizado a 10 estudiantes que cursan de matemática se les
aplico un examen para evaluar su conocimiento de la materia, entonces
se desea determinar si existe relación entre las horas de estudio y las
notas adquiridas
Paso 1:
Punto de corte para X:̅= 68
Punto de corte para Y: 10 por ser la mínima nota para aprobar.
Sacar la media para X: ∑𝑥=68; 68/10= 6.8
Sacar la media para Y: En este caso seria 10 por ser la nota mínima
aprobatoria.
Paso 2:
Se van a ubicar a los sujetos por sus puntajes, es decir, si el puntaje del sujeto
para la variable X es inferior a su punto de corte o a la media recibe un signo
negativo (-) o si el puntaje del sujeto es mayor al punto de corte recibirá un
signo positivo (+); esto también pasará con la variable Y, luego de que estén
todos los puntajes con los signos se llevará a cabo ubicarlos por cuadrantes
según el signo de ambas variables.
HORAS DE ESTUDIO NOTAS
0 1
0 --(A) -+(B)
1 +-C ++(D)
SUJETOS HORAS DE ESTUDIO (X) NOTAS (Y)
1 - -
2 - -
3 - +
4 - -
5 + -
6 + +
7 + +
8 + +
9 + +
10 + +
Paso 3
Luego se distribuyen en los cuatro cuadrantes los puntajes de los sujetos y se
toma de cada uno de los cuadrantes la frecuencia de sujetos que se encuentran
en cada uno, para luego aplicar la fórmula de rt= Cos (180 / 1+ √ad/cb) ó rt
0
180
=cos
1+ √ ad ÷ c b
NOTAS HORAS DE ESTUDIO 0 1 TOTAL
0 3(A) 1(B) A+B=4
1 1(C) 5(D) C+D=6
TOTAL A+C=4 B+D=6 N=10
Cuadrante
A: 3; B:1; C:1; D:5
Se aplica la fórmula:
1800
rt =cos
1+ √3 x 5 ÷ 1 x 1
rt = cos 36.94
rt = 0.80
16) Se desea conocer la relación entre el nivel de estrés y si fuman o no a un
grupo de 120 sujetos, para ello se aplica un instrumento que mide la
tendencia al estrés físico (que reporta valores por encima de lo
estándar)
En los resultados se asigna un valor binario arbitrario respecto a la
dicotomizacion de las variables. Para este ejercicio se tomaron en
cuenta las respuestas que coincidieron en presencia de estrés y la
cantidad de cigarrillos y las que no, por lo que se toma las opciones si y
no.
Los resultados se agrupan en cuadrantes representativos para un plano
cartesiano según Guilford, quedando como: A (++), B (-+), C (+-) y D (--)
FUMAN NO SI TOTAL
ESTRÉS
SI 15(B) 60(A) 75
NO 30(D) 15(C) 45
TOTAL 45 75 120
A= 60, B= 15, C= 15 y D=30
Se aplica la fórmula:
(√ )
180
r t =cos
AD
1+
BC
r t =cos (47,12)
r t =0.68
El coeficiente Tetracórico muestra un valor de 0,68 que sugiere una relación
moderada y directamente proporcional. Es decir, a medida que aumenta la
presencia de sujetos con estrés también hay tendencia a encontrar sujetos que
fumen.
17)Se realizó un cuestionario de personalidad en donde dos las preguntas
eran:
1. ¿le gusta a usted estar con mucha gente? Sí, No.
La mayoría respondió que no
2. ¿le gusta a usted más trabajar con otras personas que solo? Sí, No.
La mayoría respondió que Si.
Los resultados están en el cuadro siguiente. ¿Cuál es la relación entre
estas respuestas de los sujetos a cada pregunta? Determine el
coeficiente de contingencia.
PREGUNTA 1
PREGUNTA 2 SI NO TOTAL
SI 374 541 915
NO 186 389 575
TOTAL 560 930 1490
2
1490× ( 374 ×389−541× 186 )
x 21=
915 ×575 ×560 ×930
1490× ( 374 ×389−541× 186 )2
x 21=
915 ×575 ×560 ×930
2
x 1=10.94
Sacamos la contingencia:
C=
√ 10.94
10.94 +1490
C=0.085
18)Se encuestó a 180 alumnos de una IE sobre la motivación y el
rendimiento académico en matemática. Los resultados se muestran en la
siguiente tabla de contingencia de 2x2. Se pide verificar si existe
asociación entre el rendimiento académico y la motivación en
matemática. Use el coeficiente de contingencia C, e interprete el
resultado.
Para determinar las frecuencias esperadas a partir de los datos observados,
resulta de multiplicar los respectivos marginales y dividir por el gran total.
RENDIMIENTO
MOTIVACION ALTO BAJO TOTAL
ALTA 60(75) /180 60(105) /180 60
BAJA 120 (75) 180 120 (105) /180 120
TOTAL 75 105 180
A través de Chi-cuadrado se probará de forma afirmativa o negativa que la
distribución de las Frecuencias observadas difiere significativamente en
relación a la distribución de las frecuencias que deberíamos esperar.
∑ ( 0−E )2
x 2=
E
O= Frecuencia Observada E= Frecuencia Esperada
O E (O-E) 2 (0-E)2 (O-R)2/E
50 25 25 625 24
25 50 -25 625 12.5
10 35 -25 625 17.8
95 70 -25 625 8.9
x 2=63.2
Si X2
observado es mayor que el X2 crítico entonces, podemos afirmar que existe
una asociación, estadísticamente significativa entre las variables estudiadas.
Para encontrar X2
crítico se requiere comprender dos conceptos:
Grados de libertad y Nivel de significación
Grados de libertad (GL): Se define como (Número de columnas -1) x (Número
de filas -1).
Tabla de 2x2, entonces, GL = (2-1) (2-1) = 1
Nivel de significación (P): denominado nivel de confianza, se refiere a la
probabilidad de que los resultados observados se deban al azar. Este valor es
fijado por el investigador, usualmente es el 5% o 10%. Lo que indica que si se
toma P=0.05, se está significando que solo en un 5% de las veces en que se
realice la medición, el resultado obtenido podría deberse al azar. De lo
contrario sería decir que existe un nivel de confianza del 95% que el resultado
es real y no debido a la casualidad. Considerando P=0.05 y GL=1, se tiene que
X2 crítico es igual a 3.84. Se observa que X2 calculado (63.2) es mayor a X2
crítico (3.84).
Luego podemos afirmar que el rendimiento de la asignatura de matemática
está asociado a la motivación de los alumnos por dicha asignatura.
Reemplazamos valores en el coeficiente de contingencia C, tenemos:
√
2
x
C= 2
x +n
C=
√ 63.22
2
63.2 +180
C=
√ 3.994
3.994 +180
C=
√ 3.994
183.994
C=0.147
se puede decir que existe una correlación muy fuerte.
19)Medir la relación entre el color de pelo y el color de ojos. Utilice la
correlación de contingencia.
COLOR OJOS
COLOR PELO AZUL GRIS/VERDE NEGRO/PARDO TOTAL
RUBIO 260 140 17 417
CASTAÑO 118 204 64 386
NEGRO 28 110 42 180
PELIRROJO 7 8 2 17
TOTAL 413 462 125 1000
417 × 413
e 11= =172.2
1000
417 × 464
e 12= =192.65
1000
417 ×125
e 13= =52.13
1000
386 × 413
e 21= =159.42
1000
386 × 462
e 22= =178.33
1000
386 ×125
e 23= =48.25
1000
180 × 413
e 31= =74.34
1000
180 × 462
e 32= =83.16
1000
180× 125
e 33= =22.5
1000
17 × 413
e 41= =7.02
1000
17 × 462
e 42= =7.85
1000
17 ×125
e 43= =2.13
1000
Estadístico de contraste:
x 2(3−1) ⋅ ( 4−1) x 26=¿
= 10001.24 -10000 = 1.24
se puede decir que existe una correlación muy fuerte.