1
“AÑO DEL FORTALECIMIENTO DE LA SOBERANIA
NACIONAL”
UNIVERSIDAD PRIVADA ANTENOR ORREGO
FACULTAD DE CIENCIAS ECONÓMICAS
ESCUELA PROFESIONAL DE ADMINISTRACIÓN
INFORME
TABLA DE CONTINGENCIA
ESTADISTICA APLICADA PARA LA TOMA DE DECISIONES
DOCENTE: Mg. Yajahuanca Huancas, Raúl
Autores
Cortez Requena María del Carmen
PIURA – 2022
ESTUDIANTE DE IV CICLO
2
INDICE
INTRODUCCIÓN ……………………………………………………,,,….
1.1. Tabla de Contingencia………………………………………….…4
1.2. Características de la Tabla de Contingencia ……………………...4
1.3. Objetivos de una Tabla De Contingencia…………………………4
1.4. Ventajas de realizar una tabla de contingencia……………………5
2.1 Ejemplos de tabla de contigencia chi-cuadrada……………………6
2.2 Ejemplos Mc Nemar para muestra de dos…………………………..9
2.3 Ejemplos de Q de Cochran mas de dos muestras…………………..13
CONCLUSIONES………………………………………………………...17.
REFERENCIAS BIBLIOGRÁFICAS.……………………………………18
3
INTRODUCCIÓN
Las tablas de contingencia son utilizadas principalmente para resumir datos
categóricos, dentro de ellas se van a encontrar las frecuencias observadas entre dos
variables de interés; el termino de tablas de contingencia fue introducido por Pearson en
1904
En ciencias sociales es muy frecuente recurrir a la tabulación cruzada de los
datos cuando además de describir (análisis univariable) nos interesa comparar (análisis
bivariable). Las Tablas de Contingencia resultan, especialmente indicadas, cuando
disponemos de variables nominales o cualitativas, suponiendo que una de ellas depende
de la otra (variable independiente y/o explicativa). La elaboración de tablas de
contingencia no se encuentra estandarizada, basta con que ésta se lea e interprete
correctamente. Sin embargo, y dado que el programa estadístico con el que presentamos
el capítulo es el SPSS, conviene advertir que éste dispone en las filas la variable
dependiente y en las columnas la variable independiente.
El interés en el análisis de tablas de contingencia reside en resumir la
información contenida en la tabla midiendo la asociación entre las dos variables que
forman la tabla y nunca la relación entre las categorías de las variables. Vamos a
obtener uno o varios números (estadísticos) que resumen el contenido informativo
recogida en cada una de las celdas que se derivan del cruce de las variables. Por último,
y una vez determinado el grado de asociación entre las dos variables, nos resta valorar si
ésta es estadísticamente significativa, o lo que es lo mismo, si la asociación o relación
arrojada por el estadístico elegido es atribuible a un error de muestro (dicha relación no
es genuina de la población que estudiamos), no pudiendo generalizar los resultados
obtenidos.
4
1.1. TABLA DE CONTIGENCIA
Es una herramienta utilizada en la rama de la estadística, la cual consiste en
crear al menos dos filas y dos columnas para representar datos categóricos en términos
de conteos de frecuencia.
1.2. CARACTERÍSTICAS DE LA TABLA DE CONTINGENCIA
Para poder determinar la relación entre dos variables categóricas necesitamos
conocer su densidad conjunta, así mismo esta densidad nos ayudará a determinar las
densidades marginales y condicionales.
1.3. OBJETIVOS DE UNA TABLA DE CONTINGENCIA
La tabla permite medir la interacción entre dos variables para conocer una serie
de información “oculta “de gran utilidad para comprender con mayor claridad los
resultados de una investigación.
La tabla sólo mostrará los encuestados que respondieron ambas preguntas, lo
que significa que las frecuencias mostradas pueden diferir de una tabla de frecuencias
estándar. El informe que ofrece también mostrará las Estadísticas Chi-cuadrado de
Pearson, el cual representa el grado de correlación entre las variables que usan el chi-
cuadrado, el valor p y el grado de libertad.
Los objetivos de la tabla de contingencia son los siguientes:
5
Ordenar la información recolectada para un estudio cuando los datos se
encuentran divididos de forma bidimensional, esto significa a que se relaciona
con dos factores cualitativos.
El otro objetivo de la tabla de contingencia es analizar si hay una relación entre
las variables cualitativas, ya sean dependientes o independientes.
1.4. VENTAJAS DE REALIZAR UNA TABLA DE CONTINGENCIA
Entre los principales beneficios de realizar una tabla de contingencia se
encuentran los siguientes:
Facilita la lectura de los datos recolectados, ya que permite agruparlos
cuando aún se encuentran sin procesar, lo que disminuye el margen de
error al realizar un informe de investigación.
Gracias a la tabla de contingencia es posible realizar gráficas que
permitan visualizar la información fácilmente para su comprensión.
A diferencia de otros métodos estadísticos de análisis de datos, la tabla
de contingencia permite ahorrar tiempo durante la correlación de
variables.
Las tablas ofrecen resultados claros y precisos que permiten tomar
mejores decisiones y crear estrategias basadas en datos.
6
2.1. EJEMPLOS DE CHI-CUADRADA
EJEMPLO 1:
Supongamos que los registros de la muestra proporcionan el siguiente resultado de las
ventas de tres productos en 4 regiones; queremos saber si las regiones representan un
cambio significativo en las ventas suponiendo una significancia de 0,05 (α=0,05):
EJEMPLO 2:
Una fábrica cuenta con tres máquinas para la producción de un mismo producto.
Durante la última semana de producción se han producido 135 artículos. El jefe de
producción cree que las máquinas no producen en cantidades similares. Por lo que ha
solicitado clasifiquen cada producto según la máquina que la ha producido. A
continuación, se presenta la tabla de frecuencia de las cantidades producidas por cada
máquina:
MAQUINA A B C
PRODUCCION 43 53 39
Use nivel de significación 5% para probar si la cantidad producida es la misma en las 3
máquinas.
RESOLUCION:
7
PLANEAMIENTO DE HIPÓTESIS:
H0: La cantidad producida es la misma en las tres máquinas.
H1: L cantidad producida es distinta en las tres máquinas.
EJEMPLO 3:
Con el fin de realizar afiliaciones a un seguro médico, un vendedor de pólizas de
seguros hace cuatro llamadas diarias. Una muestra de 210 días da como resultado las
frecuencias del número de ventas realizadas tal como se muestra en la siguiente tabla:
N° DE VENTAS REALIZADAS N° DE DIAS (OI)
0 50
1 75
2 65
3 15
4 5
Se desea verificar si el número de ventas realizadas diariamente sigue una distribución
Binomial a un nivel de significación del 5%.
Resolución:
PLANEAMIENTO DE HIPÓTESIS:
H0: El número de ventas realizado por el seguro diariamente no sigue una distribución
binomial.
H1: El número de ventas realizado por el seguro diariamente sigue una distribución
binomial
CALCULO ESTADISTICO DE LA PRUEBA
N° N° DE VENTAS N° DE DIAS XiOi
1 0 50 0
2 1 75 75
3 2 65 130
4 3 15 45
5 4 5 20
TOTAL 210 270
8
݅ ݅ݔ
݅݅ݔ
E(X)=r.p= 1.2857
݊
r=4;1.2857=4.p
p=0.3214
EJEMPLO 4:
Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado 120 veces y
obtuvo la siguiente distribución de frecuencias de las caras resultantes.
a) Enuncie las hipótesis de la prueba y determine la frecuencia esperadas b) Describa la
estadística de la prueba c) Determine la región crítica de la prueba al nivel de
significación del 5%. d) ¿A qué conclusión llega usando el nivel de significación 0,05?
e) Determine la probabilidad P
EJEMPLO 5:
El gerente de ventas de una compañía P&C afirma que todos sus vendedores realizan el
mismo número de visitas durante el mismo período de tiempo. Una muestra aleatoria de
5 registros de los vendedores en una semana dada reveló el siguiente número de visitas
Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del gerente?
9
1) H0: hacen el mismo número de visitas
H1: hacen menor número de visitas
EJEMPLO 6:
2.2. EJEMPLOS DE MC NEMAR:
EJEMPLO 1:
Con los datos de la encuesta Encinf.sav probar si hay discrepancia entre la valoración
que hacen los alumnos sobre la dotación de las aulas de informática (Dotacion) y la
valoración que hacen del software disponible (Software).
Se trata de contrastar la hipótesis nula de que la valoración de la dotación de las aulas es
igual a la valoración del software instalado. Dado que las valoraciones de ambas
10
características son asignadas por los mismos individuos, las muestras resultantes no son
independientes. Por otra parte, las variables se miden en una escala ordinal, y por tanto
el contraste más adecuado es la prueba de Wilcoxon.
Para realizar este contraste la secuencia es:
Estadística > Pruebas no paramétricas > 2 muestras relacionadas.
En el cuadro de diálogo se selecciona en Contrastar pares las variables Dotacion
y Software; por defecto está activada la prueba de Wilcoxon. Al aceptar se obtienen los
siguientes resultados:
Como puede verse en el cuadro Rangos, el número de elementos para los cuales el valor
de la variable Software es mayor que el de la variable Dotacion es considerablemente
mayor que el de los elementos para los que está mejor valorada la dotación que el
software. En el cuadro Estadísticos de contraste, el valor tipificado del estadístico de
prueba (la menor de las dos sumas de rangos) es igual a -5,280; por tanto, se rechaza la
hipótesis nula de que la valoración de la dotación es igual que la del software para
cualquier nivel de significación.
EJEMPLO 2:
11
Un investigador deseaba estudiar posibles cambios en la actitud de la audiencia frente a
la posición expuesta por un conferencista. Para ello seleccionó una muestra de 78
estudiantes universitarios que asistieron a una conferencia y registró su acuerdo (1) o
desacuerdo (0), inmediatamente después de la conferencia (Xi) y un mes después (Yi).
Los resultados obtenidos se resumen en la siguiente tabla:
El investigador desea determinar si la proporción de personas que está de acuerdo con la
posición del conferencista es diferente un mes después de la conferencia que
inmediatamente después de ésta. O equivalentemente si hubo cambios en la actitud de la
audiencia.
EJEMPLO 3:
Se compara la eficacia de un páncreas artificial automatizado, que controla la glucemia
y suministra insulina en continuo, respecto a un sistema de control estándar en pacientes
con Diabetes tipo 1. Se usan los dos sistemas de control en un grupo de pacientes. En
dos noches distintas se ensayan cada uno de estos métodos en todos los pacientes. La
variable respuesta es si en algún momento han sufrido una hipoglucemia durante la
noche. La variable es, pues, dicotómica: tener o no una hipoglucemia.
Si miramos es cuadro de elección de la técnica a aplicar en el tema «Comparación de
dos poblaciones», veremos que como es una variable dicotómica y son muestras
relacionadas (al mismo individuo se le aplican los dos procedimientos comparados)
deberemos aplicar un Test de McNemar.
Pancreas Artifical
no hipoglucemia hipoglucemia
no hipoglucemia 20 7
CONTROL hipoglucemia 22 5
12
Como se puede ver en el Test de McNemar (Ver Herbario de técnicas) la clave es tener
en cuenta únicamente las casillas donde se producen resultados contrarios en las dos
técnicas. En nuestro caso, únicamente interesa cuándo se ha dado hipoglucemia en una
técnica de control y no se ha dado en la otra. Nos interesan los valores 22 y 7, claro.
EJEMPLO 4:
Un científico intenta determinar si un medicamento tiene un efecto sobre una
enfermedad en particular. Los recuentos de individuos se dan en la tabla, con el
diagnóstico (enfermedad: presente o ausente) antes del tratamiento en las filas y el
diagnóstico después del tratamiento en las columnas. La prueba requiere que se
incluyan los mismos sujetos en las mediciones de antes y después (pares emparejados).
Después: presente Después: ausente Total de filas
Antes: presente 101 121 222
Antes: ausente 59 33 92
Total de la columna 160 154 314
En este ejemplo, la hipótesis nula de "homogeneidad marginal" significaría que no hubo
efecto del tratamiento. A partir de los datos anteriores, la estadística de prueba de
McNemar:
tiene el valor 21,35, que es extremadamente improbable que forme la distribución
implícita en la hipótesis nula (P <0,001). Por lo tanto, la prueba proporciona pruebas
sólidas para rechazar la hipótesis nula de ningún efecto del tratamiento.
EJEMPLO 5:
Los resultados correspondientes a una muestra de n elementos se disponen en una tabla
de frecuencias 2 x 2 para recoger el conjunto de las respuestas de los mismos elementos
13
antes y después. El aspecto general de dicha tabla, en la que los signos + y - se utilizan
para representar las diferentes respuestas, es el siguiente:
2.3. EJEMPLOS DE Q DE COCHRAN MAS DE DOS MUESTRAS
EJEMPLO 1:
Se probaron tres tipos de terapia de relajación muscular a atletas de alto rendimiento. Al
final de cada terapia se les preguntaba si percibían relajación muscular. Las respuestas
eran para el si se codificaron con valor 1 y para el No se usó valor 0. Se muestra la tabla
de resultados.
ATLETA TERAPIA 1 TERAPIA 2 TERAPIA 3
1 0 0 1
2 0 1 0
3 0 1 1
4 1 0 1
5 0 1 1
6 0 1 0
7 1 1 1
8 0 0 1
9 1 0 0
10 1 1 1
11 1 0 0
12 0 1 0
13 0 0 1
14 1 1 1
EJEMPLO 2:
Se probaron las habilidades de especies de escarabajo para reconocer y alimentarse de
una planta, la cual a su vez fue modificada genéticamente. Se codificó como 1 si el
escarabajo se alimentaba de la planta y 0 si no se alimentaba de la misma.
14
NO DE ESCARABAJO PLANTA NORMAL MODIFICADA 1 MODIFICADA 2
1 1 0 0
2 1 0 0
3 1 0 0
4 1 0 0
5 1 0 0
6 0 1 0
7 0 1 1
8 1 0 0
9 1 0 0
10 1 0 1
11 0 0 0
12 1 1 0
13 1 0 0
14 0 0 1
15 0 0 0
16 1 1 0
EJEMPLO 3:
Se desea probar la percepción de dolor (ln(tenso) = 1);(No intenso = 0) de un
micronutriente de complejo B al inocularse en distintas partes del cuerpo mediante
inyección. Se reunieron 20 personas bajo consentimiento informado.
NO DE PERSONA GLUTEO IZQUIERDO GLUTEO DERECGO HOMBRO DERECHO
1 1 1 1
2 1 1 1
3 1 0 1
4 1 1 0
5 1 1 1
6 0 0 0
7 1 0 1
8 1 1 1
9 1 1 1
10 0 1 1
11 1 0 1
12 1 0 0
13 0 0 1
14 1 1 0
15 0 1 0
16 1 1 1
17 1 0 1
EJEMPLO 4:
En el desarrollo de una vacuna contra un virus, uno de los análisis fue la identificación
del puente receptor donde el virus se inserta sobre la célula. De esta manera, se probó la
capacidad del virus para insertarse en un puente receptor de la célula, así como la
capacidad para insertarse en puentes receptores modificados. Cuando el virus fue capaz
15
de unirse se marcó 1 y cuando no pudo insertarse se marcó 0. Utilice confianza al 99%
para prueba de Q de Cochran
RECEPTOR CELULAR
CON BAJA CANTIDAD DE
RECEPTOR CELULAR BAJO EN ACIDO COLESTEROL
NO DE CEPA DE ROTA VIRUS RECEPTOR CELULAR NORMAL SIALICO MEMBRANAR
1 1 1 1
2 1 1 1
3 1 0 1
4 1 1 0
5 1 1 1
6 0 0 0
7 1 0 1
8 1 1 1
9 1 1 1
10 0 1 1
11 1 0 1
12 1 0 0
13 0 0 1
14 1 1 0
15 0 1 0
16 1 1 1
17 1 0 1
EJEMPLO 5:
Supóngase que Sc quieten comparar dos líneas X y Y de un virus que ataca a las hojas
de una especie de planta. (Fig. 1). El experimento tratara de estimar la capacidad de
infección que tienen las líneas y, para ello, se inoculan una a cada lado de la vena
central (o costa) de las hojas seleccionadas. (Esto funcionar siempre y cuando los dos
focos de infección no comiencen a interactuar.)
Figura 1 Ejemplo de tan dístilo comparativo por parejas. Se inoculan las líneas X y Y de
un virus, en cada lado de la vena central de la hoja
Pero hay casos en donde lo que recolectamos son datos enumerativos. Por ejemplo,
podríamos preguntarnos si las hojas se infectan más frecuentemente con los virus de la
línea X que con los de la Línea Y y, para ello, observamos la reacción positiva o
16
negativa de las hojas a las líneas. Aquí también podemos usar como parte del díselo, el
método de aparear los datos, inoculando en las "mitacles" de las hojas, de modo que
cada hoja se convierta en un bloque. Las lineas X y Y generaran muestras pareadas.
linea Y
0 1 Total
linea X 0 25(a) 12(b) 37
1 33( c ) 45(d) 38
Total 58 57 n=115
La tabla de frecuencias 2 x 2 (Tabla 1) clasifica las reacciones positivas (codificadas
como l's) o negativas (codificadas como O's) a la inoculación en hojas de las lineas X y
Y, a partir del diserto de muestras pareadas. Los datos son ficticios y se suponen
obtenidos de n = 115 hojas. El paramiento ocurre porque cada combinación (0,0), (0,1),
(1,0) y (1,1) proviene de la observación a la reacción respecto a bs lineas X y Y,
respectivamente, en la misma hoja. Por tanto, las muestras generadas por la linea X
contienen exactamente las mismas hojas que las muestras generadas por la linea Y.
CONCLUSION
17
Desde el punto de vista estadístico las tablas de contingencia se emplean para
registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza
cualitativa (nominales u ordinales)
Las tablas de contingencia tienen dos objetivos fundamentales: Organizar la
información contenida en un experimento cuando ésta es de carácter bidimensional, es
decir, cuando está referida a dos factores (variables cualitativas). A partir de la tabla de
contingencia se puede además analizar si existe alguna relación de dependencia o
independencia entre los niveles de las variables cualitativas objeto de estudio. El hecho
de que dos variables sean independiente significa que los valores de una de ellas no
están influidos por la modalidad o nivel que adopte la otra Un estimador de un
parámetro poblacional es una función de los datos muestrales, también llamado
estadístico. En pocas palabras, es una fórmula que depende de los valores obtenidos de
una muestra, para realizar estimaciones.
En las áreas de estudio las tablas de contingencia permiten apreciar relaciones no
aparentes inicialmente. En la Comunidad Valenciana el análisis permite descubrir una
relación doble entre las tendencias anuales y las del máximo evento diario; por su parte
en el sector central del valle del Ebro la relación encontrada entre las tendencias de
precipitación anual y su variabilidad sugiere que los escenarios futuros, si se mantienen
las pautas descritas, estarán sometidos a una mayor imprecisión y aleatoriedad
REFERENCIAS BIBLIOGRAFICAS
18
Liddell, D. (1976). "Pruebas prácticas de tablas de contingencia 2 × 2". Revista
de la Royal Statistical Society.
"Prueba de Maxwell, prueba de McNemar, prueba de Kappa"Rimarcik.com.
Consultado el 22 de noviembre de 2012.
Sun, Xuezheng; Yang, Zhao (2008). "Prueba generalizada de McNemar para la
homogeneidad de las distribuciones marginales" (PDF)Foro Global SAS
Stuart, Alan (1955). "Una prueba de homogeneidad de las distribuciones
marginales en una clasificación bidireccional".
Maxwell, AE (1970). "Comparación de la clasificación de sujetos por dos jueces
independientes". La Revista Británica de Psiquiatría.
Pruebas de McNemar de homogeneidad marginal". John-uebersax.com. 2006-
08-30. Consultado el 22 de noviembre de 2012.
Chapear, vicepresidente (1966). "Una nota sobre la equivalencia de dos criterios
de prueba para hipótesis en datos categóricos". Revista de la Asociación
Estadounidense de Estadística