0% encontró este documento útil (0 votos)
255 vistas19 páginas

Análisis de Datos Bivariados en Estadística

El documento describe cómo analizar la distribución de frecuencias para dos variables, ya sean cualitativas o cuantitativas. Explica cómo construir tablas de contingencia que muestran las frecuencias conjuntas y marginales de las variables, y cómo calcular las frecuencias relativas y porcentuales. También proporciona dos ejemplos ilustrativos de tablas de contingencia.

Cargado por

llxxsergioxxll
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
255 vistas19 páginas

Análisis de Datos Bivariados en Estadística

El documento describe cómo analizar la distribución de frecuencias para dos variables, ya sean cualitativas o cuantitativas. Explica cómo construir tablas de contingencia que muestran las frecuencias conjuntas y marginales de las variables, y cómo calcular las frecuencias relativas y porcentuales. También proporciona dos ejemplos ilustrativos de tablas de contingencia.

Cargado por

llxxsergioxxll
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Sesión 05

DISTRIBUCION DE FRECUENCIAS PARA DOS VARIABLES


CUANTITATIVAS Y/O CUALITATIVAS

Análisis de datos bivariados. Distribución conjunta. Distribución


85
marginal. Frecuencias conjuntas y marginales. Frecuencia
condicional. Cualitativa Vs cualitativa. Cualitativa Vs cuantitativa.
Gráficos.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

5. ANÁLISIS DE DATOS BIVARIADOS

Anteriormente se estudio datos provenientes de una sola variable, sin embargo con frecuencia es necesario
analizar la relación entre dos variables. Supongamos que se toma una muestra de tamaño “n” de una
población que se está investigando.

Sean X e Y las variables a estudiar, tal que los datos obtenidos son:

( X1,Y1 ),( X2,Y2), ….,( Xn,Yn).

La tabla de frecuencia que agrupa a esta información se conoce “tabla de contingencia“.

Para el caso de dos variables cualitativas con dos modalidades o categorías, la tabla sería:

Y
X
Categoría 1 Categoría 2 Total
Categoría 1 Celda f11 Celda f12 Total marginal f1.
Categoría 2 Celda f21 Celda f22 Total marginal f2.
Total de
Total Total
Total individuos
marginal f.1 marginal f.2
n

Para el caso de dos variables cuantitativas, la tabla sería:

Yi
Xi
Y1 Y2 Total
X1 Celda f11 Celda f12 Total marginal f1.
X2 Celda f21 Celda f22 Total marginal f2.
X3 Celda f31 Celda f32 Total marginal f3.
Total de
Total Total
Total individuos
marginal f.1 marginal f.2
n

También se pueden construir tablas de contingencia para una variable cuantitativa y una cualitativa, la tabla
sería:

Yi
Xi
Categoría 1 Categoría 2 Total
X1 Celda f11 Celda f12 Total marginal f1.
X2 Celda f21 Celda f22 Total marginal f2.
X3 Celda f31 Celda f32 Total marginal f3.
Total de
Total Total 86
Total individuos
marginal f.1 marginal f.2
n

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

5.1 DISTRIBUCIÓN CONJUNTA Y MARGINAL

Cuando sólo interesa conocer la frecuencia de ocurrencia de cada una de las variables por separado se
habla de Frecuencia Marginal de la variable. Cuando el interés es conocer la frecuencia combinada de las
dos variables, nos referimos a la Frecuencia Conjunta.

Ejemplo 1:

HABITOS DE FUMAR
SEXO TOTAL
SI NO
VARON DISTRIBUCION
DISTRIBUCION CONJUNTA
MUJER MARGINAL
TAMAÑO DE
TOTAL DISTRIBUCION MARGINAL
MUESTRA

¿Cuántas variables tenemos? ____________

¿Cuáles son? ____________________________________________________________________________

• Frecuencia absoluta: conjunta y marginal

HABITOS DE FUMAR
SEXO TOTAL
SI NO
VARON 800 1200 2000
MUJER 1000 2000 3000
TOTAL 1800 3200 5000

• Frecuencia relativa: conjunta y marginal

Categoría Categoría
X/Y Total
variable Y variable Y
Categoría Marginal
h11=f11/ n h12=f12/n
variable X h1.=f1./n
Categoría Marginal
h21=f21/n h22=f22/n
variable X h2.=f2./n
Marginal Marginal
Total (n/n)=1
h.1=f.1/n h.2=f.2/n

HABITOS DE FUMAR
SEXO TOTAL
SI NO
VARON 0,16 0,24 0,40 87
MUJER 0,20 0,40 0,60
TOTAL 0,36 0,64 1,00

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

• Frecuencia porcentual: conjunta y marginal

Categoría Categoría
X/Y Total
variable Y variable Y
Categoría Marginal
p11=h11*100% p12=h12*100%
variable X p1.=h1.*100%
Categoría Marginal
p21=h21*100% p22=h22*100%
variable X p2.=h2.*100%
Marginal Marginal
Total 100%
p.1=h.1*100% p.2=h.2*100%

HABITOS DE FUMAR
SEXO TOTAL
SI NO
VARON 16,0% 24,0% 40,0%
MUJER 20,0% 40,0% 60,0%
TOTAL 36,0% 64,0% 100,0%

Ejemplo 2:

La compañía de cerveza “LUPULOS” está interesada en saber si el consumo de su marca de cerveza


depende de una localización geográfica en especial. Encargó el estudio a una firma de investigación de
mercados y ésta proporcionó entre otros resultados la siguiente tabla del consumo anual por persona de
muestras aleatorias de las tres regiones del país:

• Frecuencia absoluta: conjunta y marginal

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 45 20 33 98
de 5 a 10 cajas 25 45 44 114
Menos de 5 cajas 20 35 33 88
Total 90 100 110 300
• Frecuencia relativa: conjunta y marginal

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 0,150 0,067 0,110 0,327
de 5 a 10 cajas 0,083 0,150 0,147 0,380
88
Menos de 5 cajas 0,067 0,117 0,110 0,293
Total 0,300 0,333 0,367 1,000

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

• Distribución Porcentual: conjunta y marginal

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 15,0% 6,7% 11,0% 32,7%
de 5 a 10 cajas 8,3% 15,0% 14,7% 38,0%
Menos de 5 cajas 6,7% 11,7% 11,0% 29,3%
Total 30,0% 33,3% 36,7% 100,0%

• Distribución porcentual según consumo por localización geográfica

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 50,0% 20,0% 30,0%
de 5 a 10 cajas 27,8% 45,0% 40,0%
Menos de 5 cajas 22,2% 35,0% 30,0%
Total 100,0% 100,0% 100,0%

• Distribución porcentual según localización por consumo

Consumo anual Localización Geográfica: regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 45,9% 20,4% 33,7% 100,0%
de 5 a 10 cajas 21,9% 39,5% 38,6% 100,0%
Menos de 5 cajas 22,7% 39,8% 37,5% 100,0%
Total

5.2 DISTRIBUCION CONDICIONAL

Cuando se “pregunta” por la frecuencia absoluta, relativa y/o porcentual de una de las variables, digamos
X, restringida a los elementos observados de una clase dada de la otra (Y); esto es, estudiar el
comportamiento de una variable dado un valor fijo de la otra.

Y
X Categoría Categoría
variable Y variable Y
Categoría 1 f11 / f.1 f12/f.2
89
Categoría 2 f21/f.1 f22/f.2
Total 1 1

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Continuando el ejemplo anterior; contamos con la tabla de contingencia de frecuencias absolutas conjunta
y marginal.

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 45 20 33 98
de 5 a 10 cajas 25 45 44 114
Menos de 5 cajas 20 35 33 88
Total 90 100 110 300
Existe la necesidad de conocer las frecuencias del consumo anual por persona en la región costa. La
distribución condicional de estas frecuencias queda de la siguiente manera:

X/Y=Costa f(xi/yj=costa) h(xi/yj=costa) p(xi/yj=costa)


Más de 10 cajas 45 0,500 50,0%
de 5 a 10 cajas 25 0,278 27,8%
Menos de 5 cajas 20 0,222 22,2%
Total 90 1,000 100,0%
5.3 INDEPENDENCIA DE VARIABLES

Se dice que la variable “Y” se distribuye independientemente de la variable “X” si para todas las
௙೔. ௙.ೕ
frecuencias conjuntas fij se cumple: ݂௜௝ =

Para el ejemplo anterior; de la tabla de frecuencias absolutas conjunta y marginal.

Consumo anual Localización Geográfica : regiones


Total
por persona Costa Sierra Selva
Más de 10 cajas 45 20 33 98
de 5 a 10 cajas 25 45 44 114
Menos de 5 cajas 20 35 33 88
Total 90 100 110 300
௙೔. ௙.ೕ
Determinamos cada uno de los valores ; los resultados se muestran en la siguiente tabla:

Consumo anual Localización Geográfica : regiones Se observa que los valores f୧୨
Total
por persona Costa Sierra Selva
Más de 10 cajas 29,4 32,7 35,9 98 de la primera tabla son
de 5 a 10 cajas 34,2 38,0 41,8 114 diferentes a los
Menos de 5 cajas 26,4 29,3 32,3 88
݂௜௝ de la segunda tabla; por lo
Total 90 100 110 300
tanto, la variable consumo anual por persona y la variable localización geográfica son dependientes.
90
௙೔. ௙.ೕ
Nota: si al menos uno de las f୧୨es diferente a , las variables no son independientes.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

EJERCICIOS RESUELTOS Nº 5.

1. El interés de una institución educativa es conocer las perspectivas de estudios según su género, para
esto se tomaron 65 jóvenes de 5to de educación secundaria del Colegio Miguel De Cervantes Saavedra
entre 15 y 16 años de edad y se les clasificó según perspectiva (universitaria, no universitaria) y al área
que destaca obteniéndose los siguientes datos:

Tabla Nº 1: Tabla de contingencia de jóvenes entre 15 y 16 años de edad según área en que destaca y
perspectivas de estudio, Colegio Miguel de Cervantes Saavedra, año 2010.
Área en que Perspectivas de Estudio
Total
destaca No universitario Universitario
Arte 8 5 13
C.T.A. 4 2 6
CC.SS. 2 6 8
Comunicación 1 10 11
Matemática 2 7 9
Técnica 4 14 18
Total 21 44 65
Fuente: Oficina de OBE Colegio Miguel De Cervantes Saavedra

A partir de la tabla obtenemos los porcentajes en columna de la siguiente manera:


Área en que Perspectivas de Estudio
Total
destaca No universitario Universitario
Arte 8/21 5/44 13/65
C.T.A. 4/21 2/44 6/65
CC.SS. 2/21 6/44 8/65
Comunicación 1/21 10/44 11/65
Matemática 2/21 7/44 9/65
Técnica 4/21 14/44 18/65
Total 21/21 44/44 65/65
Fuente: Oficina de OBE Colegio Miguel De Cervantes Saavedra

Entonces la tabla bivariada quedará de la siguiente manera:


Tabla Nº 2: Tabla de contingencia del porcentaje de jóvenes entre 15 y 16 años de edad según el área
en que destaca de acuerdo y perspectivas de estudio, Colegio Miguel de Cervantes Saavedra, año 2010.
Área en que Perspectivas de Estudio
Total
destaca No universitario Universitario
Arte 38.10% 11.36% 20.00%
C.T.A. 19.05% 4.55% 9.23%
CC.SS. 9.52% 13.64% 12.31%
Comunicación 4.76% 22.73% 16.92% 91
Matemática 9.52% 15.91% 13.85%
Técnica 19.05% 31.82% 27.69%
Total 100.00% 100.00% 100.00%
Fuente: Oficina de OBE Colegio Miguel De Cervantes Saavedra

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Los jóvenes con perspectivas de estudios universitarios, en mayor porcentaje se relaciona con los
alumnos que destacan en el área Técnica con un 31.82%. Por otro el 38.10% representa el mayor
porcentaje de alumnos que no tienen perspectivas universitario siendo el área que destaca Arte. En
conclusión los alumnos con mayores perspectivas universitarias destacan en Técnica, mientras que los
que no tienen perspectivas universitarias destacan en el área de Arte.

2. Los siguientes datos corresponden a la información obtenida de los alumnos del cuarto de primaria de
la sección C del IE 2080 del Distrito de Rímac. Los datos corresponde a las variables: Genero y Actividad
Basica_Percibe, expresa y controla su respiración elevando y bajando al abdomen con dificultad. Se
pide elaborar la distribución conjunta de los siguientes datos.

Tabla Nº 3: Información obtenida de los alumnos del cuarto de primaria la sección B según género y
Actividad Básica; IE 2080 del Distrito del Rímac, año 2010.
Actividad Básica: Actividad Básica:
Percibe su respiración Percibe su respiración
Genero Genero
inhalando aire por la inhalando aire por la
(*) (*)
nariz y expeliendo por nariz y expeliendo por
la boca (**) la boca (**)
2 0 2 0
1 0 2 0
1 0 1 0
2 0 1 0
1 1 2 0
1 0 1 0
2 0 1 0
2 1 1 0
1 0 2 0
1 1 1 0
1 0 1 0
1 0
(*): Donde 1 corresponde a masculino, y 2 a femenino.
(**): Donde 0 corresponde a no y 1 a sí.
Respuesta: La tabla de distribución conjunta correspondiente es:

Percibe
GENERO Total
Si No
Masculino 2 13 15
Femenino 1 7 8 92
Total 3 20 23

௙೔. ௙.ೕ
Vamos a determinar si las variables son independientes; hallamos cada uno de los valores de

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

ଷ∗ଵହ ଷ∗଼ ଶ଴∗ଵହ ଶ଴∗଼


= 2.0; = 1.0; = 13.0; = 7.0
ଶଷ ଶଷ ଶଷ ଶଷ

La tabla queda de la siguiente manera:

Percibe
GENERO Total
Si No
Masculino 2.0 13.0 15
Femenino 1.0 7.0 8
Total 3 20 23

Vemos que las frecuencias conjuntas de la tabla inicial son iguales a los resultados obtenidos en la segunda
tabla; por lo tanto afirmamos que las variables género y actividad básica del niño son independientes.

EJERCICIOS PROPUESTOS N° 5.

ÁREA: INGENIERÍA

1. En un proceso de destilación químico, el porcentaje (Y) de pureza de oxigeno producido está


relacionado con el porcentaje (X) de hidrocarburo, presente en el condensador principal de la unidad
de destilación.

Se efectuaron 55 mediciones, en las cuales se observaron conjuntamente las variables X e Y, cuyos


resultados se incluyen en la siguiente tabla:

Nivel de Nivel de Pureza del Oxigeno (%)


Hidrocarburo
87 - 90 90 - 93 93 - 96 96 - 100
(%)
0.87 – 1.07 10 5 0 0
1.07 – 1.27 5 12 2 1
1.27 – 1.47 1 4 9 2
1.47 – 1.67 0 1 2 1
En qué porcentaje de las mediciones se observa un nivel de hidrocarburo superior a 1.27% en el condensador
principal, cuando en nivel de pureza de oxigeno es por lo menos 90 %?

2. La Dirección General de Salud Ambiental desea conocer la asociación entre el número de empleados y
la producción mensual de residuos sólidos (toneladas) en todas las fábricas del distrito de los Olivos. La
información se presenta en al siguiente tabla.

Producción de residuos sólidos


Número de
(Toneladas)
empleados 93
0-2 2-4 4-6 ≥6
0-10 10 2 2 1
10-100 8 3 4 1
100-1000 5 1 3 1

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

a) Calcule la distribución marginal de las dos variables.

b) Construya la distribución Porcentual: conjunta y marginal

c) Construya la distribución Relativa: conjunta y marginal

ÁREA: CIENCIAS EMPRESARIALES

1. En 1000 operaciones de venta, un concesionario de vehículos observa los siguientes datos referentes al
color de coche (blanco, azul, verde, negro) y a la forma de pago (contado/financiado). Analice la
independencia de estas variables.

Blanco Azul Verde Negro


Contado 180 240 144 36
Financiado 120 160 96 24
2. Los 474 trabajadores de una empresa han sido ordenados con arreglo a dos criterios de clasificación:
sexo y salario.

Grupos de Salario Actual


Sexo Menos de Entre 2500 y Entre 5000 y Más de
2500 5000 7500 7500
Hombre 19 174 48 17
Mujer 124 86 6 0
a) Calcule la distribución marginal de las dos variables.

b) Obtenga la distribución de la variable Y condicionada al valor de X=Mujer.

c) ¿Son las variables independientes?

3. En la siguiente tabla se muestra los resultados de medir la variables sexo y categoría laboral de los
trabajadores de una empresa.

Categoría Laboral
Sexo
Administrativo Seguridad Directivo
Hombre 157 27 74
Mujer 206 0 10
a) Calcule la distribución marginal de las dos variables.

b) Construya la distribución Porcentual: conjunta y marginal

c) Construya la distribución Relativa: conjunta y marginal

d) ¿Son las variables independientes?

94
4. La siguiente tabla de contingencia muestra la tabulación cruzada de las variables ingreso anual (dividido
en tres categorías) y la última marca de coche comprada (dividida en tres marcas) por los clientes.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Ingreso anual Marca del último auto comprado


(dólares) Ford Toyota Renault
Menos de 20,000 50 200 125
20,000 – 40,000 200 100 350
Más de 40,000 100 25 50
Se pide:

a) Calcular la distribución marginal de las dos variables.

b) Interpretar el porcentaje de clientes que tienen ingreso anual de $. 20,000 a más y el último auto comprado
es de la marca Renault.

c) De los clientes que compraron autos de la marca Toyota, que porcentaje tiene ingreso anual mayor a
$.40,000.

5. Considere un estudio sobre consumo que está interesado en investigar las preferencias de las familias
por diferentes tamaños de lavadoras. A priori, uno pensaría que sería más probable que familias más
numerosas compraran lavadoras más grandes y que familias con menos miembros compraran
lavadoras de menor carga. Supongamos que para investigar esta relación el fabricante de lavadoras
toma una muestra aleatoria de tamaño n=300 de todas aquellas familias que compraron lavadoras.

Tamaño de Tamaño familiar


Lavadora 1a2 3a4 5 o más
Carga de 1 kg. 25 37 8
Carga de 3 kg. 10 62 53
Carga de 5 kg. 5 41 59
a) De las familias que tienen de 3 a 4 integrantes, ¿Qué porcentaje compraron lavadoras de 3 kg de carga?

b) ¿las variables son independientes?

6. Tenemos una distribución bivariada expresada en la siguiente tabla de contingencia. La variable X


representa los ingresos familiares mensuales en soles (S/.). La variable Y representa, a su vez, los
metros cuadrados (m2) de la vivienda familiar.

X\Y < 60 60-80 80-100 100-150 > 150


500-1000 20 18 2 1 0
1000-2000 25 40 30 2 1
2000-3500 5 10 15 25 3
3500-5000 0 5 15 20 8
> 5000 0 1 2 7 10
a) Calcule la distribución marginal de las dos variables.

b) Obtenga la distribución de la variable Y condicionada al valor de X entre 2000 y 3500. 95


c) Calcule la distribución condicionada de X al valor de entre 100 y 150.

d) ¿Son las variables independientes?

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

7. Una empresa de investigación de mercados ha enviado muestras de un cierto champú a un cierto


número de individuos. Los datos siguientes reflejan las opiniones de éstos sobre la calidad del champú
diferenciando a los encuestados por clase de edad.

Calidad de Grupo de edad (Años)


champú 15-20 21-30 más de 30
Excelente 18 20 41
Bueno 25 27 43
Aceptable 17 15 26
Mala 3 2 8
Construya la tabla de distribución porcentual: conjunta y marginal. ¿Qué conclusiones puede extraer?

8. La dirección de un determinado hotel pretende saber si a todos los clientes se les trata con la misma
consideración con independencia de sus precios de sus habitaciones. Para ello se seleccionó una
muestra aleatoria de 155 clientes recientes y se les preguntó sobre el servicio que había recibido
durante su estancia en el hotel. Se obtuvieron los siguientes datos:

Calificación Tipo de habitación


del servicio Económica Estándar De lujo
Excelente 30 21 9
Bueno 36 29 8
Aceptable 12 8 2
¿Qué conclusiones puede extraer?

9. Una compañía evalúa una propuesta para fusionarse con una corporación. El consejo de directores
desea muestrear la opinión de los accionistas para determinar si esta es independiente del número de
acciones que posee cada uno. Una muestra aleatoria de 250 accionistas da los siguientes resultados:

Número de Opinión
Totales
acciones A favor En contra Indecisos
Menos de 200 38 29 9 76
200-1000 30 42 7 79
Más de 1000 32 59 4 95
Totales 100 130 20 250
Con base en esta información; se puede decir que la opinión con respecto a la propuesta es independiente del
número de acciones que posee el accionista.

96

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

ÁREA: LETRAS (DERECHO, EDUCACIÓN Y CIENCIAS DE LA COMUNICACIÓN)

1. En el siguiente cuadro se muestran los resultados obtenidos al aplicar una encuesta a 750 personas, en
Lima Metropolitana, para medir la intención de voto en las próximas elecciones municipales. Estos
resultados se encuentran desagregados por grupos de edad de las personas entrevistadas:

Grupos de Edad
Intención de voto
18 a 29 30 a 44 45 a 70 Total
Candidato 1 117 109 59 285
Candidato 2 45 45 26 116
Candidato 3 25 31 31 87
Candidato 4 17 14 4 35
Otros 30 33 25 88
Blanco o viciado 46 48 45 139
Total 280 280 190 750
a) Calcule la distribución marginal de las dos variables.

b) Distribución Porcentual: conjunta y marginal

c) Distribución Relativa: conjunta y marginal

2. En la siguiente tabla se muestra la distribución de los asistentes a una charla informativa sobre un
nuevo programa de especialización ofrecido por cierta escuela de postgrado, según su profesión y
condición de universidad.

Condición de
Profesión Universidad
Nacional Particular
Ingeniería 5 19
Administración 3 5
Contabilidad 6 4
Economía 6 9
Derecho 1 2
a) Construya un gráfico que permita observar la composición porcentual de los asistentes, según profesión y
condición de universidad a la charla informativa.

b) A partir del gráfico usted puede concluir que la participación de los asistentes al evento se ve influenciada
por la profesión y la condición de universidad.

3. Los siguientes datos corresponden a la información obtenida de los alumnos del segundo de primaria
de la sección A del IE 1101 del Distrito de San Miguel; las variables son Genero y Conocimiento Corporal
(Señala la rodilla y los pies en sí mismo y la de sus compañeros). Se pide elaborar la distribución conjunta
97
de los siguientes datos.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Señala la rodilla y Señala la rodilla y


los pies en sí los pies en sí
Genero (*) Genero (*)
mismo y la de sus mismo y la de sus
compañeros(**) compañeros(**)
2 0 2 0
1 0 2 0
1 0 1 0
2 0 1 0
1 1 2 0
1 0 1 0
2 0 1 0
2 1 1 0
1 0 2 0
1 1 1 0
1 0 1 0
1 0
(*) 1 masculino 2 femenino
(**) 0 no 1 si
4. Para el ejercicio anterior halle:

a) La distribución de frecuencia de la Marginal respecto a la variable genero.

b) La distribución de frecuencia de la Marginal respecto a la variable Señala la rodilla y los pies en sí mismo y
la de sus compañeros.

5. Los siguientes datos están relacionados a una encuesta realizada por un medio de comunicación a si un
determinado comercial emitido por TV tiene o no carácter racista.

Respuesta del
Genero (*)
Entrevistado (**)
2 0
1 0
1 1
2 1
1 1
1 1
2 1
2 1
(*) 1 masculino 2 femenino
(**) 0 no 1 si
Se pide elaborar la distribución conjunta y la condicional respecto a la variable Respuesta del Entrevistado.

6. Interpretar la información obtenida por los alumnos de la Facultad de Derecho de la UCV relacionados 98
con el género y las infracciones de Tránsito.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Tabla Nº 6: Información obtenida por los alumnos de la Escuela de Derecho de la UCV relacionado a
infracciones de tránsito.
Infracciones de Transito
Género Total
Si No
Masculino 15 5 20
Femenino 25 5 30
Total 40 10 50
7. Completar e interpretar los datos de la siguiente tabla, relacionados con un estudio hecho a los alumnos

de la institución de nivel inicial IE Jesús el Redentor del Distrito del Rímac, durante el presente año.

Tabla Nº 7: Información de Pre Test, obtenida de los alumnos de la sección A del IE Jesús el Redentor
del Distrito del Rímac sobre la variable Salta y zapatea adecuadamente al ritmo de la danza y la variable
Genero.
Salta y Zapatea
Género Total
Si No
Masculino 0.30 0.40
Femenino 0.10 0.60
Total 0.80 1.00
8. Para determinar si la frecuencia de escuchar radio es independiente del sexo, se entrevistó a un grupo
de estudiantes, los resultados se muestran en la tabla siguiente:

Frecuencia de Sexo
Escuchar Radio Masculino Femenino
Diariamente 258 507
Casi todos los días 91 241
Ocasionalmente 48 41
nunca 12 47
NS/NR 3 29
a) Calcule la distribución marginal de las dos variables.

b) Distribución Porcentual: conjunta y marginal

c) Distribución Relativa: conjunta y marginal

d) Construya un gráfico que permita observar la composición porcentual de los estudiantes, frecuencia de
escuchar radio y sexo.

e) A partir del gráfico usted puede concluir que la frecuencia de escuchar radio depende del sexo del
estudiante.

ÁREA: SALUD

1. Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo del tábaco; se 99

tiene los siguientes resultados:

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Hábito
Sexo
Fumadores No fumadores Total
Varones 49 64 113
Mujeres 43 37 80
Total 92 101 193
a) Se pide elaborar la distribución relativa conjunta y marginal.

b) Hallar la distribución condicional respecto a la variable Hábito.

2. Determinar si existe una asociación significativa entre la frecuencia de personas con caries y la
deficiencia en ellas de vitamina C. Un estudio arrojó los siguientes datos.

CARIES
VITAMINA C
Presentes Ausentes
Con Deficiencia 90 125
Sin Deficiencia 100 104
a) Se pide elaborar la distribución relativa conjunta y marginal.

b) Hallar la distribución condicional respecto a la variable Vitamina C.

3. Supongamos que se quiere estudiar la relación entre fumar (Si, No) y padecer cáncer de pulmón (Si,
No), para lo cual se cuenta con la siguiente información.

Cáncer de Fumar
Pulmón Si No
Si 123 58
No 26 108
a) Elaborar la distribución relativa conjunta y marginal.

b) ¿El cáncer de pulmón es independiente del hábito de fumar?

4. En un estudio acerca del uso de vitaminas en áreas urbanas y rurales; se plantea que el área de
residencia y el uso de vitaminas son independientes entre sí. Se obtiene una muestra aleatoria de 100
personas donde se miden las 2 variables, la cual se presenta en la siguiente tabla:

Área de Residencia
Uso de vitaminas
Urbana Rural
Si 36 34
No 24 6
a) Determinar si las dos variables son independientes.

b) De las personas que viven en el área urbana, ¿Qué porcentaje usa vitaminas?.

5. Un estudio fue realizado para determinar si el tipo de cáncer difería entre oficinistas, obreros y 100
desempleados.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

Una muestra de 100 empleados de cada tipo de trabajador diagnosticado con cáncer fue dividida en
categorías por tipo de cáncer. Los resultados se presentan en la siguiente tabla de frecuencias
observadas

Tipo de cáncer
Ocupación Totales
Pulmón Estómago Otros
Oficinista 53 17 30 100
Obrero 10 67 23 100
Desempleado 30 30 40 100
Totales 93 114 93 300
a) Calcule la distribución marginal de las dos variables.

b) Distribución Porcentual: conjunta y marginal

c) ¿Son independientes las variables?

6. Se hizo un estudio de niños de 10 a 12 años, consistente en experimentar la efectividad de dos


métodos de higiene bucal en la prevención de caries, el método A y el método B. Después de un año,
se observó el desarrollo de caries. El resultado observado se clasificó en tres categorías: Bajo, medio,
alto. Participaron en el estudio un total de 200 niños.

Con los resultados obtenidos, se construyó la siguiente tabla de contingencia:

Desarrollo de caries
Tratamiento Totales
Bajo Medio Alto
A 8 40 34 82
B 84 22 12 118
Totales 92 62 46 200
a) Calcule la distribución Porcentual: conjunta y marginal

b) Determine si el desarrollo de caries es independiente del método.

c) De los niños que utilizaron el método A, ¿Qué porcentaje tuvo desarrollo alto de caries?

MISCELÁNEA

1. En el distrito universitario de Jauja los 2000 estudiantes se distribuyen entre las tres carreras que
pueden cursarse del siguiente modo: el 20% estudian arquitectura, el 35% medicina y el 45% economía.
El porcentaje de alumnos que finalizan sus estudios en cada caso es del 5%, 12% y del 18%.

Se pide elaborar la distribución absoluta y relativa: conjunta y marginal.

2. La siguiente tabla contiene la información correspondiente a la marca del último automóvil comprado 101
por una muestra aleatoria de 800 jefes de hogar de cada uno de los niveles socioeconómicos: A, B, C, D.

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

MARCA
N.S.E. OTRAS NO
TOYOTA NISSAN
MARCAS TIENEN
A 350 251 170 29
B 247 203 250 100
C 109 154 348 189
D 80 70 240 410
a) Presente la información en un gráfico de barras agrupadas.

b) Interprete las celdas que están resaltadas.

3. Se seleccionaron al azar 225 personas de ambos sexos en una universidad, a quienes se les preguntó su
campo de estudio. Los resultados de este estudio se muestran a continuación:

Ciencias Ingeniería Letras Artes Otros


Sexo masculino 32 5 42 27 8
Sexo femenino 30 25 28 18 10
Represente un gráfico porcentual destacando la preferencia del área de estudio según sexo.

4. A partir de la siguiente distribución bivariada (X, Y), calcule si son independientes las variables.

X\Y 1 2 3
-1 0 1 0
0 1 0 1
1 0 1 0
5. A partir de la siguiente distribución bivariada (X, Y),

X\Y 1 2 3 4 5
-1 2 4 6 10 8
0 1 2 3 5 4
1 3 6 9 15 12
2 4 8 12 20 16
a) Calcule la distribución de X condicionada a que Y=4.

b) ¿Son independientes las variables X e Y?

6. Tenemos la siguiente tabla de contingencia. Determine si las dos variables son independientes.

X\Y 5 7
100 8 4
250 n21 6
102

UCV-LIMA NORTE ESTADISTICA


OFICINA ACADEMICA DE INVESTIGACION COORDINACION DE ESTADISTICA

7. Dada la siguiente tabla de contingencia:

X\Y 5 15 40 70
10 3 7 6 4
20 6 14 12 8
40 5 10 9 6
60 1 4 3 2
a) Calcule la distribución de la variable Y condicionada a que X= 20.

b) Calcule la distribución de la variable Y condicionada a que X≤40.

c) Calcule la distribución de la variable X condicionada a que Y= 5.

8. Supongamos que medimos a 50 sujetos, 20 varones y 30 mujeres en la variable nivel de satisfacción


con el trabajo (bajo medio y alto). Sabiendo que la mitad de los sujetos dicen que tienen satisfacción
media, que hay 10 mujeres y 10 varones que tienen satisfacción baja y 2 mujeres con satisfacción alta.

a) Elabore la distribución de frecuencias absolutas y relativas (conjuntas y condicionales) para las variables
género y nivel de satisfacción con el trabajo.

b) Represente la gráficamente la relación entre las variables genero y satisfacción laboral.

c) Globalmente, ¿quiénes están más satisfechos con el trabajo, los varones o las mujeres?

d) ¿Son independientes las variables?

10. Para ver si existe dependencia entre el trabajo profesional de una persona y su religión, se seleccionó
una muestra aleatoria de 638 individuos de la población formada por el conjunto total de médicos
administradores e ingenieros. Los resultados muestrales aparecen reflejados en la siguiente tabla:

Profesionales
Religión
Médicos Administradores Ingenieros
Protestante 64 110 152
Católico 60 86 78
Judío 57 21 10
¿Qué conclusiones puede extraer?

11. En la siguiente tabla muestra la reacción de los estudiantes de Administración al nuevo reglamento del
consejo universitario de acuerdo con el nivel, siendo “División inferior” los estudiantes de primero y
segundo año y “División superior” los estudiantes de tercero y cuarto año.

Nivel escolar
Reacción División División
inferior Superior 103
A Favor 20 19
En contra 10 16
Obtenga sus conclusiones.

UCV-LIMA NORTE ESTADISTICA

También podría gustarte