0% encontró este documento útil (0 votos)
12 vistas10 páginas

Capitulo Nro. 4

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
12 vistas10 páginas

Capitulo Nro. 4

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Capítulo Nro.

4
DISTRIBUCIONES BIDEMENSIONALES
1.- INTRODUCCION
La estadística bidimensional es una rama de la estadística que se ocupa del estudio
simultaneo de dos variables con el objetivo de analizar la relación entre las variables.
En lugar de observar una sola variable, como en la estadística unidimensional, aquí se
observan dos características de un conjunto de datos para evaluar cómo se comportan
conjuntamente, Por ejemplo:
1. Cómo el tiempo de respuesta del servidor se ve influenciado por el número de
usuarios conectados.
2. Horas de estudio y calificaciones de los estudiantes
3. La categoría de los empleados y el salario que perciben
4. Dinero gastado en publicidad y dinero obtenido por ventas en una empresa

( )
En este análisis, los datos se representan como pares de observaciones X ,Y , donde
cada par indica el valor de las dos variables para una misma unidad o individuo.
Los dos caracteres observados no tienen por qué ser de la misma clase, pudiendo
presentarse distintas situaciones:
• Dos caracteres cualitativos: El sexo y color del pelo de una persona.
• Dos caracteres cuantitativos: El peso y la estatura de una persona.
• Uno cuantitativo y otro cualitativo: La profesión y los años de servicio.

(
Las variables X ,Y ) que representan los valores de dos caracteres cuantitativos,
pueden clasificarse:
• X discreta e Y discreta: Número de hijos y número de hermanos de una persona.

• X continua e Y continua: Temperatura y el tiempo de enfriamiento de un


objeto.
• X discreta e Y continua: Hijos de una familia y estatura del padre.
• X continua e Y discreta: cantidad de productos defectuosos y tiempo de
inspección en una fábrica.
2.- FRECUENCIA CONJUNTA
La frecuencia conjunta se refiere al número de veces que ocurren simultáneamente dos
valores correspondientes a dos variables diferentes y se quiere analizar la relación
entre ellas.
Ejemplo: consideremos las siguientes variables:
• Variable X: Nivel educativo ( técnico medio, técnico superior, licenciados)

• Variable Y: Ingreso mensual ( bajo, medio, alto).


Una tabla de frecuencias conjuntas indicaría cuántas personas con un nivel
educativo específico tienen un ingreso determinado. Es una tabla en la que cada
posición representa la combinación de una categoría de la variable X y una categoría
de la variable Y, y el número en la posición indica cuántas veces ocurre esa
combinación.
La siguiente tabla describe la población, con su la frecuencia absoluta fij de individuos
que presentan a la vez el valor x i de la variable X y el valor y j de la variable Y .

3. TIPOS DE DISTRIBUCIONES
a) Distribución marginal, son distribuciones unidimensionales que estudian una
variable independientemente de la otra.
b) Distribución condicionada, se refiere a que cuando se dispone de una distribución
bidimensional será posible establecer otras dimensiones bajo ciertas condiciones.
La distribución de frecuencias absoluta condicionada de la variable X, cuando la otra
variable toma el valor de Y j se expresa por: fX Y =Yj está dada por la columna j de la
tabla de distribución bidimensional de doble entrada.
La distribución de frecuencias absoluta condicionada de la variable Y, cuando la otra
variable toma el valor de X i se expresa por: fY X =Xi está dada por la fila i de la tabla
de distribución bidimensional de doble entrada.

Ejemplo.
Un estudio realizado a 35 familias de un barrio nos interesa analizar el número de hijas
e hijos que tiene cada familia. La variable X indica el número de hijas y la variable Y, el
número de hijos. Construye una tabla simple y las distribuciones marginales.
Tabla simple

Distribuciones marginales

Distribuciones condicionales

Ejemplo 2. Establecer las distribuciones marginales de ambas variables

Califica y1 y2 y3 Total

Par A Par B Par C


x1 1 1 0 1 2
x2 2 2 1 4 7
x3 3 5 4 6 15
x4 4 10 11 8 29
x5 5 9 8 7 24
x6 6 6 8 6 20
x7 7 1 1 1 3
Total 34 33 33 100
Distribución Marginal de X Distribución Marginal de Y

Datos fi Datos fj
x1 2 y1 34
x2 7 y2 33
x3 15 y3 33
x4 Total 100
29
x5 24
x6 20
x7 3
Total 100

4.-MEDIA VARIANZA Y DESVIACIÓN TIPICA MARGINAL


las variables bidimensionales se definen de modo similar al caso de variables
unidimensionales
 
k k
fx j =1 j
f yj
Media Marginal: x = i =1 i i
, y =
n n
Varianza marginal de la variable x:
En una población En una muestra
n n

 f  (x )  f  (x )
2 2
i i
− x i i
−x
x2 = i =1
Sx 2 = i =1

N n −1
Donde:
fi : Frecuencia marginal de la fila i
x i : marca de clase o valor de x
x , x : media marginal de la variable x
n ó N : es el número total de datos
Varianza marginal de la variable y:
En una población En una muestra

( )  f  (y )
n 2 n 2
 fi  y j − y j j
−y
y2 = i =1
Sy 2 = i =1

N n −1
Donde:
fj : Frecuencia marginal de la columna j
y j : marca de clase o valor de y
y , y : media marginal de la variable y
n ó N : es el número total de datos
Se tienen formulas abreviadas para encontrar la varianza marginal:
En una población En una muestra
n k

 xi 2  fi x 2
i
 fi − nx 2
x2 = i =1
− x 2 S x2 = i =1

N n −1
n k

y j
2
 fj y 2
j
 fj − ny 2
y2 = i =1
− y 2 Sy2 = i =1

N n −1

Desviación Típica o estándar marginal

En una población En una muestra


n k

 xi 2  fi x 2
i
 fi − nx 2
x = i =1
− 2 Sx = i =1

N n −1
n k

 y j 2  fj y 2
j
 fj − ny 2
y = i =1
− 2 Sy = i =1

N n −1
5.-COVARIANZA
La covarianza es un valor que indica el grado de variación conjunta de dos variables
aleatorias respecto a sus medias
Fórmulas para datos no agrupados

En una población En una muestra

 xy =
 (x i
− x ) (y i
− y ) Sxy =
 (x i
−x )(y i
−y )
N n −1

Fórmula para datos agrupados

En una población En una muestra

)( )
k m k m

 fij  xi − x ( yi − y  f  (x ij i
−x )(y i
−y )
 xy = i =1 j =1
 xy = i =1 j =1

N n −1

Formulas abreviadas

En una población En una muestra


k m k m

 fij  xi  y j  f ij
 xi  y j − n  x  y
 xy = i =1 j =1
− x y Sxy = i =1 j =1

N n −1
Ejemplo 1. La siguiente tabla poblacional recoge las medidas de los pesos en kg y las
alturas en m de 20 estudiantes. Encuentra las medias y las varianzas y desviaciones
típicas de las variables estudiadas, así como la covarianza de ambas

N° de estudiantes 4 3 2 5 4 2

Peso X en kg 73 76 72 78 80 82

Altura Y en m 1,65 1,68 1,70 1,72 1,76 1,80

Solución

1° Media Marginal

 
k k
fx f yj 34,28
x = i =1 i i
 x = 1540 = 77 y = j =1 j
 y = = 1, 714
N 20 N 20
2° Varianza Marginal
n

x i
2
 fi
− x 2   x2 = 118770 − 77 ( )
2
x = 2 i =1
= 9.5
N 20
n

y j
2
 fj
58, 800
( )
2
y = 2 i =1
− y 2   y2 = − 1, 714 = 0, 002204
N 20
3° Desviación típica o estándar

 x = 9.5   x = 3.082

 y = 0, 002204   y = 0.0469

4° Covarianza
k m

 f ij
 xi  y j
 xy = i =1 j =1

N
− x y   xy =
2642,24
20
( )(
− 77 1, 714 = 0,134 )
6.- REPRESENTACION GRAFICA
Diagrama de dispersión o nube de puntos consiste en representar los puntos en un
plano cartesiano
Ejemplo. Realizar el diagrama de dispersión de los siguientes datos:

Matemática 5 6 2 9 4 5 1 3 7 7

Física 4 5 3 8 4 5 2 2 6 8

7.- INTERPRETACION DEL SIGNO DE LA COVARIANZA


✓ Cuando la relación entre las variables sigue una tendencia lineal positiva, la
mayoría de los puntos se encuentran en el primer grupo y por tanto la suma de
los productos de las diferencias es positiva. Luego, la covarianza es positiva.

✓ Si la relación entre las dos variables sigue una tendencia lineal negativa, la
covarianza será negativa. Esto sucede porque hay muchos más puntos en el
segundo grupo
✓ Cuando los puntos están distribuidos de forma pareja, la suma de los productos
negativos anula casi exactamente a la suma de productos positivos, por lo que
la covarianza será aproximadamente cero. Esto ocurre, por ejemplo, en
situaciones en las que no se observa ningún patrón claro entre las dos variables.

Por lo tanto, la covarianza puede usarse para analizar si la tendencia lineal entre dos
variables es positiva, negativa o no existe relación entre estas. Al realizar un gráfico de
dispersión de dos variables cuantitativas, estas pueden relacionarse de la siguiente
forma:
✓ Si las dos variables siguen una tendencia lineal positiva, la covarianza entre los
datos correspondientes a estas variables es positiva.
✓ Si las dos variables siguen una tendencia lineal negativa, la covarianza entre
los datos correspondientes a estas variables es negativa.
✓ Si las dos variables no siguen alguna tendencia o no están relacionadas de
forma lineal, la suma del producto de las diferencias será cercana a cero, por lo
que la covarianza será parecida a ese valor.
8.- EL INDICE DE PEARSON
Se llama coeficiente de correlación lineal de Pearson a un valor que mide la correlación
de tipo lineal que existe entre dos variables y se representa por la siguiente formula:
 xy
r =
x  y
El coeficiente de correlación nos proporciona información acerca del tipo de
correlación que existe entre las variables x e x. Dicha información nos la proporciona
dos hechos: el signo del coeficiente y su valor.
Signo:
✓ Si r  0 entonces la correlación es directa
✓ Si r  0 entonces la correlación es inversa
✓ Si r = 0 entonces No existe correlación entre las variables
Valor:
✓ Si r = −1 o r = 1 entonces la correlación lineal es perfecta; esto es la nube de
puntos está sobre una recta. (correlación funcional)
✓ Si −1  r  0 entonces la correlación es lineal negativa y será más fuerte
cuanto más cerca de -1 esté r.
✓ Si 0  r  1 entonces la correlación es lineal positiva y será más fuerte cuanto
más cerca de 1 esté r
✓ Si r = 0 entonces No existe correlación lineal. Esto no excluye que haya
correlación funcional
Ejemplo. La siguiente tabla poblacional recoge las medidas de los pesos en kg y las
alturas en m de 20 estudiantes. Encuentre el índice de Pearson, interprete el resultado
y realice un diagrama de dispersión

N° de estudiantes 4 3 2 5 4 2

Peso X en kg 73 76 72 78 80 82

Altura Y en m 1,65 1,68 1,70 1,72 1,76 1,80

 xy 0,134
r = = = 0, 93
 x   y ( 3.082 )( 0.0469 )

Este resultado indica que la correlación es lineal positiva como se evidencia en el


grafico

Ejemplo 2. En una encuesta realizada a una población se quiere investigar si existe una
relación entre las variables bidimensionales para esto se pide encontrar la covarianza
y el coeficiente de Pearson
✓ Horas de estudio vs. calificación: para ver si hay una relación entre el tiempo
que se estudia y el rendimiento en el examen.
✓ Tipo de colegio vs. calificación: se puedes comparar la calificación promedio
de los estudiantes de colegios particulares, fiscales y de convenio.
✓ Sexo vs. calificación: se puedes comparar el rendimiento promedio entre
estudiantes masculinos y femeninos.
✓ Edad vs. Calificación: Si las edades son variadas, puedes ver si la edad influye
en las calificaciones.

También podría gustarte