0% encontró este documento útil (0 votos)
31 vistas29 páginas

Asociación Lineal en Regresión Estadística

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
31 vistas29 páginas

Asociación Lineal en Regresión Estadística

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADISTICA GENERAL

ASOCIACION DE VARIABLES
REGRESION LINEAL
COEFICIENTE DE
CORRELACION
1

Mg. Edward I. Terrones Gálvez


2
ASOCIACION ENTRE DOS VARIABLES
1. Regresión lineal simple
El termino regresión fue originalmente utilizado por Francis Galton, para
indicar ciertas relaciones en la teoría de la herencia biológica.
Consiste en determinar una relación funcional (recta de regresión) entre
ellas, con el fin de que se pueda predecir el valor de una variable en base a
la otra.
ෝ = b0 + b1 x = a + bx
𝒚 : Regresión de “y” en “x” donde:
ෝ : Variable dependiente; variable que se desea explicar o predecir,
𝒚
también se le denomina regresando o variable respuesta.
x: Variable independiente; es la variable que supuestamente se conoce,
también se le denomina predictora o explicativa.
b0 ,a: Intercepto, ordenada en el origen o coeficiente de posición.
b1 ,b: Pendiente, coeficiente angular o coeficiente de regresión; nos
determina el ángulo de inclinación de la recta
3
Por ej: Deseamos predecir
el sueldo mensual(en soles)
en función a la experiencia
de un trabajador

Deseamos predecir el tiempo


de espera en una entidad bancaria
En función del numero de
Trabajadores que contratataron

4
Ejemplos de relaciones entre dos variables
➢¿Existe alguna relación entre entre la cantidad que
gasta una empresa en publicidad y sus ventas
mensuales?
➢¿Existe relación entre la reducción de precios y las
ventas?
➢¿Existe relación entre las horas trabajadas y la edad
en los trabajadores de una empresa?
➢¿Existe relación entre el numero de horas que
estudian los alumnos para un examen y la calificación
que obtiene?

5
Representación del coeficiente angular o pendiente

b1 >0 b1 <0 b1 =0

Ubicación del coeficiente de posición

b0 >0 b0=0 b0< 0

6
Método de mínimos cuadrados: La recta de mejor ajuste
σ 𝒙 ∗(σ 𝒚 )
σ 𝒙∗𝒚−
b1= Cov(x,y) = Sxy = ∑(xi - 𝒙ഥ)(yi - 𝒚ഥ) / (n-1) = b1= 𝒏
(σ 𝒙)
𝟐
σ 𝒙𝟐 −
∑(xi - 𝒙 ഥ)2 / (n-1) 𝒏

S2x S2x b0=ഥ𝒚 - b1 ഥ𝒙

Diagrama de dispersión o nube de puntos: Es la grafica de los


(x1, y1),(x2,y2),…(xn, yn), n valores de la variable bidimensional
(X,Y), observados en una muestra, en el sistema cartesiano.

7
2. Análisis de correlación: Coeficiente de correlación de Pearson
Fue propuesto por Carl Pearson y determina el grado de relación
que puede haber entre dos variables.
r= Cov(x,y) = Sxy = ∑(xi - 𝒙
ഥ)(yi - 𝒚
ഥ)
Sx Sy Sx Sy (n-1)* Sx Sy
Donde:
-1≤ r ≤ 1

8
Diagramas de dispersión con diferentes tipos de correlaciones

9
Coeficiente de determinación: Mide la proporción de la varianza
que queda explicada por la ecuación de regresión; o mide el
porcentaje de variabilidad en Y que puede explicarse a través del
conocimiento de la variable independiente.
r2=r*r donde: 0 ≤ r 2 ≤ 1
Cuanto mayor sea el valor de r 2, mejor será el ajuste y mas útil la
recta de regresión como instrumento de medición. Ej:
r 2 = 0.90: indica que de 100 pares de puntos, 90 están en la recta
de regresión y 10 fuera de la recta de regresión.

10
Ejercicio resuelto 1

11
a) Determinar la relación entre las variables usando la grafica adecuada
b) Determinar la ecuación de la recta
c) Estimar las ventas trimestrales de un restaurante cuando la población sea de 16000
estudiantes
d) Determinar el grado de relación entre las variables
e) Determinar el % de varianza de las ventas que es explicada por el tamaño de población

SOL
a)

12
b) Y=a + bX =b0 + b1X

13
c) Estimar las ventas trimestrales de un restaurante cuando la población sea de
16000 estudiantes
Se pide: Estimar “y”, cuando x=16 =>𝑦ො = 60 + 5 16 = 140
d) Determinar el grado de relación entre las variables
r = 2840 => r= 0.95016
9*(7.944)*(41.806)
Por lo tanto existe una relación alta positiva entre el tamaño de población
estudiantil y las ventas trimestrales
e) Determinar el % de varianza de las ventas que es explicada por el tamaño de
población
r2 =0.95016*0.95016 => r2=0.90280 =90.280%
El 90.280% de la variabilidad en las ventas se explica por la relación lineal que
existe entre el tamaño de la población de estudiantes y las ventas
14
Ejercicio resuelto 2

Numero de llamdas de ventas y


copiadoras vendidas

15
a) Determinar la relación entre las variables usando la grafica adecuada
b) Determinar la ecuación de la recta
c) Estimar la cantidad de copiadoras vendidas si se realizan 100 llamadas de ventas
d) Determinar el grado de relación entre las variables
e) Determinar el % de varianza de la cantidad de copiadoras vendidas que es explicada
por el numero de llamadas.

SOL Diagrama de dispersión que


representa las llamadas de ventas
y las copiadoras vendidas
a)

16
b) Y=a + bX =b0 + b1X 𝑥ҧ =
𝛴𝑥𝑖
𝑛
=
𝟏440
15
=96

X Y 𝛴𝑦𝑖 675
𝑦ത = = = 45
Represent Nro de Nro de 𝑥𝑖 𝑥ҧ 𝑦𝑖 𝑦ത (𝑥𝑖 𝑥ҧ)(𝑦𝑖 𝑦 ) (𝑥𝑖 𝑥ഥ) (𝑦𝑖 𝑦ത) 𝑛 15
antes llamadas copiadoras

Brian Virost 96 41 0 -4 0 0 16
Carlos Ramírez 40 41 -56 -4 224 3136 16
Carol Saia 104 51 8 6 48 64 36
Greg Fish 128 60 32 15 480 1024 225
Jeff Hall 164 61 68 16 1088 4624 256
Mark Reynolds 76 29 -20 -16 320 400 256 b1=6672/25600
Meryl Rumsey 72 39 -24 -6 144 576 36 b1=0.260625
Mike Kiel 80 50 -16 5 -80 256 25
Ray Snarsky 36 28 -60 -17 1020 3600 289 b0=45-(0.260625)*96
Rich Niles 84 43 -12 -2 24 144 4 b0= 19.98
Ron Broderick 180 70 84 25 2100 7056 625
Sal Spina 132 56 36 11 396 1296 121
Soni Jones 120 45 24 0 0 576 0
Susan Welch 44 31 -52 -14 728 2704 196
Tom Keller 84 30 -12 -15 180 144 225
Total 1440 675 6672 25600 2326

Por lo tanto
𝑦ො = 𝑏0 + 𝑏1 𝑥 ⇒ 𝑦ො = 𝟏𝟗. 𝟗𝟖 + 𝟎. 𝟐𝟔𝟎𝟔𝟐𝟓𝑿 17
c) Estimar la cantidad de copiadoras vendidas si se realizan 100 llamadas de
ventas
Se pide: Estimar “y”, cuando x=100 =>𝑦ො = 19.98 + 0. 606 5 100 = 46.04 5
d) Determinar el grado de relación entre las variables
r = 6672 => r= 0.8646
14*(42.762)*(12.89)
Por lo tanto existe una relación alta positiva entre el numero de llamadas de
ventas y la cantidad de copiadoras vendidas
e) Determinar el % de varianza de la cantidad de copiadoras vendidas que es
explicada por el numero de llamadas
r2 =0.8646*0.8646 => r2=0.7476 =74.76%
El 74.76% de la variabilidad en las ventas de copiadoras se explica por la relación
lineal que existe entre el numero de llamadas y las ventas de las copiadoras
18
EJERCICIOS A
DESARROLLAR

19
Se realizó una investigacion por muestreo a 10 empresas
Ejercicio 1 : que producen un determinado producto, en cuanto al
valor de la produccion(miles de soles) y el costo del
mismo(miles de soles).Los resultaron fueron:

a) Determinar gráficamente la relación entre las dos


variables
b) Determinar la ecuación de la recta
c) Estimar los costos para una empresa que tiene en
producción en 32(miles soles)
d) Determinar el grado de relación entre las variables
e) ¿Qué % de variabilidad de la variable Y es
explicada por la variable X

20
Ejercicio 2: Al observar el umero de sucursales y los costos
mensuales en comunicacion telefonica con la casa
central, en miles de soles, para 12 empresas se
encontro:

a) Determinar gráficamente la relación entre las dos variables


b) Determinar la ecuación de la recta
c) Estimar los costos mensuales para una empresa que tiene 7 sucursales
d) Determinar el grado de relación entre las variables
e) ¿Qué % de variabilidad de la variable Y es explicada por la variable X

21
Ejercicio 3:

22
EJERCICIO 4:

23
EJERCICIO 5:

24
Estadística

REGRESION LINEAL SIMPLE

Ejercicios 6: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm)
i xi yi
y=talla / x=edad / n=14
1 3 55
2 6 68
14
3
4
5
5
64
66  yi = 956 y = 68,3 s y = 5,6
i =1
5 3 62 14
6 4 65
 xi = 84 x = 6 sx = 2
7 9 74 i =1
8 8 75
9 9 73 cov( x, y ) = 9,07 rxy = 0,88
10 7 69 14 14
11 6 73  xi y i = 5863  xi2 = 556
12 5 68 i =1 i =1
13 8 73
14 6 71 25
Ejercicios 7: : Se ha efectuado un estudio donde se relacionan los puntajes
de aptitud con la productividad en una industria. Después de 3 meses de
entrenamiento del personal sus postulantes elegidos al azar obtuvieron los
diez pares de puntajes y productividad que se indican a continuación.
Determinar:
a) Graficar la relación entre las dos variables.
b) La ecuación de la recta Puntaje Produc
de tividad
c) ¿Cuál es la productividad esperada de un aptitud
9 23
trabajador, cuyo puntaje de aptitud fue de 18. 17 35
20 29
d) Calcular el puntaje de aptitud de un
19 33
postulante cuando la productividad es de 36 20 43
23 32
e) Calcula e interpreta el coeficiente de correlación. 15 30
25 40
f)Que % de variabilidad de la productividad es 28 45
30 38
explicada por los puntajes de aptitud 26
Ejercicios 8: los ingresos y los gastos mensuales en soles de una muestra de
100 familias, han dado las siguientes resultados:
𝑥ҧ = 210 , 𝑦ത =200 , S2x =5.76 , S2y =2.56 , ∑xy=4200364
a) Determinar la regresión de “y” en “x”
b) Estime el gasto de una familia que tiene 250 soles de ingreso.

Ejercicios 9: El coeficiente de correlación entre dos variables X e Y es r= 0.60. Si Sx =


1.50 , Sy= 2 , 𝑥ҧ = 1 0 , 𝑦=ത 2 0 , hallar la recta de regresión

Ejercicios 10: En una tabla de frecuencias correspondientes a 20 parejas, se


obtuvo la siguiente información:
ΣX = 174 ; ΣX2 = 1626 ; ΣY = 340 ; ΣY2 = 5904 ; ΣXY = 3062
a) Hallar la recta de regresión lineal de Y en X
b) Calcular e interpretar el coeficiente de Pearson
c) Qué % de la variabilidad de Y es explicada por X?
27
Ejercicios11: Al estudiar la relación entre la edad y el índice de masa
corporal a partir de una muestra de una muestra de hombres se obtuvo:
𝑆𝑋 = 8.5 , 𝑆𝑌 = 10 , 𝑋ത = 50 , 𝑌ത = 1 0 , 𝑟 2 = 0.90
a) Determine la recta de regresión
b) Estime el índice de masa corporal para un hombre de 40 años
c) Calcular la edad cuando su índice de masa corporal se estima en 25.8
d) Calcular e interpretar el coeficiente de correlación

Ejercicios 12: Al estudiar la regresión lineal entre los ingresos mensuales y


el número de hijos por familia, se obtuvo la siguiente la información:
• 𝑥ҧ = 3 ; 𝑦ത = 900 ; 𝑆𝑋 = 0.05 𝑥 𝑆𝑋𝑌 , 𝑆𝑌 = 0.5
a) Determinar la ecuación de la recta de la regresión
b)Estimar los ingresos de las familias con 4 hijos
c) ¿A cuántos hijos por familia correspondería un ingreso estimado de 750
soles 28
29

También podría gustarte