0% encontró este documento útil (0 votos)
167 vistas56 páginas

Regresión Simple

Este documento presenta la asignatura Estadística II impartida en el Instituto Tecnológico de Saltillo. Introduce los conceptos básicos de regresión lineal simple y múltiple, análisis de series de tiempo y diseño de experimentos. El objetivo es desarrollar la capacidad de realizar estos análisis estadísticos para resolver problemas en la ingeniería de gestión empresarial. El programa incluye unidades sobre regresión, diseño experimental de un factor y bloques al azar, y cuadro latino.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
167 vistas56 páginas

Regresión Simple

Este documento presenta la asignatura Estadística II impartida en el Instituto Tecnológico de Saltillo. Introduce los conceptos básicos de regresión lineal simple y múltiple, análisis de series de tiempo y diseño de experimentos. El objetivo es desarrollar la capacidad de realizar estos análisis estadísticos para resolver problemas en la ingeniería de gestión empresarial. El programa incluye unidades sobre regresión, diseño experimental de un factor y bloques al azar, y cuadro latino.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

INSTITUTO

TECNOLÓGICO DE
SALTILLO

ESTADÍSTICA II
M.C. Paola Cabrera Silveyra
INTRODUCCIÓN

 Esta asignatura aporta al perfil del Ingeniero en Gestión Empresarial la capacidad de


realizar análisis de regresión simple y múltiple, análisis de serie de tiempo y diseño de
experimentos en los diferentes ámbitos del quehacer empresarial. Se ha hecho una
mención especial en el desarrollo de experimentos aplicados a la industria que permitirán
mejorar la calidad de los productos y procesos.

 Muy importante será el poder identificar los diferentes factores que podrían resultar
relevantes en el desarrollo de nuevos productos y de nuevas tecnologías; así como la
importancia que tiene el análisis de regresión en identificar las variables explicitarías para
estimar las variables dependientes.
COMPETENCIAS ESPECÍFICAS

 Explicar la relación entre variables dependientes e independientes relacionados en problemas de la


ingeniería en gestión empresarial que permitan explicar el significado entre dichas variables.

 Aplicar los diferentes métodos de regresión al estudio de series de tiempo para predecir el
comportamiento de variables económicas y de ingeniería Presentar los conceptos fundamentales del
diseño de experimentos que permitan mejorar la calidad de los procesos de producción e ingeniería y
aplicarlos a situaciones del mundo real.
COMPETENCIAS GENÉRICAS
 Capacidad de análisis y síntesis.  Capacidad crítica y autocrítica.
 Capacidad de organizar y planificar.  Trabajo en equipo.
 Conocimientos básicos de la  Capacidad de aplicar los
carrera. conocimientos en la práctica.
 Comunicación oral y escrita.  Habilidades de investigación.
 Habilidades básicas de manejo de la  Capacidad de aprender.
computadora.  Capacidad de generar nuevas ideas
 Habilidad para buscar y analizar (creatividad)
información proveniente de fuentes  Habilidad para trabajar en forma
diversas.
autónoma
 Solución de problemas.  Búsqueda del logro
 Toma de decisiones.
PROGRAMA

 1. Regresión lineal simple / Regresión Múltiple y


correlación

 2. Diseño experimental para un factor UNIDADES DE


APRENDIZAJE

 3. Diseño experimental de bloques al azar

 4. Diseño cuadro latino


Material Requerido

 Cuaderno cuadrícula
 Calculadora científica
 Regla
 Paquete estadístico (MINITAB vers.
17 -19, EXCEL)
BIBLIOGRAFÍA SUGERIDA
 Baird, D. C., Experimentación, Prentice-Hall Hispanoamericana, S. A.
 Lawson, John, Jose L. Madrigal & John Erjavec, Estrategias experimentales para el mejoramiento de la
Calidad en la Industria, Grupo Editorial Iberoamérica S. A. de C.
 Montgomery, Douglas C., Diseño y Análisis de Experimentos, Grupo Editorial Iberoamérica S. A. de C.
 Canavos, George C., Probabilidad y Estadística, Aplicaciones y Métodos, Grupo Editorial Iberoamérica.
 Yamane, Taro, “Estadística”, Harla, S.A.
 Shao, Stephen P., Estadística para Economistas y Administradores de Empresas, Herrero Hermanos, Sucs.,
S.A.
 Juran, J.M. & Frank M. Gryna, Manual de Control de Calidad, McGraw-Hill, Vol. I y II. 8. Draper, N.R. &
H. Smith, Applied Regression Analysis, John Wiley & Sons.
 Levin I. Richard Estadistica para administadores. Ed: Prentice-Hall.
 Kazmier. Estadistica aplicada apara la Administracion y Economia. Ed.: McGraw Hill.
 Walphole. Probabilidad y Estadistica. Ed. McGraw Hill.
 John E. Freund A. Simon. Estadistica elemental. Ed: Prentice-Hall.
UNIDAD 1.
Tarea 1. Conceptos básicos
Consulta en tu cuaderno los siguientes conceptos utilizando fuentes bibliográficas confiables. Al final de la
consulta, escribe las referencias empleadas.

 Estadística  Regresión lineal simple  Hipótesis


 Estadística Descriptiva  Modelo de regresión y sus  Hipótesis nula y alternativa
elementos
 Estadística Inferencial  Análisis de varianzas
 Diagrama de dispersión (ANOVA)
 5 Ejemplos de aplicaciones
de la estadística inferencial  Relación positiva
 Variable  Relación negativa
 Clasificación de variables  Método de mínimos
cuadrados
 Variable independiente Entrega .
 Coeficiente de correlación y
 Variable dependiente su fórmula
 Población  Coeficiente de determinación
 Muestra y su fórmula
Estadística

 La estadística puede ser mirada como el estudio de las poblaciones, como el estudio de la
variación, y como el estudio de métodos de reducción de datos.
Fisher (1958)

 Es el arte de aprender a partir de los datos. Está relacionada con la recopilación de datos,
su descripción subsiguiente, y su análisis. Lo que nos lleva a extraer conclusiones.
Sheldon M. Ross (2007)

 Conjunto de técnicas y teorías que permiten la recolección, organización y análisis de


datos. Ma. Teresa González (2012)
Estadística Descriptiva Estadística Inferencial

Comprende aquellos métodos y técnicas usadas para


Comprende aquellos métodos usados para organizar y
hacer generalizaciones, predicciones, o estimaciones
describir la información recabada.
sobre poblaciones a partir de una muestra.

Trabaja con muestras Trabaja con poblaciones

Usa estadísticos Usa parámetros


Población y muestra

 Población: Es el total de la
información de los objetos de
interés para un estadístico en
una investigación particular.
 Muestra: Cualquier subgrupo
de la población.
Parámetro y estadístico
Estadística Descriptiva

 Medidas de tendencia central:


media, mediana y moda
 Medidas de dispersión:
Varianza, desviación estándar, rango, Coeficiente de variación y coeficiente de dispersión.
 Medidas de posición:
Deciles, Cuartiles, Percentiles
 Medidas de forma:
Curtosis, Asimetría
Ejercicios de medidas de tendencia central y
dispersión

 Datos simples
 Datos agrupados
 Histograma y Polígono
Situación Problemática
¿Será que se puede determinar la estatura de una persona si se
conoce su edad?
Planificar la obtención de los datos

 Preguntas:

 ¿Cuántas variables hay en la situación problemática a resolver y cuáles son las variables en
estudio?
 ¿Cuál será la unidad de medida a utilizar?
 ¿Cuál será la herramienta de medida a utilizar?
 ¿Cómo se tomarán las medidas?
 ¿Dónde y cómo se realizará la recolección de datos?
Establecimiento de parámetros

 Medida de la estatura:
 La medida de la estatura se toma sin el uso de los
zapatos, para obtener una medida precisa de la
persona, se realizan marcas de 150, 160, 170 y 180cm
en una determinada pared, con el fin de obtener
medidas de referencia y evitar alterar la medida al
mover el metro1 ver figura 1.

Figura 1
 La medida del brazo se realizó como muestra la figura 2. Parte b.

Figura 2
Organización de los datos

 En esta tabla se identifica que el primer par de observaciones ( indica que la primera
persona tiene una extensión de brazo 72 cm y su estatura corresponde a 172 cm.
Análisis Descriptivo

Preguntas:
 ¿Qué análisis descriptivo se puede realizar?
 ¿Qué tipo de variable tenemos en el estudio?
 ¿Cómo se puede lograr una mejor visualización de los datos recolectados para cada
variable?
INTRODUCCIÓN A REGRESIÓN LINEAL
SIMPLE
 Consultar concepto de :
 Hipótesis
 Tipos de hipótesis
 Variable dependiente
 Variable independiente
 Regresión Lineal simple
 Qué es el modelo de Regresión lineal simple
 Para que se usa
 Cual es procedimiento para obtenerla

 Análisis de Correlación
 Qué es
 Para que se utiliza
 Coeficiente de determinación
 Coeficiente de correlación
Regresión Lineal Simple

• Es una técnica que permite cuantificar la relación entre variables.

• El establecimiento de una correlación entre dos variables es


importante, pero esto se considera un primer paso para predecir
una variable a partir de la otra. (U otras, en el caso de la regresión
múltiple.)

• Claro está, si sabemos que la variable X está muy relacionada con Y,


ello quiere decir que podemos predecir Y a partir de X. Estamos ya
en el terreno de la predicción. (Evidentemente si, X no está
relacionada con Y, X no sirve como predictor de Y.)
Variables
 Variable dependiente (Y) Variable de respuesta
 Es el fenómeno o situación explicado
 Es la variable que es afectada por la presencia o acción de la variable independiente
 Se llama también de efecto o acción condicionada
 Utilizada para describir o medir el problema estudiado

 Variable independiente (X) Variable de predicción


 Explica, condiciona, o determina el cambio en los valores de la variable dependiente
 Se le llama también causal o experimental porque es manipulada por el investigador
 Se utiliza para describir o medir los factores que se supone son la causa o influyen en el problema
Ejemplo:
 La relación entre fumar y el cáncer del pulmón
 “tener cáncer de pulmón”( con los valores sí, no) sería la variable
dependiente
 y “fumar” (varía entre no fumar a fumar más de tres cajetillas por día)
sería la variable independiente
Ejercicio: Clasificación de variables
Variables
Ingesta de grasa Tiempo de digestión
Edad Estatura
Velocidad Fuerza del choque
Ventas No. de familias
Temperatura Tiempo de cocción
Horas de estudio Calificaciones
Largo del brazo Estatura
RPM Desgaste de una pieza
Monto de seguro de vida alcanzado Salario anual del docente
No. de pinos por acre Altura de pinos en 15 años
Tipo de motor Rendimiento de gasolina
No. de egreso Calidad de la educación
Diagrama de dispersión

 Es posible representar las observaciones mediante un gráfico de


dispersión.

Nube de datos

Diagrama de Dispersión
GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
población, el diagrama de dispersión es simplemente un gráfico de
dos dimensiones, donde en un eje (la abscisa) se sitúa una
variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si
las variables están correlacionadas, el gráfico mostraría algún nivel
de correlación (tendencia) entre las dos variables. Si no hay
ninguna correlación, el gráfico presentaría una figura sin forma,
una nube de puntos dispersos en el gráfico.

Asociación
positiva. Si
aumenta X
aumenta Y

Estadística
Económica 2007-
2008. Sara Mateo.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.

y = a + bx
Recta de regresión Pendiente

yn
yn 1 yˆi
y3
u3 ui
yi
y1 yi
y2

Intercepto
x1 x2 x3 xi xn 1 xn

yi  a  bxi  ui ui  yi  yˆi
Error
Modelo de Regresión lineal simple
EJEMPLO
Regresión Lineal Simple a mano
4. Sustituye en la fórmula

  294- (39)(42)
1. Datos 2. Memoria de datos 6
B1= =21/35.5 = 0.59
-------------------
XHrs YMiles Casos X Y X² Y² XY   (39)²
289-
5 6 1 5 6 25 36 30   6
2 9 11 81 121 99
9 11
3 10 6 100 36 60 Bo= 42-(0.59 )(39)
10 6 =3.16
4 3 4 9 16 12 6
3 4 5 6 25 36 30
5
5 6 6 7 9 49 81 63
7 9 Totales ∑ 39 42 289 326 294

5. Construye ecuación de regresión (Línea de


3. Fórmula para obtener coeficientes mejor ajuste)
  ∑x∑y
Y= Bo+B1(x) ∑xy -
B1=
n Y= 3.16+0.59(x)
-------------------- Bo= ∑y- B1 ∑x
  (∑x)²
∑x² -
  n n
6. Fórmula para el cálculo del coeficiente de Correlación de Pearson r

n∑xy-∑x∑y
--------------------------------------------
r=
[n∑x²-(∑x)²]- [n∑y²-(∑y)²]

7. Se sustituye en la fórmula usando los resultados de la memoria de datos


Casos X Y X² Y² XY
8. Criterios para interpretar r
1 5 6 25 36 30
9 11 81 121 99 Relación débil 0-0.40
2
3 10 6 100 36 60 Relación medianamente
3 4 9 16 12 fuerte 0.40-0.60
4
5 6 25 36 30 Relación fuerte 0.60-1
5
6 7 9 49 81 63
Totales ∑ 39 42 289 326 294

6(294)-(39)(42) De acuerdo al estadístico de prueba r se observa


-------------------------------------- una correlación fuerte (r=0.62) entre las variables
r= = 0.62
X y Y.
[(6)(289)-(39)²] - [(6)(326)-(42)²]
9. Cálculo del Coeficiente de determinación R²
r= 0.62
R²= r² R²= (0.62)²
R²= 0.38 = 38%

Modelo poco confiable 0- 40%

Modelo medianamente
confiable 40%-60%
Modelo confiable 60-100%

De acuerdo al estadístico de prueba R² se observa un modelo


poco confiable (R²=38%) para hacer estimaciones.

A través del estadístico de prueba Coeficiente de


determinación se observa que el R² =38% de Y está
determinado por el efecto de X.
Prueba de hipótesis para Regresión Lineal Simple
ANOVA
1. Planteamiento de Hipótesis

Ho: B1= 0 X Y
Ha: B1≠ 0 5 6
9 11
2. ANOVA
10 6
3 4
5 6
7 9
SCT SCR SCE

SCT SCR
(6 –7)²=1 Y=3.16+0.59(5)= (6.11-7)² = 0.7921
(11–7)²=16 Y=3.16+0.59(9)= ( 8.47-7)² =2.1609
(6–7)²=1 = Y=3.16+0.59(10)= ( 9.06-7)² =4.2436
(4–7)²=9 Y=3.16+0.59(3)= (4.93-7)² = 4.2849
(6–7)²=1 Y=3.16+0.59(5)= ( 6.11-7)² =0.7921
(9–7)²=4 Y=3.16+0.59(7)= ( 7.29-7)² =0.0841
∑ 32 ∑12.35
2. ANOVA

Fuente de Variación SC GL CM F
SCR K-1 SCR/g.l .R CMR/CME
Regresión 12.42 1 12.42 2.53

SCE (g.l.T –g.l.R) SCE/g.l .E


Error 19.58 4 4.895

SCT n-1
Total 32 5

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 1 12.4225 12.4225 2.54 0.186
X 1 12.4225 12.4225 2.54 0.186
Error 4 19.5775 4.8944
Lack-of-Fit 3 19.5775 6.5258 * *
Pure Error 1 0.0000 0.0000
Total 5 32.0000
Distribution Plot
F, df1=1, df2=4 R² = 38%

0.20
Se Acepta Ho
Ho: B1= 0
0.15 Ha: B1≠ 0
Density

0.10
Acepto Rechazo

0.05

F tablas
0.05
0.00
0 2.53 7.709
F calculado X
Conclusión

 De acuerdo al estadístico de prueba F de Fisher, se concluye que el


F calculado (2. 53) es menor al F de tablas (7.709) por lo que se
acepta Ho.
 Esto significa que no hay evidencia estadística significativa para
asegurar que existe una relación entre horas laboradas y el salario de
los trabajadores.
Ejercicio 1

 La agencia de protección del ambiente (EPA, por sus siglas en inglés) proporcionó la información
descrita a continuación, que compara el tamaño del motor en pulgadas cúbicas de desplazamiento
(cubic inches of displacement; CID, por sus siglas en inglés), y las millas por galón (MPG) estimadas
para ocho modelos representativos de automóviles subcompactos modelo 1984.

AUTOMOVIL

CHEVROLET CAVALIER 121 30

DATSON NISSAN STANZA 120 31

DODGE OMNI 97 34

FORD ESCORT 98 27

MAZDA 626 122 29

PLYMOUTH HORIZON 97 34

RENAULT ALIANCE / ENCORE 85 38

TOYOTA COROLLA 122 32

CID Tamaño del


MPG
motor
Ejercicio 2:
 Se midió la altura (en centímetros) y el peso (en kilogramos) de treinta chicas de
12 años de Holland Middle School de Michigan. Estudiar estos datos y la relación
entre ambas variables.
Ejercicio 3:

 En la tabla adjunta se presentan el número de páginas y el precio de doce libros técnicos:


Obtener

 Diagrama de dispersión
 Ecuación de regresión
 Graficar la línea de mejor ajuste
DISEÑO DE
EXPERIMENTOS
Introducción
El diseño de experimentos que ver con una etapa de la Investigación
 MARCO METODOLÓGICO
 1. Enfoque del estudio (cualitativa/ cuantitativo)
 2. Tipo de estudio (exploratorio, descriptivo, correlacional, experimental)
 3. Diseños de Investigación (No experimentales/ experimentales)
 4. sujetos del estudio
 5. Recogida de datos
 6. Análisis de datos
Diseños No
Experimentales

Descriptivos Correlacional

Una o más variables analizadas de Dos o más variables buscando su


forma independiente relación

TRANSACCIONAL LONGITUDINAL
Diseños
experimentales

Pre experimental
Cuasi experimental Experimental

Quedan por controlar Existe un control máximo de


No se modifica el fenómeno de variables extrañas todas las variables extrañas
estudio. Actitud pasiva. significativas más significativas.
DISEÑO DE EXPERIMENTOS

 El diseño de experimentos es el plan, la estructura y la estrategia de una


investigación cuyo objetivo es dar respuesta a ciertas preguntas y controlar la
varianza

 Son modelos estadísticos clásicos cuyo objetivo es averiguar si unos


determinados factores influyen en una variable de interés y, si existe influencia de
algún factor, cuantificar dicha influencia.

 Situaciones artificiales que genera el investigador .


DISEÑO DE EXPERIMENTOS

 La metodología del diseño de experimentos se basa en la experimentación.


 Es sabido que si se repite un experimento, en condiciones indistinguibles, los
resultados presentan una cierta variabilidad.
 Si la experimentación se realiza en un laboratorio donde la mayoría de las causas
de variabilidad están muy controladas, el error experimental será pequeño y
habrá poca variación en los resultados del experimento.
 Pero si se experimenta en procesos industriales o administrativos la variabilidad
será mayor en la mayoría de los casos.
DISEÑO DE EXPERIMENTOS

 El objetivo del diseño de experimentos es estudiar si cuando se utiliza un


determinado tratamiento se produce una mejora en el proceso o no.

 Para ello se debe experimentar aplicando el tratamiento y no aplicándolo.

 Si la variabilidad experimental es grande, sólo se detectará la influencia del uso


del tratamiento cuando éste produzca grandes cambios en relación con el error de
observación.
VARIABLE DEPOENDIENTE:
CRECIMIENTO

VARIABLE INDEPENDIENTE:
AGUA, LUZ, ETC.
Requisitos para el diseño de experimentos:

 MANIPULACIÓN DE VARIABLES (Independientes)


 Ausencia/ presencia: Con luz o sin luz/ con agua o sin agua
 Intensidad: semanalmente, diariamente
 Modalidad: agua destilada, dulce, salada, etc..
 MEDICIÓN DE LA VARIABLE DEPENDIENTE (Respuesta)
 El efecto
 COMPARACIÓN (Comparar grupos)
 Grupo experimental
 Grupo control
Diseño general de Experimento

También podría gustarte