INSTITUTO
TECNOLÓGICO DE
SALTILLO
ESTADÍSTICA II
M.C. Paola Cabrera Silveyra
INTRODUCCIÓN
Esta asignatura aporta al perfil del Ingeniero en Gestión Empresarial la capacidad de
realizar análisis de regresión simple y múltiple, análisis de serie de tiempo y diseño de
experimentos en los diferentes ámbitos del quehacer empresarial. Se ha hecho una
mención especial en el desarrollo de experimentos aplicados a la industria que permitirán
mejorar la calidad de los productos y procesos.
Muy importante será el poder identificar los diferentes factores que podrían resultar
relevantes en el desarrollo de nuevos productos y de nuevas tecnologías; así como la
importancia que tiene el análisis de regresión en identificar las variables explicitarías para
estimar las variables dependientes.
COMPETENCIAS ESPECÍFICAS
Explicar la relación entre variables dependientes e independientes relacionados en problemas de la
ingeniería en gestión empresarial que permitan explicar el significado entre dichas variables.
Aplicar los diferentes métodos de regresión al estudio de series de tiempo para predecir el
comportamiento de variables económicas y de ingeniería Presentar los conceptos fundamentales del
diseño de experimentos que permitan mejorar la calidad de los procesos de producción e ingeniería y
aplicarlos a situaciones del mundo real.
COMPETENCIAS GENÉRICAS
Capacidad de análisis y síntesis. Capacidad crítica y autocrítica.
Capacidad de organizar y planificar. Trabajo en equipo.
Conocimientos básicos de la Capacidad de aplicar los
carrera. conocimientos en la práctica.
Comunicación oral y escrita. Habilidades de investigación.
Habilidades básicas de manejo de la Capacidad de aprender.
computadora. Capacidad de generar nuevas ideas
Habilidad para buscar y analizar (creatividad)
información proveniente de fuentes Habilidad para trabajar en forma
diversas.
autónoma
Solución de problemas. Búsqueda del logro
Toma de decisiones.
PROGRAMA
1. Regresión lineal simple / Regresión Múltiple y
correlación
2. Diseño experimental para un factor UNIDADES DE
APRENDIZAJE
3. Diseño experimental de bloques al azar
4. Diseño cuadro latino
Material Requerido
Cuaderno cuadrícula
Calculadora científica
Regla
Paquete estadístico (MINITAB vers.
17 -19, EXCEL)
BIBLIOGRAFÍA SUGERIDA
Baird, D. C., Experimentación, Prentice-Hall Hispanoamericana, S. A.
Lawson, John, Jose L. Madrigal & John Erjavec, Estrategias experimentales para el mejoramiento de la
Calidad en la Industria, Grupo Editorial Iberoamérica S. A. de C.
Montgomery, Douglas C., Diseño y Análisis de Experimentos, Grupo Editorial Iberoamérica S. A. de C.
Canavos, George C., Probabilidad y Estadística, Aplicaciones y Métodos, Grupo Editorial Iberoamérica.
Yamane, Taro, “Estadística”, Harla, S.A.
Shao, Stephen P., Estadística para Economistas y Administradores de Empresas, Herrero Hermanos, Sucs.,
S.A.
Juran, J.M. & Frank M. Gryna, Manual de Control de Calidad, McGraw-Hill, Vol. I y II. 8. Draper, N.R. &
H. Smith, Applied Regression Analysis, John Wiley & Sons.
Levin I. Richard Estadistica para administadores. Ed: Prentice-Hall.
Kazmier. Estadistica aplicada apara la Administracion y Economia. Ed.: McGraw Hill.
Walphole. Probabilidad y Estadistica. Ed. McGraw Hill.
John E. Freund A. Simon. Estadistica elemental. Ed: Prentice-Hall.
UNIDAD 1.
Tarea 1. Conceptos básicos
Consulta en tu cuaderno los siguientes conceptos utilizando fuentes bibliográficas confiables. Al final de la
consulta, escribe las referencias empleadas.
Estadística Regresión lineal simple Hipótesis
Estadística Descriptiva Modelo de regresión y sus Hipótesis nula y alternativa
elementos
Estadística Inferencial Análisis de varianzas
Diagrama de dispersión (ANOVA)
5 Ejemplos de aplicaciones
de la estadística inferencial Relación positiva
Variable Relación negativa
Clasificación de variables Método de mínimos
cuadrados
Variable independiente Entrega .
Coeficiente de correlación y
Variable dependiente su fórmula
Población Coeficiente de determinación
Muestra y su fórmula
Estadística
La estadística puede ser mirada como el estudio de las poblaciones, como el estudio de la
variación, y como el estudio de métodos de reducción de datos.
Fisher (1958)
Es el arte de aprender a partir de los datos. Está relacionada con la recopilación de datos,
su descripción subsiguiente, y su análisis. Lo que nos lleva a extraer conclusiones.
Sheldon M. Ross (2007)
Conjunto de técnicas y teorías que permiten la recolección, organización y análisis de
datos. Ma. Teresa González (2012)
Estadística Descriptiva Estadística Inferencial
Comprende aquellos métodos y técnicas usadas para
Comprende aquellos métodos usados para organizar y
hacer generalizaciones, predicciones, o estimaciones
describir la información recabada.
sobre poblaciones a partir de una muestra.
Trabaja con muestras Trabaja con poblaciones
Usa estadísticos Usa parámetros
Población y muestra
Población: Es el total de la
información de los objetos de
interés para un estadístico en
una investigación particular.
Muestra: Cualquier subgrupo
de la población.
Parámetro y estadístico
Estadística Descriptiva
Medidas de tendencia central:
media, mediana y moda
Medidas de dispersión:
Varianza, desviación estándar, rango, Coeficiente de variación y coeficiente de dispersión.
Medidas de posición:
Deciles, Cuartiles, Percentiles
Medidas de forma:
Curtosis, Asimetría
Ejercicios de medidas de tendencia central y
dispersión
Datos simples
Datos agrupados
Histograma y Polígono
Situación Problemática
¿Será que se puede determinar la estatura de una persona si se
conoce su edad?
Planificar la obtención de los datos
Preguntas:
¿Cuántas variables hay en la situación problemática a resolver y cuáles son las variables en
estudio?
¿Cuál será la unidad de medida a utilizar?
¿Cuál será la herramienta de medida a utilizar?
¿Cómo se tomarán las medidas?
¿Dónde y cómo se realizará la recolección de datos?
Establecimiento de parámetros
Medida de la estatura:
La medida de la estatura se toma sin el uso de los
zapatos, para obtener una medida precisa de la
persona, se realizan marcas de 150, 160, 170 y 180cm
en una determinada pared, con el fin de obtener
medidas de referencia y evitar alterar la medida al
mover el metro1 ver figura 1.
Figura 1
La medida del brazo se realizó como muestra la figura 2. Parte b.
Figura 2
Organización de los datos
En esta tabla se identifica que el primer par de observaciones ( indica que la primera
persona tiene una extensión de brazo 72 cm y su estatura corresponde a 172 cm.
Análisis Descriptivo
Preguntas:
¿Qué análisis descriptivo se puede realizar?
¿Qué tipo de variable tenemos en el estudio?
¿Cómo se puede lograr una mejor visualización de los datos recolectados para cada
variable?
INTRODUCCIÓN A REGRESIÓN LINEAL
SIMPLE
Consultar concepto de :
Hipótesis
Tipos de hipótesis
Variable dependiente
Variable independiente
Regresión Lineal simple
Qué es el modelo de Regresión lineal simple
Para que se usa
Cual es procedimiento para obtenerla
Análisis de Correlación
Qué es
Para que se utiliza
Coeficiente de determinación
Coeficiente de correlación
Regresión Lineal Simple
• Es una técnica que permite cuantificar la relación entre variables.
• El establecimiento de una correlación entre dos variables es
importante, pero esto se considera un primer paso para predecir
una variable a partir de la otra. (U otras, en el caso de la regresión
múltiple.)
• Claro está, si sabemos que la variable X está muy relacionada con Y,
ello quiere decir que podemos predecir Y a partir de X. Estamos ya
en el terreno de la predicción. (Evidentemente si, X no está
relacionada con Y, X no sirve como predictor de Y.)
Variables
Variable dependiente (Y) Variable de respuesta
Es el fenómeno o situación explicado
Es la variable que es afectada por la presencia o acción de la variable independiente
Se llama también de efecto o acción condicionada
Utilizada para describir o medir el problema estudiado
Variable independiente (X) Variable de predicción
Explica, condiciona, o determina el cambio en los valores de la variable dependiente
Se le llama también causal o experimental porque es manipulada por el investigador
Se utiliza para describir o medir los factores que se supone son la causa o influyen en el problema
Ejemplo:
La relación entre fumar y el cáncer del pulmón
“tener cáncer de pulmón”( con los valores sí, no) sería la variable
dependiente
y “fumar” (varía entre no fumar a fumar más de tres cajetillas por día)
sería la variable independiente
Ejercicio: Clasificación de variables
Variables
Ingesta de grasa Tiempo de digestión
Edad Estatura
Velocidad Fuerza del choque
Ventas No. de familias
Temperatura Tiempo de cocción
Horas de estudio Calificaciones
Largo del brazo Estatura
RPM Desgaste de una pieza
Monto de seguro de vida alcanzado Salario anual del docente
No. de pinos por acre Altura de pinos en 15 años
Tipo de motor Rendimiento de gasolina
No. de egreso Calidad de la educación
Diagrama de dispersión
Es posible representar las observaciones mediante un gráfico de
dispersión.
Nube de datos
Diagrama de Dispersión
GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
población, el diagrama de dispersión es simplemente un gráfico de
dos dimensiones, donde en un eje (la abscisa) se sitúa una
variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si
las variables están correlacionadas, el gráfico mostraría algún nivel
de correlación (tendencia) entre las dos variables. Si no hay
ninguna correlación, el gráfico presentaría una figura sin forma,
una nube de puntos dispersos en el gráfico.
Asociación
positiva. Si
aumenta X
aumenta Y
Estadística
Económica 2007-
2008. Sara Mateo.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.
y = a + bx
Recta de regresión Pendiente
yn
yn 1 yˆi
y3
u3 ui
yi
y1 yi
y2
Intercepto
x1 x2 x3 xi xn 1 xn
yi a bxi ui ui yi yˆi
Error
Modelo de Regresión lineal simple
EJEMPLO
Regresión Lineal Simple a mano
4. Sustituye en la fórmula
294- (39)(42)
1. Datos 2. Memoria de datos 6
B1= =21/35.5 = 0.59
-------------------
XHrs YMiles Casos X Y X² Y² XY (39)²
289-
5 6 1 5 6 25 36 30 6
2 9 11 81 121 99
9 11
3 10 6 100 36 60 Bo= 42-(0.59 )(39)
10 6 =3.16
4 3 4 9 16 12 6
3 4 5 6 25 36 30
5
5 6 6 7 9 49 81 63
7 9 Totales ∑ 39 42 289 326 294
5. Construye ecuación de regresión (Línea de
3. Fórmula para obtener coeficientes mejor ajuste)
∑x∑y
Y= Bo+B1(x) ∑xy -
B1=
n Y= 3.16+0.59(x)
-------------------- Bo= ∑y- B1 ∑x
(∑x)²
∑x² -
n n
6. Fórmula para el cálculo del coeficiente de Correlación de Pearson r
n∑xy-∑x∑y
--------------------------------------------
r=
[n∑x²-(∑x)²]- [n∑y²-(∑y)²]
7. Se sustituye en la fórmula usando los resultados de la memoria de datos
Casos X Y X² Y² XY
8. Criterios para interpretar r
1 5 6 25 36 30
9 11 81 121 99 Relación débil 0-0.40
2
3 10 6 100 36 60 Relación medianamente
3 4 9 16 12 fuerte 0.40-0.60
4
5 6 25 36 30 Relación fuerte 0.60-1
5
6 7 9 49 81 63
Totales ∑ 39 42 289 326 294
6(294)-(39)(42) De acuerdo al estadístico de prueba r se observa
-------------------------------------- una correlación fuerte (r=0.62) entre las variables
r= = 0.62
X y Y.
[(6)(289)-(39)²] - [(6)(326)-(42)²]
9. Cálculo del Coeficiente de determinación R²
r= 0.62
R²= r² R²= (0.62)²
R²= 0.38 = 38%
Modelo poco confiable 0- 40%
Modelo medianamente
confiable 40%-60%
Modelo confiable 60-100%
De acuerdo al estadístico de prueba R² se observa un modelo
poco confiable (R²=38%) para hacer estimaciones.
A través del estadístico de prueba Coeficiente de
determinación se observa que el R² =38% de Y está
determinado por el efecto de X.
Prueba de hipótesis para Regresión Lineal Simple
ANOVA
1. Planteamiento de Hipótesis
Ho: B1= 0 X Y
Ha: B1≠ 0 5 6
9 11
2. ANOVA
10 6
3 4
5 6
7 9
SCT SCR SCE
SCT SCR
(6 –7)²=1 Y=3.16+0.59(5)= (6.11-7)² = 0.7921
(11–7)²=16 Y=3.16+0.59(9)= ( 8.47-7)² =2.1609
(6–7)²=1 = Y=3.16+0.59(10)= ( 9.06-7)² =4.2436
(4–7)²=9 Y=3.16+0.59(3)= (4.93-7)² = 4.2849
(6–7)²=1 Y=3.16+0.59(5)= ( 6.11-7)² =0.7921
(9–7)²=4 Y=3.16+0.59(7)= ( 7.29-7)² =0.0841
∑ 32 ∑12.35
2. ANOVA
Fuente de Variación SC GL CM F
SCR K-1 SCR/g.l .R CMR/CME
Regresión 12.42 1 12.42 2.53
SCE (g.l.T –g.l.R) SCE/g.l .E
Error 19.58 4 4.895
SCT n-1
Total 32 5
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 1 12.4225 12.4225 2.54 0.186
X 1 12.4225 12.4225 2.54 0.186
Error 4 19.5775 4.8944
Lack-of-Fit 3 19.5775 6.5258 * *
Pure Error 1 0.0000 0.0000
Total 5 32.0000
Distribution Plot
F, df1=1, df2=4 R² = 38%
0.20
Se Acepta Ho
Ho: B1= 0
0.15 Ha: B1≠ 0
Density
0.10
Acepto Rechazo
0.05
F tablas
0.05
0.00
0 2.53 7.709
F calculado X
Conclusión
De acuerdo al estadístico de prueba F de Fisher, se concluye que el
F calculado (2. 53) es menor al F de tablas (7.709) por lo que se
acepta Ho.
Esto significa que no hay evidencia estadística significativa para
asegurar que existe una relación entre horas laboradas y el salario de
los trabajadores.
Ejercicio 1
La agencia de protección del ambiente (EPA, por sus siglas en inglés) proporcionó la información
descrita a continuación, que compara el tamaño del motor en pulgadas cúbicas de desplazamiento
(cubic inches of displacement; CID, por sus siglas en inglés), y las millas por galón (MPG) estimadas
para ocho modelos representativos de automóviles subcompactos modelo 1984.
AUTOMOVIL
CHEVROLET CAVALIER 121 30
DATSON NISSAN STANZA 120 31
DODGE OMNI 97 34
FORD ESCORT 98 27
MAZDA 626 122 29
PLYMOUTH HORIZON 97 34
RENAULT ALIANCE / ENCORE 85 38
TOYOTA COROLLA 122 32
CID Tamaño del
MPG
motor
Ejercicio 2:
Se midió la altura (en centímetros) y el peso (en kilogramos) de treinta chicas de
12 años de Holland Middle School de Michigan. Estudiar estos datos y la relación
entre ambas variables.
Ejercicio 3:
En la tabla adjunta se presentan el número de páginas y el precio de doce libros técnicos:
Obtener
Diagrama de dispersión
Ecuación de regresión
Graficar la línea de mejor ajuste
DISEÑO DE
EXPERIMENTOS
Introducción
El diseño de experimentos que ver con una etapa de la Investigación
MARCO METODOLÓGICO
1. Enfoque del estudio (cualitativa/ cuantitativo)
2. Tipo de estudio (exploratorio, descriptivo, correlacional, experimental)
3. Diseños de Investigación (No experimentales/ experimentales)
4. sujetos del estudio
5. Recogida de datos
6. Análisis de datos
Diseños No
Experimentales
Descriptivos Correlacional
Una o más variables analizadas de Dos o más variables buscando su
forma independiente relación
TRANSACCIONAL LONGITUDINAL
Diseños
experimentales
Pre experimental
Cuasi experimental Experimental
Quedan por controlar Existe un control máximo de
No se modifica el fenómeno de variables extrañas todas las variables extrañas
estudio. Actitud pasiva. significativas más significativas.
DISEÑO DE EXPERIMENTOS
El diseño de experimentos es el plan, la estructura y la estrategia de una
investigación cuyo objetivo es dar respuesta a ciertas preguntas y controlar la
varianza
Son modelos estadísticos clásicos cuyo objetivo es averiguar si unos
determinados factores influyen en una variable de interés y, si existe influencia de
algún factor, cuantificar dicha influencia.
Situaciones artificiales que genera el investigador .
DISEÑO DE EXPERIMENTOS
La metodología del diseño de experimentos se basa en la experimentación.
Es sabido que si se repite un experimento, en condiciones indistinguibles, los
resultados presentan una cierta variabilidad.
Si la experimentación se realiza en un laboratorio donde la mayoría de las causas
de variabilidad están muy controladas, el error experimental será pequeño y
habrá poca variación en los resultados del experimento.
Pero si se experimenta en procesos industriales o administrativos la variabilidad
será mayor en la mayoría de los casos.
DISEÑO DE EXPERIMENTOS
El objetivo del diseño de experimentos es estudiar si cuando se utiliza un
determinado tratamiento se produce una mejora en el proceso o no.
Para ello se debe experimentar aplicando el tratamiento y no aplicándolo.
Si la variabilidad experimental es grande, sólo se detectará la influencia del uso
del tratamiento cuando éste produzca grandes cambios en relación con el error de
observación.
VARIABLE DEPOENDIENTE:
CRECIMIENTO
VARIABLE INDEPENDIENTE:
AGUA, LUZ, ETC.
Requisitos para el diseño de experimentos:
MANIPULACIÓN DE VARIABLES (Independientes)
Ausencia/ presencia: Con luz o sin luz/ con agua o sin agua
Intensidad: semanalmente, diariamente
Modalidad: agua destilada, dulce, salada, etc..
MEDICIÓN DE LA VARIABLE DEPENDIENTE (Respuesta)
El efecto
COMPARACIÓN (Comparar grupos)
Grupo experimental
Grupo control
Diseño general de Experimento