Estadistica PDF
Estadistica PDF
A S I G NAT UR A : ES TA DÍ S T I C A A P L I C A DA A L A EC O N OMI A
ESTADÍSTICA ESTADÍSTICA
DESCRIPTIVA INFERENCIAL
Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo largo
del tiempo. Por ejemplo, partes fabricadas en una línea de producción, transacciones en un
banco, llamadas que llegan a un centro de asesoría técnica y clientes que entran en las tiendas
son considerados como provenientes de una población infinita.
¿CÓMO HACER UN MUESTREO
ALEATORIO?
Se puede hacer uso de números aleatorios. Estos números pueden generarse ya sea con una
computadora programada para revolver números o mediante una tabla de números aleatorios,
que debería llamarse tabla de dígitos aleatorios.
Muestreo aleatorio con EXCEL
Muestreo con selección aleatoria simple
Usamos el muestreo estratificado cuando cada grupo tiene una pequeña variación dentro de sí mismo, pero hay
una amplia variación de un grupo a otro.
Por ejemplo si queremos conocer el ingreso medio de los habitantes de una ciudad y estos están divididos por
grupos de acuerdo a su edad ( de 25 a 35 años, de 36 a 45 años, de 46 a 55 y de 56 a 65 años) Para obtener una
estimación de esta característica de la población, podría tomar una muestra aleatoria de cada uno de los cuatro
grupos de edades y ponderar las muestras de acuerdo con el porcentaje de habitantes en ese grupo.
Los principios del muestreo aleatorio simple son
la base de la inferencia estadística, es decir, del
proceso de hacer inferencias acerca de
poblaciones a partir de información contenida en
muestras.
ACTIVIDADES
1. Una empresa de televisión por cable está planeando agregar un canal a su servicio básico;
puede escoger de entre cinco canales y por ello desea tener la opinión de sus suscriptores.
Cuenta con 20,000 suscriptores y sabe que el 35% de ellos está compuesto por estudiantes
universitarios, el 45% por empleados administrativos, el 15% por obreros y el 5% por otros.
Sin embargo, la compañía piensa que hay mucha variación dentro de estos grupos. ¿Cuál de
los siguientes muestreos es más adecuado: aleatorio, sistemático, estratificado o de racimo?
2. Una organización no lucrativa lleva a cabo una encuesta de opinión de puerta en puerta
sobre el servicio educativo de los colegios privados. La organización ha diseñado un esquema
para muestrear aleatoriamente las casas y planea llevar a cabo la encuesta los fines de
semana desde el mediodía hasta las 17:00 horas. ¿Producirá este esquema una muestra
aleatoria?
MUESTREO NO PROBABILÍSTICO
POR MUESTREO
CONVENIENCIA POR CUOTA
MUESTREO NO
PROBABILÍSTICO
ACTIVIDADES
1. ¿Cuál es el principal inconveniente del muestreo por conveniencia?
2. El muestreo por conveniencia y el muestreo de probabilidad, ¿son mutuamente excluyentes
por necesidad? Explique su respuesta.
3. Dé una lista de las ventajas del muestreo en comparación con una enumeración completa o
censo.
4. ¿Cuáles son algunas desventajas del muestreo de probabilidad en relación con el muestreo
por conveniencia?
M UCHAS GRACIAS
DISTRIBUCIÓN DE MUESTREO
A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A
2
DISTRIBUCIONES DE LAS MEDIAS
MUESTRALES EN EL MUESTREO
MEDIA MUESTRAL
DESVIACIÓN ESTÁNDAR
DE LA MEDIA MUESTRAL
(Muestreo aleatorio simple)
Factor de
corrección
Socios horas
1. Alvarado 22
2. Peña 26
3. Rivera 30
4. Romero 26
5. Ruiz 22
4
Ejemplo 1 (Continuación)
Si dos socios son seleccionados al azar, ¿cuántas muestras diferentes
son posibles?
Esto es: 5!
10
2!(5 2)!
5
Ejemplo 1 (Continuación)
Socios Total Media
1, 2 48 24
1, 3 52 26
1, 4 48 24
1, 5 44 22
2, 3 56 28
2, 4 52 26
2, 5 48 24
3, 4 56 28
3, 5 52 26
4, 5 48 24
6
Ejemplo 1 (Continuación)
Organice la media muestral en una distribución de muestreo.
7
Ejemplo 1 (Continuación)
Calcule la media de la media muestral. Compárela con la población media.
8
Ejemplo 1 (Continuación)
La media de la población también es 25.2 horas.
22 26 30 26 22
25.2
5
9
Error o desviación estándar de la
media muestral
Si σ no es conocido y n >= 30, la desviación estándar de la muestra,
designada s, se aproxima a la desviación estándar de la población.
La fórmula para la desviación estándar es:
s
sx
n
10
Distribución Normal Estándar de
las Medias Muestrales
Si la población sigue la distribución normal, la distribución muestral de la
media muestral seguirá también la distribución normal y podemos calcular una
variable aleatoria normal estandarizada, Z, que tiene una media de 0 y una
varianza de 1:
X
z
Desviación estándar de la media
de una distribución de probabilidad
normal estándar.
n
11
Ejemplo 2
Un banco calcula que sus cuentas de ahorros
individuales están normalmente distribuidas con una
media poblacional de S/. 3,000 y su desviación estándar
es de S/. 900. Si el banco toma una muestra aleatoria de
150 cuentas, ¿cuál es la probabilidad de que la media de
la muestra caiga entre S/.2,900 y S/.3,080?
12
Ejemplo 2 (Continuación)
El primer paso es hallar la desviación estándar de la media muestral:
900
Ahora calculamos los dos valores de z x S / .73,49
n 150
x S / .2,900
X S / .2,900 S / .3,000
z 1,36
n S / .73,49
13
Ejemplo 2 (Continuación)
x S / .3,080
X S / .3,080 S / .3,000
z 1,09
n S / .73,49
14
Ejemplo 2 (Continuación)
Después determinamos la probabilidad de los valores z entre -1.36 y 1.09. Esto
es:
15
Forma de la distribución muestral
de la media muestral ( )
Los resultados anteriores
respecto al valor esperado y a la • La distribución
muestral de la media
LA POBLACIÓN
desviación estándar en la TIENE muestral está
distribución muestral dela DISTRIBUCIÓN
distribuida
normalmente sea
media muestral son aplicables a NORMAL cual sea el tamaño de
cualquier población. la muestra.
16
El teorema del límite central
Cuando se seleccionan muestras aleatorias simples de tamaño n
de una población, la distribución muestral de la media muestral
puede aproximarse mediante una distribución normal a medida
que el tamaño de la muestra se hace grande.
17
El teorema del límite central
Si la población no sigue la distribución normal, pero la muestra es de al menos
30 observaciones, la media muestral seguirá la distribución normal.
Para determinar la probabilidad de que una media muestral esté dentro de
una región particular, utilice:
X
z
s n
18
Ejemplo 3
Suponga que la media del precio de venta de un galón de gasolina en
Perú en soles es de S/.11,909. Además, asuma que la distribución está
posiblemente inclinada, con una desviación estándar muestral de S/.
2,62 ¿Cuál es la probabilidad de seleccionar una muestra de 35
estaciones de gasolina y encontrar una media muestral dentro de S/.
0,74?
19
Ejemplo 3 (Continuación)
El primer paso es encontrar los valores z correspondientes a S/.11,169 y
S/.12,649. Existen dos puntos dentro de S/. 0.74 de la media de la población.
X S / .12,649 S / .11,909
z 1,67
s n S / 2,62 35
20
Ejemplo 3 (Continuación)
X S / .11,169 11,909
z 1.67
s n S / .2,62 35
21
Ejemplo 3 (Continuación)
Después determinamos la probabilidad de los valores z entre -1.67 y 1.67. Esto es:
22
¿De qué depende el tamaño de
la muestra?
1. El margen de error que
puede tolerar el
investigador.
2. El nivel de confianza que se
desea
3. La variabilidad en la
población que se estudia
[Link]
content/uploads/2017/03/intervalo-confianza-normal-
[Link]
24
Actividad
25
Actividad
26
Actividad
El costo promedio de un estudio en condominio
en desarrollo en el distrito de Magdalena es de
$62,000 con una desviación estándar de $4,200
27
Actividad
Suponga que de una población en la que σ = 10 y se
toma una muestra aleatoria simple de tamaño 50.
Halle el valor del error estándar de la media
muestral en cada uno de los casos siguientes (Usar
el factor de corrección si es necesario).
a. El tamaño de la población es infinito.
b. El tamaño de la población es N = 50 000.
c. El tamaño de la población es N = 5000.
d. El tamaño de la población es N = 500.
28
29
MUCHAS GRACIAS
30
TEMA: DISTRIBUCIONES DE
PROPORCIONES MUESTRALES
EJERCICIOS
4
Referencia bibliográfica
Newbold, Paul, et al. Estadística para Administración y Economía. (2008). 6ª Edición,
Pearson Prentice Hall, Madrid
INTERVALOS DE CONFIANZA
A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A
2
Intervalos de confianza
•Intervalo de confianza: Un conjunto de valores obtenido a partir de los
datos muestrales, en el que hay una determinada probabilidad de que
se encuentre el parámetro. A esta probabilidad se le conoce como el
nivel de confianza.
3
Estimación por intervalos de la
media poblacional
Los hechos que determinan la amplitud de un intervalo de
confianza son:
1. El tamaño de la muestra, n
2. La variabilidad de la población. normalmente estimada por s.
3. El nivel de confianza deseado.
4
Estimación por intervalos de la
media poblacional
Si la desviación estándar de la población es conocida utilizamos la
distribución z.
X z
n
5
Estimación por intervalos de la
media poblacional
Si la desviación estándar de la población es desconocida o la muestra es
mayor que 30 utilizamos la distribución z.
s
X z
n
6
Punto e intervalo de estimación
(muestras pequeñas)
Si la desviación estándar de la población es desconocida, la muestra es
menor que 30 y la población es normal o casi normal utilizamos la
distribución t
William Sealy
Gosset, estadístico
irlandés que trabajó en
la Guinness Brewery de
Dublín a principios de
s
X t
la década de 1900
n
7
Intervalo de estimación
Un intervalo de estimación establece el rango en el cual se encuentra el
parámetro de población.
Un intervalo en el cual se espera que ocurra el parámetro de población
se llama intervalo de confianza.
Los dos intervalos de confianza que son más utilizados son de 95% y
99%.
8
Intervalo de estimación
Para un 95% de intervalo de confianza, aproximadamente
95% de los intervalos construidos igualmente contendrán el
parámetro inicial. También el 95% de la muestra media para
un tamaño de muestra específico se encontrará dentro del
1.96 de la desviación estándar de la media de la población.
9
Error estándar de la media
muestral
Si σ no es conocido y n >= 30, la desviación estándar de la muestra,
designada s, se aproxima a la desviación estándar de la población.
La fórmula para la desviación estándar es:
s
sx
n
10
95% y 99% intervalos de confianza
para µ
El 95% y 99% intervalos de confianza:
95% CI para la media de la población es dada:
s
X 1.96
n
12
Ejemplo 1 (Continuación)
Encuentre el intervalo de confianza con el 95% para la media de la población.
El rango límite de confianza es de 22.88 a 25.12 horas.
s 4
X 1.96 24.00 1.96
n 49
24.00 1.12
Aproximadamente el 95% de los intervalos construidos
incluyen el parámetro de población.
13
Intervalo de confianza para la
proporción de la población (P)
P(1 P) P(1 P)
pˆ pˆ N n
p̂p̂N 1
n n
Error estándar de la Factor de corrección para
distribución muestral de muestra finita usando la
las proporciones misma regla que para la
muestrales para media muestral
población infinita
pˆ P
z Si 𝑛𝑃(1 − 𝑃) > 9
pˆ
14
Intervalo de confianza para la
proporción de la población (P)
El intervalo de confianza para la proporción de la población se estima como:
Pˆ (1 Pˆ )
p̂p̂
pˆ z
n
15
Ejemplo 2
De una muestra de 500 personas, 175 revelaron que sí se debería vacar al
presidente de la república . Desarrolle un intervalo de confianza con el 98% para
la proporción de personas que piensan que sí se debería vacar al presidente.
(0.35)(0.65)
0.35 2.33 0.35 0.0497
500
16
Ejercicio
La proporción de todos los clientes de Pizza Hut que comen en el local es del
75%. En una muestra de 100 clientes, desarrolle un intervalo de confianza con el
95% para la proporción de personas que lleva su comida a casa.
17
EJERCICIO
La industria peruana de lácteos desea calcular el consumo medio de leche
por año. Una muestra de 16 personas revela que el consumo medio anual
es de 60 litros, con una desviación
estándar de 20 litros.
a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el mejor estimador de
este valor?
b) Explique por qué necesita utilizar la distribución t.
c) ¿Cuál es el valor de t en un intervalo de confianza de 95%?
d ) Construya el intervalo de confianza de 95% de la media de población.
EJERCICIO
El propietario de una empresa desea calcular la cantidad media de huevos que
pone cada gallina. Una muestra de 20 gallinas indica que ponen un promedio
de 20 huevos al mes, con una desviación estándar de 2 huevos al mes.
a) ¿Cuál es el valor de la media de la población?
b) Explique por qué necesita utilizar la distribución t.
c) ¿Cuál es el valor de t en un intervalo de confianza de 99%?
d ) Construya el intervalo de confianza de 99% de la media de población.
Ejemplo 3
Dada la información del Ejemplo 1, construya un intervalo de
confianza del 95% para la cantidad media de horas que los
estudiantes trabajan por semana si tan sólo son 500
estudiantes en el campus.
Porque n/N = 49/500 = .098 el cual es mayor que 0.05,
utilizamos el factor de corrección de la población finita
4 500 49
24 1.96( )( ) 24.00 1.0648
49 500 1
20
EJERCICIO
El propietario de una estación de servicio desea determinar la proporción de
clientes que utilizan tarjeta de crédito o débito para pagar la gasolina.
Entrevistó a 100 clientes y descubre que 80 pagaron en ella.
a) Calcule el valor de la proporción de la población.
b) Construya el intervalo de confianza de 95% de la proporción poblacional.
c) Interprete sus conclusiones.
Elección del tamaño de
muestra apropiado
Existen 3 factores que determinan el tamaño
de la muestra, ninguno de los cuales tiene
relación con el tamaño de la población. Éstos
son:
◦El nivel de confianza deseado.
◦El máximo error permisible.
◦La variación en la población.
22
Tamaño de muestra para una estimación
por intervalo de la media poblacional
Para encontrar el tamaño de la muestra para
una variable:
z
2
2
zs n
n
E E
•Donde: E es el error permisible ( margen de error deseado), z es el valor-z
correspondiente al nivel de confianza seleccionado, y s es la desviación estándar
de la muestra del estudio piloto.
23
Ejemplo 4
•Un estudio sobre los consumidores quiere estimar la media del cargo mensual
de energía de setiembre de una casa común dentro de S/. 5 (margen de error
deseado) utilizando 99% de nivel de confianza. Basado en estudios similares, la
desviación estándar poblacional se estima debe ser S/. 20.00. ¿Cuántas
muestras son requeridas?
2
(2.58)( 20)
n 107
5
24
Tamaño de la muestra para una estimación
por intervalo de la proporción poblacional
La fórmula para determinar el tamaño de la muestra en
el caso de una proporción es:
2
Z
n pˆ (1 pˆ )
E
Donde:p̂es la proporción estimada, basada en
la experiencia anterior o de un estudio piloto, z
es valor-z asociado con el grado de confianza
seleccionado; E es el máximo error permisible
que el investigador tolerará.
25
Tamaño de la muestra
para una estimación por intervalo de
la proporción poblacional
La fórmula para determinar el tamaño de la muestra en el caso de una
proporción es:
2
Z
n p (1 p )
* *
* E
p
Donde: es la proporción planeada y se determina mediante
alguno de los métodos siguientes:
1. Utilizar la proporción poblacional de una muestra previa de las
mismas unidades.
2. Utilizar un estudio piloto y elegir una muestra preliminar.
3. Proponer una mejor aproximación
4. Si no aplica ninguna de las alternativas anteriores, emplear como
valor planeado 0,5.
26
Ejemplo 5
Una empresa quiere estimar la proporción de mascarillas KN95 con defecto
de fábrica. Si la empresa quisiera estimarlo dentro del 3% de la proporción de
la población, ¿cuántas mascarillas necesitarían revisar? Asuma 95% de nivel
de confianza y que la empresa estima que un 30% de las mascarillas KN95
tiene defecto de fábrica.
2
1.96
n (0.30)(0.70) 897
0.03
27
28
Distribución t de Student
Distribución t de Student
TEMA: INTERVALOS DE CONFIANZA Y
TAMAÑO DE LA MUESTRA
EJERCICIOS
EJERCICIOS
1. Se calcula que una población tiene una desviación estándar de 10. Desea
estimar la media de la población a menos de 2 unidades del error
máximo admisible, con un nivel de confianza de 95%.
¿De qué tamaño debe ser la muestra?
2. Quiere estimar la media de la población a menos de 5, con un nivel de
confianza de 99%. Se calcula que la desviación estándar es de 15. ¿De
qué tamaño debe ser la muestra?
3. El estimador de la proporción poblacional debe estar a más o menos
0.05, con un nivel de confianza de 95%. El mejor estimador de la
proporción poblacional es de 0.15. ¿De qué tamaño debe
ser la muestra que se requiere?
EJERCICIOS
4- La televisora Fox TV considera reemplazar uno de sus programas de
investigación criminal, que se transmite durante las horas de mayor
audiencia, por una nueva comedia orientada a la familia.
Antes de tomar una decisión definitiva, los ejecutivos estudian una
muestra de 400 telespectadores. Después de ver la comedia, 250
afirmaron que la verían y sugirieron reemplazar el programa
de investigación criminal.
a) Construya el intervalo de confianza de 99% de la proporción
poblacional.
b) Interprete los resultados que obtuvo.
EJERCICIOS
5-Utilice la tabla para localizar el valor de t en las siguientes
condiciones.
a) El tamaño de la muestra es de 15, y el nivel de confianza, de 95 por
ciento.
b) El tamaño de la muestra es de 24, y el nivel de confianza, de 98 por
ciento.
MÉTODO DE LOS MÍNIMOS CUADRADOS
O REGRESIÓN LINEAL
A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A
Cantidad de
Otras variables
empresas
Regresión lineal y correlación
LOGROS DE LA SESIÓN:
4
5. Determinar la línea (o recta) de regresión de mínimos cuadrados.
5
Análisis de correlación
El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la asociación
entre dos variables.
Un diagrama de dispersión es una gráfica que representa la
relación entre dos variables.
La variable dependiente es la variable que se predice o
calcula.
La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.
6
El coeficiente de correlación, r
El coeficiente de correlación (r) es una medida de la
intensidad de la relación lineal entre dos variables.
Requiere datos de nivel de razón.
Puede tomar cualquier valor de -1.00 a 1.00.
Los valores de -1.00 o 1.00 indican la correlación perfecta y
fuerte.
Los valores cerca de 0.0 indican la correlación débil.
Los valores negativos indican una relación inversa y los
valores positivos indican una relación directa.
7
Correlación negativa perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
8
Correlación positiva perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
9
Correlación cero
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
10
Correlación positiva fuerte
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
11
Fórmula para r
Calculamos el coeficiente de correlación de las fórmulas
siguientes.
( X X )(Y Y )
r
(n 1) s x s y
n(XY ) (X )(Y )
n(X 2
) (X ) n Y Y
2 2
2
12
Coeficiente de determinación
El coeficiente de determinación (r2) es la proporción de la
variación total en la variable dependiente (y) que se explica
por la variación en la variable independiente (x).
Es el cuadrado del coeficiente de correlación.
Su rango es de 0 a 1.
No da ninguna información sobre la dirección de la relación
entre las variables.
13
¿Qué es una prueba de hipótesis?
La prueba de hipótesis es un procedimiento
basado en la evidencia de la muestra y la teoría de
las probabilidades, usadas para determinar si la
hipótesis es una declaración razonable y no debe
ser rechazada, o es irrazonable y debe ser
rechazada.
14
Ejemplo 1
El presidente de la sociedad de alumnos de una
Universidad pública de la Facultad de Ciencias Económicas,
se ocupa de estudiar el costo de los libros de texto. Él cree
que hay una relación entre el número de páginas en el texto
y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente
en venta en la librería. Dibuje un diagrama de dispersión.
Compruebe el coeficiente de correlación.
15
Ejemplo 1 (Continuación)
Libro Páginas Precio ($/.)
Econometría 500 84
Macroeconomía 700 75
Estadística 800 99
Microeconomía 600 72
Marketing 400 69
Finanzas 500 81
Análisis matemático 600 63
Comercio exterior 800 93
16
Ejemplo 1 (Continuación)
Scatter Diagram of Number of Pages and Selling Price of Text
100
90
Price ($)
80
70
60
400 500 600 700 800
Page
17
Diagrama de dispersión con
EXCEL
DIAGRAMA DE DISPERSIÓN DE PÁGINAS DE LOS LIBROS Y PRECIOS
120
100
80
PRECIO $
60
40
20
0
0 100 200 300 400 500 600 700 800 900
PÁGINAS DE LIBROS
Ejemplo 1 (Continuación)
Libro Páginas Precio ($)
X Y XY X2 Y2
Econometria 500 84 42,000 250,000 7,056
Macroeconomía 700 75 52,500 490,000 5,625
Estadística 800 99 79,200 640,000 9,801
Microeconomía 600 72 43,200 360,000 5,184
Marketing 400 69 27,600 160,000 4,761
Finanzas 500 81 40,500 250,000 6,561
Análisis matemático 600 63 37,800 360,000 3,969
Comercio exterior 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
19
Ejemplo 1 (Continuación)
0.614
20
Ejemplo 1 (Continuación)
La correlación entre el número de páginas y el precio de venta
del libro es 0.614. Esto indica una asociación moderada entre
las variables. Pruebe la hipótesis de que no hay correlación en
la población. Utilice un nivel de la significancia del .02.
Paso 1: H0: La correlación en la población es cero.
H1: La correlación en la población no es cero.
Paso 2: H0 es rechazada si t>3.143 o si t<-3.143.
Hay 6 grados de libertad, encontrados cerca.
n–2=8–2 = 6.
21
Ejemplo 1 (Continuación)
Paso 3: Para encontrar el valor del estadístico de
prueba, utilizamos:
r n2 .614 8 2
t 1.905
1 r 2
1 (.614 ) 2
22
Análisis de regresión
En análisis de regresión utilizamos la variable independiente
(X) para estimar la variable dependiente (Y).
La relación entre las variables es lineal.
Ambas variables deben ser por lo menos escala del
intervalo.
El criterio de mínimos cuadrados se utiliza para determinar
la ecuación. Este es el término (Y – Y')2
23
Análisis de regresión
La ecuación de regresión es: Y' = a + bX, donde:
Y' es el valor pronosticado de la variable Y para un valor
seleccionado de X.
a es la ordenada de la intersección con el eje Y cuando X = 0. Es el
valor estimado de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para
cada cambio de una unidad en X.
el principio de mínimos cuadrados se utiliza para obtener a y b.
24
Análisis de regresión
El principio de mínimos cuadrados se utiliza para obtener a y b.
Las ecuaciones para determinar a y b son:
n( XY ) ( X )( Y )
b
n( X 2 ) ( X ) 2
Y X
a b
n n
25
Ejemplo 2 (Continuación)
Desarrolle una ecuación de regresión para la información dada
en el Ejemplo 1 que se puede utilizar para estimar el precio de
venta basado en el número de páginas.
636 4,900
a 0.05143 48.0
8 8
26
Ejemplo 2 (Continuación)
La ecuación de regresión es:
Y' = 48.0 + .05143X
La ecuación cruza al eje Y en $48. Un libro sin las páginas
costaría $48.
La pendiente de la línea es .05143. El costo de cada página
adicional es de cinco céntimos.
El signo del valor de b y el signo del valor de r serán siempre
iguales.
27
Ejemplo 2 (Continuación)
Podemos utilizar la ecuación de regresión para
estimar valores de Y.
El precio de venta estimado de un libro de 800 páginas es $89.14,
encontrado por
Y 48.0 0.05143 X
48.0 0.05143 (800) 89.14
28
El error estándar de estimación
El error estándar de estimación mide la dispersión de los
valores observados alrededor de la línea de regresión.
Las fórmulas que se utilizan para comprobar el error estándar
son:
(Y Y ) 2
s y. x
n2
Y 2 aY bXY
n2
29
Ejemplo 3
Encuentre el error estándar de estimación para el
problema que implica el número de páginas en un libro
y el precio de venta.
Y 2 aY bXY
s y. x
n2
51,606 48(636 ) 0.05143 (397 ,200 )
82
10.408
30
Suposiciones subyacentes en el análisis
de regresión lineal
Para cada valor de X, hay un grupo de valores de Y, y estos valores
de Y se distribuyen normalmente.
Las medias de estas distribuciones normales de valores Y, caen
todas en la recta de regresión.
Las desviaciones estándar de estas distribuciones normales son
iguales.
Los valores de Y son estadísticamente independientes. Esto
significa que en la selección de una muestra, los valores de Y
elegidos para un valor particular de X no dependen de los valores
de Y de ningún otro valor de X.
31
Intervalo de confianza
El intervalo de confianza para el valor medio de Y para un valor
dado de X está dado por:
1 ( X X )2
Y ts y. x
n ( X ) 2
X 2
n
1 (800 612 .5) 2
89.14 2.447 (10.408)
8 (4900 ) 2
3,150,000
8
89.14 15.31
32
Intervalo de predicción
El intervalo de predicción para un valor individual de Y para un
valor dado de X se da por:
1 ( X X )2
Y ts y. x 1
n ( X ) 2
X
2
n
1 (800 612 .5) 2
89.14 2.447 (10.408 ) 1
8 (4900 ) 2
3,150 ,000
8
89.14 29.72
33
Ejemplo 3 (Continuación)
Resumir los resultados:
El precio de venta estimado para un libro con 800 páginas es
$89.14.
El error estándar de estimación es $10.41.
El intervalo de confianza de 95% para todos los libros con 800
páginas es $89.14+-$15.31. Esto significa que los límites están
entre $73.83 y $104.45.
El intervalo de predicción de 95% para un libro particular con 800
páginas es $89.14+-$29.72. Esto significa que los límites están
entre $59.42 y $118.86.
Estos resultados aparecen en la siguiente salida de MINITAB.
34
DATOS EXCEL
36
Distribución t de Student
Distribución t de Student