0% encontró este documento útil (0 votos)
94 vistas139 páginas

Estadistica PDF

Este documento presenta diferentes conceptos y técnicas de muestreo estadístico. Explica la diferencia entre población y muestra, y entre parámetros y estadísticos. Describe los tipos de variables y de estadística. Además, detalla los métodos de muestreo probabilístico como el aleatorio simple, sistemático y estratificado, así como los métodos no probabilísticos como el de conveniencia. Finalmente, enfatiza la importancia del muestreo y sus ventajas sobre un censo completo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
94 vistas139 páginas

Estadistica PDF

Este documento presenta diferentes conceptos y técnicas de muestreo estadístico. Explica la diferencia entre población y muestra, y entre parámetros y estadísticos. Describe los tipos de variables y de estadística. Además, detalla los métodos de muestreo probabilístico como el aleatorio simple, sistemático y estratificado, así como los métodos no probabilísticos como el de conveniencia. Finalmente, enfatiza la importancia del muestreo y sus ventajas sobre un censo completo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

TÉCNICAS DE MUESTREO

A S I G NAT UR A : ES TA DÍ S T I C A A P L I C A DA A L A EC O N OMI A

MG. ECON. VERÓNICA A. MORE SÁNCHEZ


CONCEPTOS BÁSICOS
¿QUÉ ES LA ESTADÍSTICA?
La Estadística es la ciencia encargada de suministrar las diferentes técnicas y procedimientos que
permiten desde organizar la recolección de datos hasta su elaboración, análisis e interpretación.
Abarca dos campos fundamentales la Estadística Descriptiva y la Estadística Inferencial.
Nocedo de León Irma (2001).
“ La Estadística es un lenguaje para comunicar información basada en datos cuantitativos”
Hopkins y Glass (1997).
TIPOS DE ESTADÍSTICA

ESTADÍSTICA ESTADÍSTICA
DESCRIPTIVA INFERENCIAL

Se emplean métodos para


Es la categoría de descripción, determinar una propiedad de una
organización y análisis de la información población con base en la
de interés. información de una muestra de ella.
POBLACIÓN Y MUESTRA
POBLACIÓN

Conjunto total de elementos


( datos, personas, objetos,
medidas, etc.) que poseen una
o más características
observables sobre las cuales se MUESTRA
buscan conclusiones para Elementos elegidos entre la
tomar decisiones. población.
Porción o parte de la población
de interés.
EJEMPLOS DE POBLACIÓN
TODAS LAS FAMILIAS DE UNA CIUDAD O DEL
PAÍS

CONJUNTO DE TODOS LOS RECLAMOS DEL SERVICIO DE ENERGÍA


ELÉCTRICA DURANTE EL 2020.
DAR OTROS EJEMPLOS DE POBLACIÓN
PARÁMETRO Y ESTADÍSTICO( O
ESTADÍSTICAS)

Fuente: Estadística para Administración y Economía. Richard I. Levin


TIPOS DE VARIABLES Toman valores
enteros
DISCRETAS
CUANTITATIVAS Toman valores
numéricos y entre
CONTINUAS dos de ellos hay
Sus propiedades pueden infinitos valores
presentarse en diversos intermedios
VARIABLES grados o intensidades de
carácter numérico. Sus valores no se
NOMINALES pueden ordenar
Característica observable y medible
que varia entre los diferentes CUALITATIVAS
individuos de una población
Sus valores se
Son susceptibles de ORDINALES pueden ordenar
observación, expresas atributos
o características.
ACTIVIDAD
Proponga dos ejemplos de estudio que sean de su interés y anote algunas variables de cada tipo
que desearía conocer.
IMPORTANCIA DEL MUESTREO
Establecer contacto El costo de estudiar Es imposible verificar
con toda la población todos los elementos de manera física
requerirá mucho de una población todos los elementos
tiempo resultaría prohibitivo de la población

Algunas pruebas son Los resultados de la


de naturaleza muestra son
destructiva adecuados
MUESTREO PROBABILÍSTICO
MUESTREO ALEATORIO SIMPLE
(POBLACIÓN FINITA Y SIN REEMPLAZO)
Se selecciona la muestra tal que todos los objetos tienen la misma probabilidad de ser
seleccionados y se seleccionan independientemente, es decir la selección de un objeto no altera
la probabilidad de que sean seleccionados otros objetos. Este tipo de muestreo es ideal.
Cálculo del número de muestras aleatorias
simples distintas de tamaño n de población
finita N
MUESTREO ALEATORIO SIMPLE
(POBLACIÓN INFINITA)
En poblaciones infinitas un procedimiento para la selección de una muestra debe ser concebido
especialmente para cada situación, de manera que permita seleccionar los elementos de
manera independiente y evitar así un sesgo en la selección que dé mayores probabilidades de
selección a ciertos tipos de elementos.

Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo largo
del tiempo. Por ejemplo, partes fabricadas en una línea de producción, transacciones en un
banco, llamadas que llegan a un centro de asesoría técnica y clientes que entran en las tiendas
son considerados como provenientes de una población infinita.
¿CÓMO HACER UN MUESTREO
ALEATORIO?
Se puede hacer uso de números aleatorios. Estos números pueden generarse ya sea con una
computadora programada para revolver números o mediante una tabla de números aleatorios,
que debería llamarse tabla de dígitos aleatorios.
Muestreo aleatorio con EXCEL
Muestreo con selección aleatoria simple

Fuente: Estadística para Administración y Economía. Richard I. Levin


Muestreo aleatorio con EXCEL
Actividades
1. Asuma que se tiene una población de 10000 y se desea obtener una muestra aleatoria de
20. Emplear el muestreo aleatorio con EXCEL.
MUESTREO ALEATORIO SISTEMÁTICO
El muestreo sistemático difiere del muestreo aleatorio simple en que cada elemento tiene igual
oportunidad de ser seleccionado, pero cada muestra no tiene una posibilidad igual de ser
seleccionada.
Aun cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un
patrón secuencial, este método puede requerir menos tiempo y, algunas veces, tiene como
resultado un costo menor que el método de muestreo aleatorio simple.
Ejemplo
Se considera una población de N = 1000 avicultores y de la que se pretende extraer una
muestra sistemática de n = 40 avicultores
Primer paso
Conseguir un listado ordenado de los N elementos de la población: N = 1000 avicultores.
Segundo paso
Determinar el tamaño muestral: n = 40
Tercer paso
Definir el salto sistemático K= N = 1000 = 25
n 40
Continuación…
Cuarto paso
Elegir un número aleatorio entre 1 y k (número aleatorio = 12)
Quinto paso
Iniciar el proceso de selección sistemática
MUESTREO ALEATORIO POR RACIMOS
En el muestreo de racimo dividimos la población en grupos, o racimos, y luego seleccionamos
una
muestra aleatoria de estos racimos, asumiendo que cada uno de ellos es representativo de la
población.
Usamos el muestreo de racimo cuando hay una variación considerable dentro de cada grupo,
pero los grupos son esencialmente similares entre sí.
MUESTREO ALEATORIO ESTRATIFICADO
Dividimos la población en grupos relativamente homogéneos,
llamados estratos. Después utilizamos uno de los dos planteamientos: o bien seleccionamos aleatoriamente, en
cada estrato, un número específico de elementos correspondiente a la proporción del
mismo en relación con la población completa, o extraemos el mismo número de elementos de cada estrato y
después ponderamos los resultados considerando la proporción que el estrato representa con respecto a la
población total.

Usamos el muestreo estratificado cuando cada grupo tiene una pequeña variación dentro de sí mismo, pero hay
una amplia variación de un grupo a otro.
Por ejemplo si queremos conocer el ingreso medio de los habitantes de una ciudad y estos están divididos por
grupos de acuerdo a su edad ( de 25 a 35 años, de 36 a 45 años, de 46 a 55 y de 56 a 65 años) Para obtener una
estimación de esta característica de la población, podría tomar una muestra aleatoria de cada uno de los cuatro
grupos de edades y ponderar las muestras de acuerdo con el porcentaje de habitantes en ese grupo.
Los principios del muestreo aleatorio simple son
la base de la inferencia estadística, es decir, del
proceso de hacer inferencias acerca de
poblaciones a partir de información contenida en
muestras.
ACTIVIDADES
1. Una empresa de televisión por cable está planeando agregar un canal a su servicio básico;
puede escoger de entre cinco canales y por ello desea tener la opinión de sus suscriptores.
Cuenta con 20,000 suscriptores y sabe que el 35% de ellos está compuesto por estudiantes
universitarios, el 45% por empleados administrativos, el 15% por obreros y el 5% por otros.
Sin embargo, la compañía piensa que hay mucha variación dentro de estos grupos. ¿Cuál de
los siguientes muestreos es más adecuado: aleatorio, sistemático, estratificado o de racimo?
2. Una organización no lucrativa lleva a cabo una encuesta de opinión de puerta en puerta
sobre el servicio educativo de los colegios privados. La organización ha diseñado un esquema
para muestrear aleatoriamente las casas y planea llevar a cabo la encuesta los fines de
semana desde el mediodía hasta las 17:00 horas. ¿Producirá este esquema una muestra
aleatoria?
MUESTREO NO PROBABILÍSTICO
POR MUESTREO
CONVENIENCIA POR CUOTA

MUESTREO NO
PROBABILÍSTICO
ACTIVIDADES
1. ¿Cuál es el principal inconveniente del muestreo por conveniencia?
2. El muestreo por conveniencia y el muestreo de probabilidad, ¿son mutuamente excluyentes
por necesidad? Explique su respuesta.
3. Dé una lista de las ventajas del muestreo en comparación con una enumeración completa o
censo.
4. ¿Cuáles son algunas desventajas del muestreo de probabilidad en relación con el muestreo
por conveniencia?
M UCHAS GRACIAS
DISTRIBUCIÓN DE MUESTREO
A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A

MG. ECON. VERÓNICA A. MORE


SÁNCHEZ
DISTRIBUCIONES DE LAS MEDIAS
MUESTRALES EN EL MUESTREO
Ejemplos de estimación puntual son la media muestral, la desviación
estándar muestral, la varianza muestral, y la proporción muestral.

Una estimación puntual es un valor que se utiliza para estimar el


parámetro poblacional.

2
DISTRIBUCIONES DE LAS MEDIAS
MUESTRALES EN EL MUESTREO
MEDIA MUESTRAL

DESVIACIÓN ESTÁNDAR
DE LA MEDIA MUESTRAL
(Muestreo aleatorio simple)

Factor de
corrección

o la población sea finita y el


tamaño de la muestra sea
menor o igual a 5% de la N (n/N
menor o igual a 0,05).
Ejemplo 1
Una firma de economistas tiene 5 socios. Para su junta semanal
de socios cada uno reportó el número de horas con los clientes
para sus servicios de la semana pasada.

Socios horas
1. Alvarado 22
2. Peña 26
3. Rivera 30
4. Romero 26
5. Ruiz 22

4
Ejemplo 1 (Continuación)
Si dos socios son seleccionados al azar, ¿cuántas muestras diferentes
son posibles?

Esta es la combinación de 5 objetos tomando 2 al mismo tiempo.

Esto es: 5!
  10
2!(5  2)!

Existe un total de 10 muestras diferentes.

5
Ejemplo 1 (Continuación)
Socios Total Media
1, 2 48 24
1, 3 52 26
1, 4 48 24
1, 5 44 22
2, 3 56 28

2, 4 52 26
2, 5 48 24
3, 4 56 28
3, 5 52 26
4, 5 48 24

6
Ejemplo 1 (Continuación)
Organice la media muestral en una distribución de muestreo.

Media muestral Frecuencia Relativa probabilidad


de frecuencia
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10

7
Ejemplo 1 (Continuación)
Calcule la media de la media muestral. Compárela con la población media.

La media de la media muestral o valor esperado de la media muestral es 25.2


horas.

22(1)  24(2)  26(3)  28(2)


X   25.2
10

8
Ejemplo 1 (Continuación)
La media de la población también es 25.2 horas.

22  26  30  26  22
  25.2
5

Note que la media de la media muestral es igual a la media de la población.

9
Error o desviación estándar de la
media muestral
Si σ no es conocido y n >= 30, la desviación estándar de la muestra,
designada s, se aproxima a la desviación estándar de la población.
La fórmula para la desviación estándar es:

s
sx 
n

10
Distribución Normal Estándar de
las Medias Muestrales
Si la población sigue la distribución normal, la distribución muestral de la
media muestral seguirá también la distribución normal y podemos calcular una
variable aleatoria normal estandarizada, Z, que tiene una media de 0 y una
varianza de 1:

X 
z
Desviación estándar de la media
de una distribución de probabilidad
normal estándar.
 n
11
Ejemplo 2
Un banco calcula que sus cuentas de ahorros
individuales están normalmente distribuidas con una
media poblacional de S/. 3,000 y su desviación estándar
es de S/. 900. Si el banco toma una muestra aleatoria de
150 cuentas, ¿cuál es la probabilidad de que la media de
la muestra caiga entre S/.2,900 y S/.3,080?

12
Ejemplo 2 (Continuación)
El primer paso es hallar la desviación estándar de la media muestral:

 900
Ahora calculamos los dos valores de z x    S / .73,49
n 150

x  S / .2,900
X   S / .2,900  S / .3,000
z   1,36
 n S / .73,49

13
Ejemplo 2 (Continuación)
x  S / .3,080
X   S / .3,080  S / .3,000
z   1,09
 n S / .73,49

14
Ejemplo 2 (Continuación)
Después determinamos la probabilidad de los valores z entre -1.36 y 1.09. Esto
es:

P(1.36  z  1.09)  0.4131  0.3621  0.7752


Esperaríamos un 78% de que la media muestral esté entre más 80 y menos de
100 de la media poblacional.

15
Forma de la distribución muestral
de la media muestral ( )
Los resultados anteriores
respecto al valor esperado y a la • La distribución
muestral de la media
LA POBLACIÓN
desviación estándar en la TIENE muestral está
distribución muestral dela DISTRIBUCIÓN
distribuida
normalmente sea
media muestral son aplicables a NORMAL cual sea el tamaño de
cualquier población. la muestra.

El paso final en la identificación


de las características de la • Entonces el teorema
distribución muestral de la LA POBLACIÓN del límite central
ayuda a determinar la
media muestral es determinar la NO TIENE forma de la
DISTRIBUCIÓN
forma de la distribución NORMAL
distribución muestral
de la media muestral.
muestral.

16
El teorema del límite central
Cuando se seleccionan muestras aleatorias simples de tamaño n
de una población, la distribución muestral de la media muestral
puede aproximarse mediante una distribución normal a medida
que el tamaño de la muestra se hace grande.

17
El teorema del límite central
Si la población no sigue la distribución normal, pero la muestra es de al menos
30 observaciones, la media muestral seguirá la distribución normal.
Para determinar la probabilidad de que una media muestral esté dentro de
una región particular, utilice:

X 
z
s n

18
Ejemplo 3
Suponga que la media del precio de venta de un galón de gasolina en
Perú en soles es de S/.11,909. Además, asuma que la distribución está
posiblemente inclinada, con una desviación estándar muestral de S/.
2,62 ¿Cuál es la probabilidad de seleccionar una muestra de 35
estaciones de gasolina y encontrar una media muestral dentro de S/.
0,74?

19
Ejemplo 3 (Continuación)
El primer paso es encontrar los valores z correspondientes a S/.11,169 y
S/.12,649. Existen dos puntos dentro de S/. 0.74 de la media de la población.

X   S / .12,649  S / .11,909
z   1,67
s n S / 2,62 35

20
Ejemplo 3 (Continuación)

X   S / .11,169  11,909
z   1.67
s n S / .2,62 35

21
Ejemplo 3 (Continuación)
Después determinamos la probabilidad de los valores z entre -1.67 y 1.67. Esto es:

P(1.67  z  1.67)  2(0.4525)  0.9050


Esperaríamos un 91% de que la media muestral esté dentro (a más o menos) de
S/.0.74 de la media de la población. Por tanto, la probabilidad de que la diferencia
entre la media muestral y la media poblacional sea superior a S/. 0.74 es 1 -
0.9050 = 0.095
En otras palabras, una muestra aleatoria simple de 35 estaciones de gasolina tiene
aproximadamente 91/9 oportunidades de tener una media muestral que no difiera
de la media poblacional en más de los aceptables S/. 0.74.

22
¿De qué depende el tamaño de
la muestra?
1. El margen de error que
puede tolerar el
investigador.
2. El nivel de confianza que se
desea
3. La variabilidad en la
población que se estudia
[Link]
content/uploads/2017/03/intervalo-confianza-normal-
[Link]

Un error permisible pequeño requerirá una muestra


grande y un error permisible grande, permitirá una
muestra menor.
23
Formas de obtener la desviación
estándar de la población
Enfoque de estudio comparativo Si se tiene una dispersión
(Obtener un estudio previo, pero significativa se requiere una muestra
confiable). grande y si la población está
concentrada, se requiere una
Enfoque de aproximación basada en muestra más pequeña.
el rango (la desviación estándar es
aproximadamente una sexta parte del
rango).
Enfoque de estudio piloto (Realizar
un estudio cuantitativo, descriptivo
previo y estime la desviación
estándar).

24
Actividad

25
Actividad

26
Actividad
El costo promedio de un estudio en condominio
en desarrollo en el distrito de Magdalena es de
$62,000 con una desviación estándar de $4,200

a) ¿Cuál es la probabilidad de que un condominio


en este desarrollo cueste al menos $65,000?

27
Actividad
Suponga que de una población en la que σ = 10 y se
toma una muestra aleatoria simple de tamaño 50.
Halle el valor del error estándar de la media
muestral en cada uno de los casos siguientes (Usar
el factor de corrección si es necesario).
a. El tamaño de la población es infinito.
b. El tamaño de la población es N = 50 000.
c. El tamaño de la población es N = 5000.
d. El tamaño de la población es N = 500.

28
29
MUCHAS GRACIAS

30
TEMA: DISTRIBUCIONES DE
PROPORCIONES MUESTRALES

ASIGNATURA: ESTADÍSTICA APLICADA A LA ECONOMIA

EJERCICIOS
4
Referencia bibliográfica
Newbold, Paul, et al. Estadística para Administración y Economía. (2008). 6ª Edición,
Pearson Prentice Hall, Madrid
INTERVALOS DE CONFIANZA
A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A

MG. ECON. VERÓNICA A. MORE SÁNCHEZ


LOGROS DE LA SESIÓN

1. Interpretar el nivel de confianza.

2. Construir un intervalo de confianza para la media poblacional


cuando se conoce la desviación estándar poblacional.
3. Construir un intervalo de confianza para la media poblacional
cuando no se conoce la desviación estándar poblacional.

4. Construir un intervalo de confianza para la proporción poblacional.

5. Determinar el tamaño de la muestra por atributos y variables.

2
Intervalos de confianza
•Intervalo de confianza: Un conjunto de valores obtenido a partir de los
datos muestrales, en el que hay una determinada probabilidad de que
se encuentre el parámetro. A esta probabilidad se le conoce como el
nivel de confianza.

3
Estimación por intervalos de la
media poblacional
Los hechos que determinan la amplitud de un intervalo de
confianza son:
1. El tamaño de la muestra, n
2. La variabilidad de la población. normalmente estimada por s.
3. El nivel de confianza deseado.

4
Estimación por intervalos de la
media poblacional
Si la desviación estándar de la población es conocida utilizamos la
distribución z.


X z
n

5
Estimación por intervalos de la
media poblacional
Si la desviación estándar de la población es desconocida o la muestra es
mayor que 30 utilizamos la distribución z.

s
X z
n

6
Punto e intervalo de estimación
(muestras pequeñas)
Si la desviación estándar de la población es desconocida, la muestra es
menor que 30 y la población es normal o casi normal utilizamos la
distribución t

William Sealy
Gosset, estadístico
irlandés que trabajó en
la Guinness Brewery de
Dublín a principios de
s
X t
la década de 1900

n
7
Intervalo de estimación
Un intervalo de estimación establece el rango en el cual se encuentra el
parámetro de población.
Un intervalo en el cual se espera que ocurra el parámetro de población
se llama intervalo de confianza.
Los dos intervalos de confianza que son más utilizados son de 95% y
99%.

8
Intervalo de estimación
Para un 95% de intervalo de confianza, aproximadamente
95% de los intervalos construidos igualmente contendrán el
parámetro inicial. También el 95% de la muestra media para
un tamaño de muestra específico se encontrará dentro del
1.96 de la desviación estándar de la media de la población.

Para el 99% de intervalo de confianza, 99% de la muestra


media para un tamaño de muestra específico se encontrará
dentro del 2.58 de la desviación estándar de la media de la
población.

9
Error estándar de la media
muestral
Si σ no es conocido y n >= 30, la desviación estándar de la muestra,
designada s, se aproxima a la desviación estándar de la población.
La fórmula para la desviación estándar es:

s
sx 
n

10
95% y 99% intervalos de confianza
para µ
El 95% y 99% intervalos de confianza:
95% CI para la media de la población es dada:

s
X  1.96
n

 99% CI para la media de la población es dada


Como:
s
X  2 .58
n
11
Ejemplo 1
•El director de una escuela profesional de economía de la UNFV quiere
estimar la cantidad media de horas que los estudiantes trabajan por
semana. De una muestra de 49 estudiantes mostró una media de 24 horas
con una desviación estándar de 4 horas. ¿Cuál es la media de la
población?

•El valor de la media de la población no es conocida. Nuestra mejor


estimación de este valor es la muestra media de 24.0 horas. Este valor es
llamado estimación puntual.

12
Ejemplo 1 (Continuación)
Encuentre el intervalo de confianza con el 95% para la media de la población.
El rango límite de confianza es de 22.88 a 25.12 horas.

s 4
X  1.96  24.00  1.96
n 49
 24.00  1.12
Aproximadamente el 95% de los intervalos construidos
incluyen el parámetro de población.

13
Intervalo de confianza para la
proporción de la población (P)

P(1  P) P(1  P)
 pˆ   pˆ  N n
p̂p̂N 1

n n
Error estándar de la Factor de corrección para
distribución muestral de muestra finita usando la
las proporciones misma regla que para la
muestrales para media muestral
población infinita

pˆ  P
z Si 𝑛𝑃(1 − 𝑃) > 9
 pˆ
14
Intervalo de confianza para la
proporción de la población (P)
El intervalo de confianza para la proporción de la población se estima como:

Pˆ (1  Pˆ )
p̂p̂

pˆ  z
n

15
Ejemplo 2
De una muestra de 500 personas, 175 revelaron que sí se debería vacar al
presidente de la república . Desarrolle un intervalo de confianza con el 98% para
la proporción de personas que piensan que sí se debería vacar al presidente.

(0.35)(0.65)
0.35  2.33  0.35  0.0497
500

El rango límite de confianza es de 30,03% a 39.97%

16
Ejercicio
La proporción de todos los clientes de Pizza Hut que comen en el local es del
75%. En una muestra de 100 clientes, desarrolle un intervalo de confianza con el
95% para la proporción de personas que lleva su comida a casa.

17
EJERCICIO
La industria peruana de lácteos desea calcular el consumo medio de leche
por año. Una muestra de 16 personas revela que el consumo medio anual
es de 60 litros, con una desviación
estándar de 20 litros.
a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el mejor estimador de
este valor?
b) Explique por qué necesita utilizar la distribución t.
c) ¿Cuál es el valor de t en un intervalo de confianza de 95%?
d ) Construya el intervalo de confianza de 95% de la media de población.
EJERCICIO
El propietario de una empresa desea calcular la cantidad media de huevos que
pone cada gallina. Una muestra de 20 gallinas indica que ponen un promedio
de 20 huevos al mes, con una desviación estándar de 2 huevos al mes.
a) ¿Cuál es el valor de la media de la población?
b) Explique por qué necesita utilizar la distribución t.
c) ¿Cuál es el valor de t en un intervalo de confianza de 99%?
d ) Construya el intervalo de confianza de 99% de la media de población.
Ejemplo 3
Dada la información del Ejemplo 1, construya un intervalo de
confianza del 95% para la cantidad media de horas que los
estudiantes trabajan por semana si tan sólo son 500
estudiantes en el campus.
Porque n/N = 49/500 = .098 el cual es mayor que 0.05,
utilizamos el factor de corrección de la población finita

4 500  49
24  1.96( )( )  24.00  1.0648
49 500  1

20
EJERCICIO
El propietario de una estación de servicio desea determinar la proporción de
clientes que utilizan tarjeta de crédito o débito para pagar la gasolina.
Entrevistó a 100 clientes y descubre que 80 pagaron en ella.
a) Calcule el valor de la proporción de la población.
b) Construya el intervalo de confianza de 95% de la proporción poblacional.
c) Interprete sus conclusiones.
Elección del tamaño de
muestra apropiado
Existen 3 factores que determinan el tamaño
de la muestra, ninguno de los cuales tiene
relación con el tamaño de la población. Éstos
son:
◦El nivel de confianza deseado.
◦El máximo error permisible.
◦La variación en la población.

22
Tamaño de muestra para una estimación
por intervalo de la media poblacional
Para encontrar el tamaño de la muestra para
una variable:
 z  
2
2
 zs n
n  
 E   E 
•Donde: E es el error permisible ( margen de error deseado), z es el valor-z
correspondiente al nivel de confianza seleccionado, y s es la desviación estándar
de la muestra del estudio piloto.

•Este tamaño de muestra proporciona el margen de error deseado al nivel de


confianza elegido.

23
Ejemplo 4
•Un estudio sobre los consumidores quiere estimar la media del cargo mensual
de energía de setiembre de una casa común dentro de S/. 5 (margen de error
deseado) utilizando 99% de nivel de confianza. Basado en estudios similares, la
desviación estándar poblacional se estima debe ser S/. 20.00. ¿Cuántas
muestras son requeridas?

2
 (2.58)( 20) 
n   107
 5 

24
Tamaño de la muestra para una estimación
por intervalo de la proporción poblacional
La fórmula para determinar el tamaño de la muestra en
el caso de una proporción es:
2
Z
n  pˆ (1  pˆ ) 
E
Donde:p̂es la proporción estimada, basada en
la experiencia anterior o de un estudio piloto, z
es valor-z asociado con el grado de confianza
seleccionado; E es el máximo error permisible
que el investigador tolerará.
25
Tamaño de la muestra
para una estimación por intervalo de
la proporción poblacional
La fórmula para determinar el tamaño de la muestra en el caso de una
proporción es:

2
Z
n  p (1  p ) 
* *

* E
p
Donde: es la proporción planeada y se determina mediante
alguno de los métodos siguientes:
1. Utilizar la proporción poblacional de una muestra previa de las
mismas unidades.
2. Utilizar un estudio piloto y elegir una muestra preliminar.
3. Proponer una mejor aproximación
4. Si no aplica ninguna de las alternativas anteriores, emplear como
valor planeado 0,5.

26
Ejemplo 5
Una empresa quiere estimar la proporción de mascarillas KN95 con defecto
de fábrica. Si la empresa quisiera estimarlo dentro del 3% de la proporción de
la población, ¿cuántas mascarillas necesitarían revisar? Asuma 95% de nivel
de confianza y que la empresa estima que un 30% de las mascarillas KN95
tiene defecto de fábrica.

2
 1.96 
n  (0.30)(0.70)   897
 0.03 

27
28
Distribución t de Student
Distribución t de Student
TEMA: INTERVALOS DE CONFIANZA Y
TAMAÑO DE LA MUESTRA

ASIGNATURA: ESTADÍSTICA APLICADA A LA ECONOMIA

EJERCICIOS
EJERCICIOS
1. Se calcula que una población tiene una desviación estándar de 10. Desea
estimar la media de la población a menos de 2 unidades del error
máximo admisible, con un nivel de confianza de 95%.
¿De qué tamaño debe ser la muestra?
2. Quiere estimar la media de la población a menos de 5, con un nivel de
confianza de 99%. Se calcula que la desviación estándar es de 15. ¿De
qué tamaño debe ser la muestra?
3. El estimador de la proporción poblacional debe estar a más o menos
0.05, con un nivel de confianza de 95%. El mejor estimador de la
proporción poblacional es de 0.15. ¿De qué tamaño debe
ser la muestra que se requiere?
EJERCICIOS
4- La televisora Fox TV considera reemplazar uno de sus programas de
investigación criminal, que se transmite durante las horas de mayor
audiencia, por una nueva comedia orientada a la familia.
Antes de tomar una decisión definitiva, los ejecutivos estudian una
muestra de 400 telespectadores. Después de ver la comedia, 250
afirmaron que la verían y sugirieron reemplazar el programa
de investigación criminal.
a) Construya el intervalo de confianza de 99% de la proporción
poblacional.
b) Interprete los resultados que obtuvo.
EJERCICIOS
5-Utilice la tabla para localizar el valor de t en las siguientes
condiciones.
a) El tamaño de la muestra es de 15, y el nivel de confianza, de 95 por
ciento.
b) El tamaño de la muestra es de 24, y el nivel de confianza, de 98 por
ciento.
MÉTODO DE LOS MÍNIMOS CUADRADOS
O REGRESIÓN LINEAL

A S I G N AT U R A : E S TA D Í S T I C A A P L I C A D A A L A E C O N O M I A

MG. ECON. VERÓNICA A. MORE SÁNCHEZ


¿Con qué variables podemos
relacionar la demanda de un bien
o servicio?
Participación de
Número de Ingreso per
la mujer en el
habitantes cápita
mercado laboral

Cantidad de
Otras variables
empresas
Regresión lineal y correlación
 LOGROS DE LA SESIÓN:

1. Trazar un diagrama de dispersión.

2. Entender e interpretar los términos variable dependiente y variable


independiente.

3. Calcular y explicar el coeficiente de correlación, y el coeficiente de


determinación, así como el error estándar de estimación.

4. Realizar una prueba de hipótesis para establecer si el coeficiente de correlación


de la población es cero.

4
5. Determinar la línea (o recta) de regresión de mínimos cuadrados.

6. Elaborar e interpretar intervalos de confianza e intervalos de predicción para la


variable dependiente.

5
Análisis de correlación
El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la asociación
entre dos variables.
Un diagrama de dispersión es una gráfica que representa la
relación entre dos variables.
La variable dependiente es la variable que se predice o
calcula.
La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.

6
El coeficiente de correlación, r
El coeficiente de correlación (r) es una medida de la
intensidad de la relación lineal entre dos variables.
Requiere datos de nivel de razón.
Puede tomar cualquier valor de -1.00 a 1.00.
Los valores de -1.00 o 1.00 indican la correlación perfecta y
fuerte.
Los valores cerca de 0.0 indican la correlación débil.
Los valores negativos indican una relación inversa y los
valores positivos indican una relación directa.

7
Correlación negativa perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
8
Correlación positiva perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
9
Correlación cero
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
10
Correlación positiva fuerte
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
11
Fórmula para r
Calculamos el coeficiente de correlación de las fórmulas
siguientes.

( X  X )(Y  Y )
r
(n  1) s x s y
n(XY )  (X )(Y )

n(X 2
 
)  (X ) n Y  Y 
2 2
 2

12
Coeficiente de determinación
El coeficiente de determinación (r2) es la proporción de la
variación total en la variable dependiente (y) que se explica
por la variación en la variable independiente (x).
Es el cuadrado del coeficiente de correlación.
Su rango es de 0 a 1.
No da ninguna información sobre la dirección de la relación
entre las variables.

13
¿Qué es una prueba de hipótesis?
La prueba de hipótesis es un procedimiento
basado en la evidencia de la muestra y la teoría de
las probabilidades, usadas para determinar si la
hipótesis es una declaración razonable y no debe
ser rechazada, o es irrazonable y debe ser
rechazada.

14
Ejemplo 1
El presidente de la sociedad de alumnos de una
Universidad pública de la Facultad de Ciencias Económicas,
se ocupa de estudiar el costo de los libros de texto. Él cree
que hay una relación entre el número de páginas en el texto
y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente
en venta en la librería. Dibuje un diagrama de dispersión.
Compruebe el coeficiente de correlación.

15
Ejemplo 1 (Continuación)
Libro Páginas Precio ($/.)
Econometría 500 84
Macroeconomía 700 75
Estadística 800 99
Microeconomía 600 72
Marketing 400 69
Finanzas 500 81
Análisis matemático 600 63
Comercio exterior 800 93

16
Ejemplo 1 (Continuación)
Scatter Diagram of Number of Pages and Selling Price of Text

100

90
Price ($)

80

70

60
400 500 600 700 800
Page

17
Diagrama de dispersión con
EXCEL
DIAGRAMA DE DISPERSIÓN DE PÁGINAS DE LOS LIBROS Y PRECIOS
120

100

80
PRECIO $

60

40

20

0
0 100 200 300 400 500 600 700 800 900
PÁGINAS DE LIBROS
Ejemplo 1 (Continuación)
Libro Páginas Precio ($)
X Y XY X2 Y2
Econometria 500 84 42,000 250,000 7,056
Macroeconomía 700 75 52,500 490,000 5,625
Estadística 800 99 79,200 640,000 9,801
Microeconomía 600 72 43,200 360,000 5,184
Marketing 400 69 27,600 160,000 4,761
Finanzas 500 81 40,500 250,000 6,561
Análisis matemático 600 63 37,800 360,000 3,969
Comercio exterior 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606

19
Ejemplo 1 (Continuación)

n(XY )  (X )(Y )


r
n(X 2
 
)  (X ) n Y  Y 
2 2
 2

8(397,200)  (4,900)(636)

8(3,150,000  (4,900) 8(51,606)  (636) 
2 2

 0.614

20
Ejemplo 1 (Continuación)
La correlación entre el número de páginas y el precio de venta
del libro es 0.614. Esto indica una asociación moderada entre
las variables. Pruebe la hipótesis de que no hay correlación en
la población. Utilice un nivel de la significancia del .02.
Paso 1: H0: La correlación en la población es cero.
H1: La correlación en la población no es cero.
Paso 2: H0 es rechazada si t>3.143 o si t<-3.143.
Hay 6 grados de libertad, encontrados cerca.
n–2=8–2 = 6.

21
Ejemplo 1 (Continuación)
Paso 3: Para encontrar el valor del estadístico de
prueba, utilizamos:

r n2 .614 8  2
t   1.905
1 r 2
1  (.614 ) 2

Paso 4: H0 no se rechaza. No podemos rechazar la


hipótesis de que no hay correlación en la población. La
cantidad de asociación puede ser debido al azar.

22
Análisis de regresión
En análisis de regresión utilizamos la variable independiente
(X) para estimar la variable dependiente (Y).
La relación entre las variables es lineal.
Ambas variables deben ser por lo menos escala del
intervalo.
El criterio de mínimos cuadrados se utiliza para determinar
la ecuación. Este es el término (Y – Y')2

23
Análisis de regresión
La ecuación de regresión es: Y' = a + bX, donde:
Y' es el valor pronosticado de la variable Y para un valor
seleccionado de X.
a es la ordenada de la intersección con el eje Y cuando X = 0. Es el
valor estimado de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para
cada cambio de una unidad en X.
el principio de mínimos cuadrados se utiliza para obtener a y b.

24
Análisis de regresión
El principio de mínimos cuadrados se utiliza para obtener a y b.
Las ecuaciones para determinar a y b son:

n(  XY )  (  X )(  Y )
b
n(  X 2 )  (  X ) 2
Y X
a b
n n

25
Ejemplo 2 (Continuación)
Desarrolle una ecuación de regresión para la información dada
en el Ejemplo 1 que se puede utilizar para estimar el precio de
venta basado en el número de páginas.

8(397 ,200 )  (4,900 )(636 )


b  .05143
8(3,150,000 )  (4,900 ) 2

636 4,900
a  0.05143  48.0
8 8

26
Ejemplo 2 (Continuación)
La ecuación de regresión es:
Y' = 48.0 + .05143X
La ecuación cruza al eje Y en $48. Un libro sin las páginas
costaría $48.
La pendiente de la línea es .05143. El costo de cada página
adicional es de cinco céntimos.
El signo del valor de b y el signo del valor de r serán siempre
iguales.

27
Ejemplo 2 (Continuación)
Podemos utilizar la ecuación de regresión para
estimar valores de Y.
El precio de venta estimado de un libro de 800 páginas es $89.14,
encontrado por

Y   48.0  0.05143 X
 48.0  0.05143 (800)  89.14

28
El error estándar de estimación
El error estándar de estimación mide la dispersión de los
valores observados alrededor de la línea de regresión.
Las fórmulas que se utilizan para comprobar el error estándar
son:

(Y  Y ) 2
s y. x 
n2
Y 2  aY  bXY

n2

29
Ejemplo 3
Encuentre el error estándar de estimación para el
problema que implica el número de páginas en un libro
y el precio de venta.

Y 2  aY  bXY
s y. x 
n2
51,606  48(636 )  0.05143 (397 ,200 )

82
 10.408
30
Suposiciones subyacentes en el análisis
de regresión lineal
Para cada valor de X, hay un grupo de valores de Y, y estos valores
de Y se distribuyen normalmente.
Las medias de estas distribuciones normales de valores Y, caen
todas en la recta de regresión.
Las desviaciones estándar de estas distribuciones normales son
iguales.
Los valores de Y son estadísticamente independientes. Esto
significa que en la selección de una muestra, los valores de Y
elegidos para un valor particular de X no dependen de los valores
de Y de ningún otro valor de X.

31
Intervalo de confianza
El intervalo de confianza para el valor medio de Y para un valor
dado de X está dado por:

1 ( X  X )2
Y   ts y. x 
n (  X ) 2
X 2 
n
1 (800  612 .5) 2
89.14  2.447 (10.408) 
8 (4900 ) 2
3,150,000 
8
89.14  15.31

32
Intervalo de predicción
El intervalo de predicción para un valor individual de Y para un
valor dado de X se da por:

1 ( X  X )2
Y   ts y. x 1 
n ( X ) 2
X 
2
n
1 (800  612 .5) 2
89.14  2.447 (10.408 ) 1  
8 (4900 ) 2
3,150 ,000 
8
89.14  29.72
33
Ejemplo 3 (Continuación)
Resumir los resultados:
El precio de venta estimado para un libro con 800 páginas es
$89.14.
El error estándar de estimación es $10.41.
El intervalo de confianza de 95% para todos los libros con 800
páginas es $89.14+-$15.31. Esto significa que los límites están
entre $73.83 y $104.45.
El intervalo de predicción de 95% para un libro particular con 800
páginas es $89.14+-$29.72. Esto significa que los límites están
entre $59.42 y $118.86.
Estos resultados aparecen en la siguiente salida de MINITAB.

34
DATOS EXCEL
36
Distribución t de Student
Distribución t de Student

También podría gustarte