Licenciatura en Informática Administrativa
Alumno: Luis Gael López Salazar Matricula: 62395 Tetramestre: 5
Actividad 2
Capítulo 3 y 5: Estimación de parámetros y Pruebas de hipótesis con la distribución ji
cuadrada
Tutor: Oscar González González Asignatura: Estadística Inferencial Aula: A
Apodaca, Nuevo León 19/Septiembre/2023
Introducción
La estimación de parámetros es un método que consiste en asignar un valor al parámetro
o al conjunto de parámetros que caracterizan el campo sujeto a estudio. La fórmula
matemática que lo determina se denomina estimador. Al ser una estimación existe cierto
error. Incluso, aunque el estimador tenga todas las propiedades óptimas. Por pequeño que
sea, siempre existirá un error. Así pues, para obtener estimaciones adaptadas a esa realidad,
se crean intervalos de confianza. Es decir, rangos entre los que están esos valores
estimados con cierto grado de confianza. El grado de confianza se puede modificar. Cuando
mayor sea el grado de confianza, más grande será el intervalo. Eso sí, cuanto menos error
tenga la estimación inicial, más acotado será el intervalo de confianza.
La prueba de ji cuadrado se usa para comprobar hipótesis sobre si ciertos datos son como
se esperaba. La idea clave tras la prueba es comparar los valores observados en los datos
con los valores esperados que tendríamos si la hipótesis nula es cierta. La prueba ji
cuadrado de bondad de ajuste es una prueba de hipótesis estadística que se usa para
averiguar si es probable que una variable provenga o no de una distribución específica. Se
emplea a menudo para determinar si los datos de una muestra son representativos de la
población completa.
EI: ACTIVIDAD 2 A REALIZAR:
Resuelve los siguientes ejercicios (Procedimiento, completo, en vertical):
1. Responde las siguientes preguntas.
a) ¿Qué es un estimador? R= Es la regla que indica cómo realizar el cálculo de una
estimación a través de una fórmula que involucre los valores de una muestra
b) ¿Cuáles son las propiedades deseables de un estimador? R= Estime lo que se quiere estimar,
se busca en un estimador es que sus estimaciones varíen lo menos posible, a medida que
utilice mayor información de la población, su estimación sea cada vez más cercana al
parámetro poblacional.
c) ¿Cuál es el error de muestreo? R= El error no atribuible al muestreo se debe, entre otras
causas, a un mal diseño del instrumento, la logística implementada o una elevada tasa de
no respuesta.
d) ¿Qué es una estimación? R= Valor resultante de aplicar el estimador con los datos de la
muestra.
e) ¿Qué es una estimación puntual? R= Consiste en utilizar una regla o fórmula para estimar
el parámetro poblacional con los valores de una muestra.
f) ¿Qué es una estimación por intervalo? R= Consiste en calcular un rango de valores en los
que se espera, con cierto nivel de confianza, que se encuentre contenido el parámetro.
g) ¿Cómo se construye un intervalo para la media poblacional con muestras grandes? R= Se
determina el parámetro a estimar Promedio μ. Se determina el estimador del Parámetro
𝒙̅, se calcula el estimador puntual a través de la fórmula correspondiente: x=
∑ x i , se
n
determina la fórmula para realizar el cálculo de la estimación por intervalo del
s
estimador: IC=x ± Z , se establece el nivel de confianza para calcular z, a través del
√n
nivel de confianza (1-α), se determina la fórmula para calcular la desviación estándar del
s
estimador s x = , se calcula la desviación del estimador, se sustituye los valores en la
√n
fórmula general y calcular el límite inferior (LI) y límite superior (LS) del intervalo de
confianza (IC)
¿Cómo se construye un intervalo para la media poblacional con muestras pequeñas? R=
α 0.1
Primero se calcula α: α = 1 – 0.9 = 0.1, El resultado se divide entre 2: = = 𝟎.𝟎𝟓, Se
2 2
calculan los grados de libertad (g.l.): g.l.= n – 1 = 10 – 1 = 9, Se sustituyen en la fórmula:
[Link](0.05, 9) = 2.26, se obtiene el valor buscado.
h) ¿Cómo se construye un intervalo para la proporción poblacional? R= Se determina el
parámetro a estimar Promedio μ. Se determina el estimador del Parámetro 𝒙̅, se calcula
el estimador puntual a través de la fórmula correspondiente: x=
∑ x i , se determina la
n
fórmula para realizar el cálculo de la estimación por intervalo del estimador:
s
IC=x ± Z , se establece el nivel de confianza para calcular z, a través del nivel de
√n
confianza (1-α), se determina la fórmula para calcular la desviación estándar del
s
estimador s x = , se calcula la desviación del estimador, se sustituye los valores en la
√n
fórmula general y calcular el límite inferior (LI) y límite superior (LS) del intervalo de
confianza (IC)
i) ¿Cómo se construye un intervalo para la desviación poblacional? R= Se utiliza el
2
(n−1) S 2
siguiente resultado: 2
x n−1
σ
2. Una farmacéutica cuenta con 500 representantes médicos. Con la intención de diseñar un
plan de incentivos, se quiere conocer el promedio de visitas que realizan los representantes,
para lo cual se analizó una muestra de 30 representantes médicos elegidos al azar,
a ¿=x=
∑ x i =x= 8+ 4 ⋯ +5+5
n 30
189
x= =6.3
30
b ¿ a=1−0.95=0.05
¿ Z=1.959=1.96
s
sx= s=√ ∑ ¿ ¿ ¿ ¿
√n
s= √ ¿ ¿ ¿
s 1.235
sx= = =0.225
√n √ 30
IC=6.3+ ±1.96 ∙ 0.225
IC=6.3 ± 0.441
LI =6.3−0.441=5.859
LS=6.3+0.441=6.741
a) Estimar el promedio de visitas que realizan los representantes médicos, con una
estimación puntual. R= 6.3
b) Estimar un intervalo de confianza con un nivel de confianza del 95%. R=
(5.859 , 6.741)
c) Interpretar los resultados. R= El promedio de visitas diarias efectuadas por un
representante medico es de 6. El promedio de visitas que realiza un representante
médico al día con un nivel de confianza del 95% se sitúa entre 6 y 7
3. Con base en el problema 2, tomar una muestra de los primeros 10 y resolverlo para la
estimación de la media para muestras pequeñas, (usando distribución t de Student con
n-1 grados de libertad).
x=
∑ x i =x = 8+ 4 ⋯ +6+6
n 10
64
x= =6.4
10
a=0.05=t=2.685=2.69
s= √ ¿ ¿ ¿
¿ 1.28
1.28
sx= =0.404
√10
IC=6.4 ±2.69 ∙ 0.404
IC=6.4 ±1.086
LI =6.4−1.086=5.314
LS=6.4+1.086=7.486
a) Estimar el promedio de visitas que realizan los representantes médicos, con una
estimación puntual. R= 6.4
b) Estimar un intervalo de confianza con un nivel de confianza del 95%. R=
(5.314 ,7.416)
c) Interpretar los resultados. R= El promedio de visitas diarias efectuadas por un
representante medico es de 6. El promedio de visitas que realiza un representante
médico al día con un nivel de confianza del 95% se sitúa entre 5 y 7
4. Hacer la estimación de una proporción poblacional con la información del problema 2
y la muestra presentada, tomando un número de visitas realizadas por los representantes
mayores de 6,
a) Realizar una estimación puntual de la proporción de # de visitas realizadas
mayores de 6. R=46 %
b) Realizar una estimación por intervalo para la proporción de # de visitas
realizadas mayores de 6, con un nivel de confianza del 95%. R=29 % y 64 %
c) Interpretar los resultados. R= La estimación puntual de visitas realizadas mayor a
6 es del 46%. Con un estimado de intervalo mayor a 6 del 29% y 64% con un nivel
de confianza de 95%.
14
n=30 xi =14 p= =0.466
30
Z=95 %=1.96
s p=
√ pq
n
q=1−p
q=1−0.466=0.534
s p=
√ 0.446 ∙ 0.534
30 √=
0.238
30
=√ 0.0079=0.0888
IC=0.466 ± 1.96 ∙ 0.0888=0.466 ±0.174
LI =0.466−0.174=0.292
LS=0.466+0.174=0.64
5.
a) ¿Qué es una prueba de hipótesis estadística? R= Es un enunciado sobre el
comportamiento de un parámetro poblacional o de la distribución de una
variable aleatoria.
b) ¿Qué es una hipótesis alternativa? R= Enunciado que contrasta el
comportamiento del valor de un parámetro poblacional definido en la hipótesis
nula.
c) ¿Cuándo se presenta el error tipo I? R= Cuando se rechaza la hipótesis nula
cuando es verdadera.
d) ¿Cuándo se presenta el error tipo II? R= Cuando se rechaza la hipótesis
alternativa cuando es cierta.
e) ¿Qué es una prueba de un extremo? R= Se contrasta que el valor del parámetro
sea notablemente mayor o menor al fijado en la hipótesis nula.
f) ¿Qué es una prueba de dos colas? R= Se contrasta que el valor sea diferente al
establecido en la hipótesis nula, es decir, puede ser notablemente mayor o
menor.
g) ¿Qué es el nivel de significancia? R= Se pide determinar el valor crítico para
una prueba de una o dos colas cuando la distribución del estadístico de prueba
es una distribución normal estandarizada.
h) ¿Qué es un estadístico de prueba? R= Es una variable aleatoria debido a que su
valor dependerá de los elementos que conforman la muestra.
i) ¿Qué es el valor crítico? R= Se calcula a partir de la significancia que se defina
en la prueba.
j) ¿Qué es una zona de rechazo? R= Es el conjunto de valores del estadístico del
contraste que nos lleva a la decisión de rechazar la hipótesis nula.
6. La empresa A&B es resultado de la fusión de las empresas A y B. Recientemente, se
percibe un clima laboral que no ayuda a los logros de las metas. Para detectar los aspectos
que no favorecen al buen clima laboral, se aplicó una encuesta a 120 empleados elegidos
aleatoriamente provenientes de la empresa A, y a 150 de la empresa B. Los principales
resultados se muestran en la siguiente tabla.
De acuerdo con los resultados anteriores y considerando un nivel de significancia de
5%, responde lo siguiente: Ver
p.170
a) ¿Existe diferencia en la variación salarial entre los empleados provenientes de
A respecto a los de B? (procedimiento completo, con grafica completa).
Datos
s A =2 , 80 0 a=5 %=0.05
A
s2 =7,840 , 00 0 PC 1=1.403
s B=1 , 90 0 PC 2=0.707
B
s2 =3,610 , 00 0 EP−F=2.171
n A =12 0
n B=15 0 ZONA DE
RECHAZO
X A =7 , 20 0 a= 0.025
X B=13 , 10 0 ZONA DE
RECHAZO
p A =0.5 4 PC2=0.7 PC1=1.4 EP=2.17
pB =0.7 3 Área acumulada 0.025
2 2
Ho=s A =s B ( No existe diferencia) Área acumulada 0.0975
2 2
Ha=s A ≠ s B (Existe diferencia)
Conclusión
Estimación es el proceso de encontrar una estimación, o aproximación, que es un
valor que es utilizable para algún propósito incluso si los datos de entrada pueden estar
incompletos, inciertos o inestables. No obstante, el valor es utilizable porque se deriva de la
mejor información disponible. Los parámetros sirven para llevar a cabo evaluaciones o
valoraciones sobre alguna situación determinada, estos tienen el objetivo de hacer tanto
comparaciones como predicciones, y de esta manera, colocar en perspectiva las
circunstancias que hayan sido estudiadas y comprendidas con anterioridad.
Los parámetros juegan un papel crucial en la estadística, tanto en la estimación de
parámetros como en su selección para modelos. La estimación de parámetros es una parte
importante para entender las estadísticas de la muestra, ya que nos permite inferir cuál
podría ser el verdadero parámetro de la población. Al seleccionar parámetros para nuestro
modelo, debemos considerar las características básicas que están presentes en nuestros
datos de muestra, como el tamaño y la calidad de los conjuntos de datos. Este proceso nos
ayuda a elegir qué variables deben ir en nuestro modelo.