Universidad Católica Boliviana "San Pablo"
Probabilidad y Estadística II
Prácticas Primera Parte
Yuri Miranda Gonzáles
Febrero 2022
Contenido
1 Distribuciones de Muestreo Fundamentales 1
2 Estimación de una y dos muestras 1
3 Pruebas de hipótesis de una y dos poblaciones 1
4 Trabajo Práctico 2
4.1 Distribución de muestreo fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
4.2 Estimación de parámetros de una y dos poblaciones . . . . . . . . . . . . . . . . . . . . . . . 4
4.2.1 Simulación de una población y obtención de muestras. . . . . . . . . . . . . . . . . . . 4
4.3 Pruebas de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1 Distribuciones de Muestreo Fundamentales
Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias" Walpole
Myers, que se encuentra en "Recusos" de NEO, realizar los siguientes ejercicios:
1. Distribución muestral de medias y el teorema central del límite: 8.18 al 8.30
2. Distribucion muestral de la varianza, distribucion t y distribucion F: 8.37 al 8.41; de 8.44 al 8.48 ; 8.59,
8.64, 8.67, 8,69, 8.72, 8.73.
2 Estimación de una y dos muestras
1. Intérvalos de con…anza para la media 9.3 a 9.13
2. Estimación de la diferencia de medias 1 2: 9.40 a 9.49
3. Estimación de una proporción p y diferencia de proporciones p1 p2 . Realizar los ejercicios pares de
9.52 a 9.67
2
2
4. Estimación de la varianza ; y del cociente de varianzas 1
2 : Realizar los ejercicios pares de: 9.71 a
2
9.80
3 Pruebas de hipótesis de una y dos poblaciones
1. Tipos de errores en una pruba de hipótesis: 10.1 a 10.10; de 10.14 a 10.17
2. Prueba de hipótesis respecto a la media : 10.19 a 10.26.
1
4 Trabajo Práctico
4.1 Distribución de muestreo fundamentales
1. Descargar R y Rstudio (puede consultar el video de instalación y la presentación en "Recursos" de
NEO)
2. Primeros pasos con R: escribir el script para realizar las siguientes operaciones:
(a) q
120 + 5:3 30; 2 + 37 ; 2
3 + log(3) 35
q p3 p
8
log( 2 + 23 ); p
4
64
; 2
3 + 3
7 23
(b) Crear un vector "a" con los valores 2,4,6,8,10. Hallar el tamaño del vector, la media , y varianza.
(c) Crear un vector "b" con los valores 1.2 , 1.4, 1.7, 1.9, 0.9, 0.5, 1.1, 2.5. Hallar el tamaño del vector,
la media, desviación estándar y varianza.
(d) Usar el comando summary para hallar la media, mediana, mínimo, máximo del ventor "b".
(e) Crear un vector "c" de cadena con los siguientes valores: aaa,bbb,ddd,eee,¤f,ggg, hhh. Hallar el
tamaño del vector
(f) Consultar la ayuda para el comando seq.
3. Escribir un script para realizar las siguientes operaciones:
(a) Usar el comando seq para crear un vector con nombre vector1 que contenga números consecutivos
del 1 al 20.
(b) Sumar 3, a cada valor del vector1 y almacenar en nuevo vector2.
(c) Multiplicar 10, a cada valor del vector1 y almacenar en nuevo vector, con el nombre de vector3.
(d) Sumar los valores del vector1 y el vector2 y almacenar en un nuevo vector con el nombre de vector4.
(e) Crear un data frame con el nombre "ejercicio3" que contenga como columnas los vectores anteri-
ores.
4. Crear en un libro excel, los mismos vectores del inciso a. al d. Desde R, importar a un data frame con
el nombre de ejemplo3.
5. Los siguientes datos indican los minutos (redondeados al entero superior) que ocuparon sus asientos 50
clientes de una cafetería:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
(a) Transcribir los datos a una hoja en Excel y luego, desde Rstudio o R, importar los mismos en un
dataframe con nombre datos1 y la variable con el nombre de X.
(b) Mediante Rstudio hallar la media, mediana y varianza de la variable X
(c) Veri…car las propiedades de la media y la varianza mediante:
i. La suma de 5 minutos a cada uno de los valores de X y luego hallar la nueva media y varianza.
ii. La multiplicación por 4 a cada uno de los valores de X y luego hallar la nueva media y varianza.
(d) Gra…car el histograma.
2
(e) Gra…car el diagrama de boxplot.
6. Usar R para hallar las siguientes probabilidades y veri…car los resultados con las tablas usadas en clases
o con la aplicación para celular:
a)P (Z < 1:56) b)P (Z < b) = 0:87 c)P (t(29) < 3:45) d)P (t(20) < k) = 0:90
2 2
e)P ( (10) < b) = 0:90 f)P ( (16) < 2:33) g)P ( 2:33 < Z < 2:33) h)P (1:40 < t(9) < 3:45)
7. Para una distrubución chi-cuadrada, hallar a; b, tal que (Hallar mediante R y veri…car sus resultados
mediante una aplicación para celular)
2
(a) P ( > a) = 0:99 cuando n = 4
2
(b) P ( > b) = 0:025 cuando n = 19
2
(c) P (a < < b) = 0:95 , para un intérvalo simétrico, cuando v = 25
2
(d) P (a < < b) = 0:90 , para un intérvalo simétrico, cuando v = 14
2
(e) P ( (19) 6)
2
(f) P ( (16) 10)
2
(g) P (1 (4) 8)
8. Para una distrubución t-student, hallar mediante R y veri…car sus resultados mediante una aplicación
para celular:
(a) Calcule P (t < 2:365) cuando n = 10
(b) Calcule P (t > 1:318) cuando n = 24
(c) Calcule P ( 1:356 < t < 2:179) cuando n = 7
(d) Calcule P (t > 2:567) cuando n = 15
(e) Calcule P ( k < t < k) = 0:95 para n = 20
(f) Calcule P ( k < t < k) = 0:80 para n = 25
9. Para una distrubución F isher(n; m) hallar mediante R y veri…car sus resultados mediante una apli-
cación para celular::
(a) F0:05 con n = 7 y m = 15
(b) F0:05 con n = 15 y m = 7
(c) F0;95 con n = 7 y m = 5
(d) F0:95 con n = 19y m = 24
(e) Calcule P (F (17; 29) 5; 678)
(f) Calcule P (F (3; 6) > 2:567)
10. Hallar los valores de a y b , para los siguientes intérvalos simétricos
(a) P (a < F (12; 16) < b) = 0:95
(b) P (a < F (28; 24) < b) = 0:80
11. Usando las funciones estadísticas de Excel, calcular las tablas de probabilidad acumulada para las
siguientes distribuciones de probabilidad:
(a) T-student
(b) Chi-cuadrada
3
12. Usar R para generar 1.000 números aleatorios con las siguientes distribuciones: Normal estándar,
Tstudent (n=3), Chi-cuadrada (n=4), Binomial(n=10,p=0.3) y almacenar los resultados anteriores en
tres vectores con nombres de: z, t, x, b respectivamente.
13. Hallar un resumen de estadísticos (media, varianza, desviación estándar) de los datos almacenados en
los vectores z; t; x; b y comparar con los respectivos valores teóricos de las variables aleatorias.
14. Gra…car 4 histogramas para los anteriores vectores. Gra…car el box plot para los anteriores vectores.
4.2 Estimación de parámetros de una y dos poblaciones
1. Con referencia a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias",
Walpole Myers. Realizar los siguientes ejercicios en RStudio: Ejemplo 9.13 del libro (página 293) y
ejercicios: 9.11, 9.40 y 9.44.
2. En la unidad de aprendizaje "Recursos" de la plataforma NEO se encuentra una base de datos de la
encuesta a estudiantes en el archivo "[Link]".
(a) Descargar el archivo [Link]
(b) Hallar un resumen de estadísticos descriptivos de la variable nota y edad (media, varianza,
desviación estándar)
(c) Hallar un resumen de estadísticos descriptivos de la variable nota y edad por género.
(d) Hallar el intervalo de con…anza de 1 = 0:95 para la variable edad de los estudiantes.
(e) ¿Las mujeres obtienen una nota promedio superor a los varones?. Para responder realizar:
Hallar un grá…co de boxplot de la nota desagregada por genero
Hallar el intervalo de con…anza del 98% para la diferencia de medias, enuncie los supuestos e
interpretar los resultados.
3. Se tienen los siguientes datos de un grupo de personas de una empresa, donde "y" representa años de
experiencia despues del título profesional, x1 son los años de experiencia en general, x2 está expresado
en miles dólares y representa los ahorros acumulados durante un año:
y 1 3 0 5 8 2 12 9 5 7 1 3 0 5 8 2 12 9 5 7
x1 3 4 2 4 10 3 13 10 5 9 3 4 2 4 10 3 13 10 5 9
x2 5 5 1 6 10 5 15 10 6 12 5 5 1 6 10 5 15 10 6 12
género m m h m h m h m h h m m h m h m h m m m
(a) Almacenar las anteriores variables en un data frame, denominado ejercicio1.
(b) Hallar el intervalo de con…anza al 95% de con…anza para la media poblacional de la variable "y"
(c) Interpretar el IC anterior.
(d) Hallar el intervalo de con…anza para la diferencia de medias de la variable "y" entre hombres y
mujeres
i. Suponiendo varianzas poblacionales iguales
ii. Suponiendo varianzas poblacionales diferentes
iii. Interpretar el IC anterior.
4.2.1 Simulación de una población y obtención de muestras.
1. Simular una población de tamaño n = 100 con las siguientes variables:
y = 15x + z
w = 20x + z
Donde :
4
x P oisson( = 11)
z N ormal( = 0; = 1)
(a) Hallar los parámetros (media, varianza, desviación estandar) de la población mediante un resumen
de estadísticos descriptivos para los vectores y; w.
(b) Obtener una muestra de tamaño n=15
(c) Hallar los estimadores (media, varianza, desviación estandar) de la muestra y compararlos con los
parámetros mediante
error = ^
mediante un resumen de estadísticos descriptivos para los vectores y; w.
(d) Hallar un intervalo de con…anza del 95% para la media de la variable w, y veri…car si éste intervalo
incluye al verdadero parámetro
(e) Hallar un intervalo de con…anza del 80% para la media de la variable w, y veri…car si éste intervalo
incluye al verdadero parámetro
(f) Comparar las medias de los vectores x e y mediante un grá…co de boxplot. ¿El grá…co indica
alguna evidencia de diferencia de medias en las muestras?
(g) Para con…rmar la evidencia del anterior grá…co, hallar el intervalo de con…anza de la diferencia de
medias con los respectivos supuestos necesarios e interpretar los resultados.
4.3 Pruebas de hipótesis
1. Usar el archivo de la encuesta a estudiantes "[Link]" de NEO, y suponer que es una muestra
aleatoria, obtenida de la población de todos los estudiantes de la UCB del año 2022.
(a) Hallar un resumen de estadísticos para la variable nota promedio, horas de estudio y edad.
(b) Interpretar el Q1 de horas de estudio, el Q3 de horas y el Q1 de la variable nota.
(c) Hallar un resumen de estadísticos descriptivos de la variable nota desagregada por género.
(d) Un análisis del rendimiento académico en la UCB, a…rma que " la nota promedio de los estudiantes
de la UCB no supera 70pts ". Probar la enterior a…rmación mediante una prueba de hipótesis
i. Pantear las hipotesis en base a la evidencia de los datos
ii. Hallar el estadístico de prueba
iii. Hallar el valor p
iv. Interpretar el valor p de la prueba, para aceptar o rechazar la a…rmación
(e) Simule una muestra aleatoria de tamaño n = 100 para las siguientes variables:
y = 15x + z
w = 20x + z
Donde :
x P oisson( = 11)
z N ormal( = 0; = 1)
2. Hallar un resumen de estadísticos descriptivos para los vectores y; w.
3. Realizar las siguientes pruebas de hipotesis:
a) H0 : y = 160 H1 : y 6= 160
b) H0 : y 160 H1 : y > 160
c) H0 : y 160 H1 : y < 160
5
4. Realizar las siguientes pruebas de hipotesis:
a) H0 : w = 0 H1 : w 6= 0
b) H0 : w 0 H1 : w >0
c) H0 : w 0 H1 : w <0