Estadística y probabilidad
Organización
Valentina Anillo Martínez
COD: 1.002.133.875
Tutor
Ramiro Hernán Polanco
N° de grupo
211622_59
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERA
10 octubre 2021
Ejercicio 1
Conceptos Definiciones Ejemplos
Son coeficientes La media de tiros al arco en
descriptivos breves que un partido de futbol.
resumen un conjunto de
datos dado, que puede ser Promedio de notas en un
Estadística descriptiva una representación de toda examen.
la población o una muestra
de una población. Peso promedio en kg de
los alumnos de salón de
clases B.
Se conoce como La edad que más se repite
estadística de resumen y en el grupo de danza.
generalmente representa el
punto central del conjunto La estatura promedio de
Medidas de posición de datos. los jugadores de futbol del
central Real Madrid es de 1,72 m.
Nivel promedio de nicotina
en pacientes en
rehabilitación.
Es una tabla que enumera Alan tiene que poner los
elementos y muestra la balones de fútbol en dos
cantidad de veces que cajas. Empieza a dejar caer
ocurren. una pelota de fútbol tras
otra en dos casillas
llamadas A y B. Alan deja
caer las pelotas al azar, y
después de dejar caer 10
Tabla de frecuencia
pelotas, descansa un poco
y luego repite la tarea con
las 10 pelotas restantes.
Las tablas de frecuencia
muestran el patrón de
cómo Alan deja caer los
balones de fútbol en dos
cajas
Se utilizan cuando uno está En una distribución de
interesado en los valores calificaciones numéricas,
en una distribución solo el 10 por ciento más
asociada con posiciones alto se considerará
distintas al centro. equivalente a una
Medidas de posición no calificación en letras de A.
central Necesitaría conocer la
calificación del percentil 90.
Calcular los cuartiles de la
estatura de un grupo de
alumnos.
Es la representación Gráficos de barras, gráficos
pictórica de datos circulares, gráficos de
Gráficos estadísticos
estadísticos en forma dispersión
gráfica.
Describen la extensión de Calcular la desviación
los datos. Incluyen el media del peso de los
rango, desviación estándar balones.
Medidas de dispersión
y varianza.
Calcular la varianza en las
notas de clase.
Ejercicio 2
Construya la tabla de frecuencia con datos agrupados.
Frecuencia
Límite Límite Marca de Frecuencia Frecuencia Frecuencia
Xifi relativa
inferior superior clase absoluta acumulada relativa
acumulada
13 18 15,5 2 30,98 2 0,01 0,01
19 24 21,5 61 1310,06 63 0,20 0,21
25 30 27,5 99 2718,61 162 0,33 0,54
31 36 33,4 64 2140,48 226 0,21 0,75
37 42 39,4 44 1734,89 270 0,15 0,90
43 48 45,4 17 772,03 287 0,06 0,96
49 54 51,4 7 359,79 294 0,02 0,98
55 60 57,4 5 286,91 299 0,02 1,00
61 66 63,4 1 63,37 300 0,00 1,00
Total 300 9417,12 1,00
Construya un histograma, un diagrama circular y un polígono de frecuencia.
Presente conclusiones a partir de estos gráficos.
Histograma de frecuencia
120
100
80
60
40
20
0
15,5 21,5 27,5 33,4 39,4 45,4 51,4 57,4 63,4
Diagrama circular
15,5 21,5 27,5 33,4 39,4 45,4 51,4 57,4 63,4
Polígono de frecuencia
120
100
80
60
40
20
0
15,5 21,5 27,5 33,4 39,4 45,4 51,4 57,4 63,4
En base a los gráficos, se puede observar que la edad frecuente de los conductores se
encuentra entre 25 y 30 años de edad, mientras que la edad menos frecuente es entre 61
y 66 años de edad.
Con base en la tabla de frecuencia, responda las siguientes preguntas:
¿En cuál intervalo se observa una cantidad menor de los parámetros de su variable
escogida?
En el intervalo comprendido entre las edades de 61 y 66 años, donde solo se ubica un
parámetro.
¿Hasta cuál intervalo se acumula el 50% de los parámetros de su variable escogida?
En el tercer intervalo, comprendido entre 25 y 30 años, se acumulan 162 parámetros
de las variables. Esto representa el 54% de los datos, si bien es mayor al 50%, es el
intervalo anterior solo se alcanza el 21%.
Encuentre la media aritmética, mediana, moda el cuartil 1, el decil 5 y el percentil 63.
Interprete los resultados anteriores.
Medida Resultado Interpretación
Moda 34 La edad de mayor frecuencia del causante en los siniestros es de 34 años
Media 31 El promedio de edad de los causantes en los siniestros es de 31 años
Mediana 30 En el 50% de las personas tienen edades entre 16 y 30 años de edad
Valor mínimo 16 La edad mínima de una persona involucrada en el siniestro
Valor máximo 62 La edad máxima de una persona involucrada en el siniestro
Rango 46 Los siniestros fueron causados por personas entre 16 y 62 años
Q1 25,6 El 25% de los siniestros fueron causados por personas entre 25 y 30 años
D5 29,3 El 50% de los siniestros fueron causados por personas con hasta 30 años
P (63) 33,1 El 63% de los siniestros se ubican hasta el intervalo entre 31 y 36 años
Encuentre la varianza, desviación típica y coeficiente de variación, asimetría y
curtosis; con base en lo anterior responda:
Medida Resultado
Varianza 72,2963253
Desv. Típica 9
Coef. Variación 0,04
Asimetría 0,9400751
Curtosis 3,84691371
¿La distribución es homogénea o heterogénea?
La distribución heterogénea
¿Qué tipo de concentración y asimetría presentan los datos?
Distribución leptocúrtica, por lo cual los valores están ubicados muy alrededor de la
media. Por su parte, la asimetría es positiva, esto indica que los datos tienden a
agruparse en la parte izquierda de la media.
Ejercicio 3.
Encuentre la ecuación de regresión lineal
Variable X: Velocidad registrada (Km/H)
Variable Y: Número de personas fallecidas
𝑦̂ = 𝑎 + 𝑏𝑥
𝑦̂ = 2,08 + 0,0002𝑥
Grafique dentro de un diagrama de dispersión la recta que representa la regresión
lineal y determine si la relación entre las variables es positiva, negativa o sin
relación.
NÚMERO DE PERSONAS FALLECIDAS (Y)
4,5
4
3,5
3
2,5 y = 0,0002x + 2,081
R² = 1E-05
2
1,5
1
0,5
0
0 20 40 60 80 100 120 140 160
No existe una relación entre el numero de personas fallecidas y la velocidad registrada.
Encuentre el coeficiente de determinación y determine el porcentaje de
confiabilidad del modelo matemático obtenido.
Medida Resultado
Coeficiente de determinación R^2 1,3014E-05
Confiabilidad 0,361%
Encuentre el coeficiente de correlación de Pearson y determine el nivel de correlación
lineal entre las variables (perfecta, excelente, aceptable regular mínima o sin correlación)
Coeficiente de Pearson 0,00360753
No hay correlación entre las variables
Usando la ecuación de regresión lineal, realice 3 predicciones.
𝑦̂ = 2,08 + 0,0002𝑥
Si el conductor alcanza una velocidad de 80 Km/H, ¿Cuántas personas fallecen?
𝑦̂ = 2,08 + 0,0002(80) = 2,09 = 2 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
Si el conductor alcanza una velocidad de 85 Km/H, ¿Cuántas personas fallecen?
𝑦̂ = 2,08 + 0,0002(85) = 2,10 = 2 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
Si el conductor alcanza una velocidad de 67 Km/H, ¿Cuántas personas fallecen?
𝑦̂ = 2,08 + 0,0002(67) = 2,09 = 2 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
Bibliografía
Canavos, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos. México: McGraw
Hill.
Freedman, D., et al. (1991) Estadística. Barcelona: A.Bosch Ed.