Serie de Parcial 1
Serie de Parcial 1
ESTADÍSTICA DESCRIPTIVA
MENEJO DE DATOS
DEPARTAMENTO DE MATEMÁTICAS
UNIVERSIDAD DE SONORA.
2023-1 NOMBRE:________________________________________ GRUPO _______
1. Clasifique las siguientes características en función a su nivel de medición, es decir, diga si las variables son
Cualitativas (Nominal u Ordinal) ó Cuantitativas (Discretas ó Continuas).
a. “Medir la temperatura de ebullición de algún compuesto”
b. “Determinar el color favorito de una persona”
c. “El nombre de pila de una persona”
d. “El puesto que ocupa en una empresa un egresado de la carrera de Ciencias de la Comunicación”
e. “El tiempo que tarda un alumno en resolver un examen de Matemáticas”
f. “La numeración correspondiente de las casas de una población determinada”
g. “El número telefónico de un individuo”
h. “El programa de televisión favorito de un adolescente”
i. “La longitud de una viga”
j. “El color de los ojos de un animal”
k. “El grado de fanatismo de una persona a un deporte”
l. “El grado asignado en el ejército a una persona”
m. “Medir la temperatura ambiente”
n. “La vida útil de un televisor”
o. “El peso de una computadora”
p. “El tiempo que dura un programa de televisión”
q. “El lugar que ocupa un equipo de béisbol al finalizar una temporada”
r. “Determinar el estado civil de un estudiante universitario”
s. “El número de estudiantes que le escriben en un chat a un desconocido”
t. “La clasificación de un producto (muy bueno, bueno, regular, malo, muy malo)”
u. “Medir el coeficiente intelectual (C.I.) de un estudiante de primer ingreso de la UniSon”
2. Los datos siguientes corresponden al número total de piezas aceptables que produjeron los trabajadores en
una fábrica durante dos semanas consecutivas:
43, 67, 65, 36, 49, 84, 79, 56, 44, 82, 38, 82, 43, 78, 37, 48, 63, 72, 68, 51, 40, 43,
50, 60, 76, 57, 46, 55, 39, 45, 62, 59, 48, 76, 74, 70, 51, 40, 82, 39, 52, 35, 52, 52,
63, 63, 80, 84, 28, 37, 48, 76, 60, 48, 55, 51, 54, 45, 27, 70, 80, 21, 35, 38, 54, 42,
61, 45, 33, 61, 37, 92, 74, 36, 45, 53, 64, 37, 43, 89, 52, 48, 52, 56, 62, 65, 55, 75,
61, 73, 50, 53, 84, 71, 28, 41, 54, 82, 38, 26, 35, 47, 32, 64, 36, 43, 67, 36, 44, 41,
35, 51, 29, 80, 75, 56, 62, 22, 82, 80, 54, 88, 64, 75, 38, 62, 73, 65, 83, 68, 51, 84,
47, 53, 28, 32, 75, 56, 45, 75, 59, 53, 74, 64, 40, 50, 38, 70, 60, 43.
a. Seleccione una muestra de tamaño 10 de esta población y explique detalladamente el procedimiento
llevado a cabo.
Se utilizará el muestre sistemático, que consiste en elegir aleatoriamente un elemento de entre los primeros k
de la población y luego seleccionar en forma sucesiva el k-esimo elemento que sigue al ultimo que se obtuvo.
Tamaño de muestra: n=10
Muestra aleatoria {60, 45, 70, 35, 84, 48, 70, 42, 92, 37}= {35, 37, 42, 45, 48, 60, 70, 70, 84, 92}
b. Calcule la media, mediana y la moda para su muestra e interprételas.
n
x i
Media: X = i =1
(para datos no agrupados) = 58.3 Es el promedio de las piezas aceptables que produjeron
n
los trabajadores de una fábrica durante dos semanas, tomadas de una muestra aleatoria.
Mediana=
1
Probabilidad y Estadística.
Moda=70
3. El primer día de clases del semestre pasado se les preguntó a 50 estudiantes el tiempo que hicieron de su
casa a la universidad (redondeados a los cinco minutos más próximos). Los resultados de la encuesta son:
20, 25, 25, 15, 25, 05, 20, 25, 30, 25, 30, 15, 40, 20, 20,40, 25, 25, 10, 20, 15, 20, 25, 45, 25,
25, 10, 25, 05, 45, 25, 15, 20, 30, 35, 25, 35, 25, 30, 35, 40, 10, 25, 30, 30, 25, 35, 30, 20, 15.
a. Presente la información de la muestra en una Tabla Estadística.
0 5, 5
1 0,0,0,5,5,5,5,5
2 0,0,0,0,0,0,0,0,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5
3 0,0,0,0,0,0,0,5,5,5,5
4 0,0,0,2,2
2
Probabilidad y Estadística.
Histograma de frecuencias
20
15
10
0
5 10 15 20 25 30 35 40 45
Polígono de frecuencias:
Polígono de frecuencias
18
16
14
12
10
8
6
4
2
0
0 10 20 30 40 50
Ojiva:
Ojiva
60
50
40
30
20
10
0
0 10 20 30 40 50
3
Probabilidad y Estadística.
xn + xn
2 +1
2
si n es par
~ 2
X = = 25
x si n es impar
n +1
2
4. Un Geólogo recolectó 120 especímenes de piedra caliza de un área particular, estos tienes el tamaño de
un puño. Se hace una evaluación cualitativa de la textura de cada espécimen clasificándolo como grano
fino (F), grano medio (M) ó grano grueso (G), obteniéndose los siguientes resultados:
TEXTURA F M G
FRECUENCIA 32 40 48
a. ¿Cuál es el grado de medición de la variable?
Variable cualitativa escala ordinal
b. Construya un diagrama de pastel y un Histograma de frecuencias para estos datos.
Grafica de pastel
40
26.66666667
33.33333333
F M G
Histograma de frecuencias
60
50
40
30
20
10
0
F M G
c. ¿Cuál es la textura promedio de las piedras?; ¿Cuál es la más común?, ¿Cuál es la textura central?
4
Probabilidad y Estadística.
Para este caso, sólo es posible determinar la piedra más común y esta resulta ser la piedra de Grano
Grueso
No se pueden determinar las medidas descriptivas ni de dispersión.
5. La siguiente tabla muestra el estado civil de hombres y mujeres (de más de 18 años) en 2003. Represente
los datos mediante:
a. Un diagrama de pastel de igual diámetro, para hombres y mujeres por separado.
Diagrama para hombres:
7.9
18.4
12.4
61.3
5
Probabilidad y Estadística.
21.75
64
6. El número de automóviles que vendió cada uno de los diez vendedores de una distribuidora en el mes de
diciembre son: 2, 4, 7, 10, 10, 10, 12, 12, 14, y 15. Determine:
a. La media, la mediana, la moda, la varianza, la desviación estándar y la desviación media. Interprete
cada una de estas medidas.
Media: Cada vendedor vendió en promedio 9.6 automóviles
Moda: Dato de mayor frecuencia= 10 automóviles. El número de automoviles vendidos más común por los
vendedores de una distribuidora es 10 carros al mes.
Varianza=17.37 – La variación promedio del numero de automoviles que venden los vendedores con respecto
al numero de automoviles que venden en promedio los vendedores.
Desviación estándar: 4.16 - La variación promedio del numero de automoviles que venden los vendedores con
respecto al numero de automoviles que venden en promedio los vendedores.
b. De ntre las medidas de tendencia central, ¿cuál de los valores describe de mejor manera el volumen de
ventas por vendedor?
¿??????????
7. Los registros muestran que, en Hermosillo, la temperatura máxima diaria en promedio, es la siguiente, para
cada mes del año (en grados centígrados):
19, 18, 24, 34, 39, 41, 39, 37, 31, 29, 24, 19.
Calcule la media, la mediana, la moda, los cuartiles y la desviación estándar.
Media: 29.5- La temperatura máxima promedio durante el año
Mediana:30- La medida central de la temperatura máxima de todos los meses del año.
Moda: m1= 19, m2=24, m3=39 – La temperatura promedio máxima diaria más común durante todos los
meses del año
¿Cuál de las tres medidas de centralización, considera que es la más representativas de la información
muestral? Ninguna de las tres medidas es muy representativa de la información, sería mejor separar las
temperaturas por temporadas del año.
8. Los siguientes datos provienen de la producción diaria de un pozo petrolero (en barriles)
207, 214, 203, 205, 203, 208, 220, 226, 200, 198, 217, 243, 202, 225, 208.
Calcule la media, mediana, moda y la varianza. Interprételos.
Media: 211.93- El promedio de barriles de petróleo producidos diariamente en un pozo petrolero.
Mediana: 208 – El número de barriles central que se produce diariamente en un pozo petrolero
Moda: m1=203, m2=208 – La producción diaria de barriles más común en un pozo petrolero
Varianza: 151.92 -La variación promedio de producción diaria de barriles con respecto a los que se
producen en promedio.
9. Los siguientes datos corresponden al número de personas que hacían cola en la caja registradora de la
C.F.E. a las 9:00 A.M., durante 25 días consecutivos:
12, 11, 09, 10, 15, 18, 27, 09, 30, 18, 10, 16, 18,
18, 10, 17, 17, 26, 15, 21, 23, 14, 26, 18, 10.
Calcule la media, mediana, moda, la desviación estándar y la desviación media para los datos muestrales.
6
Probabilidad y Estadística.
c i fi
Media: X = i =1
= 16.72- El promedio de personas que hacían cola en la CFE a las 9 era de 16.72
n
Mediana= n=25--- x13=17—El número de personas central que hacían cola en la CFE a las 9 era 17
Moda=18—El número de personas más común que hacían cola en la CFE durante 25 días fue 18.
n
ci − X f i
Desviación Media: DM = i =1 = 4.7712—La variación promedio, en valor absoluto, del
n
número de personas que hacían cola en la caja registradora de la CFE a las 9 con respecto a las que hacían
cola en promedio, durante 25 días.
2
Desviación estándar: S = S =6.0863—La variación promedio, del número de personas que
hacían cola en la CFE a las 9 con respecto a las que hacían cola en promedio.
Varianza: S2 =
n (ci − X )2 f i = 37.04333333
i =1 n −1
10. En un pequeño poblado, 40 personas fueron interrogadas sobre el número de veces en el último mes que
ellos manejaron un auto después de consumir bebidas alcohólicas. Los resultados fueron:
3, 1, 0, 1, 5, 0, 0, 4, 3, 2, 3, 1, 2, 2, 2, 1, 0, 5, 2, 6,
1, 0, 2, 2, 5, 1, 4, 4, 3, 0, 2, 1, 4, 4, 0, 1, 1, 2, 3, 2.
Calcule la media, mediana, moda y la desviación estándar de este conjunto de datos.
n
c i fi
Media: X = i =1
=2.125—El promedio de entre 40 personas de las veces que manejaron un auto
n
después de consumir bebidas alcohólicas.
~
Mediana: n=40--- X =2- El número de veces central que las personas condujeron después de consumir
bebidas alcohólicas
Moda: 2—El número de veces que las personas condujeron después de consumir bebidas alcohólicas más
común.
Desviación estándar:
2
S = S =1.635934611—La variación promedio, del número de veces que las personas condujeron
después de consumir bebidas alcohólicas, con respecto a al promedio.
11. Se hicieron pruebas para analizar la porosidad en una tubería de concreto en 15 lotes de 100 secciones de
108 pulgadas cada uno. El número de secciones que no se ajustó a las normas fue:
1, 5, 6, 3, 0, 7, 4, 9, 4, 1, 3, 2, 1, 8, 6.
a. Calcule la media, mediana, moda y la varianza e interprete sus resultados.
Media: X =4 ---El valor promedio del número de secciones que no se ajustó a las normas en cada lote fue de
4.
Mediana=x8=4—El número de secciones central que no se ajustó a las normas.
Moda=1---El número de secciones que no se ajustó a las normas más común.
Varianza= S2 =
n (ci − X )2 f i = 7.714285714 ---La varianza promedio del número de secciones que
i =1n −1
no se ajustó a las normas, con respecto al número de secciones que no se ajustó a las normas
promedio.
7
Probabilidad y Estadística.
¿?????????
12. Si a todos los datos de una muestra aleatoria se les suma una misma cantidad k, describa el efecto que esto
produce sobre la moda, la mediana y la media. ¿Qué pasa si en lugar de sumar, multiplicamos por k?
¿?????????
13. Sabemos que para convertir grados Centígrados a Fahrenheit se usa la ecuación F = 1.8C+32. Si se tienen
varias mediciones en grados centígrados cuya media es 20 y varianza 16, ¿Cuál será la media y la
desviación estándar para el mismo conjunto de mediciones, pero en grados Fahrenheit?
m.a. : {𝑐1 , 𝑐2 , … . , 𝑐𝑛 } de tal manera que ̅𝑋̅̅𝐶̅ = 20 °𝐶 𝑦 𝑆𝐶2 = 16, además 𝑓𝑖 = 1.8 𝑐𝑖 + 32
¿?????’
14. Si usted fuera profesor de un grupo y deseara elevar la mediana de sus calificaciones de estadística, ¿a que
sector de estudiantes apoyaría con trabajos extras para garantizar mejores resultados?:
a. A las calificaciones más altas; b. A las calificaciones ligeramente superiores a la mediana;
c. A las calificaciones más bajas; d. A las calificaciones ligeramente inferiores a la mediana.
¿????
15. Realice el mismo análisis del problema anterior, sustituyendo la palabra "MEDIANA" por "MEDIA".
¿????
16. Los siguientes datos provienen de la resistencia de tensión (en Kg/mm2), del acero laminado:
RESISTENCIA 41 42 43 44 45 46
FRECUENCIA 4 5 8 10 5 3
a. Complete la información que se presenta en la tabla.
25
20
15
10
0
41 42 43 44 45 46
8
Probabilidad y Estadística.
Ojiva porcentual
120
100
80
60
40
20
0
40 42 44 46 48
c i fi
Media= X = i =1
=43.4571429 ----La resistencia de tensión promedio del acero laminado.
n
Mediana= 44 ----El número central de la resistencia de tensión del acero laminado.
Moda=44 ---El número de la resistencia de tensión del acero laminado más común.
Varianza= S = 2
n (ci − X )2 f i = 2.078991597--- La varianza promedio de la resistencia del acero
n −1
i =1
laminado con respecto al promedio de la resistencia del acero laminado.
17. En la siguiente tabla se presentan los valores de la resistencia a la ruptura bajo cargas de tensión (en lb/plg2)
de una muestra de 120 cilindros de concreto, con diámetros de 15.24 cm y longitud de 38.48 cm.
450 414 442 433 440 435 443 452 429 434 439 444 411 427 449
455 420 460 431 460 455 437 439 425 425 448 440 427 435 420
427 422 445 442 419 436 458 416 447 445 424 434 436 450 435
445 423 438 460 425 448 440 452 428 432 441 417 420 423 448
430 432 421 442 429 437 448 454 453 417 444 436 423 446 435.
435 438 444 448 411 440 445 435 438 414 453 429 438 440 430
437 441 426 448 438 441 408 419 461 427 434 445 426 464 438
433 442 437 424 420 453 443 412 440 435 461 430 450 438 432
a. Elabore una agrupación de la información muestral; Aunque se recomienda un número impar de
intervalos, en este caso sería más recomendable seguir la regla de Sturges y tener 8 intervalos por que
así no hay que repartir error.
9
Probabilidad y Estadística.
b. Calcule la media, mediana, moda y la desviación estándar para los datos agrupados;.
m i fi
Media: X = i =1
=436.116667 --- El promedio de la resistencia a la ruptura bajo cargas
n
de tensión de los 120 cilindros.
n
2 − Fm −1
l m =436.75 --- El número de resistencia bajo a la ruptura bajo cargas
~
Mediana= X = Lm −1 +
fm
de tensión central de 120 cilindros.
( f m − f m−1 )
Moda= Xˆ = Lm − 1 + l m =439—El número de resistencia a la ruptura
( f m − f m −1 ) + ( f m − f m +1 )
bajo cargas de tensión más común es de 439. ¿?????????????
2
Desviación estándar= S = S =12.44225879---La variación promedio, del número de resistencia a la
ruptura bajo cargas de tensión con respecto al promedio del número de resistencia a la ruptura bajo
cargas de tensión.
Varianza= S2 =
n (mi − X )2 f i =154.8098039
i =1 n −1
10
Probabilidad y Estadística.
Polígono de Frecuencias
30
25
20
15
10
0
[408,415] (415,422] (422,429] (429,436] (436,443] (443,450] (450,457] (457,464]
Ojiva porcentual
120
100
80
60
40
20
0
[408,415] (415,422] (422,429] (429,436] (436,443] (443,450] (450,457] (457,464]
18. Los siguientes datos representan el tiempo de vida (en años) de una muestra aleatoria de 30 bombas de
agua similares:
2.0 3.0 0.3 3.3 1.3 0.4 0.2 6.0 5.5 6.7 0.2 2.3 0.7 4.7 1.8
5.9 4.0 1.5 1.6 1.0 0.3 6.0 1.5 5.6 6.0 0.5 2.5 1.2 5.0 0.2
11
Probabilidad y Estadística.
c. Estime el mayor tiempo superado por las dos terceras partes de los datos.
¿???????
19. En un experimento que media el porcentaje de encogimiento al secar, 50 especimenes de prueba de arcilla
plástica produjeron los siguientes resultados:
19.3 15.8 20.7 18.4 14.9 17.3 21.3 16.1 18.6 20.5 20.5 16.9 18.5
18.7 12.3 19.5 22.8 18.8 18.3 16.9 17.9 17.1 22.5 18.8 19.4 17.4
18.5 17.5 16.5 17.5 17.3 19.5 19.1 17.5 16.8 16.3 19.0 18.2 17.4
18.2 17.2 22.5 17.9 17.5 19.3 18.8 19.0 17.4 17.4 22.5
a. Agrupe estos datos en una tabla de frecuencias con intervalos del 1% comenzando en 12. ¿Es
recomendable esta agrupación? Si la respuesta es NO, proponga una mejor forma de realizar la
agrupación y justifíquela. Esa tabla de frecuencias no es recomendable por que es mucho mejor cuando
los intervalos comienzan y terminan con el dato mayor y menor respectivamente, si se hace con el 1%
por cada intervalo habrá mucho error.
Según Sturges: k=7 l=1.5
12
Probabilidad y Estadística.
35
30
25
20
15
10
0
[12.3,13.8] (13.8,15.3] (15.3,16.8] (16.8,18.3] (18.3,19.8] (19.8,21.3] (21.3,22.8]
Ojiva
60
50
40
30
20
10
0
[12.3,13.8] (13.8,15.3] (15.3,16.8] (16.8,18.3] (18.3,19.8] (19.8,21.3] (21.3,22.8]
c. Calcule la media, mediana, moda y la desviación estándar para los datos agrupados.
n
m i fi
Media: X = i =1
=18.33 ---El promedio de el porcentaje de encogimiento al secar 50
n
especímenes de prueba de arcilla plástica.
n
− Fm −1
l m =17.44
~
Mediana: X = Lm −1 + 2
fm
13
Probabilidad y Estadística.
( f m − f m−1 )
Moda: Xˆ = Lm − 1 + l m =18.03
( f m − f m −1 ) + ( f m − f m +1 )
Desviación estándar: S = S 2 = 1.824325427
S2 =
n (mi − X )2 f i = 3.328163265
i =1 n −1
20. En una construcción se requiere preparar concreto con una resistencia mínima de compresión de 17.2
MN/m2, esta resistencia mínima debe de ser satisfecha por no menos del 96% de las pruebas. A
continuación, se proporcionan los valores de las resistencias obtenidas en 45 probetas:
24.3 22.3 18.2 24.8 23.5 23.4 28.3 23.3 23.4 21.7 32.2 25.6 20.8 23.2 26.9
23.4 20.8 19.8 22.8 23.0 23.0 23.6 28.2 25.1 26.1 23.0 25.4 22.2 30.4 17.8
20.0 17.8 16.6 22.8 28.0 22.1 18.2 20.0 20.1 24.1 22.8 25.1 23.4 25.9 28.8.
a. Agrupe en intervalos de clase la información muestral.
b. Con los datos agrupados obtenga: la media, la mediana, la moda, la varianza y el coeficiente de
variación.
n
m i fi
Media: X = i =1
= 23.38888889
n
n
− Fm −1
l m =23.23
~
Mediana: X = Lm −1 + 2
fm
( f m − f m−1 )
Moda: Xˆ = Lm − 1 + l m =23.15
(
m f − f m −1 ) + ( f m − f )
m +1
Varianza: S2 =
n (mi − X )2 f i = 10.51555556
i =1 n −1
Coeficiente de variación=Desviación estándar/media=3.2427/23.38888889=0.1386
Desviación estándar: S = S 2 =3.2427
14
Probabilidad y Estadística.
c. ¿Se cumplen las especificaciones respecto a la resistencia mínima de acuerdo con los datos obtenidos?
Sí se cumple, pues sólo existe una única probeta que no cumple este requisito, y como n=45, el
porcentaje de probetas que no cumplen con esa especificación es de 2.22%.
d. Construya un polígono de frecuencias y comente sobre le sesgo.
Polígono de Frecuencia
20
18
16
14
12
10
8
6
4
2
0
[16.6,19.2] (19.2,21.8] (21.8,24.4] (24.4,27] (27,29.6] (29.6,32.2]
El sesgo de este polígono de frecuencias es positivo, pues tiene una cola más alargada a la derecha del valor
máximo central.
21. Los siguientes datos provienen de las lecturas del flujo máximo anual de un río en m 3/seg :
370 405 391 388 420 343 484 285 335 612
326 490 503 608 512 293 432 295 391 284
602 230 601 267 643 484 508 462 503 326
612 317 348 520 419 283 540 620 370 325
a. Haga un agrupamiento de la información:
15
Probabilidad y Estadística.
Histograma de Frecuencia
10
9
8
7
6
5
4
3
2
1
0
[230,289] (289,348] (348,407] (407,466] (466,525] (525.584] (584,643]
Polígono de Frecuencias
10
9
8
7
6
5
4
3
2
1
0
[230,289] (289,348] (348,407] (407,466] (466,525] (525.584] (584,643]
16
Probabilidad y Estadística.
Ojiva Porcentual
120
100
80
60
40
20
0
[230,289] (289,348] (348,407] (407,466] (466,525] (525.584] (584,643]
m i fi
Media: X = i =1
= 424.7
n
n
− Fm −1
l m =407
~
Mediana: X = Lm −1 + 2
fm
( f m − f m−1 )
Moda: Xˆ = Lm − 1 + l m =322.71
( f m − f m −1 ) + ( f m − f m +1 )
P40=367.66
P90=609.28
D6=466
Q3.=510.25
22. Las calderas de unas plantas de energía de vapor a alta presión tuvieron las siguientes deficiencias en
porcentajes:
88.9 89.0 90.0 90.4 90.6 90.9 92.0 90.3 90.4 90.8 89.2 89.7 90.1 90.5 90.6
90.9 92.0 90.4 90.5 90.8 89.2 89.7 90.2 90.5 90.7 91.0 92.0 90.4 90.5 90.8
89.3 89.7 90.3 90.5 90.8 91.0 92.0 90.4 90.6 90.8 89.4 89.8 90.3 90.5 90.8
91.0 92.0 90.4 90.6 92.0 92.0 92.4 92.4 92.4 92.5 92.6 92.7 92.9 92.9 93.1
17
Probabilidad y Estadística.
Polígono de Frecuencias
25
20
15
10
0
[88.9,89.5] (89.5,90.1] (90.1,90.7] (90.7,91.3] (91.3,91.9] (91.9,92.5] (92.5,93.1]
Yo pienso que este polígono de frecuencias tiene sesgo positivo pues tiene la cola más alargada a la derecha
del valor máximo central.
c. Con los datos agrupados, calcule la media, la mediana, la moda y la varianza.
m i fi
Media: X = i =1
= 90.86
n
18
Probabilidad y Estadística.
n
− Fm −1
l m =90.61
~
Mediana: X = Lm −1 + 2
fm
( f m − f m−1 )
Moda: Xˆ = Lm − 1 + l m =90.46
(
m f − f m −1 ) + ( f m − f )
m +1
Varianza: S2 =
n (mi − X )2 f i = 1.12718644
i =1 n −1
23. Se seleccionó a 10 amas de casa y se les cuestionó sobre el ingreso mensual familiar que perciben,
obteniéndose la siguiente información:
1300, 1350, 1350, 1400, 1450, 1450, 1450, 1600, 1650, 4800.
a. Calcule la media, mediana y la moda.
Media: 1780 ---- Promedio de ingreso mensual familiar.
Mediana= 1450
Moda=1450
b. ¿Cuál de estas tres medidas de centralización considera usted que es la más representativa del
ingreso mensual por familia?
¿??????????
24. Los siguientes datos son el número de accidentes automovilísticos que ocurren en los 60 cruces más
transitados en la ciudad de Hermosillo en un fin de semana del mes de diciembre
0 2 5 0 1 4 1 0 2 1 5 0 1 3 0
0 2 1 3 1 1 4 0 2 4 1 2 4 0 4
3 5 0 1 3 6 4 2 0 2 0 2 3 0 4
2 5 1 2 1 2 1 6 5 0 3 3 0 0 4
a. Agrupe estos datos en una tabla con un número apropiado de intervalos de clase con la misma longitud,
¿Usted que opina? Opino que la Regla de Sturges no va tan bien en este caso, por eso utilice 6
intervalos, para disminuir el error.
19
Probabilidad y Estadística.
m i fi
Media: X = i =1
= 1.816666667
n
n
2 − Fm −1
l m =1.2727
~
Mediana: X = Lm −1 +
fm
( f m − f m−1 )
Moda: Xˆ = Lm − 1 + l m =0.6279
( f m − f m −1 ) + ( f m − f m +1 )
Varianza: S2 =
n (mi − X )2 f i = 2.32175141
i =1 n −1
c. Confeccione un histograma de frecuencias relativas y una ojiva porcentual.
20
Probabilidad y Estadística.
Ojiva porcentual
120
100
80
60
40
20
0
[0,1] (1,2] (2,3] (3,4] (4,5] (5,6]
25. Los siguientes datos representan la carrera de preferencia a la que aplicaron 80 aspirantes a la
Universidad de Sonora: n=70
Frecuencia
Carrera Frecuencia
Relativa %
Administración de empresas de Empresas 8 11.42
Arquitectura 9 12.85
Ciencias Agropecuarias 8 11.42
Licenciatura en Educación 4 5.71
Matemáticas 4 5.71
Ciencias de la Comunicación 8 11.42
Derecho 6 8.57
Economía 2 2.85
Enfermería 2 2.85
Contabilidad 6 8.57
Medicina 1 1.42
Odontología 6 8.57
Psicología 6 8.57
21
Probabilidad y Estadística.
n
xi − X
b. Encuentre la desviación de la muestra para cada grupo. Desviación media: DM = i =1
n
Desviación Fumadores= 13.55
Desviación no fumadores= 4.95625
c. Comente qué clase de impacto parece tener el fumar sobre el tiempo que se requiere para quedar
dormido. Al parecer, fumar puede aumentar el tiempo promedio que toma conciliar el sueño.
27. Actualmente, se lleva a cabo un estudio respecto al número de hijos por familia para estudiar la natalidad.
Se aplica una encuesta a 100 familias de la Costa de Hermosillo obteniéndose los siguientes datos:
1, 3, 3, 0, 4, 3, 1, 4, 0, 0, 2, 1, 0, 3, 1, 2, 1, 4, 1, 2, 3, 3, 4, 2, 0,
4, 3, 0, 2, 3, 1, 3, 4, 2, 2, 4, 4, 4, 2, 1, 4, 2, 1, 1, 0, 1, 1, 2, 3, 0,
3, 3, 3, 1, 1, 3, 3, 0, 2, 3, 4, 3, 0, 3, 1, 2, 2, 1, 2, 3, 3, 2, 1, 3, 1,
3, 4, 4, 4, 1, 3, 0, 3, 1, 0, 4, 3, 2, 3, 2, 1, 2, 0, 2, 0, 0, 2, 2, 3, 4.
a. Defina la variable y determine nivel de medición.
Variable Cuantitativa discreta de escala de proporción
b. Elabore una tabla estadística.
22
Probabilidad y Estadística.
Histograma de frecuencias
30
25
20
15
10
5
0
0 1 2 3 4
n
c i fi
Media= X = i =1
=2.08
n
xn + xn
2 +1
2
si n es par
~ 2
Mediana= X = =2
x si n es impar
n +1
2
Moda=3
Varianza= S2 =
n (ci − X )2 f i = 1.730909091
i =1 n −1
n
ci − X f i
Desviación Media= DM = i =1 = 1.1112
n
Cuartiles:
CUARTILES (k) Nk/4 CRITERIO POSICION Valor de Qx
1 25 25.5 25.5 Q1=(x25+x26)/2=1
2 50 50.5 50.5 Q2=(x50+x51)/2=2
3 75 75.5 75.5 Q3=(x75+x76)/2=3
23
Probabilidad y Estadística.
28. Una compañía electrónica fabrica fuentes de poder para computadoras personales. Se producen varios
cientos de fuentes en cada turno, y cada unidad se somete a una prueba de quemado de 12 horas. El número
de unidades que falla durante esta prueba de 12 horas en cada turno resultó ser:
3 4 2 5 6 10 5 4 3 11 9 2 7 8 4 2 6 5 4 3 2 8 10 9 11
6 7 9 1 14 13 10 9 8 10 3 2 4 6 4 10 8 7 14 13 12 5 4 6 5
4 8 4 10 14 8 12 4 5 14 2 8 6 10 8 6 4 6 15 4 7 5 3 2 6
7 2 6 9 10 7 9 16 11 13 3 13 3 7 3 2 9 4 13 3 6 5 10 6 7
6 1 4 13 12 10 2 5 7 10 4 2 2 6 4 10 8 14 6 4 4 8 7 9 2
7 8 4 7 3 6 7 8 4 12 6 17 5 10 8 9 11 7 2 8 10 7 4 3 6
a. Presente la información muestral en una tabla de distribución de frecuencias.
c i fi
Media= X = i =1
= 6.87333333
n
Varianza= S2 =
n (ci − X )2 f i = 11.98687218
i =1 n −1
24
Probabilidad y Estadística.
Histograma de Frecuencias
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Series2
25