Datos para Tabla de Frecuencia
Datos para Tabla de Frecuencia
Tarea #1 y #2
Facilitador:
Integrantes:
9/08/17
Ejercicio # 3 pag 25
Los siguientes datos son los ingresos de 60 ejecutivos del marketin para empresas de los Estados
Unidos. Los Datos estn expresados en miles de dlares.
b). Presente y explique una distribucin de frecuencia acumulada mas que y menor que.
- La mayora de los ejecutivos de ventas registran un ingreso entre los 61 y los 80 mil
dlares, especficamente un 58% del total, lo que nos indica que los niveles de ingreso para
la mayora de ellos son buenos.
- Una minora (5%), supera 80 mil balboas en ingresos, registrndose slo tres individuos en
la muestra estudiada.
Problema #11:
El sr. Bissey tambin guarda registro de las cuentas personales de ahorro. De las 40 cuentas
abiertas el mes anterior, los saldos corrientes son:
Problema #12
Utilizando los datos del problema anterior, realice e interprete una tabla de frecuencia relativa y
una tabla de frecuencia acumulada:
Por ejemplo, si analizamos la Clase 5, sabremos que existen 28 cuentas por debajo de 1173USD, y
as sucesivamente.
Problema #13:
Histograma
8 7
7 6 6 6 6
6 5
5
Frecuencias
4
4
3
2
1
0
0
50 206 421 636 851 0
1066 1281 1496 1710.5
Marca de Clase
Problema #14:
Utilizando los datos del ejercicio 11, construya un diagrama de barras que muestre los porcentajes
de cada clase.
Problema #15
Las prdidas y ganancias para las 50 firmas ms grandes en la lista de las 500 mejores empresas de
la revista Fortune para el ao 1992 aparecen a continuacin en millones de dlares. El valor ms
bajo es una prdida de 4453 millones y el ms alto es una ganancia de 5600 millones. Haga una
tabla de frecuencia con el nmero de clases apropiados.
Observaciones Clases Vmnimo Vmximo Amplitud Intervalos
50 5.64385619 -4453 5600 10053 1781.22894
6 1782
Problema 5#
Se utilizan dos procesos para producir discos de computador. Han surgido problemas respecto a las
variaciones en los tamaos de tales discos. Con base en los datos de muestra aqu observados, de
ocho tamaos de discos en pulgadas para cada procesos, explique cual proceso aconsejara usted
si su objetivo es minimizar la desviacin en el tamao alrededor de la media.
Proceso 1 Proceso 2
3.41 3.81
3.74 3.26
3.89 3.07
3.65 3.35
3.22 3.26
3.06 3.79
3.65 3.14
3.33 3.51
MEDIA 3.49 3.40
0.08048392 0.0786410
VARIANZA 9 7
0.28369689 0.2804301
Desviacin 6 5
Segn los clculos de la desviacin estndar, se debe seguir el proceso 2, ya que se obtiene una
desviacin menor que con el proceso 1. Es decir, para el proceso 2, se tiene una desviacin de
0.2804 pulgadas con respecto a la media.
Problema #6
Explique con sus propias palabras que miden la varianza y la desviacin estndar Por qu su
clculo es diferente para las poblaciones y las muestras?
R/. Como el texto lo dice, la varianza es el promedio de desviaciones respecto a su media elevada
al cuadrado. Mide o relaciona la desviacin de cada dato con respecto a la media y la eleva al
cuadrado. Esta medida no es muy til por s sola, ya que nos arroja un valor con unidad al
cuadrado.
La desviacin estndar tambin es una medida de dispersin que muestra la desviacin de los
valores con respecto a su medio. Viene siendo la raz cuadrada de la varianza, por lo cual es un
valor mucho ms til, ya que nos arroja valores con la unidad en la que estamos trabajando.
Una poblacin, se puede entender, como el total de los datos estudiados y por muestra se
entiende a una parte de dicha poblacin. En el clculo se puede observar una pequea diferencia
ya que para una poblacin, los datos suelen estar ms dispersos que para una muestra extrada de
ella. Adems que para las muestras se observa una reduccin en los grados de libertad.
Problema #7:
Un analista de inversiones sugiere que usted invierta en Boomer Securities en lugar de Reliable
Stocks. Dadas las tasas anuales de rendimiento que se muestran a continuacin para una muestra
de cada inversin Qu le dice al analista si usted desea minimizar su exposicin al riesgo?
Boomer Reliable
15.50 4.5
21.70 5.5
-7.80 3.5
-5.00 4
3.60 6.2
27.20 7.2
2.20 4.2
12.20
MEDIA 8.70 5.01
Varianza 156.8486 1.7781
Desviacin 12.5239 1.3335
Clculos con hoja de clculos de Excel
Si nos fijamos en las tasas de rendimiento de las dos empresas, vemos que Boomer ha alcanzado
nmeros ms elevados en algunos aos. Sin embargo, si nos vamos al clculo de la desviacin
estndar vemos el comportamiento de Reliable es mucho ms estable y sus valores de alejan
mucho menos de la media. Este nos dice que el grado de riesgo para Reliable es menor, a
diferencia de Boomer que incluso lleg a registrar rendimientos negativos.
Problema #10
406
Media= =10.41
39
19.524
Mediana=9+ ( 2 )=8.25
12
( 128 )
Moda=9+ ( 2 ) =10
( 128 ) + ( 128 )
450039 (10.41 )2
Varianza= =7.20
391
Analizando los datos anteriores se observa que se tuvo una mejora en el rendimiento de los
trabajos, ya que en promedio se tarda menos tiempo para completar una tarea determinada,
adems que la desviacin estndar en menor ahora, lo quiere decir que los valores de tiempo se
mantiene ms cercanos al valor promedio.
Problema #18
Los precios de las acciones estn cotizados en octavos de dlar. A continuacin se da una muestra
de siete precios de cierre de las acciones tomadas de The Wall Strees Journal de octubre de 1997.
a. Calcule la media, la mediana y la moda. Interprete cada una
MEDIA 45.303
MEDIANA 39.500
MODA 69.875
La media nos dice que el valor promedio de las 7 muestras equivale a 45.303, la mediana nos
indica que el punto medio de los valores es 39.5, es decir el 50% de los datos estn por debajo de
39.5 y el otro 50% por arriba.
La moda, simplemente nos dice el valor que ms se repite. En nuestro caso General Mills y Mobil
registraron el mismo valor, por lo cual la moda es 69.875.
VARIANZA 312.02
DESVIACION 17.66
Calculo en Excel
C. Recorrido intercuartlico
25
L25=( 7+1 ) =2
100
75
L25=( 7+1 ) =6
100
R . INTERCUARTILICO=69.87529.25=40.625
D. Calcular el Percentil 40
40
L40=( 7+1 ) =3.2
100
Problema #20:
Debido a que las tasas de inters cayeron a comienzos del 97, se encontr una muestra de las tasas
hipotecarias a 15 aos de las instituciones de crdito en Peora, Illinois era:
MEDIA 6.939
MEDIANA 6.9
MODA 7.3, 6.9
La mediana nos indica que el promedio de las tasas de crdito se posiciona en el valor de 6.939
mientras que los valores se agrupan alrededor del valor 6.9, que representa la mediana.
Analizando la media y la mediana se observa que los datos estn sesgados a la derecha, ya que la
media supera a la mediana. Calculando el coeficiente de Pearson tenemos que:
3(6.9396.9)
P= =0.424
0.2759
Varianza(Var.s) 0.0761
Desviacin(Desv
est.M) 0.2759
Problema #27
Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la nacin
reportadas en la edicin de la revista Forbes de la edicin 24 de mayo de 1997 aparecen en la
siguiente tabla de frecuencias.
F.
Clases Lmites Frecuencia Acumulad Marca de Clase fM M2 fM2
a
1 50 y menos de 55 8 8 52.5 420 2756.25 22050
2 55 y menos de 60 13 21 57.5 747.5 3306.25 42981.25
3 60 y menos de 65 15 36 62.5 937.5 3906.25 58593.75
4 65 y menos de 70 10 46 67.5 675 4556.25 45562.5
5 70 y menos de 75 3 49 72.5 217.5 5256.25 15768.75
6 75 y menos de 80 1 50 77.5 77.5 6006.25 6006.25
50 3075 25787.5 190962.5
3075
Media= =61.5
50
2521
Mediana=60+ ( 5 )=61.33
15
( 1513 )
Moda=60+ ( 5 ) =61.42
(1510 ) + ( 1513 )
Se observan que los tres valores estn bastante similares y cercanos entre s, por lo que tendr un
comportamiento simtrico, ligeramente sesgada a la derecha.
19096250 ( 61.5 )2
Varianza= =37.74
501
La desviacin estndar nos dice que para los 50 valores, hay una desviacin promedio de 6.14 aos
con respecto a la media. Por lo cual se ve que los directores se encuentran en un rango de edad
bastante parecido.
Problema #28:
Datos sobre los salarios en miles de dlares:
F. Marca de
Clases Lmites Frecuencia fM M2 fM2
Acumulada Clase
1 90 y menos de 440 9 9 265 2385 70225 632025
2 440 y menos de 790 11 20 615 6765 378225 4160475
3 790 y menos de 1140 10 30 965 9650 931225 9312250
4 1140 y menos de 1490 8 38 1315 10520 1729225 13833800
5 1490 y menos de 1840 4 42 1665 6660 2772225 11088900
6 1840 y menos de 2190 3 45 2015 6045 4060225 12180675
7 2190 y menos de 2540 5 50 2365 11825 5593225 27966125
50 53850 15534575 79174250
53850
Media= =1077
50
2520
Mediana=790+ ( 350 )=965
10
( 119 )
Moda=440+ ( 350 ) =673.33
( 1110 )+ ( 119 )
Segn los valores calculados se ve una distribucin sesgada hacia la derecha, por la diferencia
evidente entre los tres datos nos hace suponer que habr una dispersin alta.
7917425050 ( 1077 )2
Varianza= =432200
501
De sviacin Estandar= 432200=657.419
Los salarios tienen un grado de dispersin mayor al de las edades. Tomando en cuenta el valor
mnimo y mximo, los datos se agrupan en los valores ms bajos.
Haciendo una relacin con la tabla del problema anterior, vemos que haba menos personas con
edades elevadas, y del mismo modo hay menos salarios elevados; por lo cual se puede suponer
una relacin entre estos. Entre mayores son los directivos, mayores son sus salarios.
Problema #29
Janna Vice utiliza dos maqunas diferentes para producir papeleras para las fotocopiadoras Kodak.
Una muestra de las papeleras de la primera mquina midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4,
11.3, y 12.3. Las bandejas elaboras con la segunda mquina midieron 12.2, 11.9, 11.5, 12.1, 12.2,
11.9 y 11.8 pulgadas. Janna debe utilizar la mquina con mayor consistencia en los tamaos de
papelera Cul mquina debe utilizar?
Mquina 1 Mquina 2
12.2 12.2
11.9 11.9
11.8 11.5
12.1 12.1
11.9 12.2
12.4 11.9
11.3 11.8
12.3
MEDIA 11.988 11.943
VARIANZA (VAR.S) 0.121 0.063
DESVIACIN (DESVEST.M) 0.348 0.251
Janna debera utilizar la mquina #2, ya que la desviacin de las muestras es mucho menor; lo que
nos indica que la mquina 2 es mucho ms precisa.
Problema #30
Los puntajes de las dos primeras pruebas de estadstica que usted present estaban distribuidos
normalmente y reportaron medias de 90 para la prueba A y 50 para la prueba B Usted espera una
desviacin estndar ms alta o ms baja para la prueba A? Le gustara una desviacin estndar
ms alta o ms baja para la prueba B si siente que le fue bien en la prueba? Por qu? Haga una
grfica que ilustre la lgica de sus respuestas.
R/. Tomando como referencia un puntaje mximo de 100, para la prueba A esperara una
desviacin estndar menor; ya que el promedio de los valores se encuentran muy cercanos al 100.
Si tengo una desviacin menor, habr menos posibilidad que de los valores se alejen de la media.
En el caso de la prueba B, teniendo en cuenta que espero un resultado positivo, me gustara tener
una desviacin estndar alta ya que eleva las posibilidades de obtener una nota alta; alejada de la
media de 50.
GRAFICAS
Problema #31
Los siguientes datos de muestra se han obtenido para el nmero de clientes diarios en Rosies
Flower Shoppe:
MEDIA 33.25
VARIANZA (VAR.S) 51.93
DESVIACIN (DESVEST.M) 7.21
PRIMER CUARTIL 27.25
TERCER CUARTIL 39.25
RIQ=39.2527.25=12
Problema #34
a. Rango
b. La varianza
c. La desviacin estndar
d. El primer cuartil
e. El percentil 25
f. El rango o recorrido inter-cuartlico
Mnimo 12
Mximo 54
Rango 42
VARIANZA 267.43
DESVIACIN 16.35
PRIMER
CUARTIL 20.5
PERCENTIL 25 20.5
TECER CUARTIL 51
RIQ=5120.5=30.5
Problema #36
1190
Media= =14
85
42.535
Mediana=13+ ( 2 ) =13.88
17
( 1715 )
Moda=13+ ( 2 )=14.2
( 1714 )+ ( 1715 )
La empresa est mintiendo, los trabajadores en promedio tardan 14 minutos en terminar sus
tareas, y presentan una distribucin bastante normal.
Pgina 140
Problema #56
R/. La distribucn normal es una distribucin continua, ya que se utiliza para representar variables
que son divisibles infinitamente como la estatura, el peso, etc.
Si los conjuntos con igual media, tienen distintas desviacin el porcentaje del 68.3% abarcar
muchos ms datos para la que tiene mayor desviacin, es decir; al tener una mayor desviacin de
la media, el rea de la curva ser ms grande y por ende, el 68.3% representar un valor mayor.
Problema #57
Los costos de produccin mensual en una imprenta de Toledo son de 410$ dlares en promedio,
con una desviacin estndar de 87$ dlares. El gerente promete al propietario de la tienda
mantener los costos por debajo de 300$ dlares este mes si los costos estn distribuidos
normalmente, el propietario puede creerle al gerente?
300410
Z= =1.26
87
rea =0.3962
Teniendo en cuenta la tabla E, sabemos que existe una probabilidad de 39.62%, de que los costos
se mantengan debajo de 300. Al estar bajo de 50% el propietario no debera creerle al gerente.
Problema #58
Una empresa de contabilidad de Dooit and Quick descubre que el tiempo que se toma para realizar
un proceso de auditora est distribudo normalmente, con un tiempo promedio de 17.2 das y una
desviacin estandar de 3.7 das. El sr. Dooit promete iniciar un trabajo de auditora para su firma
dentro de 20 das, pero debe terminar una que ya comenz. Qu tan probable es que se cumpla
su promesa.
2017.2
Z= =0.75
3.7
rea= 0.2734
Slo hay una posibilidad del 27.34% de que el sr Dooit cumpla su promesa.
Problema #6
Dados los siguientes datos para X (28, 54, 67, 37, 41, 69, 76) Y (14, 21, 36, 39, 18, 54, 52)
X vs Y
60
50
f(x) = 0.68x - 2.63
40
30
Linear ()
Y
20
10
0
20 30 40 50 60 70 80
X
Problema #8
R/.Representa el carcter aleatorio que muestra la variable dependiente y por lo tanto el trmino
de error en la [Link] el trmino aleatorio. Habitualmente se le denomina residual cuando
se utilizan datos muestrales, e reconoce que no todas las observaciones caen exactamente en una
lnea recta.
Pgina 335
Problema #9
El centro de ubicacin laboral en State University desea determinar si los promedios puntuales en
notas de los estudiantes (GPAs) puede explicar el nmero de ofertas laborales que ellos reciben
despus de graduarse. :
b)
( 23.97 )2
SC x =70.49 =13.03
10
( 28 )2
SC y =108 =29.6
10
( 23.97 )( 28 )
SC xy =83.69 =16.57
10
16.57
b1= =1.271
13.03
Y =0.2465+1.271 X
Y =1.271 X 0.2465
Problema #10
Ingreso Vs Consumo
30
25
15 Linear (Ingreso Vs
Consumo)
10
0
5 10 15 20 25 30 35 40
Ingreso USD
INGRESO(X
Estudiante ) CONSUMO (Y) XY X2 Y2
1 24.3 16.2 393.66 590.49 262.44
2 12.5 8.5 106.25 156.25 72.25
3 31.2 15 468 973.44 225
4 28 17 476 784.00 289
5 35.1 24.2 849.42 1232.01 585.64
6 10.5 11.2 117.6 110.25 125.44
7 23.2 15 348 538.24 225
8 10 7.1 71 100.00 50.41
9 8.5 3.5 29.75 72.25 12.25
10 15.9 11.5 182.85 252.81 132.25
11 14.7 10.7 157.29 216.09 114.49
12 15 9.2 138 225.00 84.64
TOTAL 228.9 149.1 3337.82 5250.83 2178.81
( 228.9 )2
SC x =5250 =883.73
12
( 149.1 )2
SC y =2178.81 =326.24
12
( 228.9 ) ( 149.1 )
SC xy =3337.82 =493.73
12
493.73
b1 = =0.558
883.73
Y =1.776+ 0.558 X
Por cada dlar de ingreso se invierte 0.558 dlares en produccin. Existe una relacin positiva en la
ecuacin.
Problema #11
Un banco en Atlanta que se especializa en crditos para vivienda intenta analizar el mercado de
finca raz, midiendo el poder explicativo que las tasas de inters tienen sobre el nmero de casas
vendidas en el rea. Se compilaron los datos para un periodo de 10 meses, as:
200
150 Linear ()
100
50
0
8 10 12 14 16
Tasa de Inters
( 117.8 )2
SC x =1444.26 =56.576
10
( 1968 )2
SC y =443854 =56551.6
10
( 117.8 )( 1968 )
SC xy =21630.6 =1552.44
10
1552.44
b1 = =27.44
56.576
Y =520.0427.44 X
El modelo nos indica que hay una relacin negativa. Se muestra una pendiente negativa, y se
observa que por cada unidad que los intereses aumenten, las ventas se disminuirn en 27.44
unidades.
a. Si la tasa de inters es del 9.5% Cuntas casas se vendera de acuerdo con el modelo?
Problema #12
Overland Group produce partes para camin que se utilizan en los semirremolques. El jefe de
contabilidad desea desarrollar un modelo de regresin que pueda utilizarse para predecir los
costos. El Selecciona unidades de produccin fabricadas como una variable de prediccin y
recolecta los datos que se observan aqu. Los costos estn en miles de dlares y las unidades en
cientos.
Chart Title
7
6
5 f(x) = 0.13x + 3.72
R = 0.46
4
Costos
3 Linear ()
2
1
0
4 6 8 10 12 14 16
Unidades
( 82.2 )2
SC x =967.2 =122.59
8
( 40.1 )2
SC y =205.23 =4.23
8
( 82.2 )( 40.1 )
SC xy =427.46 =15.43
8
15.43
b1= =0.126
122.59
Y =3.716+ 0.126 X
De la ecuacin observamos que existe una relacin positiva, ya que por cada aumento en las
unidades de produccin, habr un consecuente aumento de 0.126 en los costos. Se puede decir
que existe un costo base de 3.716 por operacin.
Problema #13
El profesor Mundane ha notado que muchos de sus estudiantes se han ausentado la clase este
semestre. Considera que pueda explicar esta falta de asistencia por las distancias a las que sus
estudiantes viven del campus. Se practica una encuesta a once estudiantes sobre cuantas millas
deben viajar para asistir a clases y el nmero de clases a las que han faltado.
Ausencias vs Lejana
6
4
Ausencias
0
0 2 4 6 8 10 12 14 16 18
Millas de viaje
( 70 )2
SC x =684 =238.54
11
( 34 )2
SC y =124 =18.9
11
( 70 ) ( 34 )
SC xy =233 =16.63
11
16.63
b1= =0.0697
238.54
Y =2.646+ 0.0697 X
El profesor determin que la distancia a la que viven los estudiantes tiene poca influencia en el
nmero de clases que faltan; lo cual se muestra en el alto nivel de dispersin en la grfica.
c. a cuantas clases faltara usted si viviera a 3.2 millas del campos, segn el modelo?
Pgina 340
Problema #15
Qu se entiende por homoscedasticidad y heteroscedasticidad? Haga un grfico para ilustrar
antes.
R/. La Homoscedasticidad es un supuesto que dice que la varianza tiene los mismos valores de Y
para todos los valores de X, en cambio la heteroscedasticidad indica lo contrario; sucede cuando
los valores de la varianza no son constantes a lo largo de las observaciones.
Problema#16
R/. Se puede definir como la correlacin entre miembros de series de observaciones ordenadas en
el tiempo (informacin de series de tiempo) o en el espacio (informacin de corte de transversal).
La autocorrelacin positiva se da cuando el valor de un error es seguido por un valor del mismo
signo. Es decir, es ms probable que un error negativo sea seguido por un error del mismo signo.
La autocorrelacin negativa es el caso contrario, un error con signo positivo ser seguido por un
signo contrario.
Problema #18
Problema #25
( 23.97 )2
SC x =70.49 =13.03
10
( 28 )2
SC y =108 =29.6
10
( 23.97 )( 28 )
SC xy =83.69 =16.57
10
16.57
r= =0.844
13.0329.6
Problema #26
( 228.9 )2 ( 149.1 )2
SC x =5250 =883.73 SC y =2178.81 =326.24
12 12
( 228.9 ) ( 149.1 )
SC xy =3337.82 =493.73
12
493.73
r= =0.919
883.73326.24
2
r =0.844
Problema #27
Cuntos cambios en las casas vendidas pueden explicarse por la tasa de inters del ejercicio 11?
( 117.8 )2
SC x =1444.26 =56.576
10
( 1968 )2
SC y =443854 =56551.6
10
( 117.8 )( 1968 )
SC xy =21630.6 =1552.44
10
1552.44
r= =0.8679
56.57656551.6
2
r =0.9316
Problema #28
Cul es la fuerza del modelo del profesor mundane utilizado en el ejercicio 13 para explicar la
ausencia de los estudiantes?
( 70 )2
SC x =684 =238.54
11
( 34 )2
SC y =124 =18.9
11
( 70 ) ( 34 )
SC xy =233 =16.63
11
16.63
r= =0.2476
238.5418.9
2
r =0.497