Estadstica Notas de clase 15
ELABORACION DE GRAFICAS
En estadstica descriptiva las tablas representan una
manera efectiva de presentar la informacin de un
fenmeno o de un evento, sin embargo, las graficas
por si solas no dan informacin suficiente, es por
eso que surgen otras herramientas como el uso de
graficas.
Estas son algunas de las recomendaciones a la hora
de realizar una grafica estadstica:
1. Las graficas no deben estar sobre cargadas
de informacin.
2. Deben ser tan claras que no necesiten
informacin adicional, descripciones o texto.
3. Deben seguir y nunca preceder el texto.
4. No son un sustituto del cuadro, son su
complemento.
5. Deben rotularse debidamente los ejes y debe
incluir un titulo.
6. Las graficas deben contener la fuente de los
datos.
Existen diferentes tipos de graficas que se usan para
representar datos estadsticos. A continuacin
presentamos las graficas que son de uso mas
frecuente en el desarrollo de la teora estadstica.
2. Histogramas: son diagramas de frecuencias
unidimensionales en la cual se levantan
rectngulos de reas proporcionales a las
frecuencias de clases sobre los intervalos del
eje horizontal, por lo tanto, es utilizado para
representar a la variable continua, cuando la
amplitud es constante.
Ejemplo
Consideremos la siguiente tabla de frecuencias:
1. Diagramas de frecuencias: como su nombre lo
indica son las que se usan para representar las
frecuencias de un conjunto de datos.
El histograma que representa esta informacin es el
siguiente:
La grfica anterior nos muestra como se distribuyen
las frecuencias absolutas del nmero de hijos de una
serie de familias. La siguiente grafica muestra la
frecuencia absoluta acumulada para el mismo
conjunto de datos.
Andrs Mauricio Grisales Aguirre Matemtico.
[Link]
Estadstica Notas de clase 16
3. Ojiva: es un diagrama que se usa para
representar las frecuencias absolutas y relativas
acumuladas en una variable continua. Para su
construccin se determinan los puntos de
interseccin entre cada valor de la variable y su
respectiva frecuencia, luego se unen con trazos
rectilneos.
Ejemplo
La siguiente ojiva se elabora con base en los datos
de la distribucin de frecuencias de la tabla anterior.
5. Grafica de pastel o diagrama circular: La
grfica de pastel proporciona otra grfica para
presentar distribuciones de frecuencia relativa y
de frecuencia porcentual de datos cualitativos.
Para elaborar una grfica de pastel, primero se
dibuja un crculo que representa todos los
datos. Despus se usa la frecuencia relativa
para subdividir el crculo en sectores, o partes,
que corresponden a la frecuencia relativa de
cada clase.
4. Polgono de frecuencias: en una distribucin de
datos de una variable continua este tipo de
grafica se elabora fijando puntos, utilizando las
marcas de clase y las frecuencias y luego se unen
mediante una lnea quebrada.
Ejemplo
La siguiente tabla representa la venta de refrescos
en determinada compaa.
La representacin de la anterior informacin
mediante un diagrama circular es la que se muestra
a continuacin:
Si en el histograma de frecuencias unimos los
puntos medios de los rectngulos, tambin
obtenemos el polgono de frecuencias.
Andrs Mauricio Grisales Aguirre Matemtico.
[Link]
Estadstica Notas de clase 17
6. Graficas de puntos: Uno de los ms
sencillos resmenes grficos de datos son las
grficas de puntos. En el eje horizontal se
presenta el intervalo de los datos. Cada dato
se representa por un punto colocado sobre
este eje.
Ejemplo
La siguiente tabla representa la duracin de ciertas
auditorias en das:
Un diagrama de dispersin es una representacin
grfica de la relacin entre dos variables
cuantitativas y una lnea de tendencia es una lnea
que da una aproximacin de la relacin.
Ejemplo
Considere la relacin publicidad/ventas en una tienda de
equipos de sonido. Durante los ltimos tres meses, en 10
ocasiones la tienda apareci en comerciales de
televisin, en el fin de semana, para promover sus
ventas. Los directivos quieren investigar si hay relacin
entre el nmero de comerciales emitidos el fin de
semana y las ventas en la semana siguiente. En la
siguiente tabla se presentan datos muestrales de las 10
semanas dando las ventas en cientos de dlares.
El diagrama de dispersin para este conjunto de datos es
el que se muestra a continuacin:
Su representacin grafica mediante diagrama de
puntos se muestra a continuacin:
Tabulaciones cruzadas y diagramas
de dispersin
Una tabulacin cruzada es un resumen tabular de los
datos de dos variables. El uso de la tabulacin cruzada se
ilustrar con los datos de la aplicacin siguiente, que se
basan en datos de Zagats Restaurant Review. Se
recolectaron los datos correspondientes a la calidad y
precios de 300 restaurantes en el rea de Los ngeles.
La tabla 2.9 muestra los datos de los 10 primeros
restaurantes. Se presentan los datos de calidad y precio
caractersticos de estos restaurantes. La calidad es una
variable cualitativa que tiene como categoras bueno,
muy bueno y excelente. El precio es una variable
cuantitativa que va desde $10 hasta $49.
Andrs Mauricio Grisales Aguirre Matemtico.
Los diagramas de dispersin nos dan una idea de como
se relacionan las variables; pueden darse los siguientes
casos:
[Link]
Estadstica Notas de clase 18
Ejercicios de practica 3
1. Los cuatro programas con horario estelar de
televisin son CSI, ER, Everybody Loves
Raymond y Friends (Nielsen Media Research,
11 de enero de 2004). A continuacin se
presentan los datos sobre las preferencias de los
50 televidentes de una muestra.
a. Estos datos son cualitativos o cuantitativos?
b. Proporcione las distribuciones de frecuencia
c. Construya una grfica de barras y una
grfica de pastel.
d. De acuerdo con la muestra, qu programa
de televisin tiene la mayor audiencia?
Cul es el segundo?
b. Exprese la distribucin de la frecuencia
relativa.
c. Muestre la distribucin de frecuencia
acumulada.
d. Presente la distribucin de frecuencia
relativa acumulada.
e. Cul es la proporcin de los pacientes que
requieren servicio de emergencia y esperan 9
minutos o menos?
7. Considere las dos distribuciones de frecuencias
siguientes. La primera distribucin de
frecuencia proporciona el ingreso anual bruto
ajustado de Estados Unidos (Internal Revenue
Service, marzo 2003). La segunda distribucin
de frecuencia muestra las calificaciones de
exmenes de un grupo de estudiantes
universitarios en un curso de estadstica.
2. Los cinco apellidos ms comunes en Estados
Unidos, en orden alfabtico son, Brown, Davis,
Johnson, Jones, Smith y Williams (The World
Almanac, 2006). Suponga que en una muestra de
50 personas con uno de estos apellidos se
obtienen los datos siguientes.
Resuma estos datos construyendo:
a.
b.
c.
d.
Distribuciones de frecuencia
Una grfica de barras.
Una grfica de pastel.
De acuerdo con estos datos, cules son los
tres apellidos ms comunes?
3. El personal de un consultorio analiza los tiempos
de espera de los pacientes que requieren servicio
de emergencia. Los datos siguientes son los
tiempos de espera en minutos recolectados a lo
largo de un mes.
Con las clases 04, 59, etctera.
a. Muestre la distribucin de la frecuencia.
Andrs Mauricio Grisales Aguirre Matemtico.
a. Con los datos del ingreso anual elabore un
histograma. Qu evidencia de sesgo observa?
Es razonable este sesgo? Explique.
b. Con los datos de las calificaciones elabore un
histograma. Qu evidencia de sesgo observa?
Explique.
c. Con los datos del ejercicio 11 elabore un
histograma. Qu evidencia de sesgo observa?
Cul es la forma general de la distribucin?
8. NRF/BIG proporciona los resultados de una
investigacin sobre las cantidades que gastan
en vacaciones los consumidores (USA Today,
20 de diciembre de 2005). Los datos siguientes
son las cantidades gastadas en vacaciones por
los 25 consumidores de una muestra.
a. Cul es la menor cantidad gastada en
vacaciones? Cul la mayor?
[Link]
Estadstica Notas de clase 19
b. Use $250 como amplitud de clase para elaborar
con estos datos una distribucin de frecuencia y
una distribucin de frecuencia porcentual.
c. Elabore un histograma y comente la forma de la
distribucin.
d. Qu observaciones le permiten hacer las
cantidades gastadas en vacaciones?
9. El correo no deseado afecta la productividad de
los oficinistas. Se hizo una investigacin con
oficinistas para determinar la cantidad de
tiempo por da que pierden en estos correos no
deseados. Los datos siguientes corresponden a
los tiempos en minutos perdidos por da
observados en una muestra.
Resuma estos datos construyendo:
a. Una distribucin de frecuencias.
b. Una ojiva.
c. Qu porcentaje de los oficinistas pierde 5
minutos o menos en revisar el correo no
deseado?
d. Qu porcentaje pierde ms de 10 minutos
por da en esto?
10. Nielsen Home Technology Report informa
sobre la tecnologa en el hogar y su uso. Los
datos siguientes son las horas de uso de
computadora por semana en una muestra de 50
personas.
Resuma estos datos construyendo:
a. Una distribucin de frecuencia (como
ancho de clase use tres horas).
b. Una distribucin de frecuencia relativa.
c. Un histograma.
d. Una ojiva.
e. Haga un comentario sobre lo que indican
los datos respecto al uso de la computadora
en el hogar.
estudios del jefe de familia, (Statistical Abstract
of the United States, 2002).
a. Calcule los porcentajes por rengln e
identifique las distribuciones de frecuencia
porcentual del ingreso en los hogares en que el
jefe de familia termin secundaria y en los
hogares en que el jefe de familia tiene un ttulo
universitario.
b. Qu porcentaje de las familias en que el jefe
de familia termin secundaria gana $75 000 o
ms? Qu porcentaje de las familias en que el
jefe de familia tienen un ttulo universitario
gana 75 000 o ms?
c. Con los ingresos de los hogares en que el jefe
de familia termin secundaria elabore un
histograma de la frecuencia porcentual, y otro
con los ingresos de las familias en que el jefe
de familia tiene un grado universitario. Se
observa alguna relacin clara entre el ingreso
familiar y el nivel de educacin?
12. En la tabla se presentan datos financieros de 36
empresas de una muestra cuyas acciones
cotizan en la bolsa de valores de Nueva York
(Investors Business Daily, 7 de abril de 2000).
Los datos de la columna Ventas/margen/ROE
son evaluaciones financieras compuestas que se
basan en la tasa de crecimiento de las ventas de
una empresa, su margen de ganancia y su
rendimiento de los activos (ROE return on
capital employed). La calificacin EPS es una
medida del crecimiento por accin.
a. Elabore una tabulacin cruzada con los datos
Ventas/margen/ROE (renglones) y EPS
(columnas). Para el EPS emplee las clases 0
19, 2039, 4059, 6079 y 8099.
b. Calcule los porcentajes de las columnas y haga
un comentario sobre la relacin entre las
variables.
11. En la siguiente tabulacin cruzada se muestra el
ingreso familiar de acuerdo con el nivel de
Andrs Mauricio Grisales Aguirre Matemtico.
[Link]
Estadstica Notas de clase 20
consistentes con los incisos b y c? Explique
cualquier inconsistencia aparente.
13. Hace poco los administradores de un campo de
golf recibieron algunas quejas acerca de las
condiciones de los greens. Varios jugadores se
quejaron de que estaban demasiado rpidos. En
lugar de reaccionar a los comentarios de unos
cuantos, la asociacin de golf realiz un sondeo
con 100 jugadoras y 100 jugadores. Los
resultados del sondeo se presentan a
continuacin.
14. La National Football League de Estados Unidos
evala a los candidatos posicin por
posicincon una escala que va de 5 a 9. La
evaluacin se interpreta como sigue: 89 debe
empezar el primer ao; 7.07.9 debe empezar;
6.06.9 ser un apoyo para el equipo, y 5.05.9
puede pertenecer al club y contribuir. En la
tabla 2.14 se presentan posicin, peso, tiempo
(segundos en correr 40 yardas), y evaluacin de
40 candidatos (USA Today, 14 de abril de
2000).
a. Con los datos posicin (renglones) y
tiempo (columnas) elabore una tabulacin
cruzada. Para el tiempo emplee las clases
4.004.49, 4.504.99, 5.005.49 y 5.50
5.99.
b. Haga un comentario acerca de la relacin
entre posicin y tiempo, con base en la
tabulacin cruzada que elabor en el inciso
a.
c. Con los datos tiempo y calificacin
obtenida en la evaluacin elabore un
diagrama de dispersin, coloque la
calificacin obtenida en la evaluacin en el
eje vertical.
d. Haga un comentario sobre la relacin entre
tiempo y calificacin obtenida en la
evaluacin.
a. Combine estas dos tabulaciones cruzadas
utilizando como encabezados de rengln
Jugadores y Jugadoras y como encabezados de
columnas Demasiado rpido y Bien. En qu
grupo se encuentra el mayor porcentaje de los
que dicen que los greens estn demasiado
rpidos?
b. Vuelva a las tabulaciones cruzadas iniciales. De
los jugadores con bajo hndicap (mejores
jugadores), en qu grupo (jugadoras o
jugadores) se encuentra un porcentaje mayor de
quienes dicen que los greens estn demasiado
rpidos?
c. Regrese a las tabulaciones cruzadas iniciales.
De los jugadores con alto hndicap, en qu
grupo (jugadoras o jugadores) se encuentra un
porcentaje mayor para quienes los greens estn
demasiado rpidos?
d. Qu conclusiones obtiene acerca de mujeres y
hombres respecto a la velocidad de los greens?
Las conclusiones que obtuvo en el inciso a son
Andrs Mauricio Grisales Aguirre Matemtico.
[Link]