Capítulo 2, Parte B
Estadística Descriptiva:
Presentaciones Tabulares y Gráficas
! Análisis de datos exploratorio: Diagrama de Tallo y
Hojas
! Tabulación cruzada y Diagrama de Dispersión
Slide 1
Análisis de Datos Exploratorio
n Las técnicas de un análisis de datos exploratorio consiste
en imágenes aritméticamente simples y de facil dibujo los
cuales resumen datos de manera rápida..
n Una de estas tecnicas es el Diagrama de Tallo y Hojas.
Slide 2
Diagrama de Tallo y Hojas
n Un gráfico de Tallo y Hojas muestra el orden del rango
y la forma de la distribución de los datos.
n Es similar al histograma, pero tiene la ventaja de mostrar
los valores actuales de los datos.
n Los primeros dígitos de cada dato estan organizados
a la izquierda de la línea vertical.
n A la derecha de la línea vertical se coloca el último dígito
de cada dato en orden de rango.
n Cada línea del gráfico se considera un tallo.
n Cada dígito del tallo se considera hoja.
Slide 3
Ejemplo: Hudson Auto Reparación
El Gerente de Hudson Auto quisiera ganar un mejor
entendimiento del costo de las partes usadas en las
revisiones del motor realizados en el local. Ella
examina 50 facturas de los consumidores por
revisiones. Los costos de las partes, redondeados al
dólar más cercano, estan enlistados en la siguiente
diapositiva.
Slide 4
Diagrama de Tallo y Hojas
n Ejemplo: Hudson Auto Reparación
Muestra de Costos de Partes($) por 50
revisiones
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
Slide 5
Diagrama de Tallo y Hojas
n Ejemplo: Hudson Auto Reparación
5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9
Un tallo
Una hoja
Slide 6
Diagrama de Tallo y Hojas extendido
n Si creemos que el diagrama de tallo y hojas original ha
unido muchos los datos, podemos extender el gráfico
verticalmente usando dos tallos por cada primer dígito.
n Cuando el valor del tallo se repite, el primer valor corres-
ponde a los valores de hojas de 0 – 4, y el segundo corres-
ponde a los valores de hojas de 5 – 9.
Slide 7
Diagrama de Tallo y Hojas extendido
n Ejemplo: Hudson Auto Reparación
5 2
5 7
6 2 2 2 2
6 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4
7 5 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9
Slide 8
Diagrama de Tallo y Hojas
n Unidades de Hojas
• Un solo dígito es usado para definir cada hoja.
• En el ejemplo anterior, la unidad de hoja era 1.
• Las unidades de hojas pueden ser 100, 10, 1, 0.1, etc.
• Cuando una unidad de hoja no se muestra, se asume
que es 1.
• La unidad de hoja nos indica como multiplicar los
números de los tallos y hojas para aproximarse a los
datos orginiales.
Slide 9
Example: Leaf Unit = 0.1
If we have data with values such as
8.6 11.7 9.4 9.1 10.2 11.0 8.8
a stem-and-leaf display of these data will be
Leaf Unit = 0.1
8 6 8
9 1 4
10 2
11 0 7
Slide 10
Ejemplo: Unidad de hoja = 10
Si tenemos datos con valores como:
1806 1717 1974 1791 1682 1910 1838
Un diagrama de tallo y hojas seria de la siguiente manera:
Unidad de la hoja = 10
16 8 El 82 en 1682
17 1 9 está redondeado
18 0 3 a 80 y es
representado con un
19 1 7 8.
Slide 11
Tablas Cruzadas y Diagramas de Dispersión
n Hasta ahora nos hemos enfocado en métodos usados
para resumir datos para una variable.
n Usualmente un gerente esta interesado en métodos tabu-
lares o gráficos que ayuden a entender la relación entre
dos variables.
n La tabulación cruzada y un diagrama de dispersión son
dos métodos para resumir datos de dos variables al
mismo tiempo.
Slide 12
Tabulación Cruzada
n Una tabulación cruzada es un resumen tabular de
datos de dos variables.
n Una tabulación cruzada puede ser utilizada cuando:
• una variable es cualitativa y la otra cuantitativa,
• las dos variables son cualitativas, o
• las dos variables son cuantitativas.
n Los margenes de la izquierda y le tope definen las clases
de las dos variables.
Slide 13
Tabulación Cruzada
n Ejemplo: Finger Lakes Hogares
El número de hogares de Finger Lakes homes
vendidos por cada estilo y precio en los últimos dos
años se muestra a continuación.
Variable Variable
cuantitativa categórica
Rango de Estilo de Hogar
Precio Colonial Log Split A-Frame Total
< $200,000 18 6 19 12 55
> $200,000 12 14 16 3 45
Total 30 20 35 15 100
Slide 14
Tabulación Cruzada
n Ejemplo: Finger Lakes Hogares
Percepción ganada de tabulación cruzada anterior
• El número más grande de hogares (19) en la
muestra son un estilo split-level y con un precio
menor $200,000.
•Solo tres hogares en la muestra son de un estilo
A-Frame y con un precio de $200,000 o más.
Slide 15
Crosstabulation
Distribución
n Ejemplo: Finger Lakes Hogares de Frecuencia
Para la
variable del
Rango de
Precio.
Rango de Estilo de Hogar
Precio Colonial Log Split A-Frame Total
< $200,000 18 6 19 12 55
> $200,000 12 14 16 3 45
Total 30 20 35 15 100
Distribución de Frecuencia
para la variable de Estilo de
Hogar
Slide 16
Tabulación cruzada: Porcentajes por Renglón o
Columna
n Convertir las entradas en la tabla a porcentajes por
renglón o columna puede generar una visión
adicional sobre la relación entre las dos variables.
Slide 17
Tabulación cruzada: Porcentajes por Renglón
n Ejemplo: Finger Lakes Hogares
Rango Estilo de Hogar
de Precio Colonial Log Split A-Frame Total
< $200,000 32.73 10.91 34.55 21.82 100
> $200,000 26.67 31.11 35.56 6.67 100
Nota:: Los totales de los renglones son 100.01 debido al
redondeo.
(Colonial y > $200K)/(Todo > $200K) x 100 = (12/45) x 100
Slide 18
Tabulación cruzada: Porcentajes por Columna
n Ejemplo: Finger Lakes Hogares
Rango Estilo de Hogar
de Precio Colonial Log Split A-Frame
< $200,000 60.00 30.00 54.29 80.00
> $200,000 40.00 70.00 45.71 20.00
Total 100 100 100 100
(Colonial y > $200K)/(Todo Colonial) x 100 = (12/30) x 100
Slide 19
Tabulación cruzada: Paradoja de Simpson
n Los datos en dos o más tabulaciones cruzadas son
usualmente unidos para producir una tabulación
cruzada de resumen.
n Se debe tener cuidado al realizar conclusiones sobre la
relacion entre las dos variables en la tabulación
cruzada unida.
n En algunos casos las conclusiones basadas en una
tabulación cruzada unida puede ser completamente
inversa a los datos no unidos. Las inversión de las con-
clusiones entre datos unidos y no unidos se llama la
Paradoja de Simpson.
Slide 20
Diagrama de Dispersión y Línea de Tendencia
n Un diagrama de dispersión es una representación
gráfica de la relación entre dos variables cuantitativas.
n Una variable se muestra en el eje horizontal, y la otra
variable en el eje vertical.
n El patrón general de los puntos expuestos sugieren la
relación general entre las variables.
n La línea de tendencia muestra una aproximacion de
la relación.
Slide 21
Diagrama de Dispersión
n Una relación positiva
Slide 22
Diagrama de Dispersión
n Una relación negativa
Slide 23
Diagrama de Dispersión
n Ninguna relación aparente
Slide 24
Diagrama de Dispersión
n Ejemplo: Panthers Equipo de Fútbol.
El equipo de fútbol The Panthers está interesado
en investigar la relación, si la hay, entre las
intercepciones hechas y puntos logrados.
x = Número de y = Número de
Intercepciones Puntos Logrados
1 14
3 24
2 18
1 17
3 30
Slide 25
Diagrama de Dispersión
y
Número de Puntos logrados 35
30
25
20
15
10
5
0 x
0 1 2 3 4
Número de Intersepciones
Slide 26
Ejemplo: Panthers Equipo de Fútbol
n Percepción ganada del Diagrama de Dispersión
• El diagrama de dispersión indica una relación positi-
va entre el número de intercepciones y el número de
puntos logrados.
• Los puntos más altos estan asociados con los números
más altos de intercepciones.
• La relación no es perfecta. Los puntos puestos dentro
del diagrama de dispersión no se encuentran en una
línea recta.
Slide 27
Diagrama de Dispersión y Línea de Tendencia
Diagrama de Dispersión para The Panthers
35
30
Puntos logrados
25
Número de
20
15
10
5
0
0 1 2 3 4
Número de intercepciones.
Slide 28
Métodos Gráficos y Tabulares
Datos
Datos Categoricos Datos Cuantitativos
Métodos Métodos Métodos Métodos
Tabulares Gráficos Tabulares Gráficos
• Distribución de •Gráfico • Distribución de • Diagrama
Frecuencia. de Barras Frecuencia. de Puntos
• Dist.Freq.Rel. • Diagrama • Dist.Freq.Rel. • Histograma
• Distribución de Pastel • Distribución • Ojiva
Freq.Porcentual Freq.Porcentual • Diagrama de
• Tabulación cruzada. • Dist.Freq.Acum. Tallo y Hojas
• Dist.Freq.Rel.Acum. • Diagrama
• Distribución de Dispersión
Freq.Porcentual Acum.
• Tabulación cruzada.
Slide 29