“The greatest value of a picture
is when it forces us to notice
what we never expected to see”
(Tukey, 1977, p. VI).
John Wilder
Tukey
1
2
Estadística I
Semestre Abril-Agosto 2021
▪ Tabulación, que consiste en ordenar los datos originales y presentarlos de forma
que, sin perder información, sea más fácil conocer la distribución de los mismos. El
resultado final es una tabla donde se muestran los valores de la variable que se
tabula y sus frecuencias.
▪ Cálculo de medidas para resumir la distribución. Pueden ser de tendencia central,
que indican alrededor de que valores se agrupan los datos observados; y de
variabilidad o dispersión, que indican si los valores de la variable están muy
dispersos o concentrados.
▪ Representación gráfica, que facilita un análisis visual de los datos y permite sacar
conclusiones acerca de las características globales de la distribución.
3
• Una vez organizados los datos, usualmente en forma de tablas, es útil representarlos
gráficamente, esto es útil en la medida en que permite sintetizarlos o resumirlos
cómodamente y que estos contengan el máximo de información.
• En ciertas ocasiones, especialmente cuando trabajamos con un gran número de datos,
las tablas no son prácticas y es necesario una mejor visión de los datos con una
mirada rápida.
• Permite obtener información referente a la forma de la distribución, simetría,
tendencia central, dispersión, valores atípicos y datos ausentes.
• Las opciones de gráficos a utilizar varía en función del nivel de medida de las
variables, y el número de variables a incluir.
4
Intervalo
Razón
5
▪ Los gráficos circulares se dividen en
sectores o porciones; el tamaño de cada uno
representa el tamaño relativo dentro del
conjunto de datos total. Los gráficos
circulares suelen utilizarse para mostrar
tamaños relativos de partes de un todo.
▪ Como recomendación general, no se debería
emplear cuando hay más de siete
categorías, ya que las proporciones se
vuelven menos claras de interpretar.
▪ Solo se pueden emplear con variables
categóricas.
6
▪ Gráficos Circulares o de Torta ▪ Gráficos de Anillos o de Dona
7
30
36
105
A partir de las frecuencias relativas se estima qué porción del círculo debe ocupar
cada categoría.
45
Al igual que las frecuencias relativas deben sumar 1, los grados del círculo deben
sumar 360º. 84
La primera línea de referencia se suele trazar desde el centro hacia arriba, en un
ángulo de 90º.
8
▪ Un diagrama de barras es un gráfico usado para representar datos cualitativos o datos
cuantitativos discretos tomando en cuenta la frecuencia absoluta, relativa o porcentual.
▪ En el eje X se ubican las categorías o los valores de la variable discreta a graficar, en el eje Y
se puede ubicar la frecuencia absoluta, la frecuencia relativa o la frecuencia relativa
porcentual.
▪ Cada valor en el eje X está separado el uno del otro, ya que no necesariamente se asume un
continuo entre las categorías.
9
Diagrama – fi Diagrama – hi Diagrama – hi %
10
Muchos gráficos pueden incluir más de dos variables. Usualmente se puede agregar una tercera variable de
agrupación, aunque se recomiendo que esta tenga pocas categorías para facilitar la interpretación del gráfico.
Diagrama – Con Variable de Agrupación
Diagrama – Simple
Inasistencias
Número de
11
▪ Son una representación gráfica de los datos donde se señala cada uno de ellos mediante puntos
localizados a lo largo de una recta numérica.
▪ Se pueden emplear con datos cuantitativos discretos, y existen algunas versiones para datos continuos.
▪ Se pueden representar agrupaciones de datos diferentes incluyendo una tercera variable de agrupación.
12
Libros fi
0 2
Estudiante # Libros
1 2
Est 1 5
2 4
Est 2 1 0, 0, 1, 1, 2, 2, 2,2, 3, 5, 5, 8 3 1
Est 3 2 4 0
Est 4 5 5 2
Est 5 8 6 0
Est 6 0 Moda 7 0
Est 7 3 8 1
Est 8 2 Valor Atípico
Est 9 2
Est 10 1
Est 11 0
0 1 2 3 4 5 6 7 8
Est 12 2
13
Estudiantes de
2do Curso
Estudiantes de
1er Curso
0 1 2 3 4 5 6 7 8
14
Número de Libros Leídos
Continuará…
La próxima clase
15