Estadística descriptiva
Estadística descriptiva
Parte de la estadística que únicamente trata de describir y
analizar un conjunto de datos dado, sin sacar ninguna
conclusión ni hacer inferencia alguna acerca de un grupo más
grande.
En pocas palabras la estadística descriptiva es aquella que comprende
aquellos métodos que incluyen técnicas para recolectar, presentar,
analizar e interpretar datos.
Datos agrupados y no agrupados
La principal diferencia entre los datos agrupados y los no agrupados es que los
agrupados están clasificados según un criterio y los no agrupados se encuentran en
el mismo formato que cuando se recopilaron.
Es decir, la diferencia entre datos agrupados y no agrupados es que los primeros han
sido colocados en una categoría, pero los segundos están tan cual han sido
recogidos.
La diferencia entre datos agrupados y datos no agrupados no reside ni en la forma
de obtenerlos ni en el tipo de datos que son. La diferencia se encuentra en el
tratamiento que se le ha dado a los datos una vez que han sido recogidos.
Simplificando
Los datos no agrupados son aquellos que
tras ser recopilados no se ha hecho nada con
ellos, también se incluyen en este grupo los
que han sido ordenados. Sin embargo, los
datos agrupados han sido clasificados
generalmente por frecuencia.
Para que quede más claro, imaginemos que
queremos saber a qué hora se despierta un
bebé a lo largo de una semana. Para ello,
anotaremos la hora a la que se despierta
cada uno de los días. Los datos tal y como se
obtienen son datos no agrupados:
Sin embargo, los datos agrupados se presentarían por el número de veces que se ha
despertado el bebé por cada una de las horas. La siguiente tabla lo muestra:
Ejemplos de datos agrupados y no agrupados
Concluyendo, los datos agrupados se encuentran clasificados y los no agrupados son aquellos que se encuentran de la misma
forma que cuando fueron recopilados. Cuando se trabaja con grandes cantidades de datos, es necesario agruparlos para
poder trabajar con ellos.
Caracterización de datos en forma agrupada
Es posible caracterizar una variable cuantitativa teniendo en cuenta la forma en la
cual se estudiarán los datos. Así, es posible estudiar los datos en forma agrupada y
en tal caso la caracterización se hace teniendo en cuenta el diagrama de tallo y hojas,
la tabla de distribución de frecuencias, la gráfica de punto, el histograma y la ojiva.
Diagrama de tallo y hojas
Un diagrama de tallo y hojas es una representación gráfica en la cual los datos se clasifican de
acuerdo con la expresión decimal de cada uno de ellos.
Para construir un diagrama de tallo y hojas, primero, se ordenan los dígitos principales de cada
dato a la izquierda de una línea vertical; esta columna es llamada tallo. A la derecha de esta
línea se registra el último dígito para cada dato, conforme se revisan las observaciones en el
orden que se registraron; esta columna es llamada hoja
Realizar el diagrama de tallo y hojas para la siguiente situación.
El departamento de psicología del colegio ha implementado un programa de buen uso del tiempo libre para los
estudiantes. Para ello, construyó un gimnasio donde los estudiantes se pueden ejercitar en horario extraclase.
Luego, de unos meses de que el gimnasio inicia su funcionamiento, se reporta el número de veces que cada
estudiante ha asistido a dicha práctica. Los resultados para 50 estudiantes se presentan a continuación.
Tabla de distribución de frecuencias
Al igual que para las variables cualitativas, una tabla de distribución de frecuencias es un
resumen de los datos. Estos se presentan en forma agrupada y discriminando diferentes
aspectos de esta agrupación.
La tabla de distribución de frecuencias está formada por siete columnas en las cuales se
incluyen: intervalos de clase, frecuencia f, frecuencia relativa fr, frecuencia acumulada F,
frecuencia relativa acumulada Fr, porcentaje % y marca de clase xi.
Para construir una tabla de distribución de frecuencias se deben tener en cuenta tres aspectos
fundamentales:
• Determinar la cantidad de intervalos o clases convenientes para la distribución.
• Determinar el tamaño de cada clase (suele nombrarse como ancho de clase).
• Determinar los límites superior e inferior de cada clase.
Ejemplo:
Organizar los datos en una tabla de distribución de frecuencias. Luego, escribir tres conclusiones.
1.Número de intervalos 𝑛
2.Rango DM - Dm
!"#$%
3.Tamaño del intervalo
#
Histograma
El histograma es un resumen gráfico que se organiza a partir de la tabla de distribución
de frecuencias.
Para trazar un histograma se realiza lo siguiente:
• Primero, se dibuja el eje horizontal y se escriben las opciones de la variable de interés.
• Segundo, se dibuja el eje vertical y sobre este se escriben la frecuencia, la frecuencia
relativa o el porcentaje.
• Tercero, se representa cada frecuencia de clase trazando un rectángulo cuya base es
el intervalo de clase sobre el eje horizontal y cuya altura es la frecuencia
correspondiente.
A continuación represente el histograma relacionado con los tiempos de los auditores del
ejemplo anterior.
En este gráfico se utilizaron las columnas clase y f de la Se presenta un histograma en el cual las barras representan la En algunas ocasiones es necesario presentar el histograma de
tabla, correspondientes al tiempo en días, que se tardan frecuencia relativa. porcentajes.
los empleados para realizar las auditorías de fin de año.
Ojiva
Cuando en un histograma se representan las frecuencias acumuladas, la gráfica de
dicha representación recibe el nombre de ojiva.
La ojiva se traza de la siguiente manera:
• Primero, se ubica la marca de clase (punto medio) de cada intervalo.
• Segundo, se ubican puntos en la gráfica. Para ello se toma como referencia la marca
de clase del intervalo y la altura correspondiente a la frecuencia acumulada de dicha
marca de clase.
• Finalmente, se unen estos puntos con líneas rectas.
La ojiva correspondiente al ejemplo de los auditores se muestra a
continuación:
En el extremo izquierdo de la ojiva se ubicó un
punto adicional que da comienzo a la curva e indica
que no hay valores menores que la clase del 10 al
17.
Es importante anotar que la ojiva es una curva
creciente puesto que se construye a partir de las
frecuencias acumuladas.
Es posible elaborar una ojiva a partir de las frecuencias relativas acumuladas.
Práctica
El alcalde de la ciudad está considerando la posibilidad de implementar un peaje de ingreso. Sus asesores han llegado a la
conclusión que existen dos ubicaciones posibles y favorables para ello. El alcalde decide medir el número de automóviles
que ingresan a la ciudad por cada uno de los dos puntos durante los últimos 15 días. Los resultados se muestran a
continuación:
Práctica Nº 2
En un estudio relacionado con los niveles de satisfacción en el trabajo se aplicó una serie
de pruebas a 50 individuos. Se obtuvieron los siguientes datos:
Elabora un diagrama de tallo y hojas para la situación.
Con base en el diagrama de tallo y hojas, elabora la
tabla de distribución de frecuencias para la situación.
Elabora 1 histograma y 1 ojiva para la situación.
Métodos numéricos para la caracterización de
variables, para datos agrupados.
Media aritmética
Ejemplo
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media, la mediana y la moda.
Mediana
Ejemplo:
Moda
Ejemplo:
Lo primero que debemos hacer es identificar el intervalo modal:
Práctica Nº 1
A 40 estudiantes se les pidió que estimen el número de horas que dedican a estudiar durante la semana (tanto en clase como fuera de
ella), obteniéndose los siguientes resultados:
Práctica Nº 2