Estadística: es la rama de la matemática que nos permite recoger, organizar y analizar
datos. Existen dos conceptos importantes dentro de la estadística que nos permiten
analizar y estudiar dichos datos, estos son: población y muestra.
Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar.
Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea
representativo de toda la población.
Gráfica: es una representación de la relación entre variables, muchos tipos de gráficos
aparecen en estadística, según la naturaleza de los datos involucrados y el propósito
de la gráfica, es la de representar los valores tabulados obtenidos de los muestreos o
los datos del total de la población.
Distribución de frecuencia: Al resumir grandes colecciones de datos, es útil distribuirlos
en clases o categorías, y determinar el número de individuos que pertenecen a cada
clase llamado frecuencia de clase. Una disposición tabular de los datos por clases junto
con las frecuencias correspondientes de clase se llama distribuidores de frecuencia o
tablas de frecuencia.
Medidas de dispersión: Describen la cantidad de dispersión o variabilidad que se
encuentra entre los datos. Datos bastante agrupados poseen valore
s relativamente pequeños, y datos más dispersos tienen valores más grandes. El
agrupamiento más extenso ocurre cuando los datos carecen de dispersión.
La estadística descriptiva se encarga de la descripción de datos (es decir, de
información recogida a partir de un estudio). Por ejemplo, en un estudio demográfico
sobre los nacidos en 2019 en España, la estadística descriptiva se encargaría de
extraer los datos de la edad media de las madres. La estadística inferencial, en cambio,
se ocupa de extrapolar los datos extraídos de un estudio realizado sobre una muestra
del conjunto total de datos para así aplicarlos al conjunto completo, ya que en
ocasiones la población total de la que extraer información es demasiado grande e
inabarcable. Por lo tanto, la estadística inferencial realiza un análisis a partir de la
generalización de las muestras que estudia, mientras que la descriptiva no lo hace.
Cada una de las características de los objetos de estudio (por ejemplo, el peso y la edad de la
población) de denomina variable. Las variables pueden tener una naturaleza muy variada, por
lo que se establecen diferentes maneras de medirlas para trabajar con ellas en un estudio
estadístico. Los datos que recoge una variable pueden ser de los siguientes tipos:
Discretos. Los datos cuantitativos son discretos si se tratan de un número finito o un
número contable infinito de valores.
Continuos. Son continuos si los datos se recogen en forma de intervalo
Nominales. Este tipo de datos son cualitativos, es decir, son categorías como
“hombre/mujer”. En este caso, lo habitual es atribuir un número identificativo a cada
uno de los valores representados.
Ordinales. Una escala ordinal de medida representa una serie ordenada de relaciones
o una posición dentro de un rango. Por ejemplo, “en una escala del 1 al 10, el nivel de
dolor es de 6”.
Intervalos. Se trata de datos en escalas que representan cantidades y que contienen
unidades entre las que el cero también representa un punto de medida.
Ratios. Una medida en escala de ratio es similar a la de un intervalo, con la diferencia
de que no existen valores por debajo del cero.
Una vez que los datos se han recopilado y clasificado, se hace un análisis exploratorio
de los mismos. Para llevarlo a cabo se observa la distribución de los datos, que nos
proporcionará claves básicas para un primer acercamiento al estudio, como la media, la
mediana, los cuartiles, la varianza y la desviación típica.
La media mide el centro de la distribución de los datos, y se calcula sumando cada uno
de los valores y dividiendo esta suma entre el número total de valores.
La mediana se sitúa en la mitad de los datos. Ordenándolos de mayor a menor o de
menor a mayor, la mediana deja la misma cantidad de valores a un lado y a otro, con lo
que se sitúa en el valor central de los datos. Si los datos son pares, la mediana se
encuentra en el punto medio entre los dos valores centrales; si son impares, la mediana
es el valor de la muestra central.
Los cuartiles dividen la distribución en cuatro partes iguales, de manera que se crean
cuatro segmentos con el mismo número de muestras. Se pueden obtener calculando la
mediana de las muestras menores que la mediana y la mediana de las muestras
mayores que la mediana. La mediana es el segundo cuartil.
Los cinco números resumen de una distribución son: el mínimo, el cuartil 1 (Q1), la
mediana, el cuartil 3 (Q3) y el máximo. De esta manera observamos el rango de los
valores (mín. y máx.), su valor central (mediana) y su dispersión (Q1, Q3).
La varianza es una medida de dispersión que nos ayuda a estudiar la desviación de las
muestras con respecto a la media.
Calculando la raíz cuadrada de la varianza obtenemos la desviación típica, que mide la
dispersión de un modo análogo a los cuartiles.
En la estadística inferencial, los resultados de estos cálculos pueden no coincidir con
los datos reales (la media muestral puede no coincidir con la media poblacional real).
Para ello, se calculan intervalos de confianza y errores de estimación que probarán si
los datos obtenidos son generalizables y extrapolables al total de la población.
Los mecanismos estadísticos, por su productividad para el análisis y la interpretación
de datos, son empleados en una gran variedad de campos de estudio, desde la física o
la ingeniería hasta la sociología, la economía o la psicología. Supone, sin duda, una
herramienta fundamental para la ciencia a día de hoy.
La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor.
La mediana se representa por
La mediana se puede hallar solo para variables cuantitativas.
Ejemplo de cálculo simple de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de
la misma.
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
Fórmula y cálculo de la mediana para datos
agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la
mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre.
es el límite inferior de la clase donde se encuentra la mediana
es la semisuma de las frecuencias absolutas
es la frecuencia absoluta de la clase mediana
es la frecuencia acumulada anterior a la clase mediana
es la amplitud de la clase
La mediana es independiente de las amplitudes de los intervalos
Ejemplo de cálculo de la mediana para distribución estadística
Calcular la mediana de una distribución estadística que viene dada por la siguiente
tabla:
En primer lugar, crearemos una nueva columna con los valores de la frecuencia
acumulada:
En la primera casilla colocamos la primera frecuencia absoluta. En la segunda casilla
sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta
correspondiente y así sucesivamente hasta la última, que tiene que se igual a
Ejemplo
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 9 juegan
al fútbol y el resto no practica ningún deporte.
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos
cuantitativos de tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan
los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o
relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a
la frecuencia.
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo
sanguíneo ha dado el siguiente resultado:
Tablas de frecuencias,
ejercicios resueltos
Una tabla de frecuencias o distribución de frecuencias es una tabla que muestra cómo
se distribuyen los datos de acuerdo a sus frecuencias. Elaborar una tabla de
frecuencias es muy sencillo y en este artículo te mostraremos cómo hacerlo.
Tenemos dos tipos de tablas de frecuencias:
Tablas de frecuencias con datos no agrupados.
Tablas de frecuencias con datos agrupados
Esta tabla está compuesta por las siguientes columnas:
Valores de la variable: son los diferentes valores que toma la variable en el estudio.
Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La
sumatoria de las frecuencias absolutas es igual al número de datos.
Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica
cuantos datos se van contando hasta ese momento o cuántos datos se van reportando.
Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una
clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos
del estudio.
Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han
reportado hasta ese momento. Es la suma de las frecuencias relativas, y se puede
calcular también dividiendo la frecuencia acumulada entre el número de datos del
estudio.
Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o
categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.
Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se
han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la
frecuencia relativa acumulada por 100%.
Ejemplo 1:
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los
siguientes resultados:
Con los resultados obtenidos, elaborar una tabla de
frecuencias.
Solución:
En la primera columna, colocamos los valores de nuestra
variable, en la segunda la frecuencia absoluta, luego la
frecuencia acumulada, seguida por la frecuencia relativa, y
finalmente la frecuencia relativa acumulada. Por ser el primer
problema, no haremos uso de las frecuencias porcentuales.
[Link] revisar el video para
entender.
En una tienda de autos, se registra la cantidad de autos
Toyota vendidos en cada día del mes de Setiembre.
0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3;
0; 1; 2; 1; 2; 3
Con los datos obtenidos, elaborar una tabla de frecuencias.
Solución:
En la primera columna, colocamos los valores de nuestra
variable, en la segunda la frecuencia absoluta, luego la
frecuencia acumulada, seguida por la frecuencia relativa, y
finalmente la frecuencia relativa acumulada. Ahora vamos a
agregar la columna de frecuencia porcentual, y frecuencia
porcentual acumulada.