Estadística Descriptiva
Prof. SERGIO ATO FRIAS
Aprendizajes
esperados
• Determinar medidas de tendencia central en datos agrupados.
• Determinar medidas de posición.
• Calcular las medidas de central a partir de datos
tendencia
agrupados y no agrupados.
• Interpretar las medidas de tendencia central a partir de tablas y
gráficos.
Definiciones
• Estadística: Es una rama de la matemática que comprende métodos
y técnicas que se emplean en la recolección, ordenamiento,
resumen, análisis, interpretación y comunicación de conjuntos de
datos.
• Población: Es un conjunto cuyos elementos poseen alguna
característica común que se quiere estudiar, ya sea de individuos,
de animales, de objetos, de medidas, de producciones, de
acontecimientos o de sucesos.
Las poblaciones pueden ser finitas o infinitas.
• Muestra: Es un subconjunto de la población, que
debe ser
representativa y aleatoria.
Definiciones
• Variable Cualitativa: Son aquellas cuando las observaciones
realizadas se refieren a un atributo (no son numéricas), por
ejemplo: sexo, nacionalidad, profesión, etc.
• Variable Cuantitativa: Son aquellas en que cada observación tiene
un valor expresado por un número real, por ejemplo: peso,
temperatura, salario, etc.
Discretas: Que toman sólo valores enteros, por ejemplo: número
de hijos, número de departamentos en un edificio, etc.
Continuas: Susceptibles de toman cualquier valor, por ejemplo: el
peso, la estatura, etc.
Estadísti
ca
Tablas de
Población o muestra Gráficos
frecuencia
Datos NO
Datos agrupados
agrupados
Medidas de tendencia
7mo central Medidas de posición
8vo
Media aritmética
Percentil Quintil
Mediana
Decil Cuartil
Moda
Datos
estadísticos
La Estadística es la parte de la matemática encargada de recopilar,
organizar, presentar y analizar datos obtenidos de un estudio.
Un grupo de n datos se pueden representar mediante la notación:
x1, x2, x3, x4, x5, …., xn
Ejemplo
Las notas de un alumno son 4,5; 5,2; 6,4; 5,8 y 6,7.
Podemos expresar estos 5 datos como:
x1 = 4,5; x2 = 5,2; x3 = 6,4, x4 = 5,8; x5 = 6,7.
Medidas de
tendencia central
Las medidas de tendencia central entregan información
acerca de un conjunto de datos. resumida
Las medidas de tendencia central son:
• Media aritmética (o promedio)
• Mediana
• Moda
Media
aritmética (o
promedio)
La media aritmética (o promedio) corresponde al número que se
obtiene al
dividir la “suma de todos los valores” por el “número de datos” .
Para representar la media aritmética se utiliza el símbolo: x
Fórmula
x1 + x2 + x3 + ….+ xn
x =
n
Donde n representa el número de datos.
Media
aritmética (o
promedio)
Ejemplo
¿Cuál es la media aritmética (o promedio) de los datos: 3, 5, 8, 8, 10,
12, 24 , 30?
Podemos observar que el número de datos es n = 8.
Para calcular la media aritmética de estos datos se debe sumar
todos los datos y dividir esta suma por 8, es decir:
3 + 5 + 8 + 8 + 10 + 12 + 24 + 30 (Sumando)
x =
8
100
x =
8
Observación
x = 12,5 La media aritmética no
necesariamente está en el grupo
de datos.
Media
aritmética (o
promedio)
Ejemplo
El promedio de un alumno que tiene 4 notas es 6,2. Si tres de estas
notas son 5,5 ; 6,5 y 7,0, ¿cuál fue su cuarta nota?
En este caso, n = 4.
Sea x4 la nota que falta, entonces se tiene:
x1 + x2 + x3 + x4 (Reemplazando)
x =
4
5,5 + 6,5 + 7,0 + x4 (Sumando las notas y
6,2 = 4 multiplicando por 4)
4 6,2 = 19 + x4 (Multiplicando )
24,8 = 19 + x4 (Restando 19)
24,8 – 19 = x4
5,8 = x4
Media
na
La mediana (Me) o percentil 50 de un conjunto de datos es el valor que ocupa
la posición central cuando los datos han sido ordenados (en forma creciente o
decreciente).
Para calcular la mediana se debe ordenar los datos de menor a mayor (o de
mayor a menor) y encontrar el dato central.
La mediana es el valor que deja por debajo y por encima de él, el mismo
número de observaciones.
Media
na
Ejemplo
¿Cuál es la mediana de los datos 5, 6, 3, 12, 7?
Ordenando los datos de menor a mayor se tiene:
3,
5,
Me
6,
Podemos observar que el dato
central es el 6. 7,
Luego, la mediana es Me = 6.12
Media
na
(o percentil 50)
Ejemplo
¿Cuál es la mediana de los datos 15, 10, 25, 30, 5, 40?
Ordenando los datos de menor a mayor se tiene:
5, 10, 15, 25, 30, 40
Me = 20
En este caso, los datos quedan divididos en dos grupos de 3 datos.
La mediana es el promedio entre 15 y 25.
Observación
Luego, la mediana es Me = 20.
La mediana no
necesariamente está en
el grupo de datos.
Mediana
(o percentil
Al analizar50)
los ejemplos anteriores, podemos distinguir dos casos:
En un grupo de datos, donde n es el número total de ellos,
se tiene:
•Si n es impar, entonces la mediana es el dato que está en la
posición n + 1 .
2
• Si n es par, entonces la mediana se encuentra en la mitad y
es el promedio de los datos centrales, los de
ubicación
n y n + 1.
2 2
Mo
da
La moda (Mo) de un grupo de datos, corresponde al valor más frecuente,
es decir, el que más se repite.
En un conjunto de datos puede haber una o más modas, e incluso
puede no haber moda.
Ejemplo
¿Cuál es la moda en la distribución 2, 4, 4, 4, 5, 5, 7, 9?
El dato que más se repite es el 4.
Por lo tanto, la moda Mo = 4.
Mo
da
Ejemplo
¿Cuál es la moda de los datos 12, 13, 13, 16, 17, 17, 20, 28?
Podemos observar que los datos 13 y 17 se repiten 2 veces cada uno,
luego, hay dos modas.
Por lo tanto, la moda es Mo = 13 y Mo = 17.
Ejemplo
En los datos: 2, 2, 2, 8, 8, 8, 10, 10, 10, 15, 15, 15, ¿cuál es la moda?
En el ejemplo, podemos observar que los datos 2, 8, 10 y 15,
se
repiten el mismo número de veces.
Por lo tanto, en este caso NO hay moda.
Apliquemos
nuestros
conocimientos
[Link] un grupo de 10 amigos, las edades son: 12, 12, 12, 12, 15, 15, 15, 16, 16,
17.
¿Cuál es la moda de la edad de los amigos?
A) 12 años
B) 10 años
C) 14,2 años
D) 15 años
E) 15,5 años
A
Habilidad: Conocimiento
¿Cuál es la alternativa
correcta?
Apliquemos
nuestros
conocimientos
2. Un alumno quiere tener promedio final 6,0 en Física. Si son 5 notas en total y en
las primeras 4 su promedio es de 5,8, ¿cuál debe ser la quinta nota para obtener el
promedio que quiere?
A) 6,2
B) 6,4
C) 6,8
D) 6,9
E) 7,0
C
¿Cuál es la alternativa Habilidad: Aplicación
correcta?
Apliquemos
nuestros
3. Enconocimientos
los siguientes datos: 56, 96, 23, 52, 35, 78, 18, 100, 49, 23; la
mediana es
A) 23
B) 35
C) 48
D) 50,5
E) 53
D
¿Cuál es la alternativa
correcta? Habilidad: Aplicación
Apliquemos
nuestros
4. De conocimientos
los datos: 5p, 7p, 6p – 5, 2p + 9, con p IN, ¿cuál(es) de las
siguientes afirmaciones es(son) verdadera(s)?
I) La moda es p.
II) La media aritmética (o promedio) es 5p + 1.
III)Si p = 1, entonces la mediana de los nuevos datos es 6.
A) Solo I
B) Solo II
C) Solo III
D) Solo II y
III Habilidad:
E) I, II y III Análisis
D
¿Cuál es la alternativa
correcta?
Apliquemos
nuestros
5. Deconocimientos
los siguientes datos : 20, 18, 24, 20, 4, 16, 12, 18, 4, 19, 11, 16, 5,
24, ¿cuál es la mediana de las modas de la muestra?
A) 12
B) 14
C) 15,07
D) 16
E) 18 E
Habilidad: Comprensión
¿Cuál es la alternativa
correcta?
Contenidos
Estadística II
Distribución de
frecuencias Gráficos
Datos NO
Datos agrupados
agrupados
Distribución de
frecuencias
Corresponde al ordenamiento de datos cuando en un estudio estadístico se
recopila una gran cantidad de ellos.
Existen dos tipos de distribución de frecuencias:
• Datos NO agrupados
• Datos agrupados Frecuencia: Es la cantidad
de veces que se repite un
dato en una muestra.
Datos NO agrupados
Se utiliza comúnmente cuando las opciones de variables son pocas.
Ejemplo
Ordenar los datos siguientes en una tabla de frecuencias:
5, 6, 2, 1, 5, 2, 6, 5, 7, 1, 6, 6, 2, 5, 6
Al sumar la columna de la
Número Frecuencia frecuencia, se obtiene el
1 2 número total de datos
2 3 (n).
5 4
6 5
7 1
n = 15
Datos
agrupados
Datos agrupados
Construcción de tablas
Antes de construir una tabla de frecuencias primero debes conocer sus
componentes:
Población o Variable en la
muestra que se agrupa la
sometida al muestra (edad)
estudio y y frecuencia
variable a absoluta de esta
estudiar (n° de
personas)
Cada intervalo
de la muestra
corresponde
a una clase Y un extremo o límite
superior
Y cada intervalo posee un
extremo o límite inferior
Tablas de
frecuencias
Frecuencia acumulada:
Corresponde a la acumulación de las frecuencias de los datos ordenados en
orden creciente.
Frecuencia relativa:
Corresponde a la razón entre la frecuencia y el número total de datos (n).
Puede ser expresada en porcentaje.
Dato Frecuencia Frecuencia Frecuencia
acumulada relativa
x1 f1 f1 f1
n 100%
x2 f2 f 1 + f2 f2
n 100%
… … ... …
xn fn f1 + f2 … + f n fn
n 100%
Tablas de
frecuencias
Ejemplo
Construir una tabla de frecuencias para los datos:
5, 6, 2, 1, 5, 2, 6, 5, 7, 1, 6, 6, 2, 5, 6
Dato Frecuencia Frecuencia Frecuencia relativa
acumulada
2 2 2 __
1 100% = 13,3%
15
2 3 2+3=5 3
100% = 20%
15
4 5+4=9 4 __
5 100% =
26,6%
15
5 9 + 5 = 14 5 __
6 100% = 33,3%
15
7 1 14 + 1 = 15 1 __
100% = 6,6%
15
Gráficos
La información también puede ser representada en gráficos de
barra de frecuencias (o histogramas).
Ejemplo
Gráficos
El gráfico circular sirve para presentar la información de los
datos, su frecuencia, o la frecuencia relativa.
Ejemplos
¿Qué tipo de película prefiere? ¿Fuma o ha fumado?
Ex fumador
1.153 / 23%
No fumador
2.156 / 44%
Fumador
1.640 / 33%
Gráficos
Ejemplo
Según la información del gráfico, ¿cuál es el número total de datos de
la muestra?
Construyendo la tabla de
Frecuencia frecuencias de los datos se tiene:
10
Dato Frecuencia
6
5
1 6
4 2 5
3 4
Dato 4 10
1 2 3 4
Sumando las frecuencias, el número de datos es:
n = 6 + 5 + 4 + 10 = 25.
Datos
agrupados
Se utiliza cuando hay una gran cantidad y variedad de datos, por lo que es
conveniente agruparlos en intervalos semiabiertos, excepto el último, que es
cerrado.
Marca de clase:
Corresponde al valor central de cada intervalo. Es el promedio de los
extremos del intervalo.
Ejemplo
Las estaturas de los alumnos de un colegio viene dada por la tabla:
Estatura (cm) Frecuencia Marca de clase
[150, 160[ 120 155
[160, 170[ 240 165
[170, 180[ 150 175
[180, 190] 80 185
1. Medidas de tendencia central en
datos agrupados
1.1 Datos agrupados
Los datos se encuentran clasificados dentro de intervalos o clases,
por lo cual resulta imposible conocer sus valores precisos.
Ejemplo: La tabla adjunta representa las edades de los participantes en un
grupo deportivo, agrupadas en intervalos.
Edad (años) Frecuencia
[8 – 11] 16
[12 – 15] 12
[16 – 19] 10
[20 – 23] 7
[24 – 27] 4
1. Medidas de tendencia central en
datos agrupados
1.1 Datos agrupados
Cada intervalo puede ser representado por un solo valor, llamado marca de
clase, que corresponde al promedio entre los extremos del intervalo.
En el ejemplo, la marca de clase de cada intervalo es
Edad (años) Frecuencia Marca de clase
[8 – 11] 16 9,5
[12 – 15] 12 13,5
[16 – 19] 10 17,5
[20 – 23] 7 21,5
[24 – 27] 4 25,5
1. Medidas de tendencia central en
datos agrupados
1.1 Datos agrupados
El intervalo modal (o clase modal) corresponde al intervalo que tiene la
mayor frecuencia. En este caso, es [8 – 11]. Esto NO significa que en ese
intervalo se encuentre la moda de la muestra.
El intervalo donde se encuentra la mediana se determina ubicando
la posición central, de acuerdo a las frecuencias acumuladas.
Edad (años) Frecuencia Frecuencia acumulada
[8 – 11] 16 16
[12 – 15] 12 28 Posición 17
a posición 28
[16 – 19] 10 38
[20 – 23] 7 45
[24 – 27] 4 49
Como hay 49 datos en total, la mediana se encuentra en la posición 25.
Luego, el intervalo donde se encuentra la mediana es [12 – 15].
1. Medidas de tendencia central en
datos agrupados
1.1 Datos agrupados
El promedio obtenido a partir de la marca de clase se determina
utilizando la frecuencia y la marca de clase de cada intervalo.
Edad (años) Frecuencia Marca de clase Frecuencia · Marca de clase
[8 – 11] 16 9,5 152
[12 – 15] 12 13,5 162
[16 – 19] 10 17,5 175
[20 – 23] 7 21,5 150,5
[24 – 27] 4 25,5 102
Total 49 741,5
741,5
Promedio = = 15,132… años
49
Este resultado es un valor aproximado del valor real, a falta de mayor
precisión en los datos.
Media
aritmética (o
promedio)
Cuando se conoce la frecuencia de los datos, la media aritmética
(o promedio) se calcula mediante la fórmula:
x1 f1 + x2 f2 + …. + xn fn
x=
n
Con n: número total de datos, y fi la frecuencia del dato xi.
Media
aritmética (o
promedio)
Ejemplo
Según la información de la tabla, calcular la media aritmética (o
promedio) de los datos. Sumando las frecuencias, se obtiene:
Dato Frecuencia n = 6 + 5 + 4 + 10 = 25.
1 6
x1 f1 + x2 f2 + …. + xn fn
2 5 x=
n
3 4
4 10 1 6 + 2 5 + 3 4 + 4 10
x=
25
n = 25 6 + 10 + 12 + 40
x=
25
x=
68
25 x = 2,72
Mo
da
- Recordemos que en una distribución de datos NO agrupados,
la
moda es el dato de mayor frecuencia.
- En una distribución de datos agrupados, se llama intervalo modal al
intervalo que tiene mayor frecuencia.
Ejemplo
¿Cuál es el intervalo modal en la siguiente distribución de datos
agrupados?
Dato Frecuencia
[1,3[ 10 El intervalo modal es el que tiene
[3,5[ 13 mayor frecuencia, por lo tanto en
este ejemplo es [5,7[
[5,7[ 14
[7,9] 4
Media
na
- Recordemos que en una distribución de datos NO agrupados, la mediana
es el dato central cuando los datos han sido ordenados en forma creciente
(o decreciente).
- Si el número de datos es impar, la mediana corresponde al valor central. Si
el número de datos es par, la mediana corresponde al promedio entre los
dos valores centrales.
- En una distribución de datos agrupados, la mediana se encuentra
en el intervalo que contenga el dato central.
Media
na
Ejemplo
¿En qué intervalo se encuentra la mediana en la
distribución de datos siguiente agrupados?
Si sumamos las frecuencias vemos que
Dato Frecuencia el total de datos es 41, por lo tanto la
[1,3[ 10 mediana se encuentra en el intervalo que
[3,5[ 13 contiene al dato de ubicación 21.
[5,7[ 14 Este dato se encuentra en el intervalo
[3,5[.
[7,9] 4
Apliquemos
nuestros
conocimientos
1. Según la tabla de adjunta, ¿cuál es la frecuencia del dato 3?
Dato Frecuencia
A) 3 acumulada
B) 7
C) 15 1 15
D) 18 2 18
E) 25 3 25
4 35
B
¿Cuál es la alternativa
correcta? Habilidad: Aplicación
2. Según el gráfico de la figura, ¿cuál es la frecuencia relativa del dato 2?
Apliquemos nuestros Frecuencia
A) 2% conocimientos 20
B) 20%
C) 40% 12
10
D) 50% 8
E) 75%
Dato
1 2 3 4
C
¿Cuál es la alternativa Habilidad: Aplicación
correcta?
Apliquemos
nuestros
conocimientos
3. Según la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones es(son)
verdadera(s)?
Dato Frecuencia
I) El número total de datos es 75. 5 2
II) La frecuencia acumulada hasta el dato 20 es 42. 10 10
III)La frecuencia relativa del dato 15 es 30%.
15 25
20 5
A) Solo I
B) Solo II 25 8
C) Solo I y II
D) Solo II y III
E) I, II y III
B
¿Cuál es la alternativa Habilidad: Análisis
correcta?
Apliquemos
nuestros
4. En conocimientos
la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones es(son)
verdadera(s)?
I) La marca de clase del intervalo [10, 15[ es 12,5.
II) El intervalo modal es [25, 30].
III)La mediana se encuentra en el intervalo [20, 25[.
A) Solo I Intervalos Frecuencia
B) Solo I y II [10, 15[ 42
C) Solo I y III [15, 20[ 23
D) Solo II y III
[20, 25[ 35
E) I, II y III
[25, 30] 86
E
¿Cuál es la alternativa
correcta? Habilidad: Análisis
Apliquemos
nuestros
conocimientos
5. Según el gráfico, ¿cuál es el valor de la media aritmética (o promedio)?
Frecuencia
A) 3,3
45
B) 5,6
C) 9,5 35
D) 56
E) 560
10
5
Dato
2 4 6 8 10
B
¿Cuál es la alternativa
correcta? Habilidad: Aplicación
Si eres mas “visual” y/o “auditivo”
para aprender, o simplemente quieres
complementar mas el contenido visto,
les recomiendo ver los siguientes links:
[Link]
KJmwdfcVpxpuq&index=1
[Link]
IGEskx0&list=PLA0brQx7U3OWbTCcUmm7KJmwdfcVpxpuq&index=2
[Link]
KJmwdfcVpxpuq&index=3
[Link]
1hFMlffM&list=PLA0brQx7U3OWbTCcUmm7KJmwdfcVpxpuq&index=4
[Link]
Um m7KJmwdfcVpxpuq&index=5
[Link]
7
KJmwdfcVpxpuq&index=6