UNIDAD DE FORMACIÓN CONTINUA
COMPLEMENTACIÓN PEDAGÓGICA Y UNIVERSITARIA
ESTADÍSTICA APLICADA
A LA EDUCACIÓN
MG. CLARA ZEGARRA MONDRAGÓN
ORGANIZACIÓN
DE DATOS
CUALITATIVOS
• Los datos no nos dicen nada por si
mismos, pero si los ordenamos y
agrupamos podemos ver como están
distribuidos.
• Una manera de agruparlos es
mediante la Distribución de
Frecuencia.
• Su finalidad es ofrecer información de
fácil lectura y comparación e
interpretación.
DISTRIBUCIÓN DE FRECUENCIAS
Es un cuadro donde se expresa un
resumen de un conjunto de datos que
muestra las frecuencias absolutas,
relativas y porcentuales en cada una
de varias clases que no se traslapan.
PARTES DE UNA TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS
Título
Frecuencias
Categorías de la
variable
Fuente
TITULACIÓN DE UNA TABLA DE DISTRIBUCIÓN
DE FRECUENCIA
Siguiendo las indicaciones del INEI, usaremos el siguiente
esquema para colocar el título a un cuadro de Distribución de
frecuencias.
Distribución < unidades de análisis> según < variable>
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLE
CUALITATIVA
GRÁFICO ESTADÍSTICO
Un gráfico vale más que mil palabras.
Los gráficos estadísticos presentan los datos en
forma de dibujo de tal modo que se pueda
percibir los hechos esenciales y compararlo con
otro.
PARTES DE UNA GRÁFICO ESTADÍSTICO
GRÁFICOS ESTADÍSTICOS EN VARIABLE
CUALITATIVA
Distribución de personas Distribución de personas según
según su color preferido tenencia de mascota
Fuente: XX
Fuente: XX
Gráfico circular Gráfico barras
ORGANIZACIÓN
DE DATOS
CUANTITATIVOS
PARTES DE UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Título
Frecuencias
Valores de la
variable
Fuente
DISTRIBUCIÓN DE FRECUENCIAS PARA VARIABLE
CUANTITATIVA DISCRETA
GRÁFICOS ESTADÍSTICOS EN VARIABLE CUANTITATIVA DISCRETA
Distribución de trabajadores según
accidentes
Fuente: XX
Gráfico de bastones
MEDIDAS DE
RESUMEN:
• TENDENCIA CENTRAL
• DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL
Son aquellas medidas que localizan el
centro de una distribución, indicando el
valor alrededor del cual tienden a
concentrarse o distribuirse las demás
observaciones.
Entre estas medidas tenemos:
Promedio o media.
Mediana.
Moda.
MEDIDAS DE TENDENCIA CENTRAL
EN DATOS NO AGRUPADOS
Si trabajamos con datos recogidos mediante
encuestas; a esa presentación de los datos
se llama “datos sueltos” o “datos no
agrupados”.
Tiempo de espera antes de ser atendido en
una ventanilla del banco (min)
13; 3; 8; 9; 4; 10; 5; 0; 6
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO DATOS NO AGRUPADOS
El promedio es el valor representativo de un conjunto de datos
Es la media aritmética de un conjunto de valores.
Se lo calcula con la suma de dichos valores dividida entre el número de valores.
Cálculo del
promedio
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO DATOS NO AGRUPADOS
Características
Se calcula para datos cuantitativos.
El valor de la media es sensible a los valores extremos que la distorsionan.
Notación:
Promedio muestral :
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO DATOS NO AGRUPADOS
Aplicación
Ingreso Experiencia
Se presenta la información de una muestra de
Colaborador mensual laboral
colaboradores de la Compañía Textil&Punto
(soles) (años)
1 2020 4.6
2 3410 8.8
3 1967 2.1 Determine el ingreso promedio = 2555.5 soles
4 1630 1.2
5 2502 5.2 El ingreso mensual de los colaboradores de la
6 1677 1.1 Compañía Textil& Punto se encuentra alrededor
7 4286 4.9
de 2555. 5 soles.
8 2952 2.8
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA DATOS NO AGRUPADOS
Ocupa el punto medio de una distribución dividiéndola a ésta en dos partes iguales.
Cada una de las partes contiene el 50% de los datos.
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA DATOS NO AGRUPADOS
Cálculo de la Valor: Si “i” es decimal.
mediana Entonces se redondea al
valor al entero inmediato
superior
Se ordenan los Posición
datos de menor a i=0.5 * n; donde n es Valor: Si “i” es entero.
mayor tamaño de muestra Entonces la mediana es un
promedio de las posiciones
Xi y Xi+1
Paso 1 Paso 2
Paso 3
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA DATOS NO AGRUPADOS
Características
Se calcula para datos cuantitativos y cualitativos en escala ordinal.
El valor de la mediana depende del número de datos observados.
La mediana es un estadístico que no se ve afectado por valores extremos (mín y máx).
Notación:
Mediana muestral : me
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA DATOS NO AGRUPADOS
Aplicación
Se presenta la información de una muestra de colaboradores de
la Compañía Textil&Punto
Experiencia
Colaborador laboral
Determine el valor mediano de la experiencia laboral
(años)
1 4.6 1. Ordenar los datos
2 8.8
1.1 1.2 2.1 2.8 4.6 4.9 5.2 8.8
3 2.1
4 1.2 i= 4
2. Posición
5 5.2
6 1.1
me
7 4.9 3. Valor
8 2.8
MEDIDAS DE TENDENCIA CENTRAL
MEDIANA DATOS NO AGRUPADOS
Interpretación del primer 50% Interpretación del segundo 50%
de los datos: de los datos:
El 50% de los colaboradores de El 50% de los colaboradores de
la Compañía Textil&Punto la Compañía Textil&Punto
tienen una experiencia laboral tienen una experiencia laboral
hasta 3.7 años superior de 3.7 años
MEDIDAS DE TENDENCIA CENTRAL
MODA DATOS NO AGRUPADOS
Es el valor que mas se repite en un conjunto de datos.
Características
La moda se puede calcular para datos cualitativos y cuantitativos.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas
(bimodal) o mas de dos modas (multimodal). Algunas series de datos no tienen moda
(amodal).
Notación:
Moda muestral : mo
MEDIDAS DE TENDENCIA CENTRAL
MODA DATOS NO AGRUPADOS
Aplicación1
Se les preguntó a 10 huéspedes de
un Hotel por el número de veces que
se han hospedados anteriormente, Interprete el valor de la moda.
durante éste año.
mo = 2 veces
1; 2; 1; 2; 2; 2; 1; 2; 3; 2
El número de veces más frecuente que se han
hospedado anteriormente los huéspedes del
Hotel es 2.
MEDIDAS DE TENDENCIA CENTRAL
MODA DATOS NO AGRUPADOS
Aplicación2
Interprete el valor de la moda.
Mo = computadora
El equipo que cuenta con mas frecuencia
el negocio es “computadora”
MEDIDAS DE DISPERSIÓN
Las medidas de variabilidad indican
cuan alejados están los valores de
una variable del valor que los representa
Estudiaremos:
Varianza
Desviación estándar
Coeficiente de variación
MEDIDAS DE DISPERSIÓN
Observemos las estaturas de las personas en ambos grupos
Menor dispersión indica que los Mayor dispersión indica que los
datos están concentrados datos no están concentrados
alrededor de la medida de alrededor de la medida de tendencia
tendencia central central.
MEDIDAS DE DISPERSIÓN
VARIANZA EN DATOS NO AGRUPADOS
• La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
• La varianza se expresa en las unidades de los datos al cuadrado.
Cálculo de la
varianza
MEDIDAS DE DISPERSIÓN
VARIANZA EN DATOS NO AGRUPADOS
Características
Se calcula en datos cuantitativos.
La varianza se ven afectadas por valores extremos.
La varianza son números reales no negativos.
La varianza es expresada en unidades de los datos al cuadrado.
Notación:
Varianza muestral: S2
MEDIDAS DE DISPERSIÓN
VARIANZA EN DATOS NO AGRUPADOS
Aplicación
Se presenta la información de una muestra de
Experiencia colaboradores de la Compañía Textile
Colaborador laboral ሺݔ െݔҧ ሻଶ
(años)
Determine la varianza de la experiencia laboral de
1 3.5 0.3025
2 8 15.6025 los colaboradores de la Compañía Textile.
3 2.1 3.8025
4 1 9.3025
5 5.2 1.3225
6 4.5 0.2025
Total 30.535 La variabilidad de la experiencia laboral de los
Promedio 4.05 colaboradores de la Compañía Textile es 6.107
años2.
MEDIDAS DE DISPERSIÓN
DESVIACIÓN ESTÁNDAR EN DATOS NO AGRUPADOS
La desviación estándar es la raíz cuadrada positiva de la varianza.
Cálculo de la
Desviación estándar
2
𝑆=√ 𝑆
MEDIDAS DE DISPERSIÓN
DESVIACIÓN ESTÁNDAR EN DATOS NO AGRUPADOS
Características
Se calcula en datos cuantitativos.
La desviación estándar se ven afectadas por valores extremos.
La desviación estándar son números reales no negativos.
La desviación estándar es expresada en las mismas unidades de los datos.
Notación:
Desviación estándar muestral :
MEDIDAS DE DISPERSIÓN
DESVIACIÓN ESTÁNDAR EN DATOS NO AGRUPADOS
Aplicación
Se presenta la información de una muestra de
Experiencia
colaboradores de la Compañía Textile
Colaborador laboral
(años) Determine la desviación estándar de la experiencia laboral
1 3.5
de los colaboradores de la Compañía Textile.
2 8
3 2.1 2.471
años
4 1
5 5.2 La variabilidad de la experiencia laboral de los
colaboradores de la Compañía Textile es 2.471 años.
6 4.5
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE VARIACIÓN EN DATOS NO AGRUPADOS
El coeficiente de variación (CV) de un conjunto de datos indica la relación entre la
desviación estándar y su media.
Se expresa en porcentaje.
Es útil al comparar la variabilidad de dos o mas series de datos.
Es una medida de variabilidad relativa.
Cálculo del coeficiente 𝑠
de variación 𝐶𝑉 = ∗ 100
𝑥
´
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE VARIACIÓN EN DATOS NO AGRUPADOS
Características
Se debe calcular solo para valores positivos.
Notación:
Coeficiente de variación muestral : CV
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE VARIACIÓN EN DATOS NO AGRUPADOS
Aplicación
Se presenta la información de las sucursales de la Compañía
Textile, respecto a la experiencia laboral (años) de los
trabajadores.
Indique que sucursal
Desviación
Sucursal Promedio CV tiene la experiencia
estándar
laboral mas homogénea.
Trujillo 4.05 2.471 ʹ ǤͶͳ
ͳ
ܸ ൌ ͲͲͳ כൌ
ܥ ͳǤͲͳΨ
ͶǤͲͷ Por tener menor CV (CV=45%),
la sucursal ubicada en la
ʹ ǤͶ ciudad de Lima presenta mas
Lima 5.3 2.4 ܸ ൌ ͲͲͳ כൌ
ܥ ͶͷǤʹ ͺ Ψ homogenidad.
ͷǤ͵
GRACIAS