“UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO”
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
DEPARTAMENTO ACADEMICO DE ESTADISTICA
ASIGNATURA : ESTADÍSTICA Y PROBABILIDADES
TEMA: ESTADÍSTICASD DESCRIPTIVAS
Prof: José Núñez Rodríguez
ESTADíSTICAS
Una Estadística es una magnitud determinable a partir de los valores de la variable de
interés observados en la muestra de estudio, es decir, es una función muestral. Las
principales estadísticas se agrupan en:
ESTADÍSTICAS DE TENDENCIA CENTRAL O POSICIÓN Y ESTADÍSTICAS DE DISPERSIÓN
Las tablas y gráficos estadísticos permiten resumir y analizar en forma “gruesa” y pueden ser
el punto de partida para un análisis específico. En muchas situaciones no sólo basta con
conocer la distribución de las calificaciones de un grupo de estudiantes, sino que interesa
poder resumir en una cifra a fin de poder establecer comparaciones entre alumnos
aprobados y con alumnos con algún tipo de problemas de aprendizaje, también podría ser
de interés conocer cuál es la duración promedio en horas de los trabajos realizados, o la
variabilidad de estos, cuál es la estadía promedio de los pacientes en determinada sala de
un hospital, etc. Qué estadísticas utilizar en una situación específica dependerá tanto de los
objetivos del estudio como del nivel de medición de las variables.
Ejemplo
Suponga que le pedimos a un grupo de estudiantes
de la asignatura de estadística que registren su peso
en kilogramos. Con los datos del peso de los
estudiantes obtenemos el histograma de los pesos
para todo el grupo de estudiantes y un histograma
para el peso de las mujeres y uno para el de los
hombres.
¿Qué nos revelan los histogramas?
Un histograma es una gráfica muy utilizada en
estadística. Se utiliza para datos cuantitativos y nos
muestra la acumulación o tendencia de los datos, su
variabilidad y la forma de la distribución. Entonces a
partir de los histogramas elaborados, observamos que:
▪ La acumulación o tendencia del peso de los hombres
se encuentra entre los 65 y 74 kg, mientras que la
tendencia del peso de las mujeres es menor y se
encuentra entre los 50 a 59 Kg.
▪ La variabilidad de todo el grupo está en un rango comprendido
entre los 40 y los 90 kg. Sí se estudia únicamente el peso de los
hombres se observa que se reduce la variabilidad y los pesos se
encuentran ahora entre 55 y 90 kg. Para el grupo de las mujeres la
variabilidad se reduce aún más y sus pesos se encuentran entre 40 y
70 Kg.
▪ La variabilidad de todo el grupo es lógico que sea la mayor debido a
que el grupo es muy heterogéneo ya que incluye los pesos de los
hombres y de las mujeres. El que el grupo de las mujeres tenga
menor variabilidad que el de los hombres nos indica que el grupo
de las mujeres en cuanto a peso es más homogéneo que el grupo
de los hombres.
¿Se puede medir de una forma más precisa la
acumulación o tendencia y la variabilidad?
▪ La respuesta es afirmativa. Las medidas de tendencia
o acumulación se conocen como medidas de
Tendencia Central o de localización y las de
variabilidad como medidas de dispersión o de
variabilidad.
ESTADÍSTICAS TENDENCIA CENTRAL O DE POSICIÓN
Las “estadísticas de posición” tienen por objeto obtener un solo valor que
resuma en si todas las mediciones. Tratan en general de ubicar el centro de
la distribución de frecuencias por lo que también reciben el nombre de
estadísticas de “tendencia central”.
Entre las estadísticas de posición podemos mencionar la media aritmética,
la media ponderada, la mediana, la moda. Otras estadísticas de posición,
que son de interés, pero no incluiremos aquí son : la media geométrica, la
media armónica y los promedios móviles. Los cuantiles son estadísticas de
posición no central.
Media Aritmética o Promedio Aritmético ( Media o Promedio )
Es la estadística de posición más importante que sólo se puede
calcular para variables con nivel de medición en escala de intervalos
o razón.
“La media aritmética” o simplemente media o promedio se considera
como un valor representativo del conjunto de datos que se está
estudiando y caracteriza a toda una distribución. En su cálculo
intervienen todos los valores que se están estudiando.
Para su cálculo se distinguen dos casos: cuando los datos que están
tabulados y no tabulados.
a) PARA DATOS NO TABULADOS
Si tenemos “n” datos representados por: x1, x2, … xn . La media de
estos “n” datos está dado por:
n
_ ∑ Xi
X = X1 + X2 + … + Xn = i=1
n n
Ejemplo: Hallar el peso promedio de una muestra de seis recién
nacidos en el Hospital “Belén” - Lambayeque durante el mes de
junio 2021; cuyos pesos en gramos son : 3500, 4000, 3750, 3800,
3640, 3560.
Solución:
X : Peso recién nacidos (característica en estudio)
Valores de la variable: X1=3500, X2=4000, X3 = 3750, X4=3800, X5=3640,
X6 =3570
luego;
_
X = X1 + X2 + X3 + X4 + X5 + X6
6
= 3500 + 4000 + 3750 + 3800 + 3640 + 3570 = 22260 = 3710 grs.
6 6
Interpretación:
b) PARA DATOS TABULADOS:
Cuando los datos están representados en una tabla de
frecuencias (con o sin intervalo). La fórmula es:
m
_ ∑ Yi fi
Y = Y1f1 + Y2f2 + … + Ymfm = i=1
n n
donde; Yi : marca de clase
fi : frecuencia absoluta simple
m : número de clases
n : número total de datos
Ejemplo 1: Calcular e interpretar la Edad promedio de los estudiantes de la
Escuela Profesional de Estadística ciclo académico 2018-II (tabla 01).
Solución
ni
[Y i-1’ ; Yi’ ] Yi (fi ) Yifi
_
18 ; 20 19 17 323
Y = Y1f1 + Y2f2 + Y3f3 + Y4f4 + Y5f5 + Y6f6
21 ; 23 22 20 440 50
24 ; 26 25 10 250
= 1103/50
27 , 29 28 2 56
31 ; 32 31 0 0 = 22.06 ;
INTERPRETACIÓN:
33 ; 35 34 1 34
Total n=50 ∑ 1103
MEDIA ARITMÉTICA
Cuando los datos están representados en una tabla de
frecuencias sin intervalos. La fórmula es:
m
_ ∑ Yi fi
Y = Y1f1 + Y2f2 + … + Ymfm = i=1
n n
donde; Yi : valores de la variable
fi : frecuencia absoluta simple
m : número de clases
n : número total de datos
Ejemplo 2: Calcular e interpretar el número promedio
de hijos por familia de la información proporcionada
en la tabla 04 de distribución de frecuencias.
Solución:
Tabla: 04
Yi ni
Num. Hijos
(fi ) Yifi
_
Y = Y1f1 + Y2f2 + Y3f3 + Y4f4 + Y5f5 + Y6f6
0 4 0
25
1 1 1
2 6 12
= 72/25
3 2 6 = 2.9
4 7 28
Interpretación:
5 5 25
Total n=25 ∑Yifi =72
Fuente: Tabla 06
Propiedades de la Media Aritmética
1. Si todos los datos observados son iguales a una constante
“c”. Entonces el valor de la media es igual a dicha constante.
n
_ ∑c
X = i=1 = c
n
2. Si a cada uno de los valores de la variable se le suma una
constante “c”, la media queda aumentado en dicha constante.
n
∑ ( Xi + c ) _
i=1 = X+c
n
Propiedades de la Media Aritmética
3. Si a los valores de una variable se le multiplica por
una constante “c”, la media queda multiplicada por
esa constante.
n
∑ cXi _
i=1 = cX
n
4. La suma algebraica de las desviaciones de los datos
respecto a la media es igual a cero.
n _
∑ ( Xi - X ) = 0
i=1
Media Ponderada
Consideremos a X1, X2, … , Xk los valores de la variable X asociados a
los pesos P1, P2, … , Pk , respectivamente. Entonces:
k
∑ XiPi
_ i=1
X = --------------
∑ Pi
i=1
Ejemplo: Calcular e interpretar la nota promedio con la información
proporcionada en la tabla:
La siguiente Tabla muestra las calificaciones de un estudiante
Evaluaciones Calificaciones (Xi) Ponderación (Pi)
Interv. Oral 08 2
Tarea 12 2
Examen 16 4
Total 36 8
_
X = X1P1 + X2 P2 + X3 P3
8
= 8*2 +12*2 + 16*4
8
= 104/8
= 13
Interpretación:
Media Global
Consideremos una muestra de tamaño “n” que se ha particionado en k sub-
muestras de tamaño n1, n2, … , nk y sean x1, x2, … , xk las medias
correspondientes a las k sub-muestras. Entonces el promedio global es:
k _
_ ∑ Xini
XG = i=1
K
∑ ni
Ejemplo:
De una muestra de 48 estudiantes que ha dividido en tres subgrupos de
estudio de tamaño 12, 20 y 16; habiéndose obtenido los promedios
correspondientes de cada grupo de 14, 11 y 17. Calcular el promedio de los
48 estudiantes en estudio.
La siguiente Tabla muestra el promedio de los 48 alumnos en
estudio
Grupos Número Promedio de
Grupo
Grupo 1 (X1) 12 14
Grupo 2 (X2) 20 11
Grupo 3 (X3) 16 17
Total 48
Solución
_
Y = G1n1 + G2 n2 + G3n3
48
= 14*12 +11*20 + 17*16
8
= 660/48
= 13.75
Interpretación: ………
La Mediana (Me)
Si se tiene una distribución de frecuencias muy asimétrica la media
aritmética no es la mejor medida o estadística de posición ya que es muy
sensible a los valores extremos.
Ejemplo típico es la distribución de salarios en una gran empresa
¿verdadero o falso?
Como estadística alternativa se propone un valor que “divida” la
muestra, previamente ordenada de menor a mayor, en dos mitades
iguales.
Si tenemos una muestra de n valores no tabulados con n impar,
entonces la mediana corresponde a la observación “central”. En cambio,
si n es par, habrá dos observaciones “centrales” y tomaremos como
mediana el promedio simple de ellas.
Ejemplo: a) Calcular el valor de la mediana de los pesos (kgs) de 11
pacientes en el Hospital “Belén” – Lambayeque 2014.
64, 55, 78, 82, 76, 49, 57,62, 45, 67, 57.
Solución:
Ordenamos los datos: n = 11 ; es impar
45, 49, 55, 57, 57, 62, 64, 67, 76, 78, 82.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11
Posición de la mediana : X(n+1)/2 = X (11+1)/2 = X6
Luego, el valor de la mediana es: Me = X6 = 62.
Interpretación: El 50% de los pesos de los pacientes en estudio están por
debajo de 62 kilos y el 50% restante son mayores o iguales a 62 kilos.
Ejemplo: b) Calcular el valor de la medina de los pesos (kgs) de 12 pacientes en el Hospital “Belén”
– Lambayeque 2005.
64, 55, 78, 82, 76, 49, 57,62, 88, 45, 67, 57.
Solución:
Ordenamos los datos: n = 12 ; es par
45, 49, 55, 57, 57, 62, 64, 67, 76, 78, 82, 88.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
Posición de la mediana :
Xn/2 = X 12/2 = X6 = 62 ; X(n/2 )+ 1 = X(12/2) + 1 = X7 = 64
Luego, el valor de la mediana es: Me = ( 62 + 64 )/2 = 63 kilos.
Interpretación: …………….
La Mediana (Me)
Si tenemos una muestra de “ n ” valores representados en tabla de
distribución de frecuencias, se puede estimar un valor mediano
utilizando la siguiente fórmula:
n/2 - Ni-1
Me = LI + c ( Ni - Ni-1 )
donde;
Ni : Frecuencia absoluta acumulada mayor o igual a n/2.
Ni-1 : Frecuencia absoluta acumulada anterior a Ni.
LI : límite inferior correspondiente a n/2.
c : amplitud del intervalo mediano.
Ejemplo: Calcular e interpretar el valor de la mediana con la información
proporcionada en la tabla 5.
Ejemplo 1: Calcular e interpretar la edad mediana de los
pacientes con cáncer pulmonar. de la tabla 05.
Solución: tabla 05
[Y i-1’ ; Yi’) Yi ni Ni
(fi ) (Fi)
Cálculos:
26 ; 32 29 7 7
i) n/2 = 30/2 = 15
ii) Ni = 20 ; Ni-1 = 14 ; LI =38 ; C= 6
32 ; 38 35 7 Ni-1 = 14
38 ; 44 41 6 Ni = 20 Me= 38 + 6 ( 15 – 14 )/( 20 – 14 )
44 , 50 47 5 25
50 ; 56 53 3 28
= 39
56 ; 62 59 2 30 Interpretación:
Total n=30
La Moda (Mo)
Si X es una variable de nivel de medición nominal no podremos
usar como medida de medición la media aritmética ni la mediana
¿ por qué ?. Se propone como indicador de posición la
estadística llamada Modo o Moda (Mo) definida aquel valor Xi
que aparece más veces en la muestra (mayor frecuencia ni). Con
frecuencia encontramos distribuciones de frecuencias
multimodales (con más de un modo).
En el caso de una variable cuantitativa agrupada en intervalos
podríamos convenir en llamar modo al punto medio del intervalo
que presenta mayor frecuencia. En el ejemplo precedente (tabla
N° 05 ). Por lo tanto la Mo = (32 + 38) /2 =35 ; Mo = (38 + 42)
/2 = 41. El valor de la Moda es 35 y 42 ; es una distribución
bimodal.