INSTITUTO TECNOLÓGICO DE MÉRIDA
DEPARTAMENTO DE CIENCIAS ECONOMICO
ADMINISTRATIVO.
PROBABILIDAD Y ESTADISTICA
DESCRIPTIVA.
Antología
TEMA 1
Distribución de frecuencias.
1.7 Revisión de conceptos y aplicación
Profr. Raúl Alvar Rodríguez Sánchez-
Mérida, Yucatán, México.
Estadística U1- Página 1
Revisión de conceptos y su aplicación.
MEDIDAS DE TENDENCIA CENTRAL.
Una de las características más sobresalientes de la distribución de datos es su
tendencia a acumularse hacia el centro de la misma. Esta característica se
denomina Tendencia central.
Las medidas de tendencia central más usuales son:
a) media aritmética (x), el valor medio.
b) mediana, el valor central.
c) moda, el valor más frecuente.
Media aritmética:
La media aritmética de una variable se define como la suma ponderada de los
valores de la variable por sus frecuencias relativas y lo denotaremos por y se
calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.
Media aritmética
La media es la más usada de las medidas descriptivas. Tiene la ventaja de ser
muy fácil de calcular, además de poseer propiedades teóricas excelentes desde el
punto de vista de la estadística inductiva. Su principal desventaja es que, por se el
punto de equilibrio de los datos, es muy sensible a la presencia de observaciones
extremas.
La media aritmética de n valores, es igual a la suma de todos ellos dividida entre n.
Tenemos:
Si se cuenta con una distribución de datos entonces se aplica la fórmula:
Estadística U1- Página 2
Consideremos el siguiente EJEMPLO, datos no agrupados.
Mediante los siguientes datos hallar la media aritmética.
10,8,6,5,10,7
SOLUCION:
n={10,8,6,5,10,7} n = 6
substituyendo en la fórmula.
Otro ejemplo:
Si tenemos la siguiente distribución, se pide hallar la media aritmética, de los
siguientes datos expresados en kg.
Xi Ni (f) Xi ni (X1 f)
54 2 108
59 3 177
63 4 252
64 1 64
N=10 Σ=601
Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o
continua.
Estadística U1- Página 3
Cálculo de la mediana en el caso discreto:
Tomando en consideración el tamaño de la muestra.
Si N es Impar, hay un término central, el término que será el valor
de la mediana.
Si N es Par, hay dos términos centrales, la mediana será la
media de esos dos valores
La mediana siendo por definición el punto central de una serie de datos, para datos
agrupados viene dada por:
Donde
Li es el límite inferior de la clase mediana.
N el número de elementos de la población o muestra.
∑f1 el valor de la frecuencia acumulada de la clase anterior a la clase de la
mediana.
fm la frecuencia de la clase mediana.
C valor del intervalo de la clase.
[Link]:
Hallar la mediana en los siguientes datos no agrupados.
n = {25,30,28,26,32}
SOLUCION:
Se ordenan en forma creciente o decreciente y se toma el valor central.
25,26,28,30,32
mediana = 28
Otra aplicación datos no agrupados y en numero impar.
1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13
Término Central el 7º , 12
Me=12
Estadística U1- Página 4
EJEMPLO:
Hallar la mediana en los siguientes datos:
7, 10,15,13,10,12
SOLUCION:
Al ordenar se tiene: 7, 10,10,12,13,15 pero como el número de datos es par se
toma la media aritmética de los dos internos.
Los datos que se ubican en la parte central son 10 y 12
Otra aplicación datos no agrupados y en numero par
1,4,6,7,8,9,12,16,20, 24,25,27 N=12
Términos Centrales el 6º y 7º(9 y 12)
Me= (9 + 12) / 2 = 10.5
EJEMPLO:
Hallar la mediana en la siguiente distribución de frecuencias, datos agrupados.
Espesores en pulg. f Fa
0.307 - 0.310 3 3
0.311 - 0.314 5 8
0.315 - 0.318 5 13
0.319 - 0.322 22 35
0.323 - 0.326 14 49
0.327 - 0.330 1 50
N=50
Solución:
El intervalo 0.319- 0.322 contiene la clase mediana
Calculo de IL = (0.318 + 0.319)/2 = 0.3185
Frecuencia acumulada de la clase anterior a la clase mediana = 13
Frecuencia de la clase mediana = 22
Amplitud de clase = C = intervalo de clase 0.319 – 0.320 – 0.321- 0.322 0-004
Estadística U1- Página 5
Substituyendo en la formula:
Mediana = 0.3185 + ((50/2)-13) (0.004)/22)
Mediana = 0.3254
Veamos un ejemplo.
MEDIANA.- la media de de un conjunto de n números ordenados de menor a
mayor, es el número central en el arreglo. Si n es un número non (impar), sólo hay
un valor central. Si n es un número par, hay dos valores centrales, y la mediana
debe tomarse como la media de estos dos valores.
Ejemplo: 3.1, 3.2, 3.3, 3.4, 3.5
Ejemplo: 151, 152, 153, 153, 154, 155 (153+153)/2 = 153
MODA.- la moda (MO) de un conjunto de datos es el valor (si existe) que ocurre
con mayor frecuencia es uní modal. Si se tienen dos o mas valores con la misma
frecuencia máxima decimos que la distribución es by modal, trimodal, etc.
Ejemplo: 6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1 y 10.8 la moda es 85
Calculo de las medidas de tendencia central en datos no agrupados:
Relación de calificaciones. Usando diagrama de Tallo
y
74 57 71 81 28 46 hojas
50 70 79 69 70 96 2 8
74 74 42 59 70 51 ....3
43 83 75 40 61 60 4 3,2,0,3,6,0
65 70 67 54 64 86 5 0,5,7,9,4,1
55 70 69 82 89 40 6 5,7,9,9,1,4, 7,0
78 88 74 43 67 79 7 [Link].[Link].[Link].0.9
96 8 3,8,1,2,9,6
9 6
Aplicando conceptos y procedimientos.
Elaborando la tabla de DATOS NO AGRUPADOS.
x f fa fr fra fx x f fa fr fra fx
28 1 1 0.033 0.033 28 65 1 15 0.03 0.5 65
40 1 2 0.033 0.067 40 67 2 17 0.067 0.567 134
42 1 3 0.033 0.100 42 70 1 18 0.033 0.600 70
43 1 4 0.033 0.133 43 71 1 19 0.033 0.633 71
Estadística U1- Página 6
46 1 5 0.033 0.167 46 74 1 20 0.033 0.667 74
50 1 6 0.033 0.200 50 75 1 21 0.033 0.700 75
51 1 7 0.033 0.233 51 78 1 22 0.033 0.733 78
54 1 8 0.033 0.267 54 79 1 23 0.033 0.767 79
55 1 9 0.033 0.300 55 81 1 24 0.033 0.800 81
57 1 10 0.033 0.333 57 82 1 25 0.033 0.833 82
59 1 11 0.033 0.367 59 83 1 26 0.033 0.867 83
60 1 12 0.033 0.400 60 88 1 27 0.033 0.900 88
61 1 13 0.033 0.433 61 89 1 28 0.033 0.933 89
65 1 14 0-033 0-500 65 30 1971
Media aritmética =65.7
Moda =67 l
mediana =66 (65+67)/2 = 66
• DATOS AGRUPADOS
MEDIA ARITMETICA.- Se calcula suponiendo que todas las observaciones en una
clase son iguales a su valor medio (vi), por lo que la contribución de la clase i-
esima a la suma es fivi. Por lo tanto, la media se calcula por la ecuación.
Relación de calificaciones. Usando diagrama de Tallo
74 57 71 81 28 46 y hojas
50 70 79 69 70 96 2 8
74 74 42 59 70 51 ....3
43 83 75 40 61 60 4 3,2,0,3,6,0
65 70 67 54 64 86 5 0,5,7,9,4,1
55 70 69 82 89 40 6 5,7,9,9,1,4, 7,0
78 88 74 43 67 79 7 [Link].[Link].[Link].0.9
8 3,8,1,2,9,6
9 6
28 50 61 70 74 81
40 51 64 70 74 82
40 54 65 70 74 83
42 55 67 70 75 86
43 57 67 70 78 88
43 59 69 71 79 89
46 60 69 74 79 96
Valor máximo 96
Estadística U1- Página 7
valor mínimo 28
Rango 68
Clase 2c ≥ n 6
Intervalo de Clase 68/6 = 11.333 ≈ 11
EJEMPLO, datos agrupados.
Si los datos están agrupados en intervalos, la expresión de la media aritmética, es
la misma, pero utilizando la marca de clase (Xi).
Ejemplo:
(Li-1 , Li) xi ni ni xi
(30,40) 35 3 105
(40,50( 45 2 90
(50,60) 55 5 275
10 470
Otro ejemplo.
Mediante la siguiente distribución de frecuencias que nos muestra los espesores en
pulgadas, de recipientes de acero, hallar la media aritmética.
Espesores en pulg. f
0.307 - 0.310 3
0.311 - 0.314 5
0.315 - 0.318 5
0.319 - 0.322 22
0.323 - 0.326 14
0.327 - 0.330 1
N= 50
SOLUCION a la tabla anterior agregar dos columnas: M, marca de clase o promedio
del intervalo de cada clase y la que contenga el producto de marca de clase por la
frecuencia Mf.
Espesores en pulg. f M (marca de clase) fM
0.307 - 0.310 3 0.3085 0.9255
0.311 - 0.314 5 0.3125 1.5625
0.315 - 0.318 5 0.3165 1.5825
Estadística U1- Página 8
0.319 - 0.322 22 0.3205 7.0510
0.323 - 0.326 14 0.3245 4.5430
0.327 - 0.330 1 0.3285 0.3285
N=
50
Substituyendo en la formula:
=[∑(3 x 0.3085)+(5 x 0.3125)+(5 x 0.3165)+(22 x 0.3205) /50]
Considerando la expresión o formula.
Me = 64 + [((42/2)-15)/17]11=
= 64 + [(21-15)/17 ] (11) =
= 64 + (6/17)(11)
= 67.88
Me = Li med +[((N/2)-Ni-1) / ni ] ci
Li med es el límite inferior de la clase mediana.
N elementos de la población o en su caso de la muestra
Ni-1 frecuencias acumuladas de la clase anterior a la clase de la mediana
Ni numero de frecuencias de la clase mediana.
clases M f=n1 fM=niM Fa=Ni fr
28 3933.5 1 33.5 1 0.0238
40 5145.5 8 364 9 0.1905
52 6357.5 6 345 15 0.1429
64 7569.5 17 1181.5 32 0.4048
76 8781.5 7 570.5 39 0.1667
88 96 92 3 276 42 0.0714
42 2770.5
Media aritmética 65.96
Mediana 67.88
Estadística U1- Página 9
MODA.- para propósitos descriptivos es suficiente reportar la clave modal, que es
la clase cuya frecuencia absoluta es mayor.
Es una tabla de frecuencia, la moda se define como el valor medio de la clase y
cuya frecuencia tiene el valor numérico mayor, la cual recibe el nombre de la clase
modal.
clases M f=n1 fM=niM Fa=Ni fr
28 3933.5 1 33.5 1 0.0238
40 5145.5 8 364 9 0.1905
52 6357.5 6 345 15 0.1429
64 7569.5 17 1181.5 32 0.4048
76 8781.5 7 570.5 39 0.1667
88 96 92 3 276 42 0.0714
42 2770.5
Media aritmética 65.96
Moda 69.76
f(M-
clases M f fM fa fr (M-media) (M-media)² media)²
28 3933.5 1 33.5 1 0.0238 -32.4643 1053.92985 1053.9298
40 5145.5 8 364 9 0.1905 -20.4643 418.7870 3350.2959
52 6357.5 6 345 15 0.1429 -8.4643 71.6441 429.8648
64 7569.5 17 1181.5 32 0.4048 3.5357 12.5013 212.5217
76 8781.5 7 570.5 39 0.1667 15.5357 241.3584 1689.5089
88 96 92 3 276 42 0.0714 26.0357 677.8584 2033.5753
42 2770.5 8769.6964
Media aritmética 65.96
Varianza 213.90
Desviación estándar 14.63
MEDIANA
Mediana de datos agrupados= Li + ((n/2) – fa anterior)/fmed)(i))
Li= limite inferior de la clase de la mediana.
N = total de observaciones o datos .
Estadística U1- Página 10
Fa anterior= frecuencias acumuladas hasta la clase que procede a la de la
mediana.
f= frecuencias de la clase mediana.
I = intervalo de la clase-
Cla se Marca f fa fr fMarca
20.5 25.5 23 3 3 0.03614 69
25.5 30.5 28 42 45 0.50602 1176
30.5 35.5 33 21 66 0.25301 693
35.5 40.5 38 7 73 0.08434 266
40.5 45.5 43 3 76 0.03614 129
45.5 50.5 48 2 78 0.02410 96
50.5 55.5 53 2 80 0.02410 106
55.5 60.5 58 2 82 0.02410 116
60.5 65.5 63 1 83 0.01205 63
83 1.00000 2714
Para este ejemplo:
Li= limite inferior de la clase de la mediana.= 25.5
N = total de observaciones o datos .= 83
Fa anterior= frecuencias acumuladas hasta la clase que procede a la de la
mediana.= 3
f= frecuencias de la clase mediana.= 42
I = intervalo de la clase = 10
Mediana de datos agrupados= 25.5 + ((83/2) – 3)/42)(10))=
= 34.67
MEDIDAS DE DISPERSION
DATOS NO AGRUPADOS
AMPLITUD.- la amplitud (A) de un conjunto de datos es la diferencia entre las
observaciones de mayor y menor valor numérico en el mismo.
Ejemplo: A = 20- (-4)= 24
DESVIACION MEDIA.- la desviación media de un grupo de observaciones se
define como la suma de los valores absolutos de sus desviaciones con respecto a
su medida aritmética, dividida por el número de ella es decir.
Estadística U1- Página 11
∑ |X–X|
DM =
n
Ejemplo: |3| = 3, |-1|= 1
Por lo tanto DM= 1/8 (3+1+2+1+4+4+2+3)= 2.5
VARIANZA Y DESVIACION ESTANDAR.-
VARIANZA.- la varianza (σ2,S2 de la población o de la muestra) de de un conjunto
de datos se define como la suma de los cuadrados de las desviaciones de las
observaciones con respecto a su medida, divida por el número de observaciones
∑( X - µ )
σ2 = Poblacional
N
∑( X - µ )
S2 = Muestral
N - 1N
DESVIACION ESTANDAR.- Se define como la raíz cuadrada de la varianza es
decir.
∑( X - µ )
Poblacional
N
∑( X - µ )
S= Muestral
N - 1N
1 63 1.60 2.56
2 52 -9.40 88.36
3 78 16.60 275.56
4 49 -12.40 153.76
5 71 9.60 92.16
6 62 0.60 0.36
7 68 6.60 43.56
8 48 -13.40 179.56
9 56 -5.40 29.16
10 67 5.60 31.36
614.00 896.40
61.40 99.60
Observation Xi Xi-X (Xi-X)2
1 63 1.6 2.56
2 52 -9.4 88.36
Estadística U1- Página 12
3 78 16.6 275.56
4 49 - 153.76
12.4
5 71 9.6 92.16
6 62 0-6 0.36
7 68 6-6 43.56
8 48 -13- 179.56
4
9 56 -5.4 29.16
10 67 5.6 31.36
Σ 614 0 906.4
Media = 614/10 = 6.14
S2 = 896.4/9 = 99.6
S = raíz 99.6 = 9.98
DATOS AGRUPADOS
Medidas de dispersión
Las medidas de dispersión tratan de medir el grado de dispersión que tiene una
variable estadística en torno a una medida de posición o tendencia central,
indicándonos lo representativa que es la medida de posición. A mayor dispersión
menor representatividad de la medida de posición y viceversa.
Medidas de dispersión absoluta
a) Recorrido ( Re ) o Rango.
Se define como la diferencia entre el máximo y el mínimo valor de la variable:
R = máx xi – min xi
Ej: Sea X, las indemnizaciones recibidas por cuatro trabajadores de dos empresas
AyB
A 100 120 350 370
B 225 230 240 245
Estadística U1- Página 13
Re ( A) = 370 – 100= 270
Re ( B) = 245 – 225= 20 ---◻ Distribución menos dispersa
- Otros recorridos:
• Intervalo intercuartìlico I = Q3 − Q1
• intervalo interdecílico I= D9 − D1)
• intervalo intercentílico I= (P99 - P1)
b) Desviación absoluta media con respecto a la media ( de )Nos indica las
desviaciones con respecto a la media con respecto a la media aritmética en valor
absoluto.
c) Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable
respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión
existirá y por tanto menor representatividad tendrá la media aritmética.
La varianza se expresa en las mismas unidades que la variable analizada, pero
elevadas al cuadrado.
Propiedades:
Manual de Estadística Pág. 19
1ª) La varianza siempre es mayor o igual que cero y menor que infinito (S² = 0 )
Estadística U1- Página 14
2ª) Si a una variable X la sometemos a un cambio de origen “ a ” y un cambio de
escala
“ b ”, la varianza de la nueva variable Y= a + bX, será:
d) Desviación típica o estándar
Se define como la raíz cuadrada con signo positivo de la varianza.
1.6 Coeficiente de variación.
Medidas de dispersión relativa
Nos permiten comparar la dispersión de distintas distribuciones.
a) Coeficiente de variación de Pearson ( CV )
Indica la relación existente entre la desviación típica de una muestra y su media.
Suele darse el coeficiente en porcentaje. (Multiplicado por 100.)
Al dividir la desviación típica por la media se convierte en un valor excepto de
unidad de medida. Si comparamos la dispersión en varios conjuntos de
observaciones tendrá menor dispersión aquella que tenga menor coeficiente de
variación.
El principal inconveniente, es que al ser un coeficiente inversamente proporcional
a la media aritmética, cuando está tome valores cercanos a cero, el coeficiente
tenderá a infinito.
Ejemplo: Calcula la varianza, desviación típica y la dispersión relativa de esta
Distribución.
Estadística U1- Página 15
Sea x el número de habitaciones que tienen los 8 pisos que forman un bloque de
vecinos
X ni
2 2
3 2
5 1
6 3
N=8
d) Mediana ( Me )
Dada una distribución de frecuencias con los valores ordenados de menor a
mayor, llamamos mediana y la representamos por Me, al valor de la variable, que
deja a su izquierda el mismo número de frecuencias que a su derecha.
• Calculo de la mediana:
Variara según el tipo de dato:
a) Variables discretas no agrupadas:
Estadística U1- Página 16
1º) Se calcula n/2 y se construye la columna de las Ni ( frecuencias acumuladas )
2º) Se observa cual es la primera Ni que supera o iguala a n/2 , distinguiéndose
dos casos:
- Si existe un valor de Xi tal que , entonces se toma como i Me= x
- Si existe un valor i tal que 2
Ejemplo: Sea la distribución
ni ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 7 33
13 2 35
n=35
LUGAR QUE OCUPA n/2 = 35/2 = 17.5
COMO SE PRODUCE QUE Ni-1 < N/2 < N1 16 < 17.5 < 26 Me = xi n , por lo
tanto Me = 7
El otro caso lo podemos ver en la siguiente distribución:
xi ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 6 32
N 0 32
Estadística U1- Página 17
Lugar que ocupa = 32/2 = 16 ==>
Notar que en este caso se podría haber producido que hubiera una frecuencia
absoluta acumulada superior a 16. En este caso se calcularía como en el ejemplo
anterior.
b) Variables agrupadas por intervalos
En este caso hay denomina “ intervalo mediano ”.
Cada intervalo Ii vendrá expresado según la notación Ii = ( Li-1 , Li ]; observando la
columna de las frecuencias acumuladas, buscaremos el primer intervalo cuya Ni
sea mayor o igual que N/2 , que será el intervalo modal; una vez identificado dicho
intervalo, procederemos al cálculo del valor mediano, debiendo diferenciar dos
casos:
1º) Si existe Ii tal que , entonces el intervalo mediano es el ( Li-1 ,
Li ] y la mediana es:
2º. Análogamente si existeI 1 tal que , la mediana es Me = L1
(Li-1 , Li) ni Ni
(20,25) 100 100
(25,30 ) 150 250
(30,35) 200 450
(35,40) 180 630
(40,45) 41 671
N=671
671/2 = 335.5 ; Me estará en el intervalo (30 - 35 ]. Por tanto realizamos el cálculo:
Estadística U1- Página 18
Ventajas e inconvenientes :
- Es la medida más representativa en el caso de variables que solo admitan la
escala ordinal.
- Es fácil de calcular.
- En la mediana solo influyen los valores centrales y es insensible a los valores
extremos u “outliers ”.
- En su determinación no intervienen todos los valores de la variable.
MODA:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que
más se repite, es la única medida de centralización que tiene sentido estudiar en
una variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia siendo esta máxima. En
cuyo caso tendremos una distribución bimodal o polimodal según el caso.
En el caso de estar la variable agrupada en intervalos de distinta amplitud, se
define el intervalo modal, y se denota por ( Li-1 , Li ], como aquel que posee mayor
densidad de frecuencia ( hi ); la densidad de frecuencia se define como :
Una vez identificado el intervalo modal procederemos al cálculo de la moda, a
través de la fórmula:
Estadística U1- Página 19
En el caso de tener todos los intervalos la misma amplitud, el intervalo modal será
el que posea una mayor frecuencia absoluta ( ni ) y una vez identificado este,
empleando la fórmula:
Ventajas e inconvenientes:
- Su cálculo es sencillo.
- Es de fácil interpretación.
Manual de Estadística Pág. 14
- Es la única medida de posición central que puede obtenerse en las variables de
tipo cualitativo.
- En su determinación no intervienen todos lo valores de la distribución
Apoyándonos en el gráfico podemos llegar a la determinación de la expresión para
la Moda que es:
Otros autores dan una expresión aproximada para la moda que viene dada por la
siguiente expresión:
Donde
Mo = moda
Li-1 = limite inferior de la clase modal.
Ni+1 = frecuencia de la clase modal - frecuencia de la clase anterior.
Ni-1 = frecuencia de la clase modal – frecuencia de la clase posterior.
Ai = c = intervalo de clase.
Cálculo de la moda empleando los siguientes datos.
Mo =
Estadística U1- Página 20
Li-1 = 65 “es la clase de mayor frecuencias”
Ni+1 = 19 - 10.
Ni-1 = 19 - 11.
Ai = c = intervalo de clase.= 10
Li-1 Li ni Ni 19 - 10
45 55 6 6 Mo = 65 + 10 = 70.29
55 65 10 16 (19 -10) + (19 – 11)
65 75 19 35
75 85 11 46 Utilizando la fórmula aproximada
85 95 4 50
Medidas de posición no central (Cuantiles)
Los cuantiles son aquellos valores de la variable, que ordenados de menor a
mayor, dividen a la distribución en partes, de tal manera que cada una de ellas
contiene el mismo número de frecuencias. Los cuantiles más conocidos son:
a) Cuartiles ( Qi )
Son valores de la variable que dividen a la distribución en 4 partes, cada una de
las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1
es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo
cuartil que deja a su izquierda el 50% de los datos, y Q3 es el tercer cuartil que
deja a su izquierda
el 75% de los datos. (Q2 = Me)
b) Deciles ( Di)
Son los valores de la variable que dividen a la distribución en las partes iguales,
cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles.(Q2
= D5 = Me)
c) Centiles o Percentiles ( Pi )
Son los valores que dividen a la distribución en 100 partes iguales, cada una de
las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles. (Q2
= D5 = Me = P50)
Estadística U1- Página 21
Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
- Se calculan a través de la siguiente expresión: rN/q , siendo : r = el orden del
cuantil correspondiente q = el número de intervalos con iguales frecuencias u
observaciones (q=4,10, ó 100 ). N = número total de observaciones
- La anterior expresión nos indica que valor de la variable estudiada es el cuantil
que nos piden, que se corresponderá con el primer valor cuya frecuencia
acumulada sea mayor o igual a rN/q
Ejemplo: DISTRIBUCIONES NO AGRUPADAS: En la siguiente distribución
xi ni Ni
5 3 3
10 7 10
15 5 15
20 3 18
25 2 20
N=20
percentil (P90)
Mediana (Me)
Lugar que ocupa la mediana Me lugar 20/2 = 10
Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos es
Cálculo: Me = (10+15)/2 = 12.5
Primer cuartil (C1)
Lugar que ocupa en la distribución ( ¼). 20 = 20/4 = 5 Como Ni-1 < rN/q < Ni , es
decir 3 < 5 < 10 esto implicara que C1 = xi =10
Tercer cuartil (C3)
Lugar que ocupa en la distribución (3/4).20 = 60/4 = 15, que coincide con un valor
de la frecuencia absoluta acumulada, por tanto realizaremos el cálculo:
C3 = Q3 = (15+20)/2 = 17.5
Estadística U1- Página 22
Cuarto decil (D4)
Lugar que ocupa en la distribución (4/10) . 20 = 80/10 = 8. Como Ni-1 < rN /q< Ni
ya que 3 < 8 < 10 por tanto D4 =10.
Nonagésimo percentil (P90)
Lugar que ocupa en la distribución (90/100). 20 = 1800/100 = 18. que coincide con
un valor de la frecuencia absoluta acumulada, por tanto realizaremos el cálculo:
• Cálculo de los cuantiles en distribuciones agrupadas en intervalos
- Este cálculo se resuelve de manera idéntica al de la mediana.
- El intervalo donde se encuentra el cuantil i-esimo, es el primero que una vez
ordenados los datos de menor a mayor, tenga como frecuencia acumulada ( Ni )
un valor superior o igual a rN/q ; una vez identificado el intervalo Ii ( Li-1 , Li ],
calcularemos el cuantil correspondiente, a través de la fórmula:
r=1,2,...,q-1.
Cuartil: q=4; Decil:
q=10; Percentil: q=100
Ejemplo:
DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90
percentil de la siguiente distribución:
(Li-1 , Li) ni Ni
(0 , 100) 90 90
(100 , 200) 140 230
(200 , 300) 150 380
Estadística U1- Página 23
(300 , 800) 120 500
N=500
Primer cuartil (Q1)
- Lugar ocupa el intervalo del primer cuartil: (1/4). 500 = 500/4 = 125. Por tanto Q1
estará situado en el intervalo (100 – 200].Aplicando la expresión directamente,
tendremos: = − Q 1= 100 + ((125 90)/140) 100 =125
- Cuarto decil (D4)
- Lugar que ocupa: (4/10) . 500 = 200 . Por tanto D4 estará situado en el intervalo
(100 – 200]. Aplicando la expresión tendremos:
100 178,57 140 4 100 200 90 = − D = +
-
- Nonagésimo percentil (P 90)
- Lugar que ocupa: (90/100) . 500 = 450, por tanto P90 estará situado en el
intervalo (300 – 800]. Aplicando la expresión tendremos:
500 591,67
Con los datos asentados en el diagrama de frecuencias o tabla de frecuencias,
elaboramos varios tipos de gráficos.
LI LS X(M) frecuencia Frecuencia Frecuencia
acumulada relativa
f/n
18 26 22 3 3 3/40
27 35 31 5 8 5/4
36 44 40 9 17 9/40
Estadística U1- Página 24
45 53 49 12 29 12/40
54 62 58 5 34 5/40
63 71 67 4 38 4/40
72 80 76 2 40 2/40
total 40
A continuación el integrado por columnas: Histograma de frecuencias.
0,40
0,30
0,20
0,10
0,00
1 2 3 4 5 6 7
Grafica de barras de frecuencias relativas f/n
Ojiva de frecuencias acumuladas.
Gráficos de barras o de columnas verticales
Estadística U1- Página 25
Representan valores usando trazos verticales, aislados o no unos de otros,
según la variable a graficar sea discreta o continua.
Las graficas de columnas o barras no aisladas reciben el nombre de
Histogramas.
Los histogramas se utilizan para representa distribuciones de frecuencias.
Algunos software específicos para estadística grafican la curva de gauss
superpuesta con el histograma. EJEMPLOS DE GRAFICAS.
Votación mayo 2007,
PUP 93836 PUG 48201 PUH 19369
100000
80000
60000
40000
20000
0
PUP PUG PUH
Estadística U1- Página 26
HISTOGRAMA
14
12
12
9
FRECUENCIAS
10
8
6 5 5
4
4 3
2
2
0 0
0
21 22 31 40 49 58 67 76 85
MARCAS DE CLASE
Estadística U1- Página 27
0.35
0.30
0.25
0.20
Serie1
0.15
0.10
0.05
0.00
1 2 3 4 5 6 7
Graficas de líneas o poligonales.
En este tipo de gráfico se representan los valores de los datos en dos ejes
cartesianos ortogonales entre sí, ubicando los diferentes puntos (x,y) y
uniéndolos por medio de una línea poligonal.
Empleando la información de la tabla se elabora la grafica poligonal de
frecuencias.
14
12
10
0
1 2 3 4 5 6 7
Estadística U1- Página 28
FRECUENCIA DE CALIFICACIONES
18
16
F R E1 4C
UENCIA
12
10
8
6
4
2
0
MARCA DE CLASE
45
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7
Gráficos circulares, de sectores o de pastel.
Con este tipo de gráficos en un círculo se representa la distribución interna
de los datos o valores, pudiendo presentarse en porcentajes.
Ejemplos.
Estadística U1- Página 29
1.-Grafica circular o de pastel de frecuencias acumuladas.
Pictogramas
Los pictogramas son gráficos similares a los gráficos de barras, pero
empleando un dibujo en una determinada escala para expresar la unidad de
medida de los datos. Generalmente este dibujo debe cortarse para
representar los datos.
Estadística U1- Página 30
Ejemplo de Pictograma.
Estadística U1- Página 31
instrumentales Capacidad reflexiva sobre su propio trabajo Cultura general Idiomas:
conocimiento de idiomas extranjeros Toma de decisiones y solución
de problemas: localización del problema, identificar causas y
alternativas de solución, selección y evaluación de la más idónea
Expresión oral: saber expresarse con claridad en conversaciones o
debates adecuando el estilo del lenguaje al interlocutor y utilizando
vocabulario específico y relevante Expresión escrita: saber expresarse
con claridad en la redacción de escritos adecuando el estilo del
lenguaje al interlocutor y utilizando vocabulario específico y
relevante Informática: buen conocimiento de las herramientas más
comunes de informática Habilidad de documentación: consulta de
bases de datos relevantes en el campo profesional, consulta de
revistas específicas, navegación ‘experta’ por Internet
interpersonales Trabajo en equipo: Capacidad de compromiso con un equipo, hábito
de colaboración y trabajo solucionando conflictos que puedan surgir
Razonamiento cotidiano: capacidad de buscar argumentos de sentido
contrario a la propia opinión Pensamiento Crítico: capacidad de
analizar, sintetizar y extraer conclusiones de un artículo
Competencias Liderazgo: capacidad para liderar grupos de trabajo, reuniones,
Sistémicas supervisar personas Habilidad para el aprendizaje Gestión: capacidad
de gestionar tiempos y recursos: desarrollar planes, priorizar
actividades, identificar las críticas, establecer plazos y cumplirlos.
Creatividad: capacidad de innovación, iniciativa, fomento de ideas e
inventiva
Estadística U1- Página 32