Estadistica
Estadistica
Obj e t ivos
En esta quincena aprenderás a: [Link]ística descriptiva ………………… pág. 204
• Distinguir los conceptos de Población y muestra
población y muestra. Variables estadísticas
•
Gráficos variables cualitativas
Diferenciar los tres tipos de
variables estadísticas.
Gráficos variables cuantitativas discretas
•
Gráficos variables cuantitativas continuas
Hacer recuentos y gráficos.
• Calcular e interpretar las [Link] de centralización ………….… pág. 207
medidas estadísticas de Media, moda y mediana
centralización más impor- Evolución de la media
tantes. Evolución de la mediana
• Calcular las principales Media y mediana comparadas
medidas de dispersión.
• Entender la importancia de la [Link] de posición ………….………… pág. 210
elección de la muestra para Cuartiles y Percentiles
que sea representativa. Diagramas de caja y bigotes
Resumen
Autoevaluación
MATEMÁTICAS A 201
202 MATEMÁTICAS A
Est a díst ica
An t e s de e m pe za r
Recuerda
El curso pasado ya estudiaste estadística, y en numerosas ocasiones has hecho estadística
aunque no te hayas dado cuentas de ello. Veamos algunos ejemplos.
Fú t bol
N ot a m e dia
A lo largo de un curso escolar tendrás El jugador que más goles ha marcado, el
muchas ocasiones donde calcular este portero que menos ha encajado. La
valor. Si una nota depende de dos clasificación de la liga. La mejor mitad
exámenes y en uno tienes un 4, de liga. Los puestos de competiciones
intentarás sacar al menos un 6 en la otra. europeas, los de descenso, nº de veces
internacional, nº de fases finales,
Al final del instituto, las medias del
minutos jugados, tiros a puerta, faltas.
bachillerato y de la prueba selectividad.
Comparaciones con la media local o
nacional. Las medias de corte para
determinadas carreras
MATEMÁTICAS A 203
Est a díst ica
1. Estadística descriptiva
Población y muestra.
Variables estadísticas
• El nº de ordenadores en casa,
e st a díst ica s cua lit a t iva s.
tipos cu a lit a t iva s y cua n t it a t iva s .
o de televisores y el nº de
Las variables cualitativas son las que no aparecen en habitantes por vivienda, por
forma numérica sino como una categoría o atributo. ejemplo, son variables
estadísticas cua nt it a t iva s
• El
Las variables cuantitativas son las que pueden expresarse discr e t a s.
numéricamente, y a su vez pueden ser: peso, la altura, la
velocidad, la densidad, la
presión, son va r ia ble s
Cuantitativas discretas, si sólo pueden tomar un e st a díst ica s cua nt it a t iva s
número finito de valores. con t in u a s.
Cuantitativas continuas cuando pueden tomar
cualquier valor de un intervalo.
MATEMÁTICAS A 204
Est a díst ica
=
Tienen este diagrama de
sectores
frecuencia grados del sec tor
nº total de datos 360
A los datos,
1 2 4 4 3
3 3 3 0 0
0 4 0 1 0
0 3 4 1 3
0 4
les corresponde el
gráfico de la derecha.
[150, 160] 4
[160, 170] 10
[170, 180] 3
[180, 190] 6
[190, 200] 7
MATEMÁTICAS A 205
Est a díst ica
EJERCI CI OS r e su e lt os
1. Clasifica las los siguientes ejemplos de variables estadísticas: Longitud de un
camión, Carga máxima, nº de ruedas, nº de ejes, tipo de camión, marcas de
neumáticos, tipo de tapicería, nº de puertas, altura máxima.
2. Calcula los grados que corresponden a cada valor en un gráfico de sectores hecho
a partir de los datos: R, R , V , V , V , V , V , A, A y A
= = =
2 Grados R 5 Grados V 3 Grados A
, y y obtenemos
10 360 10 360 10 360
Grados
Gráficos R = 72, Grados
en variables V = 180
continuas. y Grados
superior deAtodos
=108los
rectángulos par obtenerlo.
3 . Agrupa
También se suelelos dibujar
datos siguientes y haz
el histograma deunlasdiagrama de sbarras adecuado. Datos = { 0 1
fr e cu e n cia
a cum u0la2da3s,4 1
en2 cada
2 1 2 dato
2 3 4se3 2acumula
13} la frecuencia de
los datos anteriores.
Marca Frecuencia
0 2
1 4
2 6
3 4
4 2
206 MATEMÁTICAS A
Est a díst ica
2. Medidas de centralización
Media, mediana y moda.
Un conjunto N de observaciones, N números, puede
que por si solo no nos diga nada. En cambio, si
además nos dicen que están situados alrededor de
uno o varios valores centrales ya tenemos una
referencia que sintetiza la información.
MATEMÁTICAS A 207
Est a díst ica
Datos Datos Datos
Media. Evolución al añadir y/o cambiar un dato 5y5 5, 5 y 5 5, 5 y 8
1 Para los datos 5 y 5 la media es 5. Si añadimos un 5
se mantiene en 5. Si añadimos un 8 la media pasa a
ser 6. (Figura derecha).
2 Si tenemos 9 datos con media 5, necesitamos añadir
un 6 para que la media pase a ser 5,1. Si tenemos 19
datos con media 5, necesitamos un dato de valor 7
para que la media suba a 5,1. (Figura derecha).
Datos Datos
3 Para un conjunto de datos con media 5, si añadimos 13555 13555
otro con media 5, por ejemplo 6 y 4, el nuevo conjunto 5678 56678
conserva la media.
X = 43
Datos simétricos Datos atípicos
Mediana igual a la Media Mediana distinta de la Media 3
208 MATEMÁTICAS A
Est a díst ica
EJERCI CI OS r e su e lt os
5. Calcula la media en cada caso:
a) 4, 6, 8 Soluciones: a) (4+6+8)/3 = 6
b) 4, 6, 8, 6 b) (4+6+8+6)= 24/4 = 6
c) 100, 120, 180, 200 c) (100+120+180+200)/4 = 150
x = = 169
5070
Me = 165 Mo = 175
30
MATEMÁTICAS A 209
Est a díst ica
3. Medidas de posición
Cuartiles y percentiles
Dado un conjunto de datos numéricos
correspondientes a un estudio estadístico, si los También podemos hacer
ordenamos de forma creciente y consideramos el que un diagrama de
esté en el centro, nos estaremos fijando en la frecuencias acumuladas y
m e dia na . Es el primero que supera (o iguala) al 50% dividir en partes iguales
de valores, pero también podemos fijarnos en otras como muestra el gráfico.
posiciones:
• Si nos fijamos en el primer valor que supera al
25% o al 75%, estamos hablando del pr im e r
y t e r ce r cu a r t il, Q 1 y Q 3 .
• Para otros valores como el 10%, o el 80%
hablamos de pe r ce n t ile s, P 1 0 y P 8 0 .
Ej e m plo. Para la variable de valores 0, 1, 2, 3, 4, y
frecuencias 0 9, 1 5, 2 3, 3 6, 4 3, dibujamos
barras de longitud proporcional a las frecuencias y
dividimos el total en partes iguales: en dos partes
para la mediana, cuatro para los cuartiles y 10 para
los percentiles principales.
0 1 2 3 4
210 MATEMÁTICAS A
Est a díst ica
EJERCI CI OS r e su e lt os
10. Calcula la mediana, cuartiles primer y 3º, y el percentil 30 60 y 90 de los datos.
41332 31334 00044 30303 21004 301
Hacemos el recuento: 0 8, 1 4, 2 2, 3 9 y 4 5 y barras de longitud proporcional a la
frecuencia para cada valor. Además partimos la longitud total de la barra en 2, 4 y 10 trozos
para obtener la mediana, cuartiles y percentiles, tal y como muestra la imagen.
11. Analiza el siguiente diagrama de caja y bigotes y calcula, a partir de él, los valores
máximo y mínimo, la mediana y los cuartiles.
Mínimo = 1500
Q1 = 1750
Me = 1950
Q3 = 2100
Máximo = 2500
12. Analiza el siguiente diagrama de caja y bigotes. Muestra los minutos que tarda en
hacer efecto un medicamento en una población. Interpreta la información que
presenta y responde a las preguntas.
Mínimo = 30
Q1 = 55
Me = 85
Q3 = 100
Máximo = 130
MATEMÁTICAS A 211
Est a díst ica
4. Medidas de dispersión.
Varianza, Desviación típica y rango
“La estadística es una ciencia según la cual, si yo me como un pollo
La estatura de los tributarios
y tú no te comes ninguno, nos hemos comido como promedio
presenta poca dispersión
medio pollo cada uno”.
σ2 =
∑ fi·(Xi − X)2
que equivale a σ2 =
∑ fi·(Xi)2
− (X)2
n n
σ =0,5 Rango = [4, 6] amplitud = 2
D e svia ción t ípica . La raíz cuadrada positiva de la
varianza.
σ=
∑ fi·(Xi − X) 2
o σ=
∑ fi·Xi2
− X2
n n
∑ fi·Xi
igual a 20. Sin embargo, puedes comprobar que en cálculo de la desviación típica.
ninguna de las tres medidas de dispersión definidas
σ= − X2
2
arriba coinciden.
n
Media y desviación típica. Así, para
Marca Fr
Para muestras unimodales (una sola moda) y casi 4 3
simétricas, alrededor de la media podemos considerar 5 3
un intervalo que contenga la mayoría de los datos. 6 2
media X = 4, 85
Por ejemplo, para una muestra con media 100 y
desviación típica 10, la mayor parte de los datos Se tiene que la
estarán entre 90 y 110, aproximadamente el 68% ; y
3·42 + 3·52 + 2·62
σ= − 4, 852
entre 80 y 120 estará el 95% aproximadamente. Y
casi todos entre 70 y 130. Hay una forma de 8
distribución de datos llamada n or m a l que cumple con
lo anterior, y de una manera u otra, de todas las
poblaciones grandes se pueden extraer datos que se
ajustan a ella. En cursos superiores verás la
importancia de estas distribuciones.
Muestra unimodal y simétrica
212 MATEMÁTICAS A
Est a díst ica
EJERCI CI OS r e su e lt os
13. Calcula la media y la desviación típica en
a) 200, 250
b) 175, 275
c) 250, 250
250 + 200 (250 − 225)2 + (200 − 225)2 252 + 25 2
a) X = = 225 σ= = = 25
2 2 2
175 + 275 (175 − 225)2 + (275 − 225)2 50 2 + 50 2
b) X = = 225 σ= = = 50
2 2 2
250 + 250 (250 − 250)2 + (250 − 250)2 02 + 02
c) X = = 250 σ= = = 25
2 2 2
14. Calcula la media y la desviación típica en:
a) 7, 5 , 3, 2, 4, 5
b) 20, 25, 20, 22, 21
7 + 5 + 3 + 2 + 4 + 5 26
a) X = = = 4, 33
6 6
7 2 + 5 2 + 32 + 2 2 + 4 2 + 5 2
σ= − 4,33 2 = − 18,75 = 1,59
128
6 6
20 + 25 + 20 + 22 + 21 108
b) X = = = 21, 6
5 5
20 2 + 252 + 20 2 + 22 2 + 212
σ= − 21,6 2 = − 466,56 = 1,85
2350
5 5
(Nota.- Observa la fórmula utilizada para la desviación)
15. Organiza los datos siguientes en intervalos de 10 cm desde 150 a 200. Amplia la
tabla con dos columnas, una para el producto de las marcas con las frecuencias y
otra para el producto de las frecuencias con los cuadrados de las diferencias con la
media. Calcula la media y la desviación típica.
MATEMÁTICAS A 213
Est a díst ica
5. Representatividad
Muestreo aleatorio
La característica más importante de una muestra es
su r e pr e se n t a t ivida d respecto al estudio estadístico
que se esté haciendo. Si la muestra no es
representativa diremos que está se sga da .
El proceso mediante el cual se elige una muestra se
llama m u e st r e o , y para que nos proporcione una
muestra representativa debe ser aleatorio. Un
muestreo es a le a t or io cuando los individuos de la
muestra se eligen al azar, de forma que todos tienen
la misma probabilidad de ser elegidos.
Ej em plo: Llam adas t elefónicas volunt arias. Est as encuest as
t ienen varias fuent es de sesgo. Hay fam ilias que no t ienen
t eléfono, el cost e de la llam ada no t odo el m undo est á
dispuest o a asum irlo. Pero sobre t odo, el fact or de
respuest a volunt aria, los encuest ados se aut o- seleccionan.
Suelen cont est ar aquellos con una fuert e opinión negat iva
sobre el t em a. El enoj o les anim a a part icipar.
Ej e m plo
En la imagen tienes 625 cuadros que representan a
los alumnos de un instituto ficticio, se quiere estudiar
el “número de hermanos” y para ello se ha elegido
una muestra aleatoria como puedes ver a la derecha.
214 MATEMÁTICAS A
Est a díst ica
Muestreo estratificado
En ocasiones cuando la población objeto de estudio, Debajo vemos la muestra aleatoria que
pertenece a distintos grupos o estratos conviene se ha elegido y el resultado de la
encuesta. Los últimos diagramas de
elegir la muestra de forma que todos ellos queden
sectores comparan la realidad con los
representados. resultados de la encuesta.
Este tipo de muestreo, escogiendo un reparto
proporcional a los estratos, se llama e st r a t ifica do .
Por ej em plo, si quer em os est udiar el poder adquisit ivo de
una población, y solo elegim os a individuos de una
det erm inada zona, o principalm ent e de una det erm inada
zona, la m uest ra con t oda seguridad no será represent at iva.
La m uest ra se ha de elegir t om ando m uest ras de individuos
proporcionales a la población de cada zona. Si hay t res
zonas con 12.000, 18.000 y 20.000 habit ant es, la m uest ra
deberá t ener un 24% de la prim era zona, 36% de la
segunda y 40% de la últ im a.
A continuación sobre la población del instituto ficticio
anterior se ha hecho una encuesta sobre el color preferido y
en este caso se ha decidido hacer estratificada. De cada
nivel se ha seleccionado aleatoriamente un número de
individuos proporcional al número de componentes.
EJERCI CI OS r e su e lt os
16. Una gran empresa tiene trabajadores en cuatro áreas. Operarios, Representantes,
administración y dirección. Las condiciones de trabajo son bastantes diferentes en
cada área, por lo que el grado de satisfacción no es igual en cada una de ellas.
Para averiguarlo, si hay 1000, 500, 300 y 200 trabajadores en las áreas de
operarios, representantes, administrativos y directivos, ¿cuántos hay que
seleccionar de cada área para una muestra de tamaño?
a) 200 b) 100 c) 300
MATEMÁTICAS A 215
Est a díst ica
Algunos de los ejercicios propuestos a continuación están elaborados a partir de esta
publicación de INE. Puedes ver artículos similares en
[Link]
MATEMÁTICAS A 216
Est a díst ica
Pa r a pr a ct ica r
7. Haz una tabla y un gráfico de barras 16. Calcula la mediana, primer y tercer
con los datos: cuartil y el percentil 20 de
33454532123454543344 31114153133455442144
MATEMÁTICAS A 217
Est a díst ica
19. Determina la media y la desviación b1. ¿En qué países pasean más las
típica, de los datos de la tabla anterior. mujeres que los hombres?
(
20. Determina los intervalos X − σ, X + σ )
b2. Calcula el tiempo medio que se dedica
( )
en cada país a pasear.
y X − 2σ, X + 2σ y el número de b3. ¿Qué país está en el percentil 50?
elementos que hay en cada uno.
Marca Fr
c)
0 5
1 4
2 7
3 3
4 2
a)
d)
a1. ¿Cuál es la variable estudiada? ¿ y la
frecuencia?
a2. ¿A qué grupo de actividades
dedicamos más tiempo los españoles?
a3. Calcula cuánto tiempo dedicamos al
hogar y la familia ¿cuántos grados ocupa
este sector en el diagrama?
b)
218 MATEMÁTICAS A
Est a díst ica
Pa r a sa be r m á s
MATEMÁTICAS A 219
Est a díst ica
Re cu e r da
lo m á s im por t a n t e
σ= = 1.39
54.67
Altura: 182 172 157 194 150 166 163
28
196 167 199 172 185 172 168 173 160
162 173 161 192 156 164 173 180 193
172 Cu a r t il, m e dia n a , pe r ce n t il
Re cue n t o de da t os :
xi f Intervalo xi fi
0 5 [150,160) 155 3
1 8 [160,170) 165 8
0 1 2 3 4
2 6 [170,180) 175 7
3 3 [180,190) 185 3 Me=2, Q1=1, Q3=3, P20=1, P60=2,
4 6 [190,200) 195 5 P90=4
Recorrido. De 0 a 4, de amplitud 4
28 Total 26
Gráficos de se ct or e s y ba r r a s M e dia y de svia ción En nuestro ejemplo,
Nº de hermanos 17 de 28 datos no se alejan de la media
mas de la desviación típica, son el 60,7%,
y el 100% no se alejan de la media mas
de dos veces la desviación.
Altura.
220 MATEMÁTICAS A
Est a díst ica
Au t oe va lu a ción
3 ¿Cuál es la moda ?
xi fi
15 40
25 45
35 37
45 51
5 ¿Cuál es el percentil 30 ?
xi fi
1 4
2 4
3 7
4 5
8 ¿Cuál es la media?
xi fi
180 40
200 25
220 27
240 50
MATEMÁTICAS A 221
Est a díst ica
Soluciones de los ejercicios para practicar
1. Cualitativas: d) h)
Cuantitativas discretas c) e) g) 16. Me=3, Q1=1, Q3=4 y P20=1
C. continuas: a) b) f)
17. La media es 100 en los 4 , y la
2. Propulsión, Carga, Tipo de travesía desviación 0, 1, 10 y 20.
Soluciones AUTOEVALUACIÓN
1. Sol 72º 6. Sol 2.65
MATEMÁTICAS A 222