0% encontró este documento útil (0 votos)
18 vistas22 páginas

Estadistica

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
18 vistas22 páginas

Estadistica

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

11 Est a díst ica

Obj e t ivos
En esta quincena aprenderás a: [Link]ística descriptiva ………………… pág. 204
• Distinguir los conceptos de Población y muestra
población y muestra. Variables estadísticas

Gráficos variables cualitativas
Diferenciar los tres tipos de
variables estadísticas.
Gráficos variables cuantitativas discretas


Gráficos variables cuantitativas continuas
Hacer recuentos y gráficos.
• Calcular e interpretar las [Link] de centralización ………….… pág. 207
medidas estadísticas de Media, moda y mediana
centralización más impor- Evolución de la media
tantes. Evolución de la mediana
• Calcular las principales Media y mediana comparadas
medidas de dispersión.
• Entender la importancia de la [Link] de posición ………….………… pág. 210
elección de la muestra para Cuartiles y Percentiles
que sea representativa. Diagramas de caja y bigotes

[Link] de dispersión …………….…… pág. 212


Desviación típica y recorrido
Cálculo de las medidas de dispersión
La media y la desviación típica

[Link] de las muestras..pág. 214


Muestreo estratificado
Muestreo aleatorio. Sesgo

Ejercicios para practicar

Para saber más

Resumen

Autoevaluación

MATEMÁTICAS A 201
202 MATEMÁTICAS A
Est a díst ica

An t e s de e m pe za r

Recuerda
El curso pasado ya estudiaste estadística, y en numerosas ocasiones has hecho estadística
aunque no te hayas dado cuentas de ello. Veamos algunos ejemplos.

Fú t bol
N ot a m e dia
A lo largo de un curso escolar tendrás El jugador que más goles ha marcado, el
muchas ocasiones donde calcular este portero que menos ha encajado. La
valor. Si una nota depende de dos clasificación de la liga. La mejor mitad
exámenes y en uno tienes un 4, de liga. Los puestos de competiciones
intentarás sacar al menos un 6 en la otra. europeas, los de descenso, nº de veces
internacional, nº de fases finales,
Al final del instituto, las medias del
minutos jugados, tiros a puerta, faltas.
bachillerato y de la prueba selectividad.
Comparaciones con la media local o
nacional. Las medias de corte para
determinadas carreras

MATEMÁTICAS A 203
Est a díst ica

1. Estadística descriptiva
Población y muestra.

Pobla ción es el conjunto de individuos, con alguna


característica común, sobre el que se hace un estudio Ba ch .
estadístico.
3º y 4º
En la práctica es frecuente tener que recurrir a una
muestra para inferir datos de la población. La m u e st r a es
un subconjunto de la población, seleccionada de modo que
ponga de manifiesto las características de la misma, de ahí
1º y 2º
que la propiedad más importante de las muestras es su
representatividad.

El proceso seguido en la extracción de la muestra se llama Si cada cuadrito representa a


m u e st r e o cada uno de los alumnos de un
instituto ficticio y se les
pregunta sobre su color favorito,
el total de los cuadros es la
población, 625 alumnos, y los
26 encuestados constituyen la
muestra.

Variables estadísticas

• El color de los ojos, el queso


La característica a estudiar en una población es la
va r ia ble e st a díst ica .
preferido, el continente donde
vives, son va r ia ble s
Las variables estadísticas pueden ser esencialmente de dos

• El nº de ordenadores en casa,
e st a díst ica s cua lit a t iva s.
tipos cu a lit a t iva s y cua n t it a t iva s .
o de televisores y el nº de
Las variables cualitativas son las que no aparecen en habitantes por vivienda, por
forma numérica sino como una categoría o atributo. ejemplo, son variables
estadísticas cua nt it a t iva s

• El
Las variables cuantitativas son las que pueden expresarse discr e t a s.
numéricamente, y a su vez pueden ser: peso, la altura, la
velocidad, la densidad, la
presión, son va r ia ble s
Cuantitativas discretas, si sólo pueden tomar un e st a díst ica s cua nt it a t iva s
número finito de valores. con t in u a s.
Cuantitativas continuas cuando pueden tomar
cualquier valor de un intervalo.

MATEMÁTICAS A 204
Est a díst ica

Gráficos en variables cualitativas.


Los datos: El dia gr a m a de se ct or e s es el mas indicado para este
tipo de información. El porcentaje de datos de cada valor
xi fi en una muestra se corresponde con el mismo porcentaje
0 7 de sector de un círculo. Así por ejemplo, si los datos son A,
0 3
0 1
A, A, A, A, B, B, B, C y C. Las frecuencias son (A,5), (B,3)
0 6 y (C,2), los porcentajes serán (A,50%), (B,30%) y
0 5 (C,20%) los que corresponde a un gráfico de sectores con
Total 2 2 (A, 180º), (B,108º) y (C, 72º).

=
Tienen este diagrama de
sectores
frecuencia grados del sec tor
nº total de datos 360

Gráficos en variables discretas.


D ia gr a m a de ba r r a s. Bastará que observes un ejemplo.

A los datos,

1 2 4 4 3
3 3 3 0 0
0 4 0 1 0
0 3 4 1 3
0 4

les corresponde el
gráfico de la derecha.

Gráficos en variables continuas.


H ist ogr a m a . Los datos se representan por rectángulos
cuya base es la amplitud del intervalo representado y con
la altura que nos indica la frecuencia absoluta, si todos los
intervalos son de la misma amplitud. Si no es el caso, las
alturas se calculan de manera que las áreas sean
proporcionales a las frecuencias absolutas. A la izquierda
tienes un ejemplo hecho.
Polígon o de fr e cu e n cia s. Uniremos los centros de la
parte superior de todos los rectángulos para obtenerlo.
También se suele dibujar el histograma de las fr e cu e n cia s
a cum u la da s, en cada dato se acumula la frecuencia de
los datos anteriores.

[150, 160] 4
[160, 170] 10
[170, 180] 3
[180, 190] 6
[190, 200] 7

MATEMÁTICAS A 205
Est a díst ica

EJERCI CI OS r e su e lt os
1. Clasifica las los siguientes ejemplos de variables estadísticas: Longitud de un
camión, Carga máxima, nº de ruedas, nº de ejes, tipo de camión, marcas de
neumáticos, tipo de tapicería, nº de puertas, altura máxima.

Cualitativas: Tipo de camión, marcas de neumáticos, tipo tapicería


C. discretas: Nº de ruedas, nº de ejes, nº de puertas
C. continuas: Longitud de un camión, Carga máxima y altura máxima.

2. Calcula los grados que corresponden a cada valor en un gráfico de sectores hecho
a partir de los datos: R, R , V , V , V , V , V , A, A y A

Hacemos el recuento R 2, V 5yA 3 Y calculamos

= = =
2 Grados R 5 Grados V 3 Grados A
, y y obtenemos
10 360 10 360 10 360
Grados
Gráficos R = 72, Grados
en variables V = 180
continuas. y Grados
superior deAtodos
=108los
rectángulos par obtenerlo.
3 . Agrupa
También se suelelos dibujar
datos siguientes y haz
el histograma deunlasdiagrama de sbarras adecuado. Datos = { 0 1
fr e cu e n cia
a cum u0la2da3s,4 1
en2 cada
2 1 2 dato
2 3 4se3 2acumula
13} la frecuencia de
los datos anteriores.
Marca Frecuencia
0 2
1 4
2 6
3 4
4 2

4. Clasifica los datos en intervalos y dibuja un histograma adecuado.

[150, 160] 155 7


[160, 170] 165 6
[170, 180] 175 4
[180, 190] 185 9
[190, 200] 195 4

206 MATEMÁTICAS A
Est a díst ica
2. Medidas de centralización
Media, mediana y moda.
Un conjunto N de observaciones, N números, puede
que por si solo no nos diga nada. En cambio, si
además nos dicen que están situados alrededor de
uno o varios valores centrales ya tenemos una
referencia que sintetiza la información.

M e dia . La suma de los N números dividida entre N.


Por ejemplo, para 3 , 4 y 5 , (3 +4 +5 )/3 = 12/3 = 4;
para 1 , 1 , 4 , 8 , 8 y 8 , (1 ·2+4 +8 ·3)/6=5.
x1f1 + x2 f2 + ... + xnfn
Media =
N

M oda . Si una observación se repite más que


cualquier otra, será considerada la moda de esos
datos. Por ejemplo, si tenemos las observaciones
6,7,8,6,7,6,8,6,9 y agrupamos los datos 6 4, 7 2,
8 2 y 9 1 vemos claramente que el valor 6 aparece
mas que ningún otro. En este caso la moda es 6.
En el caso de variable continua, consideraremos por
moda a la marca del intervalo de mayor frecuencia,
cuando esto ocurra. También puede ocurrir que haya
dos modas o que no haya ninguna que destaque.

M e dia na . El número tal que la mitad de las


observaciones son mayores que él y la otra mitad
menores.
En general, para pocos datos lo mejor es proceder
según el ejemplo de la izquierda, según sea una
cantidad para o impar.
Para cantidades mayores, habrá que agrupar los
Por ejemplo, si tenemos las
datos primero en una tabla. Y determinar segmentos
observaciones 6,7,8,6,7,6,8,6,9
de longitud proporcional a su frecuencia, disponerlos
y agrupamos los datos vemos
de forma lineal y marcar el centro como muestra el
claramente que el valor 6
siguiente ejemplo.
aparece mas que ningún otro.
En este caso la m oda es 6.
xi fr
6 4 0 1 2 3 4
7 2 En este otro gráfico vemos indicada la mediana en un
8 2 diagrama de Frecuencias relativas acumuladas:
9 1
Si ordenamos los datos, y dado
que el nº de datos es impar
justo el 7 queda en el centro.
666677881
Si los datos fueran
6,7,8,6,7,6,8,6,5 una vez
ordenados, y como hay una
cantidad par de datos, dos de
ellos ocuparían el centro:
5666677881
y la mediana será (6+7)/2 = 6.5

MATEMÁTICAS A 207
Est a díst ica
Datos Datos Datos
Media. Evolución al añadir y/o cambiar un dato 5y5 5, 5 y 5 5, 5 y 8
1 Para los datos 5 y 5 la media es 5. Si añadimos un 5
se mantiene en 5. Si añadimos un 8 la media pasa a
ser 6. (Figura derecha).
2 Si tenemos 9 datos con media 5, necesitamos añadir
un 6 para que la media pase a ser 5,1. Si tenemos 19
datos con media 5, necesitamos un dato de valor 7
para que la media suba a 5,1. (Figura derecha).
Datos Datos
3 Para un conjunto de datos con media 5, si añadimos 13555 13555
otro con media 5, por ejemplo 6 y 4, el nuevo conjunto 5678 56678
conserva la media.

Mediana. Evolución al añadir y/o cambiar un dato


1 La mediana, para los datos 2, 3 y 4 es Me=3. Si
cambiamos el 4 por 5 o por 6 o por cualquier otro valor
mayor sigue siendo Me = 3.
2 En cambio, si añadimos otro dato y tenemos 2, 3, 4
Datos Datos
y 4, por ejemplo, la Me = 3,5. Y si ahora añadimos un 357 3 5 10
quinto valor, un 4 o un 5 o un 6 o cualquier otro mayor
que 4, la mediana en 2,3, 4, 4 y ?? pasa a ser 4. Da
igual el valor ?? es 5, 10 o 25.

Media y mediana comparadas


Para los datos 4 y 6 la media y la mediana coinciden
en 5. Añadir un 8 o un 11 da lo mismo para la
mediana, que pasa a ser en ambos casos 6. Sin
embargo la media con un 8 pasa a ser 6 y con un 11
pasa a ser 7. Los valores 8 y 11 se consideran
Para ver la mediana se traza una
observaciones atípicas, están distanciados del resto de vertical desde el eje horizontal en
valores, tiran de la media y no afectan a la mediana. N/2
Si los datos estuvieran repartidos simétricamente
respecto a un valor, ese valor seria a la vez la media y
la mediana. En cambio, si los valores a un lado de la Por ejemplo, si tenemos las
mediana están más alejados de ella que los del otro observaciones
lado, la media se desplaza hacia esos valores alejados 1. 20, 24 y 28.
que tiran de ella. Hay una asimetría.
Me = 2 4
2. Y para 20, 24, 28 y 30
Me = ( 2 4 + 2 8 ) / 2 = 2 6
3. Para 20, 24, 28 y 100
Me = ( 2 4 + 2 8 ) / 2 = 2 6
En cambio la media no se
comporta de la misma forma
para los mismos datos
1 X = 24
2 X = 25,5

X = 43
Datos simétricos Datos atípicos
Mediana igual a la Media Mediana distinta de la Media 3

208 MATEMÁTICAS A
Est a díst ica

EJERCI CI OS r e su e lt os
5. Calcula la media en cada caso:
a) 4, 6, 8 Soluciones: a) (4+6+8)/3 = 6
b) 4, 6, 8, 6 b) (4+6+8+6)= 24/4 = 6
c) 100, 120, 180, 200 c) (100+120+180+200)/4 = 150

6. Calcula la media en cada caso:


10·2 + 20·4 + 30·3 + 40·2
a) X =
a Marca Fr b Marca Fr
10 2 100 2
=24,54
11
100·2 + 200·4 + 300·3 + 400·2
b) X =
20 4 200 4
30 3 300 3 = 245,45
11
40 2 400 2

7. Determina la moda y la mediana


a) 5,6,6 c) 1,2,3,4,2 Soluciones: a) Me=6, Mo=6 c) Me=2 Mo=2
b) 1,1,2,3 d) 3,2,3,2,2,2 b) Me=1,5 Mo=1 d) Me=2 Mo=2

8. Calcula la moda y la mediana en cada caso:


a Marca Fr b Marca Fr Soluciones:
10 2 100 2
20 4 200 3 a) Me=20 Mo=4
30 3 300 4 b) Me=250 Mo=300
40 2 400 1

9. Se han medido las alturas en cm de un grupo de 30 personas obteniéndose los


datos siguientes:
Altura en cm fi
(150,160] 7
(160,170] 9
(170,180] 10
(180,190] 3
(190,200] 1

Calcula la media, la moda y la mediana.


a) Completamos la tabla añadiendo una columna para xi y otras dos para xi·fi y
para las frecuencias acumuladas.
Altura en cm xi fi xi·fi Fi Me
(150,160] 155 7 1085 7 Mo
(160,170] 165 9 1485 16
(170,180] 175 10 1750 26
(180,190] 185 3 555 29
(190,200] 195 1 195 30
SUMA: 30 5070

x = = 169
5070
Me = 165 Mo = 175
30

MATEMÁTICAS A 209
Est a díst ica

3. Medidas de posición
Cuartiles y percentiles
Dado un conjunto de datos numéricos
correspondientes a un estudio estadístico, si los También podemos hacer
ordenamos de forma creciente y consideramos el que un diagrama de
esté en el centro, nos estaremos fijando en la frecuencias acumuladas y
m e dia na . Es el primero que supera (o iguala) al 50% dividir en partes iguales
de valores, pero también podemos fijarnos en otras como muestra el gráfico.
posiciones:
• Si nos fijamos en el primer valor que supera al
25% o al 75%, estamos hablando del pr im e r
y t e r ce r cu a r t il, Q 1 y Q 3 .
• Para otros valores como el 10%, o el 80%
hablamos de pe r ce n t ile s, P 1 0 y P 8 0 .
Ej e m plo. Para la variable de valores 0, 1, 2, 3, 4, y
frecuencias 0 9, 1 5, 2 3, 3 6, 4 3, dibujamos
barras de longitud proporcional a las frecuencias y
dividimos el total en partes iguales: en dos partes
para la mediana, cuatro para los cuartiles y 10 para
los percentiles principales.

0 1 2 3 4

Diagramas de caja y bigotes


A partir del valor de la mediana y los cuartiles se La t abla m uest ra el consum o diario
pueden representar las distribuciones estadísticas de agua, en m l, de los 20 alum nos
de una clase.
mediante los llamados “diagramas de caja y bigotes”.
Luis 1300 M ín
Veamos como se construye con los datos de la tabla Tere 1500
de la derecha. Una vez ordenados los datos, se Maya 1600
calculan los valores mínimo y máximo, los cuartiles y Marta 1650
Juan 1650
la mediana. Q1
Lupe 1700
m ín = 1 3 0 0 Q 1 = 1 6 7 5 M e = 1 9 0 0 Q 3 = 2 1 5 0 m á x = 2 5 0 0 David 1750
Pepe 1850
Alex 1900
Iris 1900 Me
Paco 1900
Marco 2000
Toño 2000
Omar 2100
Rosa 2100 Q3
Lisa 2200
Rita 2200
Julio 2300
Alma 2300
Beto 2500 Máx
Se sitúan estos valores sobre el eje de abscisas y se
dibuja la “caja” desde el primer al tercer cuartil (el NOTA: La longitud de los bigotes no
recorrido int ercuart ílico), y los “bigotes” como indica debe exceder una vez y media la de la
caja, si hay valores extremos que
la figura.
superan esa medida se dibujan como
puntos aislados.

210 MATEMÁTICAS A
Est a díst ica

EJERCI CI OS r e su e lt os
10. Calcula la mediana, cuartiles primer y 3º, y el percentil 30 60 y 90 de los datos.
41332 31334 00044 30303 21004 301
Hacemos el recuento: 0 8, 1 4, 2 2, 3 9 y 4 5 y barras de longitud proporcional a la
frecuencia para cada valor. Además partimos la longitud total de la barra en 2, 4 y 10 trozos
para obtener la mediana, cuartiles y percentiles, tal y como muestra la imagen.

Vemos que la mediana está entre el


azul y el amarillo, (3+2)/2 = 2.5, Q1
en el rojo, Q3 en amarillo.
0 1 2 3 4 Q1=0 Me=2,5 Q3=3
P30=1 P60=3 y P90=4

11. Analiza el siguiente diagrama de caja y bigotes y calcula, a partir de él, los valores
máximo y mínimo, la mediana y los cuartiles.

Mínimo = 1500
Q1 = 1750
Me = 1950
Q3 = 2100
Máximo = 2500

12. Analiza el siguiente diagrama de caja y bigotes. Muestra los minutos que tarda en
hacer efecto un medicamento en una población. Interpreta la información que
presenta y responde a las preguntas.

Mínimo = 30
Q1 = 55
Me = 85
Q3 = 100
Máximo = 130

a) ¿A qué porcentaje de la población había hecho efecto al cabo de 30 minutos?.


b) Al cabo de cuántos minutos había hecho efecto al 50 % de la población?.
c) Cuántos minutos tardó en hacer efecto al 100% de la población?
d) A qué porcentaje había hecho efecto a los 55 minutos?.
¿Cuánto tardó en hacer efecto a las tres cuartas partes de la población?

RESPUESTAS: a) Al 0%, 30 es el valor mínimo. b) a los 85 minutos (la mediana)


c) 130 minutos (valor máximo) d) 55 es el primer cuartil, al 25%
e) 100 minutos, ¾ partes son el 75%

MATEMÁTICAS A 211
Est a díst ica
4. Medidas de dispersión.
Varianza, Desviación típica y rango
“La estadística es una ciencia según la cual, si yo me como un pollo
La estatura de los tributarios
y tú no te comes ninguno, nos hemos comido como promedio
presenta poca dispersión
medio pollo cada uno”.

La estadística indicará que todos comen lo mismo El grosor de los troncos


tiene bastante dispersión
cuando las medidas de dispersión sean todas nulas.
Ra n go. El intervalo definido por el menor y el mayor
dato. También se llama rango a la diferencia entre el
mayor y el menor de los datos.

σ =1 Rango = [2, 8] amplitud = 6


Va r ia n za . La media aritmética de los cuadrados de
las diferencias de los datos con la media.

σ2 =
∑ fi·(Xi − X)2

que equivale a σ2 =
∑ fi·(Xi)2

− (X)2
n n
σ =0,5 Rango = [4, 6] amplitud = 2
D e svia ción t ípica . La raíz cuadrada positiva de la
varianza.

σ=
∑ fi·(Xi − X) 2

o σ=
∑ fi·Xi2

− X2
n n

M e dir la dispe r sión En ambos gráficos la media,


mediana y moda valen 5
Ese es el objetivo de estas medidas. Por ejemplo, los
datos A= {20, 20}, B={15, 20, 20, 25} tienen la En la práctica se suele usar la
misma media, moda y mediana. En todos los casos fórmula reducida para el

∑ fi·Xi
igual a 20. Sin embargo, puedes comprobar que en cálculo de la desviación típica.
ninguna de las tres medidas de dispersión definidas
σ= − X2
2
arriba coinciden.
n
Media y desviación típica. Así, para
Marca Fr
Para muestras unimodales (una sola moda) y casi 4 3
simétricas, alrededor de la media podemos considerar 5 3
un intervalo que contenga la mayoría de los datos. 6 2
media X = 4, 85
Por ejemplo, para una muestra con media 100 y
desviación típica 10, la mayor parte de los datos Se tiene que la
estarán entre 90 y 110, aproximadamente el 68% ; y
3·42 + 3·52 + 2·62
σ= − 4, 852
entre 80 y 120 estará el 95% aproximadamente. Y
casi todos entre 70 y 130. Hay una forma de 8
distribución de datos llamada n or m a l que cumple con
lo anterior, y de una manera u otra, de todas las
poblaciones grandes se pueden extraer datos que se
ajustan a ella. En cursos superiores verás la
importancia de estas distribuciones.
Muestra unimodal y simétrica

212 MATEMÁTICAS A
Est a díst ica
EJERCI CI OS r e su e lt os
13. Calcula la media y la desviación típica en
a) 200, 250
b) 175, 275
c) 250, 250
250 + 200 (250 − 225)2 + (200 − 225)2 252 + 25 2
a) X = = 225 σ= = = 25
2 2 2
175 + 275 (175 − 225)2 + (275 − 225)2 50 2 + 50 2
b) X = = 225 σ= = = 50
2 2 2
250 + 250 (250 − 250)2 + (250 − 250)2 02 + 02
c) X = = 250 σ= = = 25
2 2 2
14. Calcula la media y la desviación típica en:
a) 7, 5 , 3, 2, 4, 5
b) 20, 25, 20, 22, 21

7 + 5 + 3 + 2 + 4 + 5 26
a) X = = = 4, 33
6 6

7 2 + 5 2 + 32 + 2 2 + 4 2 + 5 2
σ= − 4,33 2 = − 18,75 = 1,59
128
6 6

20 + 25 + 20 + 22 + 21 108
b) X = = = 21, 6
5 5

20 2 + 252 + 20 2 + 22 2 + 212
σ= − 21,6 2 = − 466,56 = 1,85
2350
5 5
(Nota.- Observa la fórmula utilizada para la desviación)

15. Organiza los datos siguientes en intervalos de 10 cm desde 150 a 200. Amplia la
tabla con dos columnas, una para el producto de las marcas con las frecuencias y
otra para el producto de las frecuencias con los cuadrados de las diferencias con la
media. Calcula la media y la desviación típica.

Con los datos de la tabla es mas fácil, y se tiene:

MATEMÁTICAS A 213
Est a díst ica

5. Representatividad
Muestreo aleatorio
La característica más importante de una muestra es
su r e pr e se n t a t ivida d respecto al estudio estadístico
que se esté haciendo. Si la muestra no es
representativa diremos que está se sga da .
El proceso mediante el cual se elige una muestra se
llama m u e st r e o , y para que nos proporcione una
muestra representativa debe ser aleatorio. Un
muestreo es a le a t or io cuando los individuos de la
muestra se eligen al azar, de forma que todos tienen
la misma probabilidad de ser elegidos.
Ej em plo: Llam adas t elefónicas volunt arias. Est as encuest as
t ienen varias fuent es de sesgo. Hay fam ilias que no t ienen
t eléfono, el cost e de la llam ada no t odo el m undo est á
dispuest o a asum irlo. Pero sobre t odo, el fact or de
respuest a volunt aria, los encuest ados se aut o- seleccionan.
Suelen cont est ar aquellos con una fuert e opinión negat iva
sobre el t em a. El enoj o les anim a a part icipar.

Ej e m plo
En la imagen tienes 625 cuadros que representan a
los alumnos de un instituto ficticio, se quiere estudiar
el “número de hermanos” y para ello se ha elegido
una muestra aleatoria como puedes ver a la derecha.

H a zlo a sí: Decide primero el tamaño de la muestra, por


ejemplo 62 alumnos, ordenados los alumnos se elige uno de
ellos al azar (puedes simularlo eligiendo un cuadrito con los
ojos cerrados), a partir de este cuenta y señala cada 10
cuadritos (625/62≈10), cuando llegues al final de la lista
(cuadrado) sigue desde el principio. Este tipo de muestreo
aleatorio se llama sist e m á t ico.

214 MATEMÁTICAS A
Est a díst ica

Muestreo estratificado
En ocasiones cuando la población objeto de estudio, Debajo vemos la muestra aleatoria que
pertenece a distintos grupos o estratos conviene se ha elegido y el resultado de la
encuesta. Los últimos diagramas de
elegir la muestra de forma que todos ellos queden
sectores comparan la realidad con los
representados. resultados de la encuesta.
Este tipo de muestreo, escogiendo un reparto
proporcional a los estratos, se llama e st r a t ifica do .
Por ej em plo, si quer em os est udiar el poder adquisit ivo de
una población, y solo elegim os a individuos de una
det erm inada zona, o principalm ent e de una det erm inada
zona, la m uest ra con t oda seguridad no será represent at iva.
La m uest ra se ha de elegir t om ando m uest ras de individuos
proporcionales a la población de cada zona. Si hay t res
zonas con 12.000, 18.000 y 20.000 habit ant es, la m uest ra
deberá t ener un 24% de la prim era zona, 36% de la
segunda y 40% de la últ im a.
A continuación sobre la población del instituto ficticio
anterior se ha hecho una encuesta sobre el color preferido y
en este caso se ha decidido hacer estratificada. De cada
nivel se ha seleccionado aleatoriamente un número de
individuos proporcional al número de componentes.

EJERCI CI OS r e su e lt os
16. Una gran empresa tiene trabajadores en cuatro áreas. Operarios, Representantes,
administración y dirección. Las condiciones de trabajo son bastantes diferentes en
cada área, por lo que el grado de satisfacción no es igual en cada una de ellas.
Para averiguarlo, si hay 1000, 500, 300 y 200 trabajadores en las áreas de
operarios, representantes, administrativos y directivos, ¿cuántos hay que
seleccionar de cada área para una muestra de tamaño?
a) 200 b) 100 c) 300

a) De un total de 2000 empleados, los porcentajes para operarios, repartidores,


administrativos y directivos son del 50%, 25%, 15% y 10%. Lo cual hace que la muestra
tome 100 operarios, 50 repartidores, 30 administrativos y 20 directivos.
b) 50, 25, 15 y 10.
c) 150, 75, 45 y 30

MATEMÁTICAS A 215
Est a díst ica
Algunos de los ejercicios propuestos a continuación están elaborados a partir de esta
publicación de INE. Puedes ver artículos similares en
[Link]

MATEMÁTICAS A 216
Est a díst ica
Pa r a pr a ct ica r

1. Agrupa las siguientes variables: 12. Determina la moda y la mediana


a)Peso, b)densidad, c)nº de plantas de a) 50,60,60
los edificios, d)Tipo de fachada de los b) 12,12,22,32
edificios, e)nº de ventanas, f)metros c) 10,20,30,40,20
de fachada, g)nº de habitantes por d) 35,25,35,25,25,25
edificio, h)tipo de puerta principal.
13. Calcula la moda y la mediana en cada
2. Escribe tres variables cualitativas que caso:
tengan que ver con embarcaciones. a) b)
Marca Fr Marca Fr
3. Escribe tres variables cuantitativas 100 5 100 2
discretas que tengan que ver con 200 4 200 7
aviones. 300 6 300 9
400 3 400 2
4. Escribe tres variables cuantitativas
continuas que tengan que ver con 14. ¿Cuál o cuáles de los datos siguientes
trenes. se puede considerar una observación
atípica en cada una de las dos series?
5. Si las frecuencias para R, V, A y T son a) 4 5 6 5 7 8 4 5 8 7 5 12 6 7 6 5 4
R 3, V 2, A 4 y T 1 ¿Cuántos b) 8 9 1 9 8 9 7 9 6 7 8
grados le corresponde a cada letra en
un gráfico de sectores? 15. Calcula la mediana, primer y tercer
cuartil y el percentil 90 de
6. Haz una tabla y un gráfico de sectores 11433422531212242243
de los datos: R R A A R A R V N V R N 1

7. Haz una tabla y un gráfico de barras 16. Calcula la mediana, primer y tercer
con los datos: cuartil y el percentil 20 de
33454532123454543344 31114153133455442144

8. Agrupa los datos siguientes en 17. Calcula la media y la desviación típica


intervalos en cada uno de los siguientes casos:
a) 100 y 100
b) 99 y 101
c) 110 y 90
d) 120 y 80
9. Haz un histograma de los datos del
ejercicio anterior
18. Completa la tabla con los datos:
10. Calcula la media en cada caso:
a) 4, 6, 8
b) 4, 6, 8, 6
c) 100, 120, 180, 200

11. Calcula la media en cada caso:


a) b)
Marca Fr Marca Fr
1 3 1000 3
2 5 2000 5
3 3 3000 3
4 2 4000 2

MATEMÁTICAS A 217
Est a díst ica
19. Determina la media y la desviación b1. ¿En qué países pasean más las
típica, de los datos de la tabla anterior. mujeres que los hombres?

(
20. Determina los intervalos X − σ, X + σ )
b2. Calcula el tiempo medio que se dedica

( )
en cada país a pasear.
y X − 2σ, X + 2σ y el número de b3. ¿Qué país está en el percentil 50?
elementos que hay en cada uno.
Marca Fr
c)
0 5
1 4
2 7
3 3
4 2

21. Observa los siguientes gráficos y


responde a las preguntas de cada uno

a)

c1. ¿Crees que el dormir se ha contado


como actividad de cuidado personal?
c2. A las 15:00 hay un máximo local en la
gráfica ¿a qué se debe?
c3. A la hora de la comida el 38% de las
personas se dedica al cuidado personal.
Significa esto que un 62% de las personas
no come?

d)
a1. ¿Cuál es la variable estudiada? ¿ y la
frecuencia?
a2. ¿A qué grupo de actividades
dedicamos más tiempo los españoles?
a3. Calcula cuánto tiempo dedicamos al
hogar y la familia ¿cuántos grados ocupa
este sector en el diagrama?
b)

d1. ¿Cuáles son las comunidades en las


que se dedica menos tiempo a la vida
social y a la diversión
d2. ¿Cuánto tiempo dedican a la diversión
o a la vida social la mayor parte de las
comunidades?
d3. ¿Cuál es el tiempo medio que se
dedica en España a esta actividad?

218 MATEMÁTICAS A
Est a díst ica
Pa r a sa be r m á s

La profesión de enfermería. Algu n os ca m pos de


a plica ción de la e st a díst ica
Florence Nightingale (1820-1910), conocida por ser la
fundadora de la profesión de enfermería. Durante la guerra Adm in ist r a ción pú blica
de Crimea se percató de que la causa principal de las
muertes de heridos en combate era la falta de medidas
sanitarias. Al aplicarlas, la tasa de mortalidad pasó de un
42,7% a un 2,2%. Gracias a un uso eficaz de los datos
consiguió modificar el sistema de atención sanitaria a su
vuelta a Gran Bretaña. Cambió el sistema de registro de A través de las Delegaciones
datos y fue una de las primeras personas en utilizar los territoriales y provinciales, se
recogen datos para analizarlos y
gráficos estadísticos para representar los datos de una
someterlos a procesos
forma sencilla de forma que hasta los parlamentarios y estadísticos. De esta forma se
generales pudieran entender. conocen datos referidos a
nacimientos, defunciones,
Para Florence, los datos no eran algo abstracto, eran una
matrimonios, precios, salarios,
forma de poder salvar vidas humanas. trabajo, enseñanza, sanidad,...
Todos estos datos se suelen
publicar por el INE.
El padre de la estadística.
Econ om ía .
Sir Ronald A. Fisher (1890-1962) está considerado el
padre de la estadística. Los escritos de Fisher ayudaron a
organizar la estadística como campo de estudio preciso
cuyos métodos se aplican a problemas prácticos de
muchas disciplinas. Como casi todos los pioneros en la
estadística, sus trabajos nacieron de la necesidad de
resolver problemas prácticos. En este campo es
imprescindible, sobre todo en
macro-magnitudes.
Inferencia estadística Psicología .
La estadística desarrollada en este tema es lo que se
conoce como estadística descriptiva, en ella se recoge
información y se hacen cálculos que describen como están
repartidos. Pongamos el caso que una muestra elegida al
azar nos da una media. ¿La verdadera media está próxima
a la de la muestra? Si considero un intervalo alrededor de La mayor parte de los trabajos
la media muestral, la verdadera ¿con qué probabilidad científicos en psicología
estará o no en él? De estas preguntas y otras se encarga experimental tienen como
principal herramienta de trabajo
la inferencia estadística. la estadística.
M e dicin a .
Principales campos de aplicación de la estadística
La estadística se aplica en
muchos campos como en
I n du st r ia y e m pr e sa s . Para
el control de calidad en la
producción en cadena, para el En cualquier estudio
análisis de mercados, para el experimental de estas áreas
estudio de precio de venta al público de los artículos Existe una asignatura específica
llamada Bioestadística para
fabricados, en gestión financiera,... cubrir esos estudios
En la parte derecha se citan algunas otras de sus experimentales. En Genética y
aplicaciones. antropometría encontramos dos
de los campos de mayor
aplicación.

MATEMÁTICAS A 219
Est a díst ica
Re cu e r da
lo m á s im por t a n t e

Pobla ción . Alumnos de un instituto M e dia y m oda y de svia ción t ípica


ficticio.
M u e st r a . Alumnos encuestados
Va r ia ble s e st a díst ica s : Cualitativa, color
preferido; Cuantitativa discreta, nº de
hermanos y cuantitativa continua, altura.
Consideremos las dos muestras
Media = X = = 1.89
siguientes: 53
28
Nº de hermanos: 4 3 2 3 1 2 0 2 0 1 2 3 1
240114114042041 Moda=Mo=1

σ= = 1.39
54.67
Altura: 182 172 157 194 150 166 163
28
196 167 199 172 185 172 168 173 160
162 173 161 192 156 164 173 180 193
172 Cu a r t il, m e dia n a , pe r ce n t il

Re cue n t o de da t os :
xi f Intervalo xi fi
0 5 [150,160) 155 3
1 8 [160,170) 165 8
0 1 2 3 4
2 6 [170,180) 175 7
3 3 [180,190) 185 3 Me=2, Q1=1, Q3=3, P20=1, P60=2,
4 6 [190,200) 195 5 P90=4
Recorrido. De 0 a 4, de amplitud 4
28 Total 26
Gráficos de se ct or e s y ba r r a s M e dia y de svia ción En nuestro ejemplo,
Nº de hermanos 17 de 28 datos no se alejan de la media
mas de la desviación típica, son el 60,7%,
y el 100% no se alejan de la media mas
de dos veces la desviación.

Altura.

H ist ogr a m a Re pr e se n t a t ivida d


Una muestra es representativa de la
población cuando en ella podemos
encontrar las mismas proporciones de las
características de estudio que en el
conjunto de la población.

220 MATEMÁTICAS A
Est a díst ica
Au t oe va lu a ción

1 ¿Cuántos grados corresponden en un diagrama de


sectores a la marca 2?
xi fi
1 4
2 4
3 7
4 5

2 ¿La mediana de la distribución anterior es?

3 ¿Cuál es la moda ?
xi fi
15 40
25 45
35 37
45 51

4 ¿Qué porcentaje de la muestra corresponde a las


dos primeras marcas ?
xi fi
100 4
200 4
300 7
400 5

5 ¿Cuál es el percentil 30 ?
xi fi
1 4
2 4
3 7
4 5

6 ¿Cuál es la media de los datos anteriores?

7 ¿Cuál es la desviación típica del los datos del nº5?

8 ¿Cuál es la media?
xi fi
180 40
200 25
220 27
240 50

9 ¿Cuál es la desviación típica de los datos


anteriores?

10 ¿Cuál es el percentil 70?

MATEMÁTICAS A 221
Est a díst ica
Soluciones de los ejercicios para practicar

1. Cualitativas: d) h)
Cuantitativas discretas c) e) g) 16. Me=3, Q1=1, Q3=4 y P20=1
C. continuas: a) b) f)
17. La media es 100 en los 4 , y la
2. Propulsión, Carga, Tipo de travesía desviación 0, 1, 10 y 20.

3. Nº de pasajeros, nº ruedas, nº ventanas 18.

4. Velocidad máxima, carga máxima,


potencia.
5. R 108º, V 72º, A 144º y T 36º
.
6. R 5,
A 3,
V 2,
N 2

19. x = 171, 3 σ ≈ 14.02


7. 1 1, 2 2, 3 6, )
4 7, 5 4)
8. Intevalo xi fi 20. En (0.42, 2.9) hay 11,
[150,160) 155 4 y en (-0.88, 4.14) todos
[160,170) 165 7 21. a1)variable:actividades. Fr:porcentaje
[170,180) 175 4 de tiempo diario que se dedica a cada
[180,190) 185 9 actividad
[190,200) 195 6
a2)cuidados personales
9. ---------------- a3) 2h 58m 34s 44,64grados
10. a) 6 b) 6 c) 150 b1) Alemania, Suecia y Finlandia
11. a) 2.3 b) 2307 b2) E35,5 I20, F18,5 A14 N13 F12,5
S11 R3,5 en minutos
12. a)Mo=60, Me=60
b3) Francia
b)Mo=12, Me=17
c)Mo=20, Me=20 c1) Sí. c2) Comida y Siesta
d)Mo=25 Me=25 c3) No, el pico ocupa dos horas y
algunos comen en media hora
13. a) Mo=300, Me=250 b) Mo=300,
Me=300 d1) País Vasco, Cataluña y Madrid
d2) entre 1:30 y 1:40 horas:minutos
14. a) 12 b) 1
d3) 1:29
15. Me= 2, Q1=2, Q3=3, P90=4

Soluciones AUTOEVALUACIÓN
1. Sol 72º 6. Sol 2.65

2. Sol 3 7. Sol 1.06 No olvides enviar las actividades al tutor

3. Sol 51 8. Sol 212.25

4. Sol 40% 9. Sol 24.53

5. Sol 2 10. Sol 240

MATEMÁTICAS A 222

También podría gustarte