Introducción a la Estadística Básica
Introducción a la Estadística Básica
ESTADISTICA
Primero
Nombres: _________________________________________________
Apellidos:_________________________________________________
Grado y Sección
: : ____________________________________________________
Domicilio: _________________________________________________
concepto
Atención La estadística es la ciencia que nos proporciona un conjunto de métodos y procedimientos para la recolección,
clasificación, análisis e interpretación de datos en forma adecuada para la toma de decisiones cuando prevalecen
Población condiciones de incertidumbre.
Muestra
Es un subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones.
Ejemplo:
Muestra de estaturas de los alumnos del nivel primario de una determinada I. E. del departamento de Arequipa.
Variables estadísticas
Una variable es una característica observable que varía entre los diferentes individuos de una población. La
información que disponemos de cada individuo es resumida en variables.
Nota
Clasificación
Debes tener en cuenta que
una variable estadística 1. Variable cualitativa
es una característica de la Son aquellas variables cuyos valores de las observaciones quedan expresados por características o cualidades
población que interesa al
investigador.
de la población. A su vez se clasifica en:
• Variable cualitativa nominal. Cuando se definen categorías y no llevan ninguna ordenación en las posibles
modalidades.
Ejemplos:
Estado civil, color preferido, partidos políticos, etc.
• Variable cualitativa ordinal. Cuando más allá de la clasificación, se busca ordenar los casos en términos
del grado que poseen cada característica.
Ejemplos:
Nivel de educación alcanzado, nivel socioeconómico, etc.
2. Variable cuantitativa
Son aquellas variables que toman valores numéricos (cuantificables) y, en consecuencia, son ordenables. A su
Observación vez las variables cuantitativas se subdividen en dos tipos:
• Variables continuas. Son aquellas variables que pueden tomar cualquier valor de un cierto intervalo (entre
dos números fijados).
Ejemplo:
Peso, estatura, temperatura, etc.
Presentación de datos
Hay dos formas de presentar los datos estadísticos:
1. En forma tabular: cuadros y tablas de frecuencia.
2. Mediante gráficos y diagramas.
02 ESTADISTICA 1°
Cuadro estadístico
A
Consta de ocho partes: número de cuadro, título, concepto o encabezamiento, cuerpo del cuadro, nota de pie
Recuerda
de página o llamadas, fuente, nota de unidad de medida y elaboración.
Fundamentalmente se usa la
Ejemplo: forma tabular, los gráficos se
Cuadro 1 utilizan complementariamente
Errores de focalización de los principales programas sociales: Perú, 2000-2011 para ilustrar mediante figuras,
el comportamiento de las
2000 2002 2003 2004 2006 2007 2008 2009 2010 2011 variables.
FILTRACIONES
Seguro Integral de
39,4% 23,5% 27,1% 24,3% 28,2% 31,6% 39,7% 41,7% 44,8% 49,2%
Salud
Desayunos y
29,0% 19,9% 26,9% 26,1% 27,3% 35,5% 42,2% 49,0% 45,1%* 48,4%*
almuerzos escolares
Vaso de Leche 19,1% 39,4% 39,6% 37,6% 37,1% 43,6% 47,6% 51,0% 59,5% 60,5%
Comedores Populares 34,8% 31,0% 35,2% 36,8% 41,5% 46,2% 48,6% 48,1% 54,7% 53,7%
SUBCOBERTURA
Seguro Integral de
- 70,3% 69,7% 75,2% 71,7% 66,0% 45,8% 34,1% 34,5% 33,5%
Salud
Desayunos y
33,5% 68,3% 64,5% 63,8% 72,4% 55,2% 61,5% 51,2% 74,4%* 77,2%*
almuerzos escolares
Vaso de Leche 73,7% 72,7% 70,0% 69,2% 73,3% 73,3% 75,0% 76,3% 71,0% 72,9%
Comedores Populares 93,6% 96,3% 96,4% 96,9% 97,6% 97,7% 97,1% 97,5% 97,3% 97,8%
Elementos x1 f1 F1 h1 H1
Rango (R). Llamado también recorrido de datos, es la diferencia entre el mayor y menor de los valores que x2 f2 F2 h2 H2
forman las variables estadísticas. x3 f3 F3 h3 H3
R = Xmáx. - Xmín. x4 f4 F4 h4 H4
Frecuencia absoluta (f i). Es el número de veces que aparece repetida la variable estadística en el conjunto de n
observaciones realizadas. Se cumple:
• f1 + f2 + f3 + f4 = n
Frecuencia relativa (h i). Es el cociente entre la frecuencia absoluta de un dato y el número de observaciones
f f f f
realizadas. • h1= 1 ; h2= 2 ; h3= 3 ; h4= 4
n n n n
Frecuencia absoluta acumulada (Fi). Resulta de acumular sucesivamente las correspondientes frecuencias • h1 + h2 + h3 + h4 = 1
absolutas. • F1 = f1
F2 = f1 + f2 = F1 + f2
Frecuencia relativa acumulada (H i). Resulta de acumular sucesivamente las frecuencias relativas. F3 = f1 + f2 + f3 = F2 + f3
F4 = f1 + f2 + f3 + f4 = F3 + f4
Tablas de frecuencia para variables cuantitativas • H1 = h1
Una vez que se han recopilado los datos, denotaremos la variable por X y los datos por X1; X2; ...; Xn, donde n H2 = h1 + h2 = H1 + h2
es el número de observaciones realizadas. H3 = h1 + h2 + h3 = H2 + h3
En general, para construir una tabla de frecuencia, se debe llevar a cabo dos procedimientos que son: la H4 = h1 + h2 + h3 + h4 = H3 + h4
clasificación, que consiste en determinar los valores que toman las variables o intervalos de clase y la
tabulación, que consiste en distribuir los elementos.
ESTADISTICA 1° 03
n.° de observaciones: n = 20
Variable: Xi = altura de las plantas
Datos:
X1 = 61 X2 = 67 X3 = 67 X4 = 70 X5 = 69 X6 = 69 X7 = 70 X8 = 67 X9 = 60 X10 = 61
X11 = 60 X12 = 61 X13 = 61 X14 = 69 X15 = 69 X16 = 70 X17 = 67 X18 = 67 X19 = 67 X20 = 69
Observación Clasificación:
La tabla de frecuencias: Xi: 60; 61; 67; 69; 70 Xmín. = 60 Xmáx. = 70
Xi fi Tabulación:
X1 f1 CUADRO 2
X2 f2 Distribución de las alturas de 20 plantas en una clase de botánica
X3 f3 Altura de las plantas
Conteo fi Fi hi Hi
X4 f4 (Xi)
X5 f5 60 2 2 0,10 0,10
es simétrica si: 61 4 6 0,20 0,30
f1 = f5 / f2 = f4 67 6 12 0,30 0,60
69 5 17 0,25 0,85
70 3 20 0,15 1
n = 20 1
2. Elegimos el número de intervalos (K), que convenientemente debe estar entre 5 y 20. Podemos emplear dos
Nota métodos para hallar el valor de K:
El número de intervalos (K) a) Si n < 25, entonces K = 5 y si n $ 25, entonces K = n
es arbitrario, sin embargo b) Regla de Sturges: K = 1 + 3,32 # log(n)
es recomendable tener en
cuenta ciertos criterios: En el ejemplo:
- Naturaleza de la variable. K = 1 + 3,32 # log(40) = 1 + 3,32(1,60) = 6,32 & K = 6 intervalos
- Número de valores
observados.
- El recorrido de la variable. 3. Determinamos la amplitud de los intervalos (c) de la siguiente manera:
- Unidad de medida de la X - Xmín.
variable. c = máx.
K
- Los objetivos del estudio.
Para el ejemplo:
c = 94 - 46 = 48 = 8
6 6
4. Construimos los intervalos:
[Li ; LsH
[46; 54H
[54; 62H
[62; 70H
[70; 78H
[78; 86H
[86; 94]
04 ESTADISTICA 1°
Se calcula el punto medio de cada intervalo, llamado marca de clase (xi), para finalmente organizarlas en una
A
tabla.
[Li ; LsH xi Ten en cuenta
La marca de clase xi, es
x1 = 46 + 54 = 50 [46; 54H 50 el punto medio de cada
2 intervalo.
x 2 = 54 + 62 = 58 [54; 62H 58
2
x3 = 62 + 70 = 66 [62; 70H 66
2
x 4 = 70 + 78 = 74 [70; 78H 74
2
x5 = 78 + 86 = 82 [78; 86H 82
2
x 6 = 86 + 94 = 90 [86; 94] 90
2
Tabulación:
CUADRO 3
Distribución de las remuneraciones diarias de 40 obreros Nota
En la tabulación se
[Li ; LsH xi Conteo fi Fi hi Hi contabilizan cuántos
elementos se encuentran
[46; 54H 50 2 2 0,050 0,050 comprendidos en cada
[54; 62H 58 8 10 0,200 0,250 intervalo.
A A D C C E E C D A También: H6 = 1
C D E E A C D A A D Se cumple en general que:
D A D D D A C C A D Hk = 1
C C E E D C D D D C
Donde:
A: Administración C: Contabilidad D: Derecho E: Economía
CUADRO 4
Distribución de las especialidades de 40 estudiantes universitarios encuestados
Especialidad fi hi
Administración 9 0,225
Contabilidad 11 0,275
Derecho 14 0,350
Economía 6 0,150
n = 40 1
ESTADISTICA 1° 05
Representación gráfica
Un gráfico estadístico es la representación de un fenómeno estadístico por medio de figuras geométricas, cuyas
dimensiones son proporcionales a la magnitud de los datos representados.
2
Ii
Medidas de posición
46 54 62 70 78 86 94
Media aritmética (X)
La media aritmética, llamada también media o simplemente promedio, se calcula dividiendo la suma de los
valores de la variable entre el número de observaciones o valores. Es decir:
Mediana (Me)
Sean X1, X2, X3, ..., Xn los valores de la variable X, ordenados de menor a mayor, donde n es el número de
observaciones. Entonces:
Xn + Xn
+1
2 2
• Si n es par, se tiene: Me =
2
Observación
• Si n es impar, se tiene: Me = X n + 1
La moda no siempre existe y 2
no siempre es única.
Moda (Mo)
Dada una distribución de frecuencias; la moda es el valor de la variable que tiene la más alta frecuencia.
06 ESTADISTICA 1°
Problemas resueltos A
1 Se tienen los promedios finales de 10 estudiantes en el curso de 3 Se tiene la distribución de las estaturas en metros de 100 alumnos
matemática básica I. del [Link]; 2.° y [Link] año de secundaria de una I. E.
10,2 10,5 11,2 13 14
16,2 13,7 12 10,9 13,1 Ii Fi Hi
Si se clasifican los datos en 4 intervalos de clase, halla f3 + F2 + h1. [1,40; 1,45H 0,14
3 =6 f3 = n # h3 = 24 # 2 = 4
12 n 12 ` 70 alumnos tienen una estatura mayor o igual que 1,45 m y
ESTADISTICA 1° 07
5 De los siguientes datos: En el gráfico del enunciado:
24 22 21 21 24 23 22 26 23 22 B Luego:
21 23 22 23 23 26 23 26 26 26 A (24%) q1 + q2 + 12x = 360°
Halla la media. 86,4° + 57,6° + 12x = 360°
5x θ1 144°+ 12x = 360°
Resolución: 7x θ2
12x = 216°
D (16%) x = 18°
Primero ordenamos los datos en forma ascendente: C
21 21 21 22 22 22 22 23 23 23
23 23 23 24 24 26 26 26 26 26
q1 = 24% # 360° & q1 = 86,4°
Estos datos los podemos ubicar en una tabla de frecuencias:
q2 = 16% # 360° & q2 = 57,6°
Xi fi
21 3
8 Del problema 7, ¿qué porcentaje de las personas prefieren el lugar
22 4 turístico B?
23 6
24 2 Resolución:
26 5 Sea b el porcentaje de las personas que prefieren el lugar turístico B.
n = 20 Del gráfico.
b = 0,25
b = 5x
Nos piden: 360° b = 25%
` El 25% de las personas prefieren
X = 21 # 3 + 22 # 4 + 23 # 6 + 24 # 2 + 26 # 5 = 23, 35 b=
5 (18°)
20 360° el lugar turístico B.
Piden: Me + Mo = 23 + 23 = 46 48
24
500 550 600 650 700 750 Sueldo (S/.)
7 En el diagrama circular se muestra las preferencias de un grupo de ¿Cuántos trabajadores tiene dicha empresa?
personas por los lugares turísticos A, B, C y D.
B Resolución:
A (24%)
Construimos la tabla de frecuencias a partir del histograma:
5x
Ii fi
7x [500; 550H 74
D (16%) [550; 600H 86
C
[600; 650H 68
Halla x.
[650; 700H 48
Resolución: [700; 750] 24
Hay que tener en cuenta que en un diagrama circular, el ángulo Total 300
correspondiente a un sector se calcula así: ` Dicha empresa tiene 300 trabajadores.
fi
qi = # 360° 10 De la pregunta 9, ¿cuántos trabajadores ganan entre S/.600 y
n
S/.700?
Luego: qi = hi # 360°
También: Resolución:
θi Piden: f3 + f4 = 68 + 48 = 116
qi = hi # 100% # 360° / hi # 100% =
360° ` 116 trabajadores ganan entre S/.600 y S/.700.
08 ESTADISTICA 1°
Aplicamos lo aprendido
tema 2: ESTADÍSTICA
1 Se tienen los promedios de 10 estudiantes del curso de 2 Del siguiente cuadro de frecuencias:
Física I. Ii fi hi
10,2 13,6 11,9 12,8 10,8
[600; 800H 1/x
13,0 12,2 14,4 11,4 16,2
Si se clasifican los datos en 4 intervalos de clase, halla h3 + F2. [800; 1000H 3 3/x
[1000; 1200H 6/x
[1200; 1400] 2/x
Halla: f1 + f4 + h3
3 Se tiene la distribución de las estaturas de 50 alumnos del 4 Se tiene el siguiente cuadro de frecuencia:
[Link] y 2.° año de secundaria de una I. E. Ii fi Fi
Ii Fi Hi [50; 70H 8
[1,40; 1,45H [70; 90H 10
[1,45; 1,50H 0,56 [90; 110H 30
[1,50; 1,55H [110; 130H
[1,55; 1,60] [130; 150] 9 50
A) 30 B) 28 C) 26 A) 22 B) 32 C) 26
D) 24 E) 22 D) 30 E) 31
09 ESTADISTICA 1°
7 De la siguiente tabla de distribución de frecuencia indica qué tanto 8 Se tiene la tabla de distribución de las edades de personas que
por ciento del total tienen edades desde 16 hasta 23 años. fueron hospitalizadas en un determinado hospital durante un año.
Edades fi hi Edades fi Fi
[12; 16H 20 [10; 20H
[20; 30H
[16; 20H 40 [30; 40H
[20; 24H 0,30 [40; 50H 15 81
[24; 28] 10 0,10 [50; 60]
¿Cuántas personas que fueron hospitalizadas tenían menos
de 40 años?
A) 40% B) 60% C) 70% A) 60 B) 62 C) 63
D) 80% E) 90% D) 64 E) 66
9 Calcula la diferencia entre la media y la mediana de los 10 Se tienen las notas finales de 15 alumnos en el curso de
siguientes datos: Aritmética, del [Link] año de secundaria de una I. E.
5 8 9 5 5 8 18 16 15 15 18
3 10 5 8 3 9 15 17 16 17 17
17 16 17 17 16
Halla la diferencia entre la mediana y la moda.
11 Los siguientes datos corresponden al número de horas que 12 En el diagrama circular se muestran las preferencias de un
dedican a la semana a estudiar, los alumnos del [Link] año de grupo de personas sobre 3 productos: A, B y C.
secundaria de una I. E. Producto B Producto A
4x° 5x°
20 18 20 24 28 18 18 20 116°
28 20 18 20 20 24 24 18 99° 145°
Calcula la diferencia entre la media y la moda.
Producto C
27,5 %
Halla x.
A) 20 B) 22 C) 26 A) 30 B) 60 C) 24
D) 28 E) 30 D) 28 E) 80
Claves
ESTADISTICA 1° 10
Practiquemos
NIVEL 1 Luego, se hizo el siguiente histograma:
n.º de personas
Comunicación matemática
90
80
Enunciado para los problemas 1; 2 y 3. 75
En el siguiente diagrama de barras se muestra el número de 60
trabajadores de una empresa según su estado civil.
40
fi
18 Edades
16 14 16 18 20 22 24
13 Determina el tamaño de la muestra.
A) 345 B) 410 C) 520
3 D) 350 E) 380
Estado
civil
Soltero Casado Divorciado Viudo 7. Para el siguiente conjunto de datos:
1; 1; 2; 3; 2; 5; 7; 8; 13; 14; 2; 3; 14; 5; 6; 7; 8
1. ¿Cuántos trabajadores tiene dicha empresa?
Determina la mediana.
Respuesta: A) 2 B) 3 C) 5
D) 7 E) 8
2. ¿Qué porcentaje del total de trabajadores son casados?
8. Para el siguiente conjunto de datos:
Respuesta:
3; 3; 4; 5; 4; 7; 9; 10; 15; 16; 4; 5; 16; 7; 8; 9; 10
Determina la moda.
3. ¿Qué porcentaje del total de trabajadores son viudos?
A) 4 B) 5 C) 7
Respuesta: D) 8 E) 9
a) F2 = f1 + f2
NIVEL 2
b) F4 = n
Comunicación matemática
c) F1 + F2 = n
Enunciado para los problemas 11 y 12.
5. Indica verdadero (V) o falso (F) según corresponda. El siguiente diagrama muestra el número de trabajadores de una
determinada empresa, que llegaron tarde a su centro laboral durante
a) F1 - f1 = n la semana.
fi
b) F3 + f4 = n 36
35
c) f1 + f2 = n
25
Resolución de problemas 24
11 ESTADISTICA 1°
11. ¿Cuántas tardanzas se registraron toda la semana? 17. Dada la siguiente distribución discreta:
Respuesta: Xi 2 4 6 10
fi 16 10
12. ¿Qué porcentaje del total de tardanzas, se registró el día jueves? Fi 6 20
Respuesta: Calcula la mediana y la moda, respectivamente.
A) 2; 10 B) 4; 6 C) 6; 6
Razonamiento y demostración D) 10; 4 E) 6; 10
Enunciado para los problemas 13 y 14. 18. El diagrama circular muestra las preferencias de n alumnos de
Dada la siguiente tabla de frecuencias, cuyos intervalos de clase son una I. E. sobre sus deportes favoritos.
de ancho constante: Vóley
Ii fi hi Fi Hi
Básquet
[a1 ; a2H f1 h1 F1 H1 Ajedrez
60°
[a2 ; a3H f2 h2 F2 H2
[a3 ; a4H f3 h3 F3 H3 Otros
Fútbol
[a4 ; a5] f4 h4 F4 H4
n Si 50 alumnos prefieren ajedrez, entonces n es:
A) 150 B) 200 C) 250
13. Indica verdadero (V) o falso (F) según corresponda. D) 300 E) 350
a) h4 > 1
Enunciado para los problemas 19 y 20.
b) f1 < F1 Se tiene el siguiente histograma de frecuencias relativas de 400
observaciones.
c) h1 + h2 = H2
hi
8a
14. Indica verdadero (V) o falso (F) según corresponda.
a) h1 < H2
4a
b) F3 = f1 + f2 2a
a
c) h1 + h2 > 1 Ii
m n p q r s
ESTADISTICA 1° 12
21. El valor de x es: 28. En el último examen de admisión se observó las edades de los
postulantes, las cuales se muestran en el cuadro. Calcula la
22. El valor de y es: edad promedio.
n° de personas
Razonamiento y demostración 900
800
Enunciado para los problemas 23 y 24. 750
Considerando que la siguiente distribución de frecuencias tiene ancho 600
de clase común.
400
Ii xi fi hi
[ ; 30H 25 b+1 Edades
14 16 18 20 22 24
[ ; H 1b 0,32
[ ; H 1(b + 1) A) 18,37 B) 15,61 C) 19,52
[ ; ] °
10 D) 17,53 E) 13,32
°
n = 10
29. En el diagrama circular se muestra las preferencias de 300
personas sobre tres productos, halla cuántas personas prefieren
23. Indica verdadero (V) o falso (F) según corresponda. el producto C.
°
a) b = 3 Producto A
b) f4 = 10 Producto B
144° 25%
c) n = 50
Producto C
24. Indica verdadero (V) o falso (F) según corresponda.
a) x2 + x3 = 90
A) 80 B) 25 C) 105
b) x4 + f4 = 65 D) 120 E) 240
A) 25,2 B) 26,1 C) 27
26. Dada la siguiente distribución de frecuencias:
D) 27,8 E) 28
Ii [26; 34H [34; 42H [42; 50H [50; 58H [58; 66]
fi 16 25 29 23 10
Halla: X + H4 + F3 C l a ve s
A) 115,13 B) 112,71 C) 111,18 7. c 13. 20. c 26. d
Nivel 1
D) 115,81 E) 110,53
1. 8. a 14. Nivel 3 27. C
27. La familia Mendieta tiene 6 hijos: 3 trillizos, 2 mellizos y uno 2. 9. a 15. e 21. 28. c
menor de 6 años. Si al calcular la media, mediana y moda de 3. 10. c 16. d 22. 29. c
estas edades resultaron 10; 11 y 12, respectivamente. Halla la 4. Nivel 2 17. c 23. 30. c
diferencia entre la máxima y mínima edad.
5. 11. 18. d 24.
A) 10 B) 6 C) 8 6. a 12. 19. e 25. d
D) 7 E) 9
13 ESTADISTICA 1°