Guía III medio: ESTADISTICA
PROFESOR/A: Catalina Gangas Moreno Fecha: / / Curso: III°
/2024 Medio
OA 2: Tomar decisiones en situaciones de Nombre del estudiante:
incerteza que involucren el análisis de datos
estadísticos con medidas de dispersión y
probabilidades condicionales.
Glosario
Tabla de Datos No Agrupados
Cuando los datos a estudiar vienen dados, sin ordenar y se les ordena por clases en tablas de
frecuencia, se les dice Datos No Agrupados.
Ejemplo: En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del
mes de Setiembre.
0; 1; 2; 4; 4; 0; 2; 2; 0; 0; 0; 1; 1; 0; 3; 0; 0; 4; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 2
Resultados
0
1
2
3
4
Total
Tabla de Datos Agrupados
Cuando se tiene una gran cantidad de datos, con muchas clases distintas, es convenientes
distribuirlos por categorías o intervalos, aquí pasan a llamarse Datos Agrupados
Ejemplo: Un grupo de atletas se está preparando para una maratón siguiendo una dieta muy
estricta. A continuación, viene el peso en kilogramos que ha logrado bajar cada atleta gracias a la
dieta y ejercicios.
Frecuenci
Edad(años)
a
[0 – 4[ 5
[4 – 8[ 6
[8 – 12[ 4
[12 – 16[ 4
[16 – 20] 2
Construcción de una tabla Para datos agrupados
Para construir una tabla de datos agrupados puedes seguir los siguientes pasos:
Medidas de tendencia central
Definición:
Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la
distribución de la muestra o población estudiada. Sirven como puntos de referencia para
interpretar la información, nos indican hacia dónde se inclinan o se agrupan más los datos
obtenidos.
Ellas son:
Moda
Medidas de
tendencia central
Mediana
Media
Medidas de tendencia central o Promedio
Moda en datos agrupados
Cuando los datos están agrupados por intervalos, existe un intervalo modal, que corresponde al
intervalo que tiene la mayor frecuencia.
Edad(años) Frecuencia
[0 – 4[ 5 Es la
mayor
[4 – 8[ 6 frecuencia
Es el [8 – 12[ 4
Intervalo
modal [12 – 16[ 4
[16 – 20] 2
En este caso, es [4 – 8[
Nota: Esto NO significa que en ese intervalo se encuentre la moda de la muestra.
Medidas de tendencia central
Mediana
Corresponde al valor central de todos los datos de una muestra, ordenados en forma ascendente o
descendente.
Cuando la muestra presenta una cantidad par de datos, la mediana corresponderá a la suma de los
dos datos centrales dividida en dos, o sea al promedio de ellos
Ejemplo 1:
Los puntajes de 8 alumnos en un ensayo PDT son los siguientes:
650 – 655 – 722 – 700 – 570 – 660 – 814 – 670
¿Cuál es la mediana de los puntajes?
Nota: La mediana se puede hallar solo para variables cuantitativas.
Mediana en datos agrupados
El intervalo donde se encuentra la mediana se determina ubicando la posición central, de acuerdo a
las frecuencias acumuladas. Aquel que la incluya, es el intervalo donde está.
Ejemplo:
Edad (años) Frecuencia Frecuencia acumulada
[12 – 18[ 16 16
[18 – 24[ 12 28
[24 – 30[ 10 38
[30 – 36[ 7 45
[36 – 42] 4 49
49+1
Como hay 49 datos en total, la mediana se encuentra en la posición 25, esto es por =25 .
2
Luego, el intervalo donde se encuentra la mediana es [18 – 24[, que es el que incluye a la posición
25.
Promedio (o media aritmética) (x)
Es la suma de todos los datos, dividida por el número de datos.
Ejemplo 1:
Los puntajes de 8 alumnos en un ensayo PDT son los siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670
Luego, el promedio (o media aritmética) es:
Nota: El promedio se puede hallar solo para variables cuantitativas.
Promedio (o media aritmética) (x), en datos agrupados
El promedio se determina a partir de la frecuencia y la marca de clase de cada intervalo.
Ejemplo:
La tabla adjunta representa las edades de un equipo deportivo, agrupadas en intervalos. ¿Cuál es el
promedio de las edades, obtenido a partir de la marca de clase?
Frecuencia · Marca de
Frecuencia Marca de clase
Edad (años) clase
(fi) (xi)
(fi · xi)
[8 – 11] 16
[12 – 15] 12
[16 – 19] 10
[20 – 23] 7
[24 – 27] 4
Total 49
Principales medidas de dispersión
RANGO
Es la diferencia entre el valor mínimo y el valor máximo en una muestra. Permite tener una idea de
que tan dispersos están los datos, mientras mayor sea el rango, más dispersos se encuentran
Supongamos estos datos obtenidos de preguntar cuántos mensajes han enviado los alumno en la
hora pasada.
“Los datos encontrados en la muestra varían entre un mínimo de 1 y un máximo de 15”
VARIANZA
La varianza nos entrega una idea de la variabilidad de una serie de datos respecto a su media
aritmética.
La unidad de la varianza será la unidad de medida de los datos y siempre será mayor a 0.
Veamos un ejemplo:
Supongamos los mismos datos NO agrupados que vimos con el rango;
DESVIACIÓN ESTÁNDAR
VEAMOS UN EJEMPLO
Para la misma muestra de datos con la que hemos trabajado continuamente,
Para la misma muestra de datos NO agrupados con la que hemos trabajado continuamente,
Y ya que conocemos la varianza (calculada previamente)
Ejercicios
1) Una tienda en línea registra el tiempo que tarda la empresa de correos en hacer llegar su
mercadería a los clientes. Los tiempos en días registrados son los siguientes:
2-7-9-15-14-20-6-35-5-20-13-32-21-29-18-20-13-9-12-35
Con los datos obtenidos, elaborar una tabla de frecuencias. (Número de intervalos = 5)
2) Calcula el rango, la varianza y desviación estándar del siguiente conjunto de datos:
14, 7, 3, 17, 22, 23, 14, 18, 6, 13, 5, 21, 7, 11