0% encontró este documento útil (0 votos)
186 vistas77 páginas

Herramientas de Estadística Descriptiva

Este documento presenta la unidad sobre herramientas de estadística descriptiva para analizar datos. Explica que después de recolectar datos en la unidad anterior, ahora se aprenderá a sistematizarlos y obtener información a través de medidas estadísticas como la media, mediana y moda. Esto permitirá comprobar hipótesis de manera fundamentada. Enseñará el cálculo de medidas de tendencia central, variabilidad y posición, así como la interpretación de gráficos para sacar conclusiones. Todo esto se aplicará al anális

Cargado por

Anonimo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
186 vistas77 páginas

Herramientas de Estadística Descriptiva

Este documento presenta la unidad sobre herramientas de estadística descriptiva para analizar datos. Explica que después de recolectar datos en la unidad anterior, ahora se aprenderá a sistematizarlos y obtener información a través de medidas estadísticas como la media, mediana y moda. Esto permitirá comprobar hipótesis de manera fundamentada. Enseñará el cálculo de medidas de tendencia central, variabilidad y posición, así como la interpretación de gráficos para sacar conclusiones. Todo esto se aplicará al anális

Cargado por

Anonimo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

Unidad 3.

Herramientas de estadística
descriptiva para el manejo de datos

Presentación

Herramientas de estadística descriptiva para el manejo de datos.

En la unidad anterior empezaste a recabar datos ¿Recuerdas la encuesta que


aplicaste? Ahora tienes muchos datos, pero ¿qué hacer con ellos? Bueno, lo
importante de tener muchos datos es que podamos sistematizarlos y obtener
información a partir de ellos.
En esta unidad vas a aprender a obtener información, vamos a traducir los
datos en información ¿Cómo lo vamos a hacer? Bueno, pues lo vamos a hacer
ayudándonos de la estadística. Vas a aprender a calcular las medidas de
tendencia central que son: la media, la mediana y la moda. Medidas de
dispersión como: el rango, la desviación estándar y la varianza. Y medidas de
posición como: cuartiles, deciles y percentiles.
Suena como raro o difícil ¿Verdad? Pero nada de eso, es muy sencillo te va a
encantar hacerlo.

En este momento estás justo a la mitad de la asignatura: has iniciado una investigación y
has compartido con tus compañeros diversos puntos de vista para formular un objetivo y
una hipótesis que son la guía de tu investigación, también aplicaste una encuesta para
recabar datos, que en esta unidad podrás transformar en información valiosa que te
permitirá comprobar tu hipótesis.
Hasta este momento sólo tienes datos reunidos en una base, datos que no han sido
sistematizados y sin relación entre sí, por lo que no se pueden interpretar, quizá te den
una idea de las tendencias de las respuestas de los encuestados, pero no te permiten
formular conclusiones fundamentadas. Para ello es preciso que los datos se sistematicen,
y para hacerlo nos auxiliaremos de la estadística, especialidad de las matemáticas que
proporciona herramientas específicas para analizar los datos que tenemos.
Seguramente has estado en contacto con la estadística a través de los medios de
comunicación, que nos muestran con gráficas y a veces con porcentajes, las opiniones de la

1
gente sobre diversos temas, pero ¿cómo sabemos si esa información no ha sido
manipulada o si podemos confiar en ella?
En esta unidad conocerás la metodología que se sigue para dar tratamiento estadístico a
los datos, aprenderás a calcular algunos indicadores básicos como las medidas de
tendencia central, de variabilidad y de posición, a interpretarlos y a representarlos
mediante gráficos (histogramas y diagramas circulares), así como a formular
conclusiones en base a la interpretación de los indicadores calculados.
Todo esto lo aplicarás a la base de datos que integraste en la unidad anterior con tu
equipo de trabajo, por lo que continuarás trabajando con el mismo equipo para hacer el
análisis estadístico en esta unidad y en la siguiente.

¿Dónde empiezo?

Para iniciar, igual que en las semanas anteriores, lo haremos respondiendo un cuestionario, el
cual te ayudará a colocarte en el punto preciso que necesitas, de acuerdo a los conocimientos
que ya tienes sobre el tema. Por eso es muy importante que lo respondas con honestidad,
recuerda que NO cuenta para calificación, solamente es el punto para saber si iniciarás la
unidad desde el inicio, si requieres de algún apoyo, o si ya dominas algunos temas, y de esta
manera puedas continuar haciendo el análisis estadístico de tu investigación.
Este cuestionario es automatizado y conocerás los resultados de manera inmediata. Lee
detenidamente cada reactivo antes de responder. Solamente una opción es correcta.

Realiza la actividad en plataforma:


¿Dónde empiezo?

Tutorial Excel

Es importante que sepas que en esta unidad necesitarás realizar varios cálculos
matemáticos, si gustas podrás hacerlos con calculadora o de manera manual, pero
cuando ya tengas muchos números o cantidades grandes, esto te puede llevar a cometer
errores, por eso te recomiendo usar Excel. Si quieres puedes echar un vistazo al siguiente
sitio para que te vayas familiarizando y lo tengas a la mano cuando lo necesites.

Consulta el siguiente link:


http://www.aulaclic.es/excel-2013/

2
Medidas de tendencia central para datos no agrupados

La semana pasada aplicaste 10 encuestas y junto con los compañeros con quienes estás
haciendo tu investigación integraste una base de datos en Excel. Es importante que esté
en este programa para poder realizar los cálculos necesarios y con un menor rango de
error. En esta base tienes muchos datos, pero no es información, porque no están
sistematizados y por lo tanto no se pueden interpretar.
Lo interesante de tener muchos datos, y por eso el equipo aplicó muchas encuestas, es
que podemos transformarlos en información y las conclusiones obtenidas a partir de
estos datos se pueden generalizar para toda la muestra calculando algunos indicadores
estadísticos. Para hacer el análisis estadístico de tu base de datos iniciaremos calculando
las medidas de tendencia central.

Empecemos con el análisis de datos no agrupados.

Medidas de tendencia central

Las medidas de tendencia central sirven para describir características básicas de un


estudio con datos cuantitativos, comparar resultados o interpretar puntajes en relación a
otro central. Estas medidas son:

Las medidas de tendencia central permiten ubicar el centro de una distribución de datos,
desde diferentes perspectivas.

3
En algunas distribuciones estas medidas pueden tener el mismo valor y en otras
pueden tener diferentes valores.

4
Empezaremos a estudiar la medida de tendencia central más conocida que es la media,
la cual seguramente conoces como promedio, y es el mismo que has utilizados muchas
veces para saber cuál será tu calificación final en un ciclo escolar.

La media o promedio es muy fácil de calcular, tú sabes que para calcular un promedio lo
haces sumando todos los datos y divides el resultado entre la cantidad de datos esto se
puede representar mediante una fórmula matemática de la siguiente manera:

5
Donde X representa a la
media,
X1, X2... Xn representan a los datos, y
n es el número total de datos o tamaño de la muestra.

Una manera simplificada de representar la misma fórmula es la siguiente:

Donde ∑ indica la sumatoria de todos los datos,


Xi representa a cada uno de los datos, y
es el total de datos o tamaño de la muestra

Ahora veamos un ejemplo:

Una joven atleta estaba en un parque haciendo ejercicio y observó que 5 niños jugaban
haciendo “carreritas”, les preguntó sus edades y calculó el promedio.

Tomada para fines educativos de:


https://fthmb.tqn.com/2lkAYgphfaOo5R9dO48196IFsAU=/2716x1810/filters:no_upscale()/about/iStock_kids_running_LARGE-
56a13e443df78cf77268b964.jpg

Las edades de los niños en años eran las siguientes: 6, 8, 7, 7, 6.

6
Aplicando la fórmula, la edad promedio de los niños fue la siguiente:

Esto quiere decir que aunque las edades de los niños iban de 6 a 8 años, la edad
promedio era de 6.8 años, esto es, casi 7 años (si redondeamos el dato para que quede
en años completos)

Después de conocer la edad promedio, la atleta se interesó por saber la altura promedio
de los niños, ya que aunque tenían edades diferentes su estatura era similar. Las
medidas obtenidas fueron las siguientes:

1.15m, 1.06m, 1.10m, 1.09m, 1.13m

Aplicando la fórmula para la media, la altura promedio de los niños fue la siguiente:

7
Esto quiere decir que la altura promedio de los niños
era de 1.10 m.

Conozcamos las propiedades de la media.

Propiedades de la media

Se usa sólo para datos cuantitativos.

Al calcular la media se incluyen todos los valores, por


lo que es más confiable entre más datos se incluyan
en la muestra.

Un conjunto de datos sólo tiene una media aritmética


y es un valor único.

La media se ve afectada cuando hay valores


muy grandes o muy pequeños.

Ahora es tu turno. Te invitamos a ejercitarte en el tema de la media:

1. Calcula la media del peso de los niños que jugaban en el parque


donde estaba la atleta (Los pesos están medidos en kilogramos)

19.45, 22.20, 20.84, 21,63, 22.98

a. 22.30 kg.
b. 21.42 kg.
c. 20.40 kg.
d. 21.50 kg.

2. Un equipo de jugadores de basketbol se reúnen y quieren saber cuál es


la estatura promedio del equipo.

8
Las medidas son las siguientes:

1.70, 1.98, 1.68, 1. 69, 1.90, 1.68, 1.74, 1.93, 1.73, 1.70, 1.91, 1.68

a. 1.78 m.
b. 1.75 m.
c. 1.68 m.
d. 1.80 m.

3. Juan quiere estudiar medicina y sabe que necesita tener un promedio


mínimo (sin redondear) de 9.5 para poder concursar y entrar a la
Universidad que quiere. Si las siguientes son las calificaciones de los seis
semestres del bachillerato, ¿Juan reúne el requisito para poder presentar el
examen de admisión? (calcula la media con dos decimales)

Calificaciones de los semestres: 9.2, 9.7, 9.8, 9.5, 9.9, 9.4

a. No podrá presentar el examen porque su promedio es de


9.49 b. Sí podrá presentar el examen porque su promedio es
de 9.6 c. No podrá presentar el examen porque su promedio es
de 9.50 d. Sí podrá presentar el examen porque su promedio
es de 9.58

Respuestas: b, a, d.

Otra medida de tendencia central es la mediana

Vamos a conocerla

9
Conoce las propiedades de la mediana:

Propiedades de la mediana:

1. Divide a la muestra exactamente en dos


partes iguales.

2. Se usa sólo para datos cuantitativos.

3. A diferencia de la media, la mediana de una


variable discreta es siempre un valor de la variable.

10
4. Un conjunto de datos solamente tiene
una mediana.

5. Los valores extremos no afectan a la mediana.

La mediana describe mejor que la media una distribución cuando está sesgada hacia uno
y otro lado y es conveniente obtener ambos indicadores porque proporcionan más
información acerca de la distribución de datos.

Para calcular la mediana sigue estos pasos:

1. Ordena los datos de menor a mayor.

2. Al total de datos agrega uno.

3. Divide el resultado de la suma entre dos.

4. El resultado de la división es el lugar que ocupa


la mediana.

o Si se trata de datos pares, y quedan dos


datos en medio, se promedian para obtener
el lugar que ocupa la mediana.

La fórmula que representa matemáticamente a la


mediana es la siguiente:

11
Veamos un ejemplo.

Maru tenía que leer diariamente 10 minutos como actividad extra clase, los dos primeros
días no leyó, así que trató de compensarlo leyendo más tiempo los días siguientes.
Observa la gráfica de sus tiempos de lectura:

Los tiempos de lectura de Maru fueron los siguientes:

Lunes = 0 min. (no leyó)

Martes = 0 min. (no leyó)

Miércoles = 5 min.

Jueves = 10 min.

Viernes = 20 min.

12
Si calculas la media, verás que el promedio de lectura fue de 7 minutos, con lo que no
alcanzaba en promedio los 10 minutos que le habían dejado diario.

Ahora calculemos la mediana siguiendo los pasos arriba descritos:

Ordena los datos de menor a mayor: 0, 0, 5, 10, 20


Al total de datos agrega uno: Son 5 datos
5+1=6
Divide el resultado de la suma entre dos: 6/2=3
El resultado de la división da el lugar que ocupa la mediana: Lugar 3

La mediana la podemos interpretar de la siguiente manera:

El promedio de lectura de Maru en una semana fue de 7 minutos. La mitad de los días
leyó menos de 5 minutos y la otra mitad leyó más de 5 minutos.

13
Cuando Maru se dio cuenta de que a pesar de haber leído más tiempo los últimos dos
días, no cumplía con los 10 minutos de lectura requeridos, leyó un poco más el día
sábado. Al graficar los nuevos tiempos de lectura quedaron así:

1. El tiempo promedio de lectura esta vez fue de: ____________ min.

Respuesta: 10

Ahora calculemos la mediana siguiendo el mismo procedimiento:

Ordena los datos de menor a mayor: 0, 0, 5, 10, 20

Al total de datos agrega uno: Son 6 datos


6+1=7

Divide el resultado de la suma entre dos: 7/2 = 3.5


Como el resultado no es un número entero eso indica que son dos los datos que
quedan al centro, serían los datos que ocupan los lugares 3 y el 4 y para
calcular la mediana se promedian:

14
Al promediar 5 y 10 se obtiene la mediana: Me = 7.5

Estos tiempos de lectura de Maru, se pueden interpretar de la


siguiente manera:

El promedio de lectura de Maru en una semana fue de 10 minutos, y la


mitad de los días leyó menos de 7.5 minutos y la otra mitad leyó más de 7.5
minutos.

¿Quieres practicar lo aprendido?

1. Calcula la mediana del peso de los niños de una estancia infantil. Los
pesos están medidos en kilogramos:
19.45, 22.20, 20.84, 21.63, 22.98
a. 21.63kg.
b. 21.33kg.
c. 20.40 kg.

15
d. 21.50 kg.

2. Diana está siguiendo una dieta y durante 7 días realizó un registro para
saber cuál era su ingesta de calorías. Calcula la mediana e interprétala:
Las calorías ingeridas estos días fueron las siguientes:
1800, 1500, 2100, 2300, 1900, 1950

a. Diana ha ingerido la mitad de los días más de 2100 calorías


b. Diana ha ingerido la mitad de los días menos de 1900
calorías c. Diana ha ingerido la mitad de los días más de 1925
calorías
d. Diana ha ingerido la mitad de los días alrededor de 1950 calorías

3. Calcula la mediana de la estatura de los jugadores de un equipo de


futbol americano y elige la afirmación que describe esta muestra.
Las medidas son las siguientes:
1.98, 1.98, 1.79, 1.90, 1.78, 1.84, 1.93, 1.73, 1.90, 1.91, 1.96, 1.77
a. La mitad de los jugadores mide más de 1.85 b.
La mitad de los jugadores mide menos de 1.90 c.
La mitad de los jugadores mide entre 1.84 y 1.93
d. La mitad de los jugadores mide más de 1.80

Respuestas: a, c, b

Ahora que ya has estudiado la


media y la mediana, estudiemos
la moda

16
Conoce las propiedades de la moda:

Propiedades de la moda:

Es fácil de identificar porque es el dato con mayor frecuencia.


Se puede emplear tanto para datos cuantitativos como
cualitativos No siempre está en el centro de la distribución
Es la única medida de tendencia central que puede tener más de un valor o
no existir en una muestra.

Veamos el ejemplo de las edades de los


niños que estaban jugando en el parque:

Sus edades eran: 6, 8, 7, 7, 6

Como la moda es el dato que más se


repite, la moda es 7, y lo podemos
interpretar así:

La edad más frecuente en los niños que juegan


carreritas en el parque “Las arboledas” es de 7 años.

Ahora veamos qué pasa con su estatura.

La altura de estos niños era la siguiente:

1.15m, 1.06m, 1.10m, 1.09m, 1.13m


¡En esta muestra no existe la moda!

17
Esto se debe a que todos tienen la misma frecuencia, por lo tanto no hay ninguna que se
repita más veces que las otras.
Sigamos con el ejemplo: Inicialmente eran 5 niños quienes jugaban carreritas, pero
después llegaron más niños al parque y se integraron al juego, sus estaturas eran las
siguientes:

Es más fácil de localizar la moda si primero ordenamos


los datos, para ordenarlos, presiona en la imagen.

18
En este caso hay dos modas, porque son dos los datos que se repiten con más
frecuencia: la moda es 1.06, que se repite 2 veces y 1.15, que también se repite 2 veces.
Como hay dos modas, se dice que la muestra es bimodal.

En este caso la moda la interpretamos así:

La altura más frecuente en los niños que juegan carreritas


en el parque “Las arboledas” es de 1.06 y 1.15 m.

Siguiendo con este mismo ejemplo, después llegaron otros dos niños, y ahora la muestra
quedó así:

Presiona en la imagen para ordenar los datos.

19
Aquí la interpretación sería la siguiente:

La altura más frecuente en los niños que juegan carreritas


en el parque “Las arboledas” es de 1.15 m.

En este ejemplo la moda es 1.15m, porque es el dato que se repite más veces, pues
aunque la altura de 1.06m. también se repite, la que se repite más veces es 1.15m.

Ejercitemos lo aprendido.

1. Una agencia de publicidad realizó una encuesta para conocer el grado de


satisfacción de los clientes del hospital “San Antonio” y obtuvo los
siguientes resultados:
Grado de satisfacción Frecuencia

Completamente satisfechos 46

Satisfechos 30

Regularmente satisfechos 12

Insatisfechos 7

Completamente 5
insatisfechos

20
Identifica la moda y su significado en esta muestra:
a. La moda corresponde a la opción “Completamente insatisfechos”. Significa
que de todas las opciones hay más encuestados que se sienten
completamente insatisfechos con el servicio que brinda el hospital
“San Antonio”.

b. La moda corresponde a la opción “Regularmente satisfechos”. Significa que


de todas las opciones hay más encuestados que se sienten regularmente
satisfechos con el servicio que brinda el hospital “San Antonio”.

c. La moda corresponde a la opción “Satisfechos”. Significa que de todas las


opciones hay más encuestados que se sienten satisfechos con el servicio
que brinda el hospital “San Antonio”.

d. La moda corresponde a la opción “Completamente satisfechos”. Significa que


de todas las opciones hay más encuestados que se sienten
completamente satisfechos con el servicio que brinda el hospital “San
Antonio”.

2. Los siguientes datos muestran la cantidad de horas que duermen estudiantes


de bachillerato:
8, 11, 10, 9, 7, 6, 6, 5, 9, 10
a. La muestra es bimodal
b. La muestra es multimodal
c. La muestra es unimodal
d. La muestra no tiene moda

3. Identifica la moda de la siguiente muestra, en la que se preguntó a niños


de 7 años su color preferido:
Morado, rosa, verde, azul, azul, rosa, amarillo, rosa, naranja, rosa, azul.,
morado, morado
a. La moda es azul
b. La moda es rosa y azul
c. La moda es rosa
d. La moda es azul y morado

Respuestas: d, a, c.

21
Como puedes observar, en todos los ejercicios que hicimos trabajamos con pocos datos,
y las medidas de tendencia central también se pueden calcular con bases de datos
grandes, como la base de datos que tienes de tu investigación. Para trabajar con muchos
datos podemos auxiliarnos con Excel, una ventaja de hacerlo en este programa es que lo
haces más rápido y con un margen de error mínimo si sigues el procedimiento. Para que
sepas cómo usar las funciones estadísticas de Excel te invitamos a ver el siguiente video:

Excel para media, mediana y moda

En esta ocasión vamos a calcular la media, mediana y moda con la ayuda de


Excel. Como primer paso es importante que tengas listos los datos que vas a
trabajar en una hoja independiente.
Empecemos con la media. Coloca el cursor en la celda donde quieras el
resultado de la media, busca en el menú superior el símbolo de sumatoria y
presiona la flechita que se ve a su derecha para abrir el menú de opciones,
selecciona donde dice promedio.
Observa que en la celda que seleccionaste se lee =PROMEDIO y unos
paréntesis donde se selecciona el rango desde la primera celda que en este
caso es B4, hasta la última que sería B28, le das Enter y automáticamente
tienes el promedio. Para que sepas y te acuerdes que dato es ese, te
recomiendo que en una celda anterior escribas la palabra media. Así sabrás
que este dato corresponde a la media.
Ahora calculemos la mediana, para calcular la mediana usaremos las
funciones, igual que con la media coloca el cursor en la celda donde quieras
que te dé el resultado de la mediana. Busca en el menú superior las funciones,
para saber identificar dice fx, cuando presionas ahí se abre un cuadro de
diálogo donde te va a mostrar las funciones que recientemente se han
ocupado.
Sino encuentras o no está a la vista la que necesitas, aquí vas a teclear la
mediana y le das Enter, das doble clic en mediana y te va aparecer un rango
sugerido para calcular la mediana, borras ese que te sugiere y vas a
seleccionar todos los datos, los que quieres calcular la mediana y das Enter y
listo, ya tienes la mediana. Te sugiero igual que en la media que a un lado le
pongas el nombre de la medida que tenemos, y ya puedes cerrar tu cuadro de
funciones ¡Listo!
Calculemos la moda. Aunque Excel también tiene entre las funciones estadísticas
la moda, no te recomiendo usarlo, porque solo te va a identificar una moda y si tu
muestra es multimodal no vas a conocer los otros valores. Entonces para
identificar la moda en tu muestra te sugiero primero ordenar los datos y buscar
visualmente
22
la moda. Para ordenar los datos seleccionas todos tus datos, buscas en el
menú superior de la A a la Z que te va ordenar los datos.
Generalmente te pregunta que si quiere ampliar la selección, le vamos a decir
que queremos continuar con la selección actual y le dices que los ordene, una
vez que ya los tienes ordenados podemos ver visualmente, más fácilmente
¿Cual dato es el que más veces se repite?, por ejemplo, aquí vemos que el 8
se repite tres veces, el 7.9 tres veces, el 7.5 cuatro veces, pero el 7 se repite
cinco veces; por lo tanto nuestra moda es unimodal y la moda es 7.

Ahora estás listo para calcular e interpretar la media, mediana y moda de tu investigación.
La encuesta que aplicaste y que tienes en tu base de datos, tiene varios reactivos, tú sólo
elegirás los reactivos que estén directamente relacionados con tu hipótesis. Consulta a tu
asesor para confirmar los reactivos que vas a analizar y guarda los resultados en un
archivo de Excel, pues te servirán para integrar el trabajo final de esta unidad. Por el
momento sólo vas a calcular las tres medidas de tendencia central: media, mediana y
moda y también vas a interpretar cada una de los reactivos relacionados con tu hipótesis
de investigación.
Nombra a tu archivo Analisis de datos_tema de investigación_nombre y apellido tuyos.
(sin acentos)

Media ponderada.

A veces nos encontramos con situaciones de evaluación en las que no todos los criterios
tienen el mismo peso, para estos casos se usa la media ponderada.
Un ejemplo que tú conoces es la forma de calificar en la escuela, donde el profesor toma
en cuenta varios aspectos, pero no todos tienen el mismo valor:

En la secundaria Rosario Castellanos la profesora de física les dijo a sus alumnos que
calificaría de la siguiente manera el primer bimestre:

23
Pablo obtuvo las siguientes calificaciones:

24
Pero no sabe cuál será su calificación del bimestre
hasta que calcule el valor de cada factor:

Para obtener la media ponderada solamente se multiplica


cada una de las evaluaciones por la ponderación
correspondiente y se divide entre la suma de las
ponderaciones.

puntuación puntuación obtenida


actor ponderación obtenida multiplicada por la
ponderación
Examen 40 7.5 300
Laboratorio 30 8 240
Tareas 10 10 100
Ejercicios en 10 8 80
clase
Total 10 720

Media ponderada= 720/100=7.2


La calificación de Pablo para el primer bimestre será de 7.2

25
El siguiente bimestre, Pablo estudió más para el examen y se empeñó en las prácticas de
laboratorio porque se dio cuenta que tenían una ponderación más alta, eso es, que valían
más, por hacer los informes de laboratorio no pudo entregar todas la tareas y sus
calificaciones fueron las siguientes, ayúdale a calcular su calificación del segundo
bimestre con un decimal:

factor ponderaciónpuntuación obtenida puntuación obtenida multiplicada


por la ponderación
40 9.1
Examen ________________

Laboratorio 30 10 ________________

Tareas 10 5 ________________

Ejercicios en clase 10 9 ________________

Total 100 ________________

Media ponderada= ________________

Respuestas: 364, 300, 50, 90, 804, 8.04

Es momento de un pequeño reto.

Realiza la actividad en plataforma:


¿Qué tanto aprendí de medidas de tendencia central?

Antes de pasar al siguiente tema contesta el


siguiente cuestionario para identificar el camino a
seguir:

Realiza la actividad en plataforma:


¿Dónde continúo?

26
Medidas de dispersión para datos no agrupados y agrupados
Además de las medidas de tendencia central existen otras medidas que nos ayudan a
describir mejor una muestra. Veamos un ejemplo:

El informe del clima para el 15 de junio de 2017 indicaba que podía esperarse una
temperatura media de 28ºC, con temperatura mínima de 19ºC y una máxima de 37ºC.
Partiendo de esta información ¿Cómo habrías elegido qué ponerte ese día? Observa que
la temperatura media indicaba un clima templado, en tanto que las otras dos eran
extremosas. Como puedes ver, además de la medida central, es importante conocer el
rango en el que se encuentran los datos.

Para conocer las principales medidas de dispersión


veamos el siguiente video:

Medidas de dispersión

Medidas de dispersión
Las medidas de variabilidad o medidas de dispersión como su nombre lo
indica, nos dicen que tan dispersos o separados están los datos de una
muestra. En la primera gráfica podemos observar que los datos se concentran
en un punto por eso se ve alta o picuda, en tanto que en la segunda imagen
se aprecia una gráfica más plana, pero más ancha, porque los datos están más
dispersos.
En esta ocasión estudiaremos tres medidas de dispersión, el rango, la
varianza y la desviación estándar. Empecemos por el rango, también es
conocido como

27
recorrido y se obtiene restando el puntaje más alto al más bajo, retomemos el
ejemplo de las edades de los niños que estaban jugando en el parque, sus
edades eran 6, 6, 7, 7, y 8 años. Ya sabíamos que la edad promedio de los
niños era de 7 años, la mitad de los niños tienen más de 7 años y la otra mitad
menos de 7 años, y la edad más frecuente es también de 7 años.
Si calculamos el rango restando el puntaje más alto al más bajo, tenemos que
8-6=2, esto quiere decir que hay una variabilidad de 2 años de edad entre
niños de menor edad y el de mayor edad. Las ventajas del rango es que es
muy sencillo de calcular y está en la misma unidad de medida que las
variables, las desventajas que tiene es que solo toma en cuenta los datos que
están en los extremos, y no toma en cuenta que tan dispersos están los demás
datos.
La siguiente medida que vamos a estudiar es la varianza. A diferencia del
rango la varianza sí toma en cuenta los valores de todos los datos, para
calcularla se
emplea la siguiente formula: 2 =
∑ ( − ̅ )2
=

−1

Observa que en esta fórmula la varianza está representada por:


2
=Varianza

=Es cada uno de los datos


̅
=Es la media o promedio del conjunto de datos = Es el total de datos o tamaño de la
muestra.

Para calcular la varianza:


1. Es calcular la media, que tú ya conoces y se obtiene sumando todos los
datos y dividiendo el resultado entre el total de datos.
2. El siguiente paso es restar la media a cada dato que en la fórmula vemos como − ̅ .
3. El siguiente paso es elevar al cuadrado cada resultado obtenido en la
resta anterior.
4. Como paso 4 se suman todos los resultados del paso tres.
5. Y finalmente se divide el resultado de la suma del paso cuatro entre el
tamaño de la muestra menos 1.

Ahora veamos un ejemplo: ∑


=
2
( − ̅ )

2=

−1

Calculamos la varianza de las edades de los niños que jugaban en el parque,


las edades son: 6, 6, 7, 7 y 8 años, primero calculamos la media y tenemos
que es 6.8. El paso 2 nos dice que vamos a restar a cada dato la media,
entonces restamos 5-6.8= nos da -0.8, no importa que nos den datos
negativos, tenemos que hacer una resta algebraica. El siguiente dato es 6- 6.8
nos da nuevamente -0.8, el siguiente es 7-6.8 =0.2, 7-6.8= 0.2 y finalmente 8-
6.8= 1.2.

28
Como tercer paso vamos a elevar al cuadrado el resultado de las restas
anteriores, por eso no importa el haber tenido resultados negativos porque al
elevarlo al cuadrado van a quedar como positivos, entonces el 0.8 que es el
resultado de la primera resta lo elevamos al cuadrado y nos da 0.64, el
siguiente -0.8 al cuadrado también nos da 0.64, luego 0.2 al cuadrado, nos da
0.04 y 1.2 al cuadrado nos da 1.44.
El paso cuatro es sumar los resultados obtenidos en el paso anterior, por lo
que sumamos 0.64+0.64+0.04+1.44= 2.76. Se divide el resultado de la suma
del paso 4 entre el tamaño de la muestra menos 1, esto es: 2.76/5-1, que sería
2.76/4 y nos da como resultado 0.69, por lo que la varianza es 0.69.
La desventaja de la varianza es que esta expresada en las unidades de la
variable al cuadrado, por lo que en nuestro ejemplo sería en metros cuadrados
y eso dificulta la interpretación. Las ventajas que tiene es que toma en cuenta
todos los valores de la muestra y además es un paso previo para calcular la
desviación estándar que es otra medida de dispersión. Ahora veamos la
desviación estándar
La desviación estándar es una de las medidas más usadas para medir la
variabilidad de la distribución y muestra la dispersión de los puntajes respecto
de la media. Se obtiene sacando la raíz cuadrada de la varianza que ya
habíamos calculado anteriormente. Retomemos nuestro ejemplo de la edad de
los niños que juegan en el parque, ya sabemos que la varianza es de 0.69, por
lo que para calcular la desviación estándar solo le sacamos raíz cuadrada a la
varianza y entonces tenemos que la desviación estándar es de 0.83066.
Como propiedades de la desviación estándar podemos ver que si su valor es 0,
significa que todos los datos son el mismo número, si su valor es pequeño
significa que los datos son muy cercanos o parecidos entre sí, y si su valor es
grande quiere decir que hay grandes variaciones entre los datos; por lo tanto
en nuestro ejemplo podemos ver que la desviación estándar es pequeña, por
lo que las edades de los niños son muy similares entre sí.
La desviación estándar nos dice el promedio de alejamiento de los datos
respecto de la media, tiene la ventaja de que esta expresada en las mismas
unidades de medida de la variable, esto se convierte en desventaja cuando se
quiere comparar dispersiones de datos con diferentes unidades de medida.

¿Qué te parece si pones en práctica lo aprendido


sobre las medidas de dispersión?

29
La Dirección de una escuela primaria aplicó un examen de lectura de comprensión a una
muestra de alumnos de los dos grupos de 6º grado. Los resultados obtenidos fueron los
siguientes, medidos en aciertos:
70, 52, 44, 83, 101, 65, 66, 87, 59, 78, 83, 49, 85, 92

1. El rango de variación fue de:

a. 57 aciertos
b. 50 aciertos
c. 65 aciertos
d. 87 aciertos

2. La desviación estándar fue de:

a. 17.27
b. 44
c. 21.1
d. 12.8

3. El resultado obtenido de la desviación estándar indica lo siguiente:

a. Hay una gran dispersión de los datos


b. Los datos se concentran en el centro
c. Los datos se concentran en el extremo inferior
d. Los datos son extremosos

Después de tener los resultados, preguntó a las profesoras y se dio cuenta que
cada una empleaba un método distinto, por lo que decidió comparar los grupos:

6º A 6º B
51 44
59 49
66 65
70 83
78 83
85 92
87 101
4. Los dos grupos tienen la misma media

a. Verdadero
b. Falso

30
5. La puntuación con mayor frecuencia en ambos grupos fue 83

a. Verdadero
b. Falso

6. La desviación estándar de los grupos indica lo siguiente:

a. La desviación estándar del 6º A fue de 13.11 y en el 6º B fue de 21.68, lo


que indica que hay mayor dispersión en el 6º B.
b. La desviación estándar del 6º A fue de 21.13 y en el 6º B fue de 19.08, lo
que indica que hay mayor dispersión en el 6º B.
c. La desviación estándar del 6º A fue de 9.33 y en el 6º B fue de 15.42, lo
que indica que hay mayor dispersión en el 6º A.
d. La desviación estándar del 6º A fue de 35.61 y en el 6º B fue de 24.07, lo
que indica que hay mayor dispersión en el 6º A.

Respuestas: a, a, a, a, a, a

Al igual que las medidas de tendencia central,


también puedes calcular la desviación estándar
usando Excel, ¿te interesa saber cómo? Revisa la
siguiente información:

¿Cómo calcular la desviación estándar en excel?

Para calcular la desviación estándar primero colocas tu cursor en la celda que


quieres que aparezca el resultado, después buscas en el menú superior el
ícono fx, presionas y se va a abrir el cuadro de diálogo, te va a pedir que
busques una función y ponemos la abreviatura de desviación estándar.
Seleccionas la desviación estándar, generalmente ocupamos la primera, en
este caso vamos a abrir esta que es DESVEST.S que calcula la desviación
estándar de una muestra.
Y te va a pedir que le marques el rango de números, seleccionamos nuestros
datos y le damos Enter, automáticamente tenemos el valor de la desviación
estándar, como en ocasiones anteriores no olvides escribir a un lado de qué
medida se trata.

31
Ahora que ya conoces el tema de las medidas de dispersión puedes continuar haciendo
el análisis estadístico de los reactivos de tu investigación, calculando e interpretando la
desviación estándar y rango. Recuerda que sólo trabajarás los reactivos que están
directamente relacionados con tu hipótesis.
Guarda tu información en el archivo que nombraste Analisis de datos_tema de
investigación_nombre y apellido tuyos. (sin acentos) para la entrega del trabajo final de
la unidad.
En los ejemplos que hemos visto hasta este momento hemos trabajado con pocos datos,
gracias a ello hemos podido calcular tanto las medidas de tendencia central como las de
dispersión de manera directa. Sin embargo esto casi nunca ocurre, la mayor parte del
tiempo se maneja una gran cantidad de datos, ya que entre más grande es la muestra
más representa a la población y se pueden formular generalizaciones más certeras sobre
el comportamiento de la población en su conjunto.
Cuando tenemos una base de datos grande se busca cómo agrupar la información para
que se manejable, y ello se logra con dos tipos de herramientas: las distribuciones de
frecuencias (simples y agrupadas) y las representaciones gráficas.
Todos los datos que ya tenemos, así como los indicadores estadísticos (medidas de
tendencia central y medidas de dispersión) los podemos interpretar mejor si se muestran
visualmente, eso lo podemos hacer mediante diferentes tipos de gráfica:

32
3
3
Para graficar se hace a partir de tablas de datos que concentran las diferentes respuestas
y el número de veces que se repiten, o sea, su frecuencia. Empecemos haciendo las
tablas de frecuencias simples.

¡Aprendamos a graficar!

¿Cómo gratificar en Excel?

En esta ocasión vamos a aprender a graficar con Excel. La gráfica de barras es


la manera más usual de presentar una distribución de frecuencias. Para
hacerla en Excel necesitas capturar tus datos en una tabla de frecuencia
simple, como esta que tenemos aquí a la izquierda.
En la primera columna vas a colocar los valores que corresponden a la variable
independiente, y en la segunda columna la frecuencia o cantidad de veces que
se repiten y que corresponden a la variable dependiente. Vemos que nuestro
ejemplo, tenemos como variable independiente las mascotas que prefieren los
adultos solteros mayores de 30 años, y que por cierto es una variable nominal,
son perros, gatos, pajaritos, peces, hámsters, ninguno u otro, y como variable
dependiente tenemos la frecuencia con que eligen cada opción.
Par graficar es muy sencillo, primero selecciona todos los datos que quieres
graficar, cuida de incluir el encabezado ya que al hacerlo esto aparece como el
título del gráfico, una vez que hayas seleccionado los datos, busca en el menú
superior donde dice insertar, y veras que te muestra diferentes tipos de
gráficos, aquí están los tipos de gráficos, en este caso vamos a seleccionar el
ícono de barras verticales, que aquí le llaman columnas, y entonces cuando le
das clic te van a aparecer varios tipos de graficas de barras, en este caso yo
seleccionaré una en tercera dimensión y de inmediato se crea la gráfica.
Observa que en el menú superior te ofrece varios estilos de diseño para tu
gráfica, por lo que puedes probar con varios según tu prefieras, lo que sí es
importante considerar es que tu gráfica tenga un título, aquí al seleccionar el
rubro de la columna aparecerá automáticamente el título “mascotas que
prefieren adultos mayores de 30 años”, también es importante lo que
representa cada barra y cuanto es lo que representa cada una, para ello coloca
el cursor sobre una columna y presiona el lado derecho del mouse y verás que
sale un cuadro de diálogo, selecciona el que dice agregar etiquetas de datos y
tu gráfica está lista. Ya tienes lo que representa cada barra y su frecuencia.

34
Como vemos que la gráfica quedó pequeñita porque aquí aparece un cuadro,
le podemos dar clic normal y le damos suprimir y entonces ya tenemos el
título y se ven más grandes las barras. Tu gráfica de barras esta lista.
Ahora veamos otro ejemplo, pero ahora con datos cuantitativos, al igual como en
el ejemplo anterior necesitamos una tabla de frecuencias que tenemos aquí a la
izquierda. Para este ejemplo vamos a utilizar las estaturas medidas en metros de
los alumnos de preparatoria, la variable independiente son las estaturas que van
de 1.67m hasta 1.75m, en este caso ya los tenemos ordenados de menor a mayor,
y la variable dependiente es la frecuencia o la cantidad de veces que se repite la
estatura. Igual que en el ejemplo anterior, primero vamos a seleccionar los datos y
después en el menú superior vamos a seleccionar insertar gráfica, y entonces
vamos a seleccionar el tipo de gráfica, nuevamente elegimos el de columna, ahora
voy a elegir un cilindro agrupado, tu puedes elegir de las opciones el que te
agrade más, aparece ya con el título, damos clic derecho sobre una columna y
ponemos agregar etiqueta de datos, para que nos aparezca la frecuencia arriba de
cada columna, y ya quedó lista nuestra gráfica.
Ahora realicemos una gráfica de pastel también conocido como diagrama
circular, igual que los casos anteriores necesitas una tabla de frecuencias
simples. En este ejemplo graficaremos el porcentaje de cada género de los
alumnos de una escuela de bachillerato, observa que la tabla de frecuencia
simple tiene datos absolutos, no los porcentajes que son los que se necesitan
en un diagrama circular, ya que en este tipo de gráfico representa
proporciones por lo que necesitas la frecuencia relativa o porcentaje. En este
caso no lo vamos a calcular porque Excel lo hace de manera automática.
Para hacer la gráfica seleccionamos los datos que vamos a graficar y
presionamos menú superior donde dice insertar, seleccionas la gráfica que
aquí vamos a seleccionar la circular, voy a elegir una circular en 3D y tenemos
el pastel o gráfica circular, le doy clic derecho sobre una proporción del pastel
y ahí agrego la etiqueta de datos, aquí me están apareciendo las frecuencias
absolutas que son las mismas que tenemos en nuestra tabla de frecuencias
simples, si quiero cambiar por porcentajes, aquí observa que aparecen
diferentes tipos de diseño y elijo este que tiene los porcentajes y ya aparece
con porcentajes, nuestra grafica quedó lista.

Ahora que ya sabes cómo hacer las gráficas de barras y circulares, te invito a poner en
práctica lo aprendido, haciendo las gráficas correspondientes para tu trabajo de
investigación. Puedes hacer las gráficas y escribir a un lado la descripción que ya hiciste
al

35
calcular las medidas de tendencia central y de dispersión. Al observar la gráfica tendrá
más sentido la descripción que haces y también será más visible cómo se distribuyen las
respuestas entre todas las opciones de respuesta.
Comparte con tus compañeros en el foro gráficas alguna de las gráficas que hiciste y la
interpretación que haces de la misma incluyendo los datos de la media, mediana, moda y
desviación estándar. Después regresa para comentar al menos dos gráficas de otros
compañeros. Al compartir opiniones se enriquecerá tu trabajo.

Ingresa al foro:
Gráficas

Datos agrupados

Hasta este momento hemos tenido ejemplos con pocos datos, fáciles de manejar, donde
las opciones de respuesta no han sido más de 10, pero no siempre es así. Sobre todo
cuando las variables que se investigan son continuas y la muestra es grande es frecuente
que las opciones de respuesta sean muchas y con muchos datos, lo cual dificulta su
manejo.
Veamos el ejemplo de los gastos hormiga de una pareja en un mes. Esta pareja se ha
percatado de que tenían muchos gastos que no estaban contemplados entre los gastos
normales y quieren saber qué tanto impacto tiene en su economía. Para ello hicieron un
registro de gastos hormiga en una quincena, entre los gastos registraron propinas,
dulces, chucherías, antojos, estacionamientos y otros gastos imprevistos. El registro de
gastos hormiga quedó como sigue:

Tomada para fines educativos de:


http://blog.ods.com.mx/wp-content/uploads/2014/06/1406-02-GastosHormiga.jpg

36
1 5 15 25 42 5 5 5 3 10
22 3 3 3 10 12 18 25 4 3
38 16 23 5 5 5 5 5 5 4
5 10 10 12 8 8 24 45 45 18
3 6 12 10 10 22 17 10 3 3

En estos datos pues observar que n=50 y las opciones


de respuesta son más de 10, pues el rango va de 3 a 45

Cuando tenemos más de 10 opciones de respuesta se trabaja en una


distribución de frecuencias agrupadas, que es una tabla que agrupa los datos
en clases. Cuando se agrupan datos:

No puede haber menos de 5 clases


Ni más de 20
Todos los intervalos deben tener la misma amplitud

37
Una distribución de frecuencias agrupadas permite ver los comportamientos y tendencias
de una manera más compacta al agrupar los datos individuales en categorías llamadas
clases. Para hacer una distribución de este tipo se trabaja en una tabla de frecuencias
agrupadas, la cual permite después calcular las medidas de tendencia central, de
dispersión y también graficar. Para que sepas cómo hacer una tabla de frecuencias
agrupadas observa la siguiente información:

Tabla de frecuencias agrupadas

En esta ocasión aprenderemos a hacer una tabla de frecuencias agrupadas.


Como primer paso ordena los datos de menor a mayor, esto nos va ayudar a
calcular el rango, pues sabemos que el rango se obtiene restando al valor
máximo, el valor mínimo. Entonces si nuestro valor máximo es 45 y se resta el
valor mínimo que es 3 y tenemos un rango de 42.
El siguiente paso es obtener las clases. Cuando tenemos menos de 125 datos se usa la
siguiente fórmula que es la √ . Sabemos que n= 50 porque tenemos 50 datos,
entonces sacamos la raíz cuadrada de n, en este caso la vamos obtener con nuestras
funciones estadísticas, le damos clic en fx y luego buscamos la raíz, al darle clic en la
raíz nos pregunta ¿De qué número?, le decimos que de 50 y nos va arrojar una raíz de
7.07, como las clases siempre tienen que estar en números enteros, sabremos que
tenemos 7 clases.
El tercer paso, es saber el ancho de clase, esto es ¿cuántos datos van en cada
clase?, todas las clases deben tener el mismo ancho y no pueden
superponerse, de manera que cada dato debe caer dentro de una clase
exclusivamente, el ancho de clase lo vamos a obtener dividiendo el rango
entre el número de clase. Entonces aquí sabemos que tenemos un rango de
42, tenemos 7 clases y el ancho de clases, dividimos 42 entre 7 y nos va a dar
un ancho de clase de 6.
A continuación estableceremos los límites de intervalos, por lo que la primera
clase empieza con 3, son los datos que tenemos y le vamos a sumar 6 que es
el ancho de clase, nos va a dar 9. 3+6= 9. La segunda clase va empezar con
10, porque no se puede sobreponer con la anterior y le agregamos el ancho de
clase que es 6, lo que nos da un límite superior de 16. La tercera clase iniciaría
con el 17, que es el que le sigue al 16, le sumamos 6 del ancho de clase y el
límite superior sería 23. Y sucesivamente formamos las 7 clases.
Ahora que ya conocemos cuantas clases tenemos y su límite inferior y límite
superior, vamos a calcular la marca de clase, la marca de clase es el valor central
de cada intervalo y se utiliza como su valor representativo, especialmente cuando
se calcula la media y la desviación estándar en las distribuciones agrupadas. Para
calcular la marca de clase solo hay que sumar el límite superior, que en este caso
es 3 + el límite inferior y el resultado lo dividimos entre 2, hacemos los mismo con
los siguientes renglones o clases, sumamos el límite inferior + el límite superior y
el

38
resultado lo dividimos entre dos, ya sea que hagas uno por uno, o puedes
copiar la fórmula jalándola, ¡Listo, tenemos las marcas de clase!
El siguiente paso es obtener las frecuencias absolutas, esto es contaremos
cuantos valores caen dentro de los límites de cada clase, para la primera clase
contaremos cuantos saltos están entre el 3 y el 9, que son los límites.
Entonces los contamos entre el primer dato que es el 3 y el 9 y vemos que son
25. Para la siguiente clase, que es la clase 2, vemos cuantos datos hay entre el
10 y el 16, nos vamos aquí donde está el 10, yo ya los tengo numerados y
entre el 10 y el 16 hay 12 datos; por lo tanto la frecuencia absoluta en la clase
2, son 12.
La tercera clase son los datos que están entre el 17 y 23, aquí tenemos entre
el 17 y el 23 son 6 datos. La clase cuatro son los datos que están entre el 24 y
30, solamente son tres datos como podemos ver aquí, la clase cinco son los
datos que están entre el 31 y 37, y observamos que no hay ninguno, por lo
tanto la frecuencia es 0. La clase seis son los datos que están entre 38 y 44,
tenemos que son 2. Y finalmente los datos que están entre el 45 y 51 que
serían 2 los que nos quedan. ¡Listo!
Para verificar que hayamos incluido a todos los datos y que no nos hayamos equivocado
vamos a hacer una sumatoria, al final de la columna de la frecuencia absoluta vamos a
sumar todos los datos, lo puedes hacer buscando en el menú superior, la letra ∑ que indica
sumatoria, te va a señalar que es todo lo que estas sumando y tendremos 50 ¡correcto!
Como nuestra muestra es de 50 datos, quiere decir que sumamos a todos nuestros datos.
Con esto ya tenemos las frecuencias absolutas de cada clase, ahora vamos a
calcular la frecuencia relativa. Esta frecuencia tiene la ventaja de ser
adimensional y expresa los resultados como parte proporcional de un entero y
se expresa en porcentaje, que se obtiene por medio de una regla de tres, esto
es que vamos a multiplicar cada frecuencia absoluta por 100, en este caso
multiplicamos 25 por 100 y el resultado lo vamos a dividir entre el total de
datos que es 50, y tenemos su frecuencia relativa, esto nos da una frecuencia
del 50%.
Hacemos lo mismo con las demás clases, ya sea insertando la fórmula de manera manual o
igual la copiamos colocando el cursor en la esquinita del ángulo inferior derecho. Y para
comprobar que estemos en lo correcto, igual que la frecuencia absoluta vamos a poner
aquí una sumatoria, buscamos la letra ∑ en el menú superior, nos indica de donde a donde
está seleccionando para hacer la suma y nos dio el 100%, esto quiere decir que vamos
bien.
Finalmente para terminar la tabla de frecuencias agrupadas vamos a calcular la
frecuencia relativa acumulada, el término acumulado significa que suma la
frecuencia del nivel en el que está con los que le anteceden, los que están arriba,
de esta forma la frecuencia para la primera clase sería 50, porque esa es la
frecuencia relativa, se queda en su renglón, la frecuencia relativa acumulada se
obtendría sumando la frecuencia del renglón + la que le antecede, lo cual nos da
un 74, la tercer frecuencia vamos a hacer lo mismo, vamos a sumar la frecuencia
del renglón en el que está + las que le anteceden, seguimos el mismo
procedimiento para cada una de las clases. Observa que en la última te va a dar el
100, porque es la suma de todas las frecuencias relativas acumuladas, con esto

39
tenemos lista nuestra tabla de frecuencias agrupadas, esta nos será muy útil,
pues con ella podemos realizar más gráfica y otros cálculos que con una base
de datos muy grande se nos dificultarían mucho.

Ahora que ya tenemos la tabla de frecuencias acumuladas podemos graficar los


resultados de la misma forma que hicimos con los datos sin agrupar.

Para hacer la gráfica de barras retomamos la frecuencia


absoluta:

Y para el diagrama de pastel retomamos la columna


de la frecuencia relativa:

40
La tabla de frecuencias agrupadas no sólo nos sirve para graficar, sino también para
calcular las medidas de tendencia central y de dispersión para datos agrupados.
En la distribución de frecuencias agrupadas se acostumbra usar la tabla de frecuencias
para calcular las tres medidas de tendencia central: media, mediana y la moda.
La fórmula para calcular la media o promedio de los datos agrupados es la siguiente:

Donde Xi es la marca de clase


fi es la frecuencia
n es el total de datos o tamaño de la muestra

41
Retomando la marca de clase y la frecuencia absoluta que ya vimos en el video de las
tablas de frecuencias agrupadas podemos calcular la media.

Clases Marca de Frec. Absoluta fi xifi


clase Xi
1 6 25 6 * 25 = 150
2 13 12 13 * 12= 156
3 20 6 20 * 6 = 120
4 27 3 27 * 3 = 81
5 34 0 34 * 0 = 0
6 41 2 41 * 2 = 82
7 48 2 48 * 2 = 96
∑ = 685

Sustituyendo los datos en la fórmula tenemos lo siguiente:

Esto significa que los gastos hormiga promedio son de


13.7 pesos en una quincena.

Para calcular la mediana lo primero que se necesita es determinar el intervalo o clase (j)
en que se encuentra, recuerda que la mediana es el dato que está justo a la mitad.
Como sabemos que nuestra muestra tiene 50 datos, entonces la mitad está entre los
datos 25 y 26, por lo que buscamos en la tabla de frecuencias agrupadas en qué clase
está, como justo está entre dos clases los promediamos y quedaría en el lugar 26, lo que
corresponde a la clase 2:

42
Clases Frec. Absoluta fi
1 25
2 12
3 6
4 3
5 0
6 2
7 2

Observa que como la primera clase tiene 25 datos, el


dato 26 estaría en la segunda clase.

Esto quiere decir que vamos a trabajar con la primera clase.

La fórmula de la mediana para datos agrupados es la siguiente:

Donde:
Li es el límite inferior de la clase donde se encuentra la
mediana.
N es el tamaño de la muestra
Fi-1 es la frecuencia acumulada anterior a la clase donde
está la mediana.
fi es la frecuencia absoluta de la clase donde está la
mediana.
a es la amplitud de la clase donde está la mediana

43
Sustituyendo la fórmula tenemos lo siguiente:

Clases Intervalo de valores Frec. Absoluta


Límite inferior Límite superior
1 3 9 25
2 10 16 12

Mediana= 10

Esto se interpreta como que la mitad de los gastos hormigas son menores a 10 pesos y la
otra mitad son mayores a esta cantidad, lo cual puede parecer no oneroso para la
familia.

Sigamos con el ejemplo de los gastos hormiga para calcular la moda para datos agrupados.
La fórmula es la siguiente:

44
Donde:
k es la clase donde se encuentra la moda
(L inf) k es el límite inferior donde se encuentra la moda d1 es la diferencia entre la
frecuencia de la clase que tiene a la moda y la frecuencia de la clase que le antecede.
d2 es la diferencia de la clase que tiene a la moda
menos la frecuencia de la clase que le sigue.
a es el ancho de clase donde está la moda.

En el caso de la moda es muy sencillo saber en qué clase se encuentra, pues basta con
ver la frecuencia absoluta. En nuestro ejemplo vemos que la moda está en la primera
clase.

Clases Intervalo de valores Frec. Absoluta


Límite inferior Límite
superior
1 3 9 25
2 10 16 12
3 17 23 6
4 24 30 3
5 31 37 0
6 38 44 2
7 45 51 2

Por lo cual podemos sustituir los valores en la fórmula:

45
Por lo tanto la moda sería 6

Retomando las medidas de tendencia central, se puede apreciar en la gráfica de barras


que el promedio de gastos es de 13.7 pesos, la mitad de los gastos son menores a 10
pesos y lo más frecuente es que se gaste en cosas con valor de 6 pesos, lo cual hace que
muchas veces no se perciban estas salidas y pueden ser en su mayoría propinas
menores.

Tomada para fines educativos de:


http://images.freeimages.com/images/previews/8e9/polish-money-2-1558389.jpg

46
Ahora que ya calculamos las medidas de tendencia central para datos agrupados
calculemos la desviación estándar para estos datos:
Igual que en los datos sin agrupar, la desviación estándar se calcula sacando raíz
cuadrada a la varianza, así que comencemos con la fórmula de la varianza:

Estos símbolos ya los conoces, pues son los mismos que utilizamos para calcular las
medidas de tendencia central:

Donde:
∑ x2i fi indica que se eleva al cuadrado la marca de
clase de un intervalo y después se multiplica por su
frecuencia, esto se hace con cada una de las clases de
la distribución y se suman.

(∑ xi fi )2 indica que se multiplica cada marca de clase


por su frecuencia y luego se suman todos los productos.

∑fi es la suma de todas las frecuencias, o lo que es lo


mismo, el total de datos N.

Para calcular la varianza utilizaremos la misma tabla de frecuencias de nuestros datos


sobre los gastos hormiga.

Clases Marca de clase Xi Xi2 Frec. Absoluta fi xifi X2fi


1 6 36 25 150 900
2 13 169 12 156 2028
3 20 400 6 120 2400
4 27 729 3 81 2187
5 34 1156 0 0 0
6 41 1681 2 82 3362
7 48 2304 2 96 4608
∑ 50 685 15485

47
Y una vez que tenemos la varianza para calcular la desviación estándar se saca raíz
cuadrada a este resultado

Desviación estándar = √ 124.5 = 11.15

Con el valor de la desviación estándar podemos decir que los gastos hormiga son muy
dispersos, pues hay gastos muy pequeños y otros que no lo son tanto, pero todos son
gastos que no están contemplados ni programados. Esto también lo corroboramos al
calcular el rango, ya que los gastos van de 3 a 45 pesos, lo que nos da un rango bastante
amplio, de 42 pesos.

Tomada para fines educativos de:


http://www.noticierosgrem.com.mx/wp-content/uploads/2015/09/gasto-hormiga.jpg

A continuación te invitamos a aplicar lo aprendido calculando las medidas de tendencia


central y de dispersión de 30 empleados generales de una empresa de logística.
Completa la tabla como apoyo para calcular las medidas solicitadas. (usa todos los
decimales para hacer los cálculos y en el resultado final redondea a dos decimales)

48
Clases Límite Límite Frec. Absoluta Marca de clase Xi Xifi
inferior superior fi

1 600 740 8 __________ __________

2 741 881 3 __________ __________

3 882 1022 4 __________ __________

4 1023 1163 2 __________ __________

5 1164 1304 13 __________ __________

∑ = 30

Ancho de clase = __________


Rango = __________
X = __________
Mediana = __________
Moda = __________

Resultados: 670, 5360, 811, 2433, 952, 3808, 1093, 2186, 1234, 16042, 141, 704, 994.3, 1023, 1228.57

Es momento de un pequeño reto.

Realiza la actividad en plataforma:


¿Qué tanto aprendí de medidas de dispersión?

Ya casi llegamos al final de la unidad, responde las


siguientes preguntas para determinar el camino a seguir:

49
Realiza la actividad en plataforma:
¿Dónde continúo?

Medidas de posición para datos no agrupados


El Instituto Nacional de Estadística, Geografía e Informática (INEGI), en colaboración con otras
instituciones nacionales de salud, realizan cada 6 años la Encuesta Nacional de Adicciones
para conocer la dimensión de 3 problemas de salud pública que requieren atención
prioritaria: el tabaquismo, el alcoholismo y la fármaco dependencia. Esta encuesta se realiza
a nivel nacional a personas de 12 a 65 años con el objetivo de definir las estrategias de
acción y el diseño y ejecución de acciones específicas para apoyar su prevención y atención.

A continuación se muestra la respuesta que dieron 50 personas en una encuesta sobre


tabaquismo, la pregunta era a qué edad probaron el cigarro por primera vez. Calcula
media, mediana, moda y desviación estándar. Para que te sea más práctico realizar los
cálculos, abre el siguiente archivo de Excel, recuerda que puedes usar las funciones
estadísticas:

Descarga el archivo Excel:

50
Sólo usa dos números decimales.

Media = ________

Mediana = ________

Moda = ________

desv std = ________

Respuestas: 18, 17, 16, 5.48

Como recordarás, la mediana es el valor central de los datos ordenados y eso significa
que el 50% de los datos son menores o iguales que la mediana y el otro 50% son
mayores.
La mediana además de ser una medida de tendencia central, también es una medida de
posición porque tiene un valor específico en relación con el resto de los demás datos
ordenados. Las medidas de posición son los cuartiles, deciles y percentiles.

51
Para que comprendas mejor las medidas de posición, te invitamos a
ver la siguiente información de Gabriel Leandro, donde retomaremos
las medidas de tendencia central y también los cuartiles.

Medidas de posición

Vamos a hablar de varios conceptos de estadísticas básica, específicamente


hablaremos de las medidas de posición y de variabilidad. En esta lección
vamos a usar de ejemplos las estaturas de varios jugadores de futbol y
jugadores de basquetbol también, vamos a mostrar aquí un conjunto de 8
jugadores y sus respectivas estaturas. Empezamos con el brasileño Cacá que
mide 1.83m, el argentino Tevés que mide 1.73m, el español Villa que mide
1.75m, el argentino Messi que mide 1.69m, el sueco Zatlan que mide 1.94m,
Cristiano Ronaldo que mide 1.83m, Ronaldiño que mide 1.81m y el inglés
Crouch que mide 2.01m.
También tenemos aquí la estatura de varios jugadores de basquetbol Bryant
que mide 2.01m, el español Gassol que mide 2.15m, James que mide 1.90m, el
chino Jao Ming que mide 2.28m, Cris Pool que mide 1.83m y Shakille O´Neal
que mide 2.15m. Entonces aquí tenemos dos conjuntos de datos, ¿Cuál es la
finalidad que persigue la estadística cuando tiene un conjunto de datos?
Bueno, queremos describir conjuntos de datos, queremos entonces decir como
son estos datos y para eso podemos emplear medidas de posición y podemos
emplear medidas de variabilidad, entre otros tipos de medida, pero en este
caso vamos a concentrarnos básicamente en los conceptos de las medidas de
posición y variabilidad, en realidad no vamos a meternos en esta lección en la
parte del cálculo, sino que vamos a ir básicamente a los conceptos.
Entonces vamos a tomar nuestros conjuntos de datos para mostrar los que se
llaman medidas de posición central. Estas medidas de posición central son
medidas que cuando el conjunto de datos se ordena de menor a mayor, estos
valores tienden a estar en el centro del conjunto de datos, entonces vamos a
ver una primera medida de posición central o de tendencia central que se
llama la Moda.
La Moda es simplemente el dato más frecuente, o sea, el dato que más se
repite, en este caso tenemos entonces que 1.83 es el dato que más se repite,
entonces la moda es de 1.83 cm, veámoslo en el conjunto que tenemos de
basquetbolistas

52
vamos a buscar también cual es el dato que más se repite, en este caso
entonces tenemos que la moda, este dato más frecuente, es de 2.15m.
Pero también tenemos otras medidas de posición central, una muy conocida se
llama: la mediana, para calcular la mediana tenemos que tener ordenado el
conjunto de datos de menor a mayor, la mediana es un valor tal que la mitad
de los datos son menores que la mediana, y la otra mitad de los datos son
mayores que la mediana, o sea que la mediana es un valor que nos divide el
conjunto de datos en dos, veamos que en este caso esta mediana es de 1.82,
tenemos que la mitad de los valores son inferiores a 1.82 y la otra mitad de los
datos son superiores a 1.82.
Veamos con nuestro conjunto de estaturas de basquetbolistas, lo primero que
tenemos que hacer para calcular la mediana, entonces, es ordenar el conjunto
de datos de menor a mayor, y entonces vamos a buscar un valor tal que la
mitad de los datos sean menores que ese valor y la otra mitad sean mayores.
Y observamos que ese valor tiene que estar entre 2.01m y 2.15m, en este
caso entonces lo que hacemos es sacar el punto medio entre 2.01 y 2.15, que
en este caso sería de 2.08, tenemos que la mitad de los datos son inferiores a
2.08 y la otra mitad de los datos son superiores a 2.08.
Ahora vamos a hablar de la más conocida de las medidas de posición central,
esta medida se llama la media o el promedio, y consiste simplemente en la
suma de todos los datos dividido entre el conjunto total de datos, entonces
vamos a sumar 1.83+1.73+1.75 hasta el último de los datos que es 2.01, esa
suma nos da 14.59, esto lo dividimos entre 8. Y eso nos va a dar el promedio
que en este caso es de 1.82, decimos que los jugadores de este conjunto
tienen una estatura promedio de 1.82m.
Hagamos el mismo cálculo pero con los jugadores de basquetbol, tenemos
entonces aquí nuestro conjunto que en este caso está compuesto por 6 datos
y vamos a calcular entonces la suma de 2.01+2.15+1.90+2.28+1.83+2.15=
12.32, lo cual lo dividimos entre 6, es decir, nos va a dar 2.05, la estatura
promedio de este conjunto de jugadores de basquetbol es de 2.05m.
Ahora, no todas las medidas de posición son medidas de posición central, hay
algunas que no son medidas de posición, para calcular estas medidas de
posición también tenemos que tener ordenado el conjunto de datos de menor
a mayor, entonces también vamos a mencionar una medida importante, se
refiere a los cuartiles, los cuartiles dividen el conjunto de datos en cuatro
partes, veamos que aquí este conjunto de datos que está ordenado de menor
a mayor lo hemos dividido en cuatro partes, entonces aquí vamos a tener el
primer valor que lo llamamos el primer cuartil, un segundo valor que es el
segundo cuartil que

53
observemos bien que coincide con la mediana, y un tercer valor que lo
llamamos el tercer cuartil.
Hablemos entonces del primer cuartil, partimos de nuestro conjunto de datos
ordenado de menor a mayor, y entonces como es un cuartil nos divide el
conjunto de datos en cuartas partes, el primer cuartil es un valor tal que la
cuarta parte de los datos son menores que este valor, y las restantes tres
cuartas partes de los datos son mayores, en este caso nosotros tenemos que
este primer cuartil va a ser 1.74, observemos que dos jugadores, o sea, la
cuarta parte total de los 8 jugadores que tenemos en este conjunto de datos
miden menos de 1.74 y las restantes tres cuartas partes miden más de 1.74m.
Ahora vamos a hablar del tercer cuartil, nuevamente tomamos nuestro
conjunto de jugadores y vamos a tener entonces un valor que tres cuartas
partes de los datos son menores que él y una cuarta parte de los datos son
mayores, observemos entonces la posición donde está el tercer cuartil 1.89
sería el tercer cuartil, tres cuartas partes de los datos miden menos de 1.89 y
una cuarta parte de los datos es mayor de 1.89m.
Entonces veamos que teníamos unos conjuntos de datos y el objetivo era
describir este conjunto de datos, en este caso hemos empleado medidas de
posición para describir este conjunto de datos, y entonces observemos que
para el conjunto de futbolistas y basquetbolistas hemos calculado su moda y
observamos que la moda de los basquetbolistas es mucho más alta que la de
los futbolistas, nos indicaría que los basquetbolistas tienen una estatura
mayor.
La mediana también, nos refuerza la misma conclusión de que lo
basquetbolistas tienen estaturas mayores, lo mismo observamos con el
promedio e igualmente tenemos el primer cuartil y el tercer cuartil, podemos
observar en este caso que el primer cuartil de los basquetbolistas es mayor
que el tercer cuartil que los futbolistas, lo cual nos refuerza la tendencia de
que la mayoría de los basquetbolistas tienen estaturas más altas que la de los
futbolistas.

54
Como pudiste apreciar en la información, cada cuartil representa una cuarta parte del
total de datos que tenemos, por lo que representan los siguientes porcentajes:

Para visualiza los cuartiles.

7 Q1
10 Primer cuartil
11 = 25% de la
11 muestra
12 Q2
12 Segundo cuartil
12
= 50% de
13
la
muestra
13
Q3
14
Tercer cuartil
14
= 75% de
15
la
15 muestra
15

15

15

16

16

16

16

16

17

17

17

17

17

18

18

18

18

19

19

19

20

23

23

24

25

25

32

5
5
Ahora que ya sabes cómo calcular los cuartiles vamos a interpretarlos. En nuestra
muestra de la edad a la que empezaron a fumar, tenemos los siguientes cuartiles:

Q1= 14 años.
Significa que 25% de los encuestados empezaron
a fumar antes de los 14 años, por lo tanto, el 75%
restante empezó a fumar después de los 14 años.

Q2= 16 años.
Significa que 50% de los encuestados empezaron
a fumar antes de los 16 años, y el otro 50%
empezó después de esa edad.

Q3= 18 años.
Significa que 75% de los encuestados empezó a
fumar antes de los 18 años, por lo tanto, el 25%
restante empezó a fumar después de los 18 años,
ya siendo mayores de edad.

Esto puede parecer alarmante, pues la mayoría empieza a fumar antes de ser mayor de
edad, y si calculamos de desviación estándar vemos que es de 5.4 años, lo cual
muestra una variabilidad grande, porque hay quien empezó a fumar muy chico o ya
siendo adulto.

Por eso ahora pondremos atención en la parte central de la muestra, esto es las dos
cuartas partes de en medio, que es el Rango intercuartil y abarca desde el primer
cuartil y hasta el tercer cuartil. El Rango intercuartil es importante porque se refiere a la
parte central de la muestra, quitando las respuestas extremas.

56
7
10
11
11
12
12 ¿Y esto se puede representar en una gráfica?
12 ¡Por supuesto!
13 Para eso se utiliza la gráfica de ojiva
13
14 ascendente,
14 que es como ésta:
15
15
15
15
15
16
16
16
16
16
17
17
17
17
17
18
18
18
18
19
19
19
20
23
23
24
25
25
32

5
7
Aprendamos cómo hacer la gráfica de ojiva creciente con
una tabla de frecuencias simples

Gráficas de Ojiva

Aprendamos a hacer una gráfica de ojiva


Para hacer la gráfica de Ojiva creciente se necesita la frecuencia relativa
acumulada, para eso haremos una tabla de frecuencias con cuatro columnas,
la primera es la de los datos que deben estar ordenados de menor a mayor, en
este caso los datos son las edades, la segunda es la frecuencia absoluta de
cada dato, esto es la cantidad de veces que se repite cada uno de los datos.
La tercera columna se refiere a la frecuencia relativa; esto es los porcentajes
que corresponden a cada frecuencia, para ello tomamos en cuenta que como
son 40 datos en total en este caso los que tenemos, el 100% es 40 y
aplicamos una regla de tres, donde si el 100% es 40, vamos a calcular qué
porcentaje corresponde 1. Multiplicamos 100 x 1, que está en la celda B2, y el
resultado lo dividimos entre el total de datos que es 40.
Repetimos este procedimiento para obtener la frecuencia relativa de cada
dato, o si lo hacemos con fórmula se puede copiar colocando nuestro cursor en
la esquinita del lado derecho vamos a poner un crucecita blanca o negra,
jalamos y ya tenemos todas nuestras frecuencias relativas.
Al final de la columna vamos hacer una sumatoria para verificar que el total
nos de 100%, buscamos la sumatoria en el menú superior, observamos que
cubra todos los datos que necesitamos y si, efectivamente tenemos el 100%,
nuestro procedimiento fue correcto. Si la suma que obtienes es distinta a 100
hay que revisar el procedimiento.
La cuarta columna es la de la frecuencia relativa acumulada, es la que nos va
a servir para hacer la ojiva creciente, para obtener los datos de esta columna
empezamos escribiendo la cantidad de la frecuencia relativa de la primera,
que está del lado izquierdo, en este caso es 2.5, la siguiente frecuencia
relativa acumulada se obtiene sumando la frecuencia anterior + la que se
encuentra a la izquierda en el mismo renglón, en este caso como la frecuencia
del renglón es 0 nos sigue dando 2.5.
Para la siguiente igual sumamos la anterior + la de la izquierda, en este caso
como es 0 también nos da 2.5, seguimos haciendo el mismo procedimiento con
cada renglón, aquí ya se observa la diferencia 2.5 del de arriba con 2.5 de la de la
izquierda nos da 5, la siguiente sería la de arriba que es 5, más 5 de la izquierda
me

58
daría 10, puedo hacerlo de manera manual o también lo jalo para que ya me
dé todas las frecuencias relativas acumuladas.
Observa que la última frecuencia relativa acumulada siempre debe dar el
100%, porque nos da el total de la frecuencia relativa, un vez que ya tenemos
completa la columna de la frecuencia relativa acumulada vamos a graficar.
Vamos a seleccionar todos los datos de nuestra cuarta columna y en el menú
superior vamos a buscar los tipos de gráfica, ya sea que le des insertar y
después graficar, o como en este caso que nos aparecen los gráficos,
seleccionamos la gráfica de línea, y automáticamente tendremos nuestra
gráfica.
Podemos darle el formato que queramos si elegimos de los diseños que se
sugiere, aquí en la parte superior tenemos, podemos ir probando, observa que
esta nos da espacio para poner el título de los ejes, aquí nos dan los valores de
cada uno de los puntos, podemos observar varias, me voy a quedar con la de
los ejes porque es importante.
Entonces nuestro eje horizontal es la edad y nuestro eje vertical es la
frecuencia. ¡Listo! Le voy a quitar este para que se vea mejor la gráfica, y ya
tengo mi gráfica. Observa que por default el inicio del eje horizontal nos da el
1, pero en nuestros datos la primera edad no es un 1, sino es un 7, entonces lo
que vamos a hacer para modificar el eje, damos clic derecho colocando
nuestro mouse sobre el eje horizontal y vamos a buscar donde dice seleccionar
datos, se abre un cuadro de diálogo y donde dice categoría de etiqueta de ejes
de la categoría x nos colocamos ahí y seleccionamos los datos que queremos
que aparezcan, decimos aceptar y listo.
Ahora sí tenemos que empieza de los 7 años a los 31, tal como tenemos en
nuestra tabla de datos, ahora sí quedó lista nuestra gráfica de ojiva. Es tu
turno: te invito a realizar tu gráfica y compararla con la de la plataforma.

Ahora estudiemos los deciles y percentiles.

Si dividimos nuestra muestra en 10 partes, tendremos los


deciles, y puedes calcularlos con una regla de 3.

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

59
Hagamos un ejemplo: si queremos saber a qué edad empezó a fumar el 40% de la población
estaríamos hablando del cuarto decil, por lo que podemos calcularlo con la regla de 3:

Si el 100% son 40 datos, ¿cuántos datos serán el 40%?

100%40
----------datos
40% ---------- X

Y tendremos:

Recuerda que el cálculo da una posición, por lo que después de tener la posición debes
buscar en los datos ordenados previamente cuál es el valor que ocupa esa posición.
Veamos en la tabla qué dato ocupa el lugar 16

60
6
1
1. Ahora calcula el D6 y el
D2 D6= __________
2. Esto significa que el ______% de los encuestados empezaron a fumar antes
de los ______ años.
3. D2= __________
4. Esto significa que el ______% de los encuestados empezaron a fumar antes
de los ______ años.

Resultados: 24, 60, 17, 8 20, 13

¿Y qué pasa si quiero saber a qué edad empezó a fumar el 43% de la población?
Entonces calculemos los percentiles.

Los percentiles dividen el conjunto de datos ordenados en 100 partes iguales

Por lo tanto, el primer percentil (p1) muestra el valor por debajo del cual se encuentra el
1% de los datos.

Tomada para fines educativos de:


http://www.thedataschool.co.uk/wp-content/uploads/2016/08/12.png

62
La imagen muestra el percentil 80, esto es, el valor por debajo del
cual se encuentra el 80% de los datos.

Para calcular los percentiles, también se hace


aplicando una regla de 3

Hagamos un ejemplo:

Los siguientes son los sueldos de 20 trabajadores de una constructora


a la semana (ya están ordenados de menor a mayor):

1500 1700 1750 1800 1810 2000 2012 2025 2025 2030
2038 2040 2040 2087 2110 2110 2150 2200 2236 2250

Tomada para fines educativos de:


http://www.mascastillalamancha.com/wp-content/uploads/2015/06/trabajadores-680x365_c.jpg

Calcula cuánto gana el 33%


100% ---------- 20
33% ---------- X

63
Por lo tanto el lugar 7 lo ocupa el dato 2012,
esto quiere decir que el 33% de los
trabajadores gana menos de $2012

Ahora calcula cuánto gana el 17% redondeando la cifra que obtengas. Recuerda que
menos de 0.5 se redondea al dígito anterior y 0.5 o más se redondea al dígito superior.
(escribe la cifra sin signo de pesos, y sin puntos decimales)

P17= _______
Esto significa que el _______% de los trabajadores gana menos de _______ pesos

Resultados: 3, 17, 1750

Ahora calcula qué porcentaje gana menos de 2100 pesos.

Para aplicar la regla de 3 primero cuenta cuántos datos hay antes del dato que quieres,
en este caso, antes de 2100 y sustituye en la regla de 3 como sigue:

100 ----------
% 20
K 14
----------

El 100% son 20, ¿qué porcentaje serán 14 datos


que están antes de 2100 pesos?

64
Por lo tanto 70% de los trabajadores ganan
menos de 2100 pesos.

¡Es tu turno! Calcula qué porcentaje de trabajadores gana menos de 2000 pesos.

Pk= _______ %
Por lo tanto _______% de los trabajadores ganan menos de _______ pesos.

Resultados: 25, 25, 2000

¡Pongamos en práctica lo aprendido!

Las siguientes son horas extra semanales que laboraron algunos empleados de oficina:

5 6 6 7 7 8 9 10 10 11 15 15

Tomada para fines educativos de: http://www.doublerule.com/images/blog/blog-work-extra.jpg

Realiza los cálculos correspondientes para


completar las oraciones:

65
El 50% de los empleados trabaja más de _______hrs. extras a la semana.

El 22% de los empleados trabaja menos de _______hrs. extras a la semana.

El 80% de los empleados trabaja menos de _______hrs. extras a la semana.

El _______% de los empleados trabaja menos de 7 hrs. extras a la semana.

El _______% de los empleados trabaja 10 hrs. extras a la semana o menos.

Respuestas: 9, 6, 11, 25, 75

Ahora sí estás preparado para verificar lo


aprendido poniendo en práctica tus nuevos
conocimientos sobre las medidas de posición.

Realiza la actividad en plataforma:


¿Qué tanto aprendí de medidas de posición?

66
Actividad integradora

Ahora que terminamos la unidad, puedes entregar a tu asesor el análisis estadístico que
has venido realizando. Recuerda entregarlo en un archivo de Excel y que contenga el
análisis de los reactivos relacionados con tu hipótesis de investigación.

Tu archivo debe tener los siguientes elementos:

Primera hoja con la Hipótesis y nombre de los integrantes del equipo


(Recuerda que esta actividad es en equipo)

Segunda hoja con la base de datos completa

A partir de la tercer hoja irán por separado cada


reactivo analizado con los siguientes datos:

Media

Mediana

Moda

Desviación estándar y rango

Rango intercuartil

Al menos un dectil y un percentil

Gráficas de barras y circular de cada reactivo acompañado de su


interpretación dentro el contexto de la encuesta retomando las medias
calculadas.

67
Realiza la actividad en plataforma:
Análisis estadístico

Espera a que tu asesor revise tu trabajo para que


vayas integrando los resultados en tu informe de
investigación que has venido trabajando en el
documento de Word con el
nombre Investigación_cuantitativa_tema_equipo
#. Con los datos y la información que has obtenido
en esta unidad vas a integrar la sección de
resultados de tu informe, para ello vas a retomar
las gráficas con su interpretación, así como los
datos que consideres relevantes para tu estudio,
de acuerdo al objetivo y a la hipótesis que
planteaste al inicio. En el informe final no incluyas
las fórmulas, ni la base de datos o tablas de
frecuencias.

Estás a punto de terminar la tercera unidad. Sólo


falta superar un último reto.

Realiza la actividad en plataforma:


¿Qué tanto aprendí de la estadística descriptiva?

68
Dónde se aplica la estadística descriptiva

Ya conoces las medidas de tendencia central, de posición y de variabilidad y es


importante que sepas que la estadística descriptiva tiene una gran aplicabilidad, por lo
que te invitamos a leer los siguientes artículos, como ejemplos de áreas donde se puede
aplicar.
Empezaremos por un artículo académico de Arias Gallegos y Nuñez Cohello (2015) en el
que reportan los resultados de su investigación sobre el agotamiento emocional en
supervisores de seguridad industrial en Arequipa.

Tomada para fines educativos de:


https://7c1096715b08106e45d9-86066560621c8d09273ccd7d125f633d.ssl.cf5.rackcdn.com/r/covers/64556/foto4.png

Síndrome de Burnout en Supervisores de Seguridad Industrial de Arequipa.

Consulta el siguiente link:


http://www.scielo.cl/pdf/cyt/v17n52/art13.
pdf

69
Como puedes apreciar, el artículo tiene otros indicadores estadísticos además
de los que se revisan en esta unidad, pero nosotros nos centraremos en los
que estudiamos. ¡Vamos a practicar lo aprendido!

1. La muestra estaba integrada de la siguiente manera

a. 46 hombres y 12 mujeres
b. 22 hombres y 36 mujeres
c. 31 hombres y 27 mujeres
d. 32 hombres y 26 mujeres

2. De acuerdo a las medidas de dispersión de la edad de los participantes,


se puede decir lo siguiente:

a. La muestra es homogénea y casi todos son jóvenes.


b. La muestra es homogénea y casi todos son personas maduras
c. Las edad son muy diversas y hay más personas mayores que jóvenes.
d. La muestra es variada y está integrada por personas jóvenes y grandes.

3. Respecto de los hijos que tienen los participantes se puede decir que:

a. La mayoría no tiene hijos


b. La mayoría tiene 3 hijos
c. La mayoría tiene 1 hijo
d. La mayoría tiene 2 hijos

4. Al observar la tabla de medias del síndrome de Burnout según el sexo se


puede afirmar que:
Las mujeres se agotan más que los hombres

a. Falso
b. Verdadero

5. Los varones tienen una realización más baja que las mujeres

a. Verdadero
b. Falso

6. Hombres y mujeres presentan igual nivel de síndrome de

Burnout a. Falso

70
b. Verdadero

7. En todos los aspectos hay mayor variabilidad para las mujeres que para
los varones.

a. Verdadero
b. Falso

8. Al observar la gráfica podemos percatarnos de lo siguiente:

a. Los niveles de síndrome de Burnout en los supervisores de seguridad


tienden a ser severos.
b. Los niveles de síndrome de Burnout en los supervisores de seguridad
tienden a estar en un nivel bajo.
c. Los niveles de síndrome de Burnout en los supervisores de seguridad son
más bien moderados.
d. Los niveles de síndrome de Burnout en los supervisores de seguridad están
entre moderado y severo.

Respuestas: c, d, a, b, a, b, a, b

Ahora te invitamos a leer este pequeño artículo sobre las


redes sociales y la investigación de mercado:

Redes sociales y la investigación de mercado

Consulta el siguiente link:


http://blog.amai.org/index.php/las-redes-
sociales-y-su-influencia-en-la-investigacion-
de-mercados/

71
Tomada para fines educativos de:
http://www.socialpolit.com.br/wp-content/uploads/2016/07/cropped-area_marketing.png

Este texto es interesante porque revela hábitos de los mexicanos sobre el uso de redes
sociales. Muchos artículos, como éste que acabas de leer se basa en medidas estadísticas,
aunque no las menciona por su nombre técnico, sino por otro más coloquial. Vamos a ver si
identificaste dónde retomó los indicadores estadísticos

1. La media de horas que se conectan los mexicanos en internet es:

a. X = 9 hrs.
b. X = 10 hrs.
c. X = 11 hrs.
d. X = 6 hrs.

2. Cuando dice: “9 de cada 10 pertenece a una red social”, se está refiriendo

a. Decil 9
b. 90%
c. 10%
d. Decil 10

Respuestas: d, a

72
Finalmente, si te interesa conocer un poco sobre la aplicación de la
estadística, te invitamos a ver la:

Encuesta Nacional de Valores en Juventud 2012

Consulta el siguiente link:


http://www.imjuventud.gob.mx/imgs/uploa
ds/ENVAJ_2012.pdf

Aquí encontrarás diferentes tipos de gráficos. Observa que en todos ellos se emplean
las frecuencias relativas, es decir, porcentajes, debido a que la población encuestada
es muy grande.

Comenta los resultados de una de las gráficas de esta encuesta.

Comentarios:
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
__________________________________________

73
Referencias

Arias Gallegos, W. y Núñez Cohello, AL. (2015) Síndrome de Burnout en


supervisores de seguridad industrial en Arequipa, en Revista Ciencia y trabajo,
17, 52, disponible en http://www.scielo.cl/pdf/cyt/v17n52/art13.pdf

Díaz Limón, S (2015) Las redes sociales y su influencia en la investigación de


mercados, disponible en http://blog.amai.org/index.php/las-redes-sociales-y-
su-influencia-en-la-investigacion-de-mercados/

IMJUVE (2012) Encuesta Nacional de Valores, IMJUVE, disponible


en http://www.imjuventud.gob.mx/imgs/uploads/ENVAJ_2012.pdf

74

También podría gustarte