Matemáticas
Matemáticas
Análisis de datos
¿Sabías qué?
¿Sabías que los científicos no siempre están de acuerdo sobre el significado de
los datos? Diferentes científicos pueden analizar el mismo conjunto de datos y
ofrecer diferentes explicaciones, y el desacuerdo entre científicos no indica que
haya mala ciencia.
1. Suponiendo que es verano y sabes que vas a estar al aire libre y que unas horas
vas a estar en un edifico con aire acondicionado, ¿qué ropa elegirías?
Este ejemplo puede parecer simplista, pero refleja la manera en la que los
científicos recogen datos, los analizan y los interpretan.
La estadística descriptiva permite a los científicos sumar rápidamente los
atributos más importantes de un conjunto de datos, usando medidas como el
promedio, la media, y la desviación estándar. Estas medidas proveen un sentido
general del grupo estudiado, permitiéndoles a los científicos colocar el estudio
en un contexto más amplio.
4
Realiza la lectura guiada del siguiente texto.
Un primer análisis que se puede utilizar para cuantificar la contaminación del aire
es el resumen estadístico de las mediciones en un periodo de tiempo
determinado.
Tabla 1. Concentraciones de ozono observadas el primero de enero de 2023 en la
Ciudad de México.
Estación de monitoreo
FECHA HORA
BJU CUA GAM IZT MGH MPA
01/01/2023 1 1 22 2 3 2 30
01/01/2023 2 1 26 2 2 4 30
01/01/2023 3 1 25 2 2 4 31
01/01/2023 4 1 25 2 2 2 31
01/01/2023 5 1 23 3 2 2 31
01/01/2023 6 1 21 2 2 2 32
01/01/2023 7 1 17 3 2 2 25
01/01/2023 8 1 18 3 3 2 22
01/01/2023 9 3 20 5 6 5 27
01/01/2023 10 18 31 21 23 23 32
01/01/2023 11 45 39 45 49 51 41
01/01/2023 12 63 50 44 60 64 47
01/01/2023 13 53 62 45 60 74 44
5
Estación de monitoreo
FECHA HORA
BJU CUA GAM IZT MGH MPA
01/01/2023 14 47 57 56 47 60 37
01/01/2023 15 42 51 49 42 52 39
01/01/2023 16 39 48 41 39 48 42
01/01/2023 17 37 37 36 37 45 42
01/01/2023 18 32 33 31 35 32 37
01/01/2023 19 28 28 26 27 21 36
01/01/2023 20 23 23 19 19 11 35
01/01/2023 21 14 18 12 15 4 31
01/01/2023 22 4 19 5 8 1 29
01/01/2023 23 4 9 2 13 2 28
01/01/2023 24 5 12 2 11 8 28
Media aritmética
𝑛
1 También denominada promedio, se define
𝑥ҧ = 𝑥𝑖
𝑛 como la suma de los valores de todas las
𝑖=1 observaciones divididas por el número total
Donde: de datos. Se representa por xത .
xത =media aritmética
xi =dato i
n= número de datos
6
Mediana
Para hallar la mediana, se ordenan los
La mediana (𝑥𝑚𝑒𝑑 ) es el valor números y se determina el que queda en
que se encuentra en el lugar el medio. Si la cantidad de términos es
central de todos los datos cuando impar, la mediana es el valor central. Si la
éstos están ordenados de menor cantidad de términos es par, suma los
a mayor. dos términos del medio y se divide entre
dos.
𝑥𝑖 = 1, 1, 1, 1, 1, 1, 1, 1, 3, 18, 45, 63, 53, 47, 42, 39, 37, 32, 28, 23, 14, 4, 4, 5
n=
𝑛
1 465
𝑥ҧ = 𝑥𝑖 = =
𝑛
𝑖=1
Mediana
Ordenan los números y determina el que queda en el medio.
𝑥𝑖 =
Suma los dos términos del medio y divide entre dos.
𝑥𝑚𝑒𝑑 = =
2
7
CUA – Cuajimalpa
Promedio Mediana
𝑛
1
𝑥ҧ = 𝑥𝑖 = = 𝑥𝑚𝑒𝑑 = =
𝑛 2
𝑖=1
𝑛
1
𝑥ҧ = 𝑥𝑖 = = 𝑥𝑚𝑒𝑑 = =
𝑛 2
𝑖=1
IZT – Iztacalco
Promedio Mediana
𝑛
1
𝑥ҧ = 𝑥𝑖 = = 𝑥𝑚𝑒𝑑 = =
𝑛 2
𝑖=1
Promedio Mediana
𝑛
1
𝑥ҧ = 𝑥𝑖 = = 𝑥𝑚𝑒𝑑 = =
𝑛 2
𝑖=1
8
MPA – Milpa Alta
Promedio Mediana
𝑛
1
𝑥ҧ = 𝑥𝑖 = = 𝑥𝑚𝑒𝑑 = =
𝑛 2
𝑖=1
Estación de monitoreo
Parámetro
BJU CUA GAM IZT MGH MPA
Promedio
Mediana
9
6. ¿Consideras que la media aritmética es el parámetro adecuado para
determinar la variación de la concentración de ozono (O3) en la Ciudad de
México?
Si ( ) No ( )
¿Por qué?
10
Sesión 2
Variabilidad de los datos
11
¿Por qué?
01/01/2023 1 1 22 2 3 2 30
01/01/2023 2 1 26 2 2 4 30
01/01/2023 3 1 25 2 2 4 31
01/01/2023 4 1 25 2 2 2 31
01/01/2023 5 1 23 3 2 2 31
01/01/2023 6 1 21 2 2 2 32
12
Estación de monitoreo
FECHA HORA
BJU CUA GAM IZT MGH MPA
01/01/2023 7 1 17 3 2 2 25
01/01/2023 8 1 18 3 3 2 22
01/01/2023 9 3 20 5 6 5 27
01/01/2023 10 18 31 21 23 23 32
01/01/2023 11 45 39 45 49 51 41
01/01/2023 12 63 50 44 60 64 47
01/01/2023 13 53 62 45 60 74 44
01/01/2023 14 47 57 56 47 60 37
01/01/2023 15 42 51 49 42 52 39
01/01/2023 16 39 48 41 39 48 42
01/01/2023 17 37 37 36 37 45 42
01/01/2023 18 32 33 31 35 32 37
01/01/2023 19 28 28 26 27 21 36
01/01/2023 20 23 23 19 19 11 35
01/01/2023 21 14 18 12 15 4 31
01/01/2023 22 4 19 5 8 1 29
01/01/2023 23 4 9 2 13 2 28
01/01/2023 24 5 12 2 11 8 28
13
Desviación estándar y varianza
Las medidas de dispersión más comunes para las variables métricas son la
desviación estándar y la varianza. Estas dos medidas relacionan cada
característica de una variable con el valor medio y, por tanto, indican hasta qué
punto las características individuales están dispersas en torno al valor medio.
¿Qué es la varianza?
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝑣=
𝑛
Desviación estándar
Indica qué tan dispersos están los datos con respecto a la media. Se denota por
medio de 𝜎.
Una desviación estándar grande indica que los puntos están lejos de la media, y
una desviación pequeña indica que los datos están agrupados cerca de la media.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝜎=√
𝑛
14
Así pues, la diferencia entre la varianza y la desviación estándar es que la
desviación estándar mide la distancia media respecto a la media y la varianza
mide la distancia media al cuadrado respecto a la media. En otras palabras, la
varianza es la desviación estándar elevada al cuadrado y la desviación estándar
es la raíz de la varianza.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝜎=√
𝑛
Donde n=24
a. Sumen los valores de la columna (𝑥𝑖 − 𝑥ҧ )2 y sustituyan el resultado en la
fórmula.
15
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
(𝑥𝑖 − 𝑥ҧ )2 =
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝜎=√ = = =
𝑛 24
CUA – Cuajimalpa
𝑥ҧ =
16
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
01/01/2023 1 22 -7.750
01/01/2023 3 25 22.563
01/01/2023 5 23 -6.750
01/01/2023 7 17 162.563
01/01/2023 10 31 1.250
01/01/2023 12 50 410.063
01/01/2023 13 62 32.250
01/01/2023 16 48 333.063
01/01/2023 18 33 3.250
01/01/2023 21 18 138.063
01/01/2023 24 12 -17.750
𝑛
(𝑥𝑖 − 𝑥ҧ )2 = 4812.512
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝜎=√ = = = 14.161
𝑛 24
17
GAM – Gustavo A. Madero
𝑥ҧ = 19.083
01/01/2023 1 2
01/01/2023 7 3
01/01/2023 13 45
01/01/2023 16 41
01/01/2023 21 12
18
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
𝑛
(𝑥𝑖 − 𝑥ҧ )2 =
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2 =
𝜎=√ = 351.993 = 18.761
𝑛 24
IZT – Iztacalco
𝑥ҧ =
01/01/2023 3 2
01/01/2023 8 3
01/01/2023 14 47
19
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
01/01/2023 19 27
01/01/2023 24 11
𝑛
(𝑥𝑖 − 𝑥ҧ )2 = 9169.952
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2 9169.952
𝜎=√ =√ = √ 382.081 =
𝑛 24
𝑥ҧ =
20
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
(𝑥𝑖 − 𝑥ҧ )2 =
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2
𝜎=√ = = √574.04 =23.959
𝑛 24
𝑥ҧ = 33.625
01/01/2023 2 30
21
Fecha Hora 𝑥𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥ҧ )2
01/01/2023 9 27
01/01/2023 15 39
01/01/2023 21 31
(𝑥𝑖 − 𝑥ҧ )2 = 937.634
𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ )2 937.634
𝜎=√ =√ = = 6.250
𝑛 24
22
Completa el resumen estadístico de la concentración de ozono el primero de
enero de 2023 en la Ciudad de México, anotando los valores: mínimo, máximo
y la desviación estándar, calculados en la actividad anterior.
Estación de monitoreo
Parámetro
BJU CUA GAM IZT MGH MPA
Máximo
Mínimo
Rango
Desviación
estándar
23
5. ¿Y que en la estación BJU – Benito Juárez la concentración observada de
ozono fue mayor que en la estación GAM – Gustavo A. Madero?
Argumenta tu respuesta.
¿Por qué?
24
Sesión 3
Uso de gráficas en el análisis de datos
¿Sabías que la frase "una imagen vale más que mil palabras" ciertamente se
aplica a la ciencia? Los datos complejos pueden ser muy difíciles de entender sin
mostrarlos de forma visual, por lo que los científicos suelen utilizar pantallas
visuales para ayudar durante el análisis de datos.
25
¿Por qué?
2. ¿A qué horas se consume más agua? ¿Cómo puedes explicar esos puntos?
Las gráficas nos proporcionan una visión de conjunto que sirve para
aclarar el tema que se trate. También nos permiten establecer comparaciones e
incluso hacer predicciones.
26
Título. A través del título se tiene un primer acercamiento al contexto de los datos y la
información reportada en el gráfico estadístico.
Variable(s) estadística(s). Nombre de la variable (o variables) estadística que se involucra
en el estudio y de la cual se da información por medio del gráfico.
Valores que toma(n) la(s) variable(s). Son las diferentes modalidades (valores o
categorías) que toma la variable estadística.
Ejes. Los ejes de un gráfico son el sistema de referencia de este. No todos los gráficos
cuentan con ejes.
Etiquetas. En las etiquetas se muestra parte del contenido contextual del gráfico y las
variables estadísticas involucradas en el estudio.
Escala. Refiere la magnitud en la que se ha medido la variable estadística.
Unidades de medida. Indica las unidades de medida de la frecuencia que toma cada
valor de la(s) variable(s) estadística(s).
Por la naturaleza del ejemplo no se hace explícita la unidad de medida, pues el número
de personas se representa por medio de un número natural (podría decirse que la unidad
es ‘cantidad de personas’).
Especificadores. Son los elementos que se emplean para representar los datos o sus
frecuencias (por ejemplo: rectángulos/barras, líneas, puntos, íconos, etc.).
Fuente. A partir de la fuente se puede validar la veracidad de los datos y la información
presentada en el gráfico estadístico. Esta da a conocer la entidad u organismo que recoge
o proporciona los datos a partir de los cuales se construye el gráfico estadístico.
Barajas, F., Salinas, L., Álvarez, I. (2018). ¿Sabes leer e interpretar gráficos estadísticos?
[Link]
27
Analiza el siguiente gráfico y responde las preguntas.
Gráfica 1 Concentraciones de Ozono observadas el primero de enero de 2023
en la Ciudad de México
6. Escribe su nombre.
28
Participa en la plenaria comparte el análisis de la gráfica y dando respuesta a
los siguientes planteamientos. Si es necesario corrige errores.
¿Qué repasaste en esta sesión?
¿Los contenidos que abordaste en esta sesión tienen relación con la vida
cotidiana?
¿En qué situación de tu entorno aplicarías los conocimientos de esta sesión?
Escribe un ejemplo.
29