Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Sesión de Práctica N° 04
Presentación de datos numéricos en
tablas y gráficos.
Ms. Zoraida Yanet Vidal Melgarejo
[email protected] Representación de datos numéricos
Diferencias
Género SMAF en SMAF en
Nro. Edad (tiempo 3 –
(Sexo) tiempo 1 tiempo 3
tiempo 1)
Ejercicio: 1 90 1 28 20 -8
2 88 1 8 11 3
Se presenta la calificación total en el SMAF 3 88 1 6 9 3
de los datos del estudio de Hébert et al. 4 90 1 22 18 -4
(1997) sobre la disminución funcional de 5 88 2 6 7 1
ancianos. Se utiliza un subgrupo de los 6 86 1 9 9 0
datos, 72 sujetos de 85 años o más que 7 86 2 23 15 -8
completaron el SMAF en el año 1 y 3, así 8 85 1 12 40 28
como las diferencias en las calificaciones 9 88 1 9 30 21
entre los años 3 y 1. 10 86 1 5 15 10
Los datos contenidos en el archivo “Datos
68 86 1 4 6 2
resultados SMAF.xlsx”, representan el 69 86 1 16 26 10
registro de dichos datos. 70 85 1 5 6 1
71 88 1 48 51 3
72 86 2 9 17 8
-2-
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 1
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
Con los datos contenidos en el archivo de Excel realizar lo indicado a continuación:
1. Generar la tabla de frecuencias.
2. Calcular la desviación estándar, coeficientes de asimetría y curtosis, media, mediana,
moda, primer y tercer cuartil, sexto y séptimo deciles y percentiles 54, 47 y 82.
3. ¿Se puede intuir si los datos provienen de una distribución normal?
4. Construir los histogramas de frecuencias absolutas y frecuencias absolutas
acumuladas.
5. Construir el polígono de frecuencias relativas y frecuencias relativas acumuladas.
6. Analizar gráficamente la simetría de la distribución.
-3-
Representación de datos numéricos
1. Importar los datos del archivo de Excel: “Datos resultados SMAF.xlsx”
a. Estando en la Vista de datos, desde el menú Archivo, seleccionar la opción
Importar datos, y luego la opción Excel.
2
3
-4-
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 2
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
b. Ubicar el archivo “Datos resultados SMAF.xlsx” y seleccionarlo.
Seleccionar el archivo
de Excel que contiene
4 los datos que serán
importados.
Verificar el
nombre del
5 archivo de 6
Excel.
-5-
Representación de datos numéricos
Escribir el rango de celdas
c. Indicar el rango de las que contienen los datos que
celdas que contienen los 7 serán importados.
valores que serán
Verificar que las 3
importados. 8 opciones estén
seleccionadas.
Verificar la vista
9 previa de los datos
que se importarán.
10 -6-
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 3
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
d. Verificar en la nueva hoja de datos que se hayan importado los 72 registros.
Primer
11 registro
Último
12 registro
-7-
Representación de datos numéricos
e. En la Vista de variables se determinan las propiedades para las variables Edad,
Género, SMAF en el tiempo 1 y SMAF en el tiempo 3.
-8-
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 4
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
2. Se registra la fórmula para el cálculo de la diferencia entre el SMAF en el tiempo 3 y
el SMAF en el tiempo 1.
a. En el Menú Transformar, se selecciona la opción Calcular variable.
1
2
-9-
Representación de datos numéricos
b. En la ventana Calcular variable, se escribe el nombre de la variable objetivo y luego se crea la
expresión numérica (fórmula) para el cálculo del valor de la variable objetivo.
3 4
5
- 10 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 5
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
c. En la Vista de variables, especificar las propiedades de la nueva variable Diferencia.
- 11 -
Representación de datos numéricos
2. Generar la tabla de frecuencias.
2 3
5
4
- 12 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 6
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
2. Generar la tabla de frecuencias.
- 13 -
Representación de
datos numéricos
En la hoja de Resultados podemos observar:
El resumen de los
datos procesados 1
(válidos y perdidos)
La tabla de distribución
de frecuencias. 2
- 14 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 7
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
2. Calcular la desviación estándar, coeficientes de asimetría y curtosis, media, mediana, moda,
primer y tercer cuartil, sexto y séptimo deciles y percentiles 54, 47 y 82.
a. En el menú Analizar, se selecciona la b. Se selecciona la variable a analizar.
opción Estadísticos descriptivos y
luego Frecuencias.
1 4 6
2 3
- 15 -
Representación de datos numéricos
c. Se seleccionan los estadísticos que serán calculados.
8
7
9 12
10
11
- 16 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 8
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos
numéricos
A El valor de la moda es 2, se
puede verificar que en la tabla
de distribución de frecuencias
(pregunta 1) tiene el mayor
valor de frecuencia (8).
En la hoja de Resultados
podemos observar:
- 17 -
Representación de datos numéricos
Las medidas de asimetría tienen como finalidad elaborar un indicador que
B permita establecer el grado de simetría (o asimetría) que presenta una
distribución, sin necesidad de llevar a cabo su representación gráfica.
1
σ𝑘 ത 3
𝑖=1 𝑋𝑗 −𝑋 𝑛𝑖
𝑁
El Coeficiente de asimetría de Fischer: 𝑔1 = 3ൗ
1 𝑘 2 2
σ 𝑋𝑗−𝑋ത 𝑛𝑖
𝑁 𝑖=1
Si g1 = 0 la distribución es simétrica, si g1 > 0 la distribución es asimétrica
positiva (a la derecha), y si g1 < 0 la distribución es asimétrica negativa (a la
izquierda).
Dado que el valor obtenido es 2.003 podríamos inferir que la distribución
tiene una asimetría positiva.
- 18 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 9
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
Las medidas de curtosis estudian la distribución de frecuencias en la zona central
C de la misma. La mayor o menor concentración de frecuencias alrededor de la
media y en la zona central de la distribución dará lugar a una distribución más o
menos apuntada. Por ello también se les llama medidas de apuntamiento o
concentración central.
Las medidas de curtosis se aplican a distribuciones campaniformes, es decir,
unimodales simétricas o con ligera asimetría.
1 4
σ𝑘 𝑋 −𝑋ത 𝑛𝑖
𝑁 𝑖=1 𝑗
El Coeficiente de curtosis: 𝑔2 = 1 𝑘 2 2 −3
σ 𝑋 −𝑋ത 𝑛𝑖
𝑁 𝑖=1 𝑗
Una distribución es mesocúrtica (apuntamiento igual al de la normal) cuando g2 =
0, es leptocúrtica (apuntamiento mayor que el de la normal) si g2 > 0 y es
platicúrtica (apuntamiento menor que el de la normal ) si g2 < 0.
Dado que el valor obtenido es 4.331 podríamos inferir que la distribución es
leptocúrtica.
- 19 -
Representación de datos numéricos
3. ¿Se puede intuir si los datos provienen de una distribución normal?
Razones para considerar que una variable sigue una distribución
A normal:
• Distribución simétrica. Es decir, existe el mismo número de
observaciones tanto a la derecha como a la izquierda del valor
central. También, que la media, la mediana y la moda tienen el
mismo valor.
• Las observaciones con más frecuencia o probabilidad están
alrededor del valor central. En otras palabras, las observaciones
con menos frecuencia o probabilidad se encuentran lejos del
valor central.
Dado que los valores obtenidos de media, mediana y moda no son
iguales, por lo que podemos indicar que los datos no provienen de
una distribución normal.
Al ser la media mayor que la mediana podemos indicar que los
datos presentan una distribución asimétrica a la derecha
(asimetría positiva).
- 20 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 10
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
b. Para corroborar la normalidad de los datos.
1 4
- 21 -
Representación de datos numéricos
En la hoja de Resultados podemos observar:
El gráfico señala la no normalidad de los datos,
debido a que la línea de puntos se separa
significativamente de la diagonal.
- 22 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 11
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
4. Construir los histogramas de frecuencias absolutas y absolutas acumuladas.
Histograma de frecuencias absolutas.
b. Se selecciona la variable a analizar.
a. En el menú Analizar, se selecciona la
opción Estadísticos descriptivos y
luego Frecuencias. 4
6
1
2 3
0 5
- 23 -
Representación de datos numéricos
9
8
- 24 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 12
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
En la hoja de Resultados podemos observar:
Se muestra el Histograma de Frecuencias Absolutas con curva normal.
- 25 -
Representación de datos numéricos
Histograma de frecuencias absolutas acumuladas.
1
4
2 3
- 26 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 13
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
En la hoja de Resultados podemos observar:
6
Histograma de Frecuencias Absolutas Acumuladas.
8
- 27 -
Representación de datos numéricos
5. Construir el polígono de frecuencias relativas y relativas acumuladas.
a. Polígono de frecuencias relativas.
1 4
5
- 28 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 14
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
En la hoja de Resultados podemos observar:
6
Polígono de Frecuencias Relativas.
8 - 29 -
Representación de datos numéricos
b. Polígono de frecuencias relativas acumuladas.
1 4
- 30 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 15
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
En la hoja de Resultados podemos observar:
Polígono de Frecuencias Relativas Acumuladas.
8
- 31 -
Representación de datos numéricos
6. Analizar gráficamente la simetría de la distribución.
1
4
5
2
- 32 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 16
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
8
9
7
- 33 -
Representación de datos numéricos
En la hoja de Resultados podemos observar:
El diagrama de Caja y Bigotes corrobora la asimetría ya que la línea mediana no se encuentra en el centro de la caja.
- 34 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 17
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Sesión de Práctica N° 04
Ejercicios propuestos sobre la
presentación de datos numéricos con
tablas y gráficos
Ms. Zoraida Yanet Vidal Melgarejo
[email protected] Representación de datos numéricos
Alumno Estatura Alumno Estatura Alumno Estatura
Alumno 1 1.25 Alumno 21 1.23 Alumno 41 1.21
Problema 1 Alumno 2 1.28 Alumno 22 1.26 Alumno 42 1.29
• La siguiente tabla muestra Alumno 3 1.27 Alumno 23 1.30 Alumno 43 1.26
Alumno 4 1.21 Alumno 24 1.21 Alumno 44 1.22
la altura de los niños de Alumno 5 1.22 Alumno 25 1.28 Alumno 45 1.28
una clase y se obtienen los Alumno 6 1.29 Alumno 26 1.30 Alumno 46 1.27
Alumno 7 1.30 Alumno 27 1.22 Alumno 47 1.26
siguientes resultados (en
Alumno 8 1.24 Alumno 28 1.25 Alumno 48 1.23
centímetros). Alumno 9 1.27 Alumno 29 1.20 Alumno 49 1.22
Alumno 10 1.29 Alumno 30 1.28 Alumno 50 1.21
Alumno 11 1.21 Alumno 31 1.30 Alumno 51 1.29
Alumno 12 1.29 Alumno 32 1.24 Alumno 52 1.30
Alumno 13 1.26 Alumno 33 1.27 Alumno 53 1.24
Alumno 14 1.22 Alumno 34 1.29 Alumno 54 1.27
Alumno 15 1.28 Alumno 35 1.21 Alumno 55 1.23
Alumno 16 1.27 Alumno 36 1.29 Alumno 56 1.26
Alumno 17 1.30 Alumno 37 1.21 Alumno 57 1.30
Alumno 18 1.22 Alumno 38 1.29 Alumno 58 1.21
Alumno 19 1.25 Alumno 39 1.26 Alumno 59 1.28
Alumno 20 1.20 Alumno 40 1.22 Alumno 60 1.21
- 36 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 18
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
Problema 1
Con los datos del problema 1, desarrollar:
a. Generar la tabla de frecuencias.
b. Calcular la desviación estándar, media, mediana, moda, primer y tercer cuartil, cuarto y
octavo deciles y percentiles 21, 48 y 72.
c. ¿Se puede intuir si los datos provienen de una distribución normal?
d. Construir los histogramas de frecuencias absolutas y frecuencias absolutas acumuladas.
e. Construir el polígono de frecuencias relativas y frecuencias relativas acumuladas.
- 37 -
Representación de datos numéricos
Problema 2
• Los datos presentados en la siguiente tabla corresponden a las mediciones de índice de
choque, presión arterial sistólica y frecuencia cardiaca de 20 sujetos observados.
Número Presión Número Presión
Índice de Frecuencia Índice de Frecuencia
de arterial de arterial
choque cardiaca choque cardiaca
paciente sistólica paciente sistólica
1 0.61 139 85 11 0.55 164 80
2 0.56 151 84 12 0.50 138 69
3 0.52 201 104 13 0.75 118 89
4 0.33 170 56 14 0.82 130 106
5 0.45 123 55 15 1.30 109 142
6 0.74 121 90 16 1.29 92 119
7 0.73 119 87 17 0.85 126 107
8 0.92 100 92 18 0.44 139 61
9 0.42 164 69 19 0.73 121 104
10 0.63 161 102 20 0.56 100 - 38105
-
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 19
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Representación de datos numéricos
Problema 2
Con los datos de la frecuencia cardiaca del problema 2, desarrollar:
a. Generar la tabla de frecuencias.
b. Calcular la desviación estándar, media, mediana, moda, primer y tercer cuartil, tercer y
sétimo deciles y percentiles 15, 62 y 88.
c. ¿Se puede intuir si los datos provienen de una distribución normal?
d. Construir los histogramas de frecuencias absolutas y frecuencias absolutas acumuladas.
e. Construir el polígono de frecuencias relativas y frecuencias relativas acumuladas.
- 39 -
Representación de datos numéricos
Archivos a enviar:
• Archivo de datos de los ejercicios 1 y 2 (.sav)
• Archivo de resultados (.spv)
• Hojas de respuestas (.docx, .xlsx, .pptx o .pdf)
Guardar todos los archivos en una carpeta. Luego, comprimir la carpeta (.rar o .zip).
Subir al Campus Virtual, el archivo de la carpeta comprimida.
La fecha de presentación y la rúbrica para la calificación están indicadas en el ROA.
- 40 -
Curso: Informática Médica y Bioestadística Tema: Presentación de datos numéricos
Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 20