CLASE 2
CLASE 2
✓ Sugerencias para el armado de bases de datos
✓ Sugerencias sobre programas de análisis
✓ Activación de análisis en Excel
Trabajo de campo y recolección de datos mediante las
diferentes técnicas seleccionadas
(encuesta, observación, valoración antropométrica, revisión de
HC, etc).
Cada pregunta del cuestionario Armado de la base o matriz de datos
es un indicador. (Excel) y tabulación.
Cada opción de respuesta es
una categoría.
•Con los códigos de las variables categóricas
•Con la forma de representar los valores vacíos
•Con los nombres de las variables
MATRIZ DE DATOS IDEAL
•Con la identificación de las observaciones
•Con la estructura de archivos en las carpetas del proyecto
•Única (no siempre es posible, pero debe intentarse). •Con los nombres de los archivos
•Consistente •Con el formato de las fechas
• Todas las casillas deberían estar llenas) •Con las frases en las observaciones
•Las columnas son Variables
•Las filas son Observaciones.
•No debe tener variables obtenidas a partir de calculos con otras
variables de la matriz. Sugerencia: cálculos en una hoja de cálculo
diferente. Recuerda poner cuales y cómo las has calculado en la
leyenda de los datos.
•No debe tener fórmulas, ni calculos, ni pre-análisis, en la matriz de
datos.
•No debe haber información en los formatos. Los colores o negritas
de las filas o columnas no se exportan.
• Formato csv, o en su defecto xlsx u ods.
NUNCA COMBINAR (JUNTAR CELDAS) ni de la misma fila, ni de
la misma columna.
¿Cuántos días a la semana
desayunas?
Todos los días
5 a 6 días por semana
4 a 3 días a la semana
2 a 1 día por semana
No desayuno
Trabajo de campo y recolección de datos mediante las
diferentes técnicas seleccionadas
(encuesta, observación, valoración antropométrica, revisión de
HC, etc).
Armado de la base o matriz de datos
(Excel) y tabulación.
Carga en la matriz de datos.
Revisión de los datos (¿falta de datos? ¿Incongruencias?)
ANALISIS ESTADISTICO
• Excel
Algunas sugerencias para realizar el análisis de datos
• Infostat https://www.infostat.com.ar/
• BioEstat https://bioestat.software.informer.com/5.0/
• Epidat https://www.sergas.es/Saude-publica/EPIDAT-4-2?idioma=es
• R
• SPSS
• STATA
• Minitab https://www.minitab.com/es-mx/
• GRAPH PRISMA https://www.graphpad.com/scientific-software/prism/
Como activar análisis de datos
• Van a archivo
• Opciones de excel
• Complementos
• Seleccionar herramientas de análisis
• Activar
• Enter
Clase 2 (segunda parte)
- Estadística descriptiva
- Algunas sugerencias de herramientas informáticas para
hacer la estadística descriptiva
Estadística descriptiva
• Es una gran parte de la estadística que propone explorar, resumir y representar los
datos.
• Tablas de frecuencias
• Gráficos
• Estadísticos (medida central, posición,
dispersión)
• Generalmente este análisis es muy básico y sirve para caracterizar y resumir a las
variable obtenidas.
• Permite conocer las características de los datos para luego decidir los métodos de
análisis estadístico a realizar.
Estadística descriptiva
➢ Datos cualitativos (categóricos): distribución de frecuencias y
porcentajes, moda. Graficos de barras y de sectores.
➢Datos cuantitativos: distribución de frecuencias, medidas de
tendencia central, y dispersión. Histogramas y box plots.
Medidas de tendencia central
Valores medios o centrales de una distribución (datos cuantitativos) que sirven para
ubicarla dentro de la escala de medición.
• MODA: Categoría o puntuación que se presenta con mayor frecuencia.
• MEDIANA: es el valor que divide la distribución por la mitad.
• MEDIA: es el promedio aritmético de una distribución (la más utilizada).
Medidas de posición
• Dividen un conjunto ordenado de datos en grupos con la misma cantidad
de observaciones/UA: percentiles (100), cuartiles (4), deciles (10).
• Revelan la situación (posición) de una puntuación con respecto a un grupo
de datos.
• Indican para cierto puntaje de la variable, qué cantidad de valores están por
debajo de él.
Medidas de variabilidad o de dispersión
• RANGO: Indica la extensión total de los datos en la escala (la diferencia entre la puntuación mayor y menor). Cuanto
mayor sea el rango, mayor será la dispersión de los datos. Es muy sensible a la presencia de observaciones extremas.
• Varianza: DE 2
• DE: variabilidad de una serie de datos respecto a su media. es una medida de dispersión muy
sensible a la presencia de datos outliers (es más sensible que la media ya que las distancias están
elevadas al cuadrado)
ACOMPAÑA A LA MEDIA
EN EXCEL
Al seleccionar ANALISIS DE DATOS, Se lee un cuadrante donde seleccionaran
estadística descriptiva
Deberán indicar:
• El rango de entrada ( VARIABLE en matriz a usar).
• Rango de salida (donde quieren que muestre los datos).
• Resumen de estadística
• Dan aceptar y les mostrara los resultados estadísticos
descriptivos.
• Ir a función (fx) e indicar cuartil, dar enter.
Les aparecerá un cuadrante donde indicarán:
• Matriz o variable a trabajar.
• Cuartil que quieren calcular (1-2 o 3).
Ejemplo Edad
ID (años)
1 50
2 37
3 40
4 25
5 39
6 41
7 39
8 34
9 35
10 22
EJEMPLOS TABLA 1
Distribución de frecuencias
Distribución de frecuencias: Datos cualitativos
• Conjunto de puntuaciones ordenadas en sus respectivas categorías (mutuamente
excluyentes) y la frecuencia con que aparecen.
• Permite presentar los datos de una manera que facilite su comprensión e
interpretación.
• Al ser mostrados en una tabla, los valores de los datos se presentan en orden y,
por lo general, el valor del dato más bajo aparece en la parte inferior de la tabla.
EXCEPTO QUE SEA ORDINAL, LO CUAL IMPLICA
QUE LAS CATEGORIAS DEBEN PRESENTARSE
ORDENADAMENTE
Frecuencias Frecuenci
Frecuencias Porcentual a
Variable Acumulad
Absolutas
Nominal a
Variable
Ordinal
Excel: Tablas Dinámicas
TABLAS DINÁMICAS
Paso N°1Voy a inicio, tabla dinámica, selecciono la opción tabla dinámica
Paso N°2:
1.Se abrirá una tabla donde dice CREAR TABLA DINÁMICA.
2. Presionar en el
cuadrante: Tabla o
rango
Paso N°3:
1.Una vez presionado, voy a la hoja de cálculo que llamé MATRIZ (o base).
2.Selecciono desde la primer columna tanto vertical y horizontal, hasta la
última columna que he completado, incluyendo los encabezados.
Paso N°4:
1.Vuelvo a apretar el cuadrante de tabla o rango
2.Luego presiono aceptar.
Paso N°5: En la hoja de cálculo donde seleccione que se abra la matriz de datos (puedo llamarla
RESULTADOS) se abrirá una tabla y a su derecha, llamada LISTA DE CAMPO.
Paso n°6: Seleccione y arrastre los datos que le interesan describir.
Por ejemplo: Si desea saber cuantos individuos femeninos y masculinos hay.
1.Selecciones el DX sexo(Diagnostico sexo).
2.Arrástrelo en donde dice etiquetas filas y valores.
3.Observará que en la tabla dinámica figurará : Cuenta Dx de sexo FEMENINO O MASCULINO
y una columna de total indicando cuantos son de cada uno y en la muestra total
ETIQUETA DE
VALOR
ETIQUETA
FILA
Distribución de frecuencias:
Datos cuantitativos
• Agrupar los datos en intervalos de clase (del mismo tamaño), con
algún criterio y teniendo el cuenta el número de datos y el recorrido
(rango) de la variable.
• Número de intervalos de clase: suele recomendarse entre 7 y no más
de 15.
Elaboración de una distribución de
frecuencias de datos agrupados
Ejemplo: Se registra el peso al nacer de 82 niños.
1. Encontrar el rango o recorrido de datos:
Rango=Dato máximo - Dato mínimo
Rango= 4,7 – 2,3= 2,4
2. Determinar la amplitud (tamaño) de cada intervalo de clase (i). Ejemplo: 8
intervalos
3. i=Rango/x intervalos
4. i=2,4/8=0,3
5. Hacer una lista con los límites de cada intervalo
Amplitud:
ejemplo:
2,6 – 2,3: 0,3
Intervalos
(8)
FRECUENCIA RELATIVA: FREC ABSOLUTA/ N° DE DATOS
Porcentaje: x 100
https://www.youtube.com/watch?v=y5KaCj2HmMA
En excel https://www.youtube.com/watch?v=FNHemIx5IlY
• Paso 1: ordenar los datos de menor a mayor
• Paso 2: armar la siguiente tabla.
• Paso 3: armar la siguiente tabla. Datos
N° datos 90
Max 118,3
Min 46,5
Rango (max
- min) 71,8
Intervalos 7,4
Intervalo de clase Amplitud 9,0
Frecuencia Diferencia 0,5
Limite Inferior Limite superior Absoluta Frecuencia Porcentual
https://exceltotal.com/como-hacer-un-histograma-en-excel/
EN EXCEL: Frecuencias
• 1er paso ordenar: inicio ordenar datos de menor a mayor.
• 2do paso: quitar los duplicadores, van a datos, quitar duplicados.
Enumero.
• 3er paso: ir a función frecuencia. Les va a pedir los datos (total de
datos) y los grupos (los que ordenaron y sacaron repetidos).
Datos cualitativos: GRÁFICOS
• Diagrama de barras y circular (sectores).
• Datos Ordinales (eje no arbitrario).
• Altura proporcional al número de casos (llevar a 100%)
• Barras del mismo ancho.
• Distancias entre barras iguales.
• Se puede utilizar frecuencias absolutas o relativas.
Barras verticales/ horizontales.
Barras adyacentes (permiten observar la relación entre dos variables)
Barras superpuestas o bivariadas (ejemplo: grupo etario según nivel educativo)
Consumo de verduras en el
total de la muestra (n=90) Nivel de AF
18%
SEDENT.
INSUF. ACT.
24% ACTIVO
17%
3 veces por semana o MUY ACTIVO
42% menos 59%
6 a 4 veces por
semana
6%
Nunca
04%
29%
Datos cuantitativos: gráficos
EN EXCEL: histogramas
https://exceltotal.com/como-hacer-un-histograma-en-excel/
Seleccionar datos
• 1er paso: copiasr columna de datos a describirr ordenar: inicio
ordenar datos de menor a mayor.
• 2do paso: quitar los duplicados, ir a Dato---QUITAR DUPLICADOS.
• 3er paso: ir a analisIS de datos, HISTOGRAMA
Columna donde se quitaron los duplicados
Dar formato al histograma
Blox plot (“cajas y bigotes”)
En las versiones mas
nuevas de Excel ya esta
incorporado
https://www.youtube.com/watch?v=F-zOCZho4RI
ARMADO DE GRAFICOS EXCEL
https://www.youtube.com/watch?v=cucK3A0BXEk
Tablas de contingencias
(tablas de doble entrada)
• Están compuestas por filas (horizontales), para la información de una variable y columnas (verticales) para la
información de otra variable.
Se busca analizar la relación entre dos
variables.
• Estas filas y columnas delimitan celdas donde se vuelcan las frecuencias de cada combinación de las variables
analizadas.
• En su expresión más elemental, las tablas tienen solo 2 filas y 2 columnas (tablas de 2x2).
https://www.youtube.com/watch?v=ZmZK2JveptY