Análisis de datos para la toma de decisiones
Profesora: Katherine Barquero Mejías
Clase 1:
Datos y sus principales herramientas de análisis
Profesora: Katherine Barquero Mejías
Los datos
❖ En la práctica, es probable que alguna vez hayamos utilizado la palabra datos, pero
realmente sabemos ¿qué son? o ¿cuáles tipos existen?
Según UM (2020), los datos se definen como: “aquella información extraída de la realidad
qque tiene que ser registrada en algún soporte físico o simbólico, que implica una
elaboración conceptual y además que se pueda expresar en alguna forma de lenguaje”
❖ Los datos están muy relacionados con la labor de los (as) investigadores: en muchos
casos el dato hay que construirlo. Los datos tienen una estructura compuesta por tres
elementos:
Una unidad de análisis que en una variable asume un valor
determinado.
Definiciones básicas
❖ Unidad de análisis:
Elementos menores que constituyen el universo de estudio de una investigación a
partir de los cuales se estudia el comportamiento de variables. Se refiere a una
unidad de la población de estudio.
Definiciones básicas
❖ Variables: Característica, Aspecto, magnitud de un elemento o unidad de análisis con
la propiedad de asumir diferentes valores
❖ Valores: se refieren a las categorías que presenta la variable y adopta alguna unidad de
análisis y que se puede expresar de forma cualitativa o cuantitativa.
Tablas de datos
❖ Las tablas de datos, usualmente conocidas como bases datos, son una representación de cualquier tipo
de información en forma tabular, es decir, ordenada en filas y columnas (por eso se conocen también
como matrices).
❖ En general, pueden ser de muchos tipos, pero
en nuestro caso vamos a analizar tablas
tradicionales para el análisis estadístico:
aquellas que tienen información representada
por números o cadenas de caracteres (string o
letras).
❖ Las matrices de datos resumen unidades de análisis a
las que asignamos valores a variables específicas. La
tabla 1 muestra el modelo típico de una matriz o tabla
de datos, notar que en este ejemplo cada columna es
una variable y cada fila es la unidad de análisis.
Tablas de datos
❖ En los casos de los cuestionarios o encuestas, como los archivos de datos que vamos a trabajar en el
curso, usualmente la información de las bases de datos tienen códigos u opciones de respuestas
indicadas en el cuestionario. Esto facilita el procesamiento de los datos, como veremos más adelante
Ciclo de análisis de datos
Partimos de un problema de Recurrimos al Brindamos evidencia y
investigación para el cual análisis de datos tomamos decisiones
buscamos evidencia de informadas
soluciones
Recopilación
Presentación y
Limpieza
visualización
Análisis Procesamiento
Actividad en clase
• Desarrolle un esquema en el cual se evidencien los pasos del ciclo de
análisis de datos y que pueda ser aplicado a su organización o en la
vida real.
Fuentes de información
Registros Cuestionarios o Información en
administrativos Encuestas la web
Se emplean para
Información recopila recolectar información
datos y registros de las de personas, grupos o Se refiere a información
operaciones de una temas específicos de los disponible en la web
organización cuales no se tiene
información
Pueden venir de
Usualmente se trabaja
Pueden ser producidos a diferentes fuentes:
con muestras porque no
lo interno de la instituciones
se dispone de toda la
organización o provenir académicas, organismos
información del universo
de fuentes externas internacionales, portales
de interés
estadísticos
Tipos de análisis de datos
Análisis Análisis Análisis
descriptivo Exploratorio inferencial
Análisis de
Análisis Análisis
series de
espacial predictivo
tiempo
Análisis de Análisis de
texto redes
Análisis descriptivo
❖ Objetivo: resumir y describir los datos
mediante estadísticas descriptivas (tablas de
frecuencias, promedios, desviaciones
estándar, gráficos)
Ejemplo
• Se realizó una encuesta a 258 docentes
• Se indagó sobre su formación universitaria
• Se resume la información con una tabla de frecuencias
37%
36%
36%
35%
34%
33%
33%
32%
31%
30%
30%
29%
28%
27%
Universidades Universidades Universidades
públicas privadas públicas y privadas
Análisis exploratorio
❖ Objetivo: explorar datos desconocidos para encontrar patrones o relaciones
❖ Técnicas de minería de datos y web mining
Análisis inferencial
❖ Objetivo: realizar inferencias y generalizaciones a partir de una muestra de datos
❖ Técnicas propias del análisis inferencial (muestreo y análisis multivariado)
❖ Emplea el análisis descriptivo para presentar y resumir la infromación
Objetivo:
Conocer las habilidades en
lectura que alcanzan los Conclusión:
estudiantes al terminar la
escuela Distribución de estudiantes según el nivel de desempeño
alcanzado en lectura, 2019
IV nivel 30.60%
Muestra de
3.000 III nivel 23.40%
estudiantes
Total de
estudiantes del país II nivel 38.80%
I nivel 7.20%
Fuente: Unesco, 2019
Análisis espacial
• Objetivo: Comprender patrones geográficos y relaciones entre datos en un contexto
geográfico
• Técnicas de Sistemas de información Geográfica (SIG)
Pregunta de investigación
¿Existen patrones espaciales en la
disminución de la matrícula de las
escuelas públicas de Costa Rica?
Análisis de series de tiempo
• Objetivo: analizar el cómportamiento de variables cuyos datos se registran en el
tiempo. Se busca proyectar el comportamiento futuro
• Estadística multivariada, técnicas de minería de datos y machine learning
Análisis de texto
• Área de la minería de datos enfocada en la web principalmente no estructurados.
• Incluye la Minería de contenido web (textos, imágenes, videos), minería de estructura
web (enlaces y relaciones entre páginas) y minería de uso web (interacciones de los
usuarios)
Comparaciones entre discursos Similitudes entre discursos
Objetivo:
Contrastar los discursos
presidenciales de las
administraciones: Chinchilla,
Solís y Alvarado, con sus
prioridades y enfoques
Análisis de redes
• Identificar relaciones entre entidades, redes de colaboración, transporte, etc.
• Estadística multivariada
Redes entre productos de exportación y
socios comerciales en Costa Rica. 2018
Objetivo: Identificar los
principales socios comerciales con
respecto al peso de los principales
productos de exportación.
Muchas gracias