ANALISIS DE DATOS – LIKENDIN
Es el proceso de inspección, limpieza, transformación y modelado de datos para la toma de
decisiones empresariales
Analista de datos:
Trabaja con datos que se presentan en formas muy diversas
Las herramientas son tan diversas como los datos
Parte de filas de datos en bases de datos, hojas de calculo o archivos CSV
Convierte esos registros en resultados más significativos
Crea potentes visualizaciones de datos
QUE ES A LIMPIEZA DE DATOS
Es remodelar los datos, agregar cálculos que no existen para enriquecer el modelos o eliminar
columnas y filas que no son necesarias para el análisis
VISUALIZACION DE DATOS
Muestra deforma inmediata y visual los problemas existentes en los datos asi como mejores
formas de interpretar los datos
ROLES DEL ANALISTA DE DATOS
Traer los datos
Hace análisis iniciales
EQUIPO PARA ANLISIS DE DATOS
Comparte habilidades comunes
Datos, habilidades y pensamiento únicos
Trabaja de forma coordinada
Su objetivo es: analizar, construir medidas y brindar información
HABILIDADES DE LOS ANALISTAS DE DATOS
La función a realizar determinara el requisito de habilidades técnicas
Las habilidades también cambiaran con el tiempo
Interpretar datos, asi como identificar el formatos mas adecuado para los datos
HABILIDADES QUE NECESITA UN ANALISTA
Minería de datos
Consultas a orígenes de datos
Modelado de datos
Diagramas de flujo de trabajo
Visualización
ROLES EN LA CIENCIA DE LA INFORMACION
Análisis
Investigación
Gobierno de datos
Ciencia de datos
Gestión de proyectos
TIPOS DE DATOS
El tipo de dato define
La estructura de dato que tienen los valores que se almacenan en una columna
Definen las acciones que se pueden hacer sobre los datos
Son muy variados
Texto o cadena, fecha, fecha y hora, numero, booleano
LIDIAR CON LOS DATOS QUE NO TENEMOS
Siempre buscar una forma de extraerlos o calcularlos usando una función o formula, funciones
básicas; sumas, restar, multiplicar, dividir, concatenar, estructuras condicionales si o IF, CASE
LIMPIEZA DE DATOS
Se trata de estandarizar los datos, eliminar lo que no es necesarios para el informe y
corregir los valores cuando son inconsistentes
Validar los datos
Estandarizar los datos
MEJORES PRACTICAS DE DATOS
Examinar los resultados antes de organizar algo
Organizar un proceso de verificación o revisión por duplicado
Mantener una agenda adecuado con los puntos a presentar
Anotar todo lo que puedas en una reunión y las preguntas de seguimiento
Compilar documentación que respalde al consumidor
Reforzar y actualizar las habilidades individuales del equipo
GOBERNABILIDAD DE LOS DATOS
REGULADA
Existe gobierno de los datos en industria regulada
Las organizaciones tienen un plan de datos
Tienen muchas áreas de enfoque
Mayor beneficio es la calidad de datos
Los datos son seguros e íntegros
NO REGULADA
No existe un plan de gobierno de datos
Pedir diccionario de datos
Puedes o no formar parte del equipo de gobierno
ERRORES COMUNES EN LOS PRINCIPIANTES
Se asume que reunir datos es fácil
Se intenta hacer menos pregunta por miedo a parecer que no sabes
Revisar el conteo de registros, devueltos por cada operación
Corroborar las cifras siempre
Dominar las herramientas de trabajo
No solicitar el diccionario de datos
No asumir nada en los datos por que cada quien lee los datos diferentes
Dominar las técnicas para crear las uniones
DATOS DE ORIGEN
Los datos de origen son donde se inician los datos y donde viven
Son mas fiables cuando mas cerca del origen esten
Los datos viven en muchos lugares diferentes
MUY IMPORTANTE:
Identificar los conjuntos de datos de origen
Determinar la mejor fuente para tus datos
Crear informes a partir de tus propias fuentes
DICCIONARIO DE DATOS
Mapea la información
Muestra relaciones
SIN DICCIONARIO
Resolver las relaciones usando otros informes
Buscar a los usuarios de negocio, para cada información
DOCUMENTACION
Responde a preguntas: donde estas las uniones, combinaciones, cuando se actualizan los datos,
origen de los datos, metas etc
Documentar cada paso