0% encontró este documento útil (0 votos)
39 vistas3 páginas

Análisis y Limpieza de Datos en LinkedIn

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
39 vistas3 páginas

Análisis y Limpieza de Datos en LinkedIn

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ANALISIS DE DATOS – LIKENDIN

Es el proceso de inspección, limpieza, transformación y modelado de datos para la toma de


decisiones empresariales

Analista de datos:

 Trabaja con datos que se presentan en formas muy diversas


 Las herramientas son tan diversas como los datos
 Parte de filas de datos en bases de datos, hojas de calculo o archivos CSV
 Convierte esos registros en resultados más significativos
 Crea potentes visualizaciones de datos

QUE ES A LIMPIEZA DE DATOS

Es remodelar los datos, agregar cálculos que no existen para enriquecer el modelos o eliminar
columnas y filas que no son necesarias para el análisis

VISUALIZACION DE DATOS

Muestra deforma inmediata y visual los problemas existentes en los datos asi como mejores
formas de interpretar los datos

ROLES DEL ANALISTA DE DATOS

 Traer los datos


 Hace análisis iniciales

EQUIPO PARA ANLISIS DE DATOS

 Comparte habilidades comunes


 Datos, habilidades y pensamiento únicos
 Trabaja de forma coordinada
 Su objetivo es: analizar, construir medidas y brindar información

HABILIDADES DE LOS ANALISTAS DE DATOS

 La función a realizar determinara el requisito de habilidades técnicas


 Las habilidades también cambiaran con el tiempo
 Interpretar datos, asi como identificar el formatos mas adecuado para los datos

HABILIDADES QUE NECESITA UN ANALISTA

 Minería de datos
 Consultas a orígenes de datos
 Modelado de datos
 Diagramas de flujo de trabajo
 Visualización
ROLES EN LA CIENCIA DE LA INFORMACION

 Análisis
 Investigación
 Gobierno de datos
 Ciencia de datos
 Gestión de proyectos

TIPOS DE DATOS

El tipo de dato define

 La estructura de dato que tienen los valores que se almacenan en una columna
 Definen las acciones que se pueden hacer sobre los datos
 Son muy variados
 Texto o cadena, fecha, fecha y hora, numero, booleano

LIDIAR CON LOS DATOS QUE NO TENEMOS

Siempre buscar una forma de extraerlos o calcularlos usando una función o formula, funciones
básicas; sumas, restar, multiplicar, dividir, concatenar, estructuras condicionales si o IF, CASE

LIMPIEZA DE DATOS

 Se trata de estandarizar los datos, eliminar lo que no es necesarios para el informe y


corregir los valores cuando son inconsistentes
 Validar los datos
 Estandarizar los datos

MEJORES PRACTICAS DE DATOS

 Examinar los resultados antes de organizar algo


 Organizar un proceso de verificación o revisión por duplicado
 Mantener una agenda adecuado con los puntos a presentar
 Anotar todo lo que puedas en una reunión y las preguntas de seguimiento
 Compilar documentación que respalde al consumidor
 Reforzar y actualizar las habilidades individuales del equipo

GOBERNABILIDAD DE LOS DATOS

REGULADA

 Existe gobierno de los datos en industria regulada


 Las organizaciones tienen un plan de datos
 Tienen muchas áreas de enfoque
 Mayor beneficio es la calidad de datos
 Los datos son seguros e íntegros

NO REGULADA

 No existe un plan de gobierno de datos


 Pedir diccionario de datos
 Puedes o no formar parte del equipo de gobierno

ERRORES COMUNES EN LOS PRINCIPIANTES

 Se asume que reunir datos es fácil


 Se intenta hacer menos pregunta por miedo a parecer que no sabes
 Revisar el conteo de registros, devueltos por cada operación
 Corroborar las cifras siempre
 Dominar las herramientas de trabajo
 No solicitar el diccionario de datos
 No asumir nada en los datos por que cada quien lee los datos diferentes
 Dominar las técnicas para crear las uniones

DATOS DE ORIGEN

 Los datos de origen son donde se inician los datos y donde viven
 Son mas fiables cuando mas cerca del origen esten
 Los datos viven en muchos lugares diferentes

MUY IMPORTANTE:

 Identificar los conjuntos de datos de origen


 Determinar la mejor fuente para tus datos
 Crear informes a partir de tus propias fuentes

DICCIONARIO DE DATOS

 Mapea la información
 Muestra relaciones

SIN DICCIONARIO

 Resolver las relaciones usando otros informes


 Buscar a los usuarios de negocio, para cada información

DOCUMENTACION

Responde a preguntas: donde estas las uniones, combinaciones, cuando se actualizan los datos,
origen de los datos, metas etc

Documentar cada paso

También podría gustarte