0% encontró este documento útil (0 votos)
30 vistas10 páginas

Clasificación y Modelado de Datos

Este documento describe los diferentes formatos de datos, incluyendo datos primarios y secundarios, internos y externos, continuos y discretos, cualitativos y cuantitativos, nominales y ordinales, estructurados y no estructurados. Proporciona definiciones de cada formato junto con ejemplos para ilustrar las diferencias entre ellos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
30 vistas10 páginas

Clasificación y Modelado de Datos

Este documento describe los diferentes formatos de datos, incluyendo datos primarios y secundarios, internos y externos, continuos y discretos, cualitativos y cuantitativos, nominales y ordinales, estructurados y no estructurados. Proporciona definiciones de cada formato junto con ejemplos para ilustrar las diferencias entre ellos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Los formatos de datos en la práctica

Cuando se piensa en la palabra "formato", pueden venir a la mente muchas cosas. Piensa en un anuncio de tu tienda favorita. Podrías encontrarlo
en forma de anuncio impreso, en una valla publicitaria o incluso en un comercial. La información se presenta en el formato que mejor te convenga
para asimilarla. El formato de un conjunto de datos es muy parecido, y la elección del formato adecuado te ayudará a gestionar y utilizar tus datos
de la mejor manera posible.

Ejemplos de formatos de datos


Como ocurre con la mayoría de las cosas, es más fácil que las definiciones encajen cuando podemos emparejarlas con ejemplos de la vida real.
Revisa primero cada definición y luego utiliza los ejemplos para afianzar tu comprensión de cada formato de datos.

Primarios versus secundarios

la siguiente tabla destaca las diferencias entre los datos primarios y secundarios y los ejemplos de cada uno de ellos

Clasificación del
Definición Ejemplos
formato de datos
- Datos de una entrevista que has realizado - Datos de una
Recogidos por un
encuesta realizada a 20 participantes - Datos de
Datos primarios investigador a partir de
cuestionarios que has recibido de un grupo de
fuentes de primera mano
trabajadores
Datos secundarios Recogidos por otras - Datos que compró de los perfiles de clientes de una
Clasificación del
Definición Ejemplos
formato de datos
empresa local de análisis computacional de datos - Datos
personas o a partir de otras
demográficos recogidos por una universidad - Datos del
investigaciones
censo recogidos por el gobierno federal

Internos versus externos

la siguiente tabla destaca las diferencias entre los datos internos y externos y los ejemplos de cada uno de ellos

Clasificación del
Definición Ejemplos
formato de datos
-Salarios de los empleados de las distintas unidades de
Datos alojados en los
negocio controlados por RR. HH. - Datos de ventas por
Datos internos sistemas propios de
ubicación de la tienda - Niveles de inventario de productos
una empresa
en los centros de distribución
Datos que viven fuera - Salarios medios nacionales para los distintos puestos de su
Datos externos de una empresa u organización - Informes de crédito de los clientes de un
organización concesionario de automóviles
Continuos versus discretos

la siguiente tabla destaca las diferencias entre los datos continuos y discretos y los ejemplos de cada uno de ellos

Clasificación del
Definición Ejemplos
formato de datos
Datos que se miden y que - Altura de los niños en las clases de tercer grado (52,5
Datos continuos pueden tener casi cualquier pulgadas; 65,7 pulgadas) - Marcadores de tiempo de
valor numérico ejecución en un video - Temperatura
Datos que se cuentan y - Cantidad de personas que visitan un hospital a diario
Datos discretos tienen un número limitado (10, 20, 200) - Capacidad máxima permitida de la sala -
de valores Entradas vendidas en el mes en curso

Cualitativos versus cuantitativos

la siguiente tabla destaca las diferencias entre los datos cualitativos y cuantitativos y los ejemplos de cada uno de ellos
Clasificación del
Definición Ejemplos
formato de datos
Medidas subjetivas y - Actividad física que más se disfruta - Marcas
Cualitativos explicativas de cualidades y favoritas de los clientes más fieles - Preferencias de
características moda de los adultos jóvenes
- Porcentaje de médicos certificados que son
Medidas específicas y objetivas
cuantitativos mujeres - Población de elefantes en África -
de hechos numéricos
Distancia de la Tierra a Marte

Nominal versus Ordinal

la siguiente tabla destaca las diferencias entre los datos nominales y ordinales y los ejemplos de cada uno de ellos

Clasificación del
Definición Ejemplos
formato de datos
- Cliente nuevo, cliente que vuelve, cliente habitual -
Un tipo de datos cualitativos
Nuevo solicitante de empleo, solicitante existente,
Nominales que no se categoriza con un
solicitante interno - Nuevo listado, listado de precio
orden establecido
reducido, ejecución hipotecaria
Ordinales Un tipo de datos cualitativos - Calificaciones de películas (cantidad de estrellas: 1
con un orden o escala estrella, 2 estrellas, 3 estrellas) - Selecciones de
preestablecidos votación por orden (1º, 2º, 3º) - Nivel de ingresos
Clasificación del
Definición Ejemplos
formato de datos
(ingresos bajos, ingresos medios, ingresos altos)

Estructurados versus no estructurados

la siguiente tabla destaca las diferencias entre los datos estructurados y no estructurados y los ejemplos de cada uno de ellos

Clasificación del
Definición Ejemplos
formato de datos
Datos organizados de cierta forma, - Informes de gastos - Declaraciones de
Datos estructurados
por ejemplo, en filas y columnas impuestos - Inventario de tiendas
Datos que no se organizan de forma - Mensajes de redes sociales - Correos
Datos no estructurados
que sea fácil identificarlos electrónicos - Videos

La estructura de los datos


Los datos están en todas partes y pueden almacenarse de muchas maneras. Las categorías de datos generales son dos:

 Datos estructurados: Datos organizados de cierta forma, por ejemplo, en filas y columnas
 Datos no estructurados: No organizados de ninguna manera fácil de identificar.
Por ejemplo, cuando calificas tu restaurante favorito en línea, estás creando datos estructurados. Pero cuando utilizas Google Earth para ver una
imagen por satélite de la ubicación de un restaurante, estás utilizando datos no estructurados.

A continuación, te recordamos las características de los datos estructurados y no estructurados:

Datos estructurados Datos no estructurados


Tipos de datos definidos Tipos de datos variados
Datos más a menudo
Datos más a menudo cuantitativos
cualitativos
Fáciles de organizar Difíciles de buscar
Fáciles de buscar Proporcionan más libertad de análisis
Almacenados en lagos de datos, almacenes de datos y bases de
Fáciles de analizar
datos NoSQL
Almacenados en bases de datos relacionales
No se pueden poner en filas y columnas
y almacenes de datos
Ejemplos: Mensajes de texto, comentarios en redes sociales,
Contenidos en filas y columnas transcripciones de llamadas telefónicas, diversos archivos de
registro, imágenes, audio, video
Ejemplos: Excel, Google Sheets, SQL, datos
de clientes, registros telefónicos, historial de
transacciones

Datos estructurados
Como hemos descrito anteriormente, los datos estructurados se organizan en un formato determinado. Esto facilita su almacenamiento y consulta
para las necesidades de la empresa. Si los datos se exportan, la estructura va junto con los datos.
Datos no estructurados
Los datos no estructurados no pueden ser organizados de una manera fácil de identificar. Y en el mundo hay muchos más datos no estructurados
que estructurados. Los archivos de video y audio, los archivos de texto, el contenido de las redes sociales, las imágenes por satélite, las
presentaciones, los archivos PDF, las respuestas a encuestas abiertas y los sitios web son todos ellos tipos de datos no estructurados.

El problema de la equidad
La falta de estructura hace que los datos no estructurados sean difíciles de buscar, gestionar y analizar. Pero los recientes avances en inteligencia
artificial y algoritmos de aprendizaje automático están empezando a cambiar esta situación. Ahora, el nuevo reto al que se enfrentan los científicos
de datos es asegurarse de que estas herramientas sean inclusivas e imparciales. De lo contrario, ciertos elementos de un conjunto de datos estarán
más ponderados y/o representados que otros. Y como estás aprendiendo, un conjunto de datos no equitativo no representa con exactitud a la
población, causando resultados sesgados, bajos niveles de precisión y análisis poco fiables.

Niveles y técnicas de modelado de datos


Esta lectura presenta el modelado de datos y los diferentes tipos de modelos de datos. Los modelos de datos ayudan a mantener la consistencia de
los datos y permiten a las personas trazar un mapa de cómo se organizan. Una comprensión básica facilita a los analistas y a otros interesados dar
sentido a sus datos y utilizarlos de forma correcta.

Nota importante: Como analista de datos junior, no se te pedirá que diseñes un modelo de datos. Pero es posible que te encuentres con modelos de
datos existentes en tu organización.

¿Qué es el modelado de datos?


El modelado de datos es el proceso de creación de diagramas que representan visualmente cómo se organizan y estructuran los datos. Estas
representaciones visuales se llaman modelos de datos. Se puede pensar en el modelado de datos como en el plano de una casa. En un momento
dado, puede haber electricistas, carpinteros y fontaneros utilizando ese plano. Cada uno de estos constructores tiene una relación diferente con el
plano, pero todos lo necesitan para entender la estructura general de la casa. Los modelos de datos son similares; los distintos usuarios pueden
tener necesidades de datos diferentes, pero el modelo de datos les permite comprender la estructura en su conjunto.

Niveles de modelado de datos


Cada nivel de modelado de datos tiene un nivel de detalle diferente.

Los tres tipos más comunes de modelado de datos


1. El modelado conceptual de datos ofrece una visión de alto nivel de la estructura de datos, como la forma en que los datos interactúan en
una organización. Por ejemplo, un modelo de datos conceptual puede utilizarse para definir los requisitos comerciales de una nueva base
de datos. Un modelo de datos conceptual no contiene detalles técnicos.
2. El modelo de datos lógico se centra en los detalles técnicos de una base de datos, como las relaciones, los atributos y las entidades. Por
ejemplo, un modelo de datos lógico define cómo se identifican los registros individuales en una base de datos. Pero no detalla los nombres
reales de las tablas de la base de datos. Ese es el trabajo de un modelo de datos físico.
3. El modelo de datos físico describe el funcionamiento de una base de datos. Un modelo de datos físico define todas las entidades y atributos
utilizados; por ejemplo, incluye los nombres de las tablas, los nombres de las columnas y los tipos de datos de la base de datos.
Se puede encontrar más información en esta comparación de modelos de datos.

Técnicas de modelado de datos


Hay muchos enfoques a la hora de desarrollar modelos de datos, pero dos métodos comunes son el Diagrama de Relación de Entidades (ERD) y el
diagrama del Lenguaje Unificado de Modelado (UML). Los ERD son una forma visual de entender la relación entre las entidades del modelo de
datos. Los diagramas UML son diagramas muy detallados que describen la estructura de un sistema mostrando las entidades, los atributos, las
operaciones y las relaciones del sistema. Como analista de datos junior, tendrás que entender que existen diferentes técnicas de modelado de datos,
pero en la práctica, probablemente utilizarás la técnica existente en tu organización.

Puedes leer más sobre ERD, UML y diccionarios de datos en este artículo sobre técnicas de modelado de datos.

Análisis de datos y modelado de datos


El modelado de datos puede ayudarte a explorar los detalles de alto nivel de tus datos y cómo se relacionan en los sistemas de información de la
organización. El modelado de datos a veces requiere un análisis de datos para entender cómo se reúnen los datos; de esta manera, se sabe cómo
mapear los datos. Por último, los modelos de datos facilitan la comprensión de los datos por parte de todos los miembros de la organización y la
colaboración con ellos. ¡Esto es importante para ti y para todos los miembros de tu equipo!

También podría gustarte