1. Definición de Datos.
Los datos representan un fragmento de una cantidad, medida, descripción o
palabra, los cuales son agrupados o clasificados de una determinada manera para
generar de información.
En forma general, los datos solo sirven después de ser procesados según una
intención y relevancia. Las bases de datos, por ejemplo, agrupan los datos en
estructuras lógicas y sistemáticas para luego ser analizadas o procesadas según
un propósito.
2. Tipos de Datos: Simples y Estructurados.
Los tipos de datos simples más básicos son: entero, lógico, carácter y real. Y la
mayoría de los lenguajes de programación los soportan, no como ocurre con los
estructurados que pueden variar de un lenguaje a otro. ejemplo: Los enteros son
números que no tienen parte decimal y pueden estar precedidos del signo + ó –.
Por ejemplo: 10590, +176, -42.
Los reales son números que tienen una parte decimal y pueden estar precedidos
del signo + ó –. Por ejemplo: 7.5, -8724.315, +14500.0.
Mientras que una variable de un tipo simple sólo referencia a un elemento, los
estructurados se refieren a colecciones de elementos. Las colecciones de
elementos que aparecen al hablar de tipos estructurados son muy variadas:
tenemos colecciones ordenadas que se representan mediante el tipo array,
colecciones sin orden mediante el tipo conjunto, e incluso colecciones que
contienen otros tipos, son los llamados registros.
3. Comparación y preferencia de tipos de datos
simples y estructurados.
Almacenamiento
Esta es la diferencia más clara entre ambos conceptos. Los datos estructurados
se almacenan en una base de datos relacional (RDBMS), mientras que los datos
no estructurados no pueden almacenarse en estructuras de datos relacionales
predefinidas (NoSQL).
Facilidad de análisis
Los datos estructurados al poseer, como su propio nombre indica, una estructura
organizada que otorga al usuario de facilidad de análisis para la obtención de
resultados medibles. Por el contrario, los datos no estructurados
necesitan herramientas analíticas más complejas.
Flexibilidad
Los datos no estructurados que permanecen en el Data Lake son más flexibles, es
decir, mucho menos sensibles a los cambios que los datos estructurados. Al
almacenar toda la información en bruto, permite el acceso de cualquier usuario
para configure y reconfigurare según la finalidad para la que hayan sido
concebidos.
Información
Los datos almacenados en el Data Warehouse son más maduros y, precisamente
por esa cualidad proporcionan resultados organizados y fiables que los que
permanecen en el Data Lake, que destacan por ser un conglomerado de
información masiva.
A pesar de sus diferencias, ambos están destinados a convivir en armonía en el
entorno empresarial. Son conceptos complementarios, por lo que pueden utilizarse
por separado para ayudar al negocio a conocer mejor el mercado y el consumidor
y, en base a esto diseñar la estrategia de negocio adecuada.