0% encontró este documento útil (0 votos)
29 vistas6 páginas

Tema 1

Este documento trata sobre el panorama general de Big Data y Ciencia de Datos. Explica conceptos clave como las 3 V's de Big Data (Volumen, Velocidad y Variedad), qué es un dato, tipos de datos, y cómo funciona Big Data a través de la integración, gestión y análisis de datos.

Cargado por

Edgar Guerrero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como ODT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
29 vistas6 páginas

Tema 1

Este documento trata sobre el panorama general de Big Data y Ciencia de Datos. Explica conceptos clave como las 3 V's de Big Data (Volumen, Velocidad y Variedad), qué es un dato, tipos de datos, y cómo funciona Big Data a través de la integración, gestión y análisis de datos.

Cargado por

Edgar Guerrero
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como ODT, PDF, TXT o lee en línea desde Scribd

Tema 1.

Panorama general de Big Data y Ciencia de


Datos

•   1.1 ¿Qué es la Ciencia de Datos? 


¿Qué es exactamente Ciencia de Datos?
¿Cuáles y qué son las 3 V's que surgieron en la década de los 2000 con la llegada del concepto
de Big Data?

A. Son Valor de Mercado, Ventas y Vigencia y es una forma de validar a la Big Data.
B. Son Volumen, Veracidad y Valor y son elementos que forman parte del concepto de Big Data.
C. Son Volumen, Velocidad y Variedad y son características que forman parte del concepto de Big Data.

La respuesta correcta es la C. En la década del 2000 el analista de Gartner Doug Laney formuló 3
características que sirven para identificar a los grandes volúmenes de datos, conocidos hoy como
Big Data y estás son: Volumen (el gran tamaño que los datos que se producen hoy en día está
teniendo); Velocidad (la forma en la que los datos están fluyendo y la necesidad de contar con
tecnologías rápidas y eficientes para analizarlos en tiempo real) y Variedad (los diferentes tipos y
fuentes de datos tanto estructurados; semi-estructurados y no estructurados).

¿Qué es un dato?

A. Es la mínima representación de información que necesita una computadora para poder funcionar.
B. Es un elemento que determina un patrón elemental de una cosa; persona u organización y que sirve
para hacerlo único.
C. Es la representación simbólica de un atributo, que puede ser cualitativo o cuantitativo, de la
información de un objeto; persona; ser viviente; organización; etc.

La respuesta correcta es la C. Un dato es la representación simbólica de un atributo que puede ser
cuantificable ó que brinda ciertas cualidades (estado de ánimo; nivel de confianza, etc.); atribuible
a una persona, objeto; organización o ser viviente.
Tipos de datos
1. Datos estructurados : son aquellos donde los datos tienen una estructura bien particular, como son
las fechas, los números, entre otros
Un ejemplo de ellos son las hojas de cálculo

2. Datos no estructurados : tienen un formato específico y no se pueden almacenar en hoja de cálculos


y mucho menos manipular la información
un ejemplo de esto son los documentos en PDF.

3. Datos semiestructurados: este tipo de datos no tienen un formato en particular, ya que cuentan con
sus propios formatos denominados metadatos semi-estruturados,
ejemplo de estos son los códigos de las páginas web (HTML).

Big Data trata de explotar las características únicas de los datos y de la analítica como activos
digitales para crear nuevas fuentes de valor económico para una organización. La mayoría de los activos
exhiben una relación transaccional de uno a uno.
Definiciones:
Business Intelligence
Con el Business Intelligence, a través de una serie de técnicas, se transforman todos los datos
de una organización en información, con la cual se podrán identificar posibles indicadores, los
cuales serán explotados con objeto de tomar las mejores decisiones. Por ejemplo, listados de
ventas o cuadros de control de producción.

Business Analytics
se refiere a la exploración de los datos históricos de muchos sistemas de origen a través de
análisis estadísticos,  análisis cuantitativos, data mining, modelado predictivo y otras
tecnologías y técnicas para identificar las tendencias y comprender la información que puede
impulsar el cambio empresarial y apoyo sostenido de prácticas empresariales exitosas. 

Hadoop
marco de referencia para el uso de grandes volúmenes de datos
NoSQL
base de datos para datos no estructurados

análisis descriptivo
ayuda a los analistas a comprender la realidad actual del negocio. Necesita comprender el
contexto de los datos históricos para comprender la realidad actual de dónde se encuentra el
negocio hoy en día. Este enfoque ayuda a una organización a responder preguntas tales como
qué estilos de productos se están vendiendo mejor este trimestre en comparación con el
último trimestre, y qué regiones están exhibiendo el crecimiento más alto o más bajo.
análisis predictivo
ayuda a anticipar cambios basados en la comprensión de los patrones y las anomalías dentro
de esos datos. Con este modelo, el analista asimila una cantidad de fuentes de datos
relacionadas para predecir los resultados. El análisis predictivo aprovecha los sofisticados
algoritmos de aprendizaje automático (machine learning) para obtener información continua.

1.2 ¿Cómo funciona Big Data? 

¿Cuáles son las 3 acciones clave para el funcionamiento de Big Data?

A. Conocer los datos, Modelar los datos y Gestionar los datos.


B. Conocer los datos, Modelar los datos y Controlar los datos.
C. Integrar los datos, Conocer los datos y Analizar los datos.
D. Integrar los datos, Gestionar los datos y Analizar los datos.

La respuesta correcta es la D. Para entender mejor como funciona Big Data es necesario conocer
las 3 acciones clave que se involucran en su funcionamiento: Integrar los datos; esta acción está
relacionada con la forma en la que los datos deben de ingresarse; para posteriormente
procesarlos y asegurarse que están en el formato correcto y disponibles de forma adecuada para
que se puedan analizar. Gestionar los datos; esta acción determinar la forma en la que los datos
deben ser almacenados para una fácil gestión y control de los mismos. Analizar los datos, es la
forma en la que los datos serán estudiados para determinar la mejor forma de utilizarlos para el
beneficio de la organización.

Identifica el ejemplo que mejor describe el aprendizaje profundo (Deep Learning).

A. Detección de fraudes comerciales.


B. Netflix lo utiliza para poder desarrollar nuevos productos.
C. Ayuda a eliminar el correo "spam" de tu computadora.
D. Simulando el funcionamiento del cerebro, está siendo usado para diseñar automóviles autónomos.

La respuesta correcta es la D. El aprendizaje profundo (Deep Learning) subconjunto de la


inteligencia artificial que a través del concepto de Redes Neuronales Artificiales en donde se buscó
inspiración en entender cómo funciona la biología del cerebro humano y la forma en la que se
realizan las interconexiones entre las neuronas para poder aprender. Ahora se aplica esta
tecnología en el diseño de automóviles autónomos.
TIPO DE DECISIONES
Características de las decisiones

Efectos futuros

Tiene que ver con la medida en que los compromisos relacionados con la decisión afectarán el
futuro. Una decisión que tiene una influencia a largo plazo, puede ser considerada una decisión
de alto nivel, mientras que una decisión con efectos a corto plazo puede ser tomada a un nivel
muy inferior.

Reversibilidad
Se refiere a la velocidad con que una decisión puede revertirse y la dificultad que implica hacer
este cambio. Si revertir es difícil, se recomienda tomar la decisión a un nivel alto, pero si revertir
es fácil se requiere tomar la decisión a un nivel bajo.

Impacto
Esta característica se refiere a la medida en que otras áreas o actividades se ven afectadas. Si el
impacto es extensivo es indicado tomar la decisión a un nivel alto, un impacto único se asocia
con una decisión tomada un nivel bajo.

Calidad
Este factor se refiere a las relaciones laborales, valores éticos, consideraciones legales,
principios básicos de conducta, imagen de la compañía, etc. Si muchos de estos factores están
involucrados se requiere tomar la decisión a un nivel alto, si solo algunos factores son
relevantes se recomienda tomar la decisión a un nivel bajo.

Periodicidad
Este elemento responde a la pregunta de si una decisión se toma frecuente o excepcionalmente:
Una decisión excepcional es una decisión de alto nivel, mientras que una decisión que se toma
frecuentemente es una decisión de nivel bajo.

Estructura
Este determina si la decisión está programada, generalmente las decisiones programadas están
definidas y requieren poco análisis, son de corto plazo, muy reversible y su complejidad es
menor, mientras que las decisiones no programadas son aleatorias, requieren de mayor análisis
y son de largo plazo, irreversibles y más complejas.
Proceso para la toma de decisiones

La toma de decisiones es el proceso a través del cual, se escoge un curso de acción como respuesta a
un problema de decisión.

TIPO DE DECISIONES POR NIVELES OPERATIVOS

También podría gustarte