1
ACTIVIDAD
Ensayo
Cristian Ramos Moreno
Facultad de Ingeniería de Sistemas, Fundación Universitaria Compensar
Fundamentos de inteligencia de negocios y gobierno de datos
2023
2
ACTIVIDAD
Tabla de contenido
Reflexión sobre los fundamentos de la ciencia de datos y la forma en que se cuenta con la
relación e integración con el Big Data.............................................................................................3
Ciencia de datos y Big Data.............................................................................................3
Conclusión...........................................................................................................................8
Referencias..........................................................................................................................9
3
ACTIVIDAD
Reflexión sobre los fundamentos de la ciencia de datos y la forma en que se cuenta con la
relación e integración con el Big Data
Ciencia de datos y Big Data
La ciencia de datos es un campo con múltiples disciplinas que combina la estadística, las
matemáticas y la informática para extraer conocimientos útiles a partir de grandes conjuntos de
datos. El objetivo de la ciencia de datos es descubrir patrones, relaciones y tendencias en los
datos que permitan tomar decisiones informadas; por consiguiente, el Big Data se refiere a
conjuntos de datos complejos y pesados hablando de tamaño en (KB) que superan la capacidad
de procesamiento de los sistemas de datos tradicionales o de almacenamientos muy simples.
La ciencia de datos y el Big Data están estrechamente relacionados y se complementan
entre sí. La ciencia de datos proporciona las herramientas y técnicas necesarias para analizar y
comprender grandes conjuntos de datos, mientras que el Big Data proporciona la infraestructura
y los recursos necesarios para almacenar y procesar grandes cantidades de datos.
La integración de la ciencia de datos y el Big Data es fundamental para una amplia gama
de aplicaciones, desde la predicción del comportamiento del consumidor hasta la detección
temprana de enfermedades proporcionando que en estos casos el análisis de grandes conjuntos de
datos puede generar información valiosa y una ventaja competitiva en el mercado además claro
está en beneficio de la calidad de vida de las personas.
En adición a lo anterior, la ciencia de datos y el Big Data también están integrados en la
inteligencia artificial y el aprendizaje automático ya que el común denominador es el uso de
algoritmos de aprendizaje automático que se utilizan para analizar grandes conjuntos de datos y
encontrar patrones y tendencias que puedan utilizarse para tomar decisiones.
4
ACTIVIDAD
Conceptos de datos
Anteriormente, definimos como se interrelacionan la ciencia de datos y el Big data.
Ahora abordaré los conceptos de datos aplicado en la ciencia de datos puesto que se enfoca en la
extracción de información valiosa a partir de datos mediante el uso de técnicas y herramientas
estadísticas y de programación. Los datos se consideran el material crudo sobre el cual se trabaja
en la ciencia de datos, y pueden incluir información estructurada por ejemplo: bases de datos
(SQL y NoSQL) y no estructurados como texto y multimedia.
conocimiento e información
Los datos se convierten en información cuando se procesan y se transforman en una
forma que tiene significado donde nos arrojan valor y conocimiento. La información es valiosa
porque permite a las personas tomar decisiones informadas y basadas en hechos; sin embargo, el
valor de la información depende de la calidad de los datos subyacentes y la precisión del análisis
realizado sobre ellos y esto se logra gracias a un proceso que se denomina extracción,
transformación y carga de datos (ETL).
Importancia de los datos en la actualidad
La importancia de los datos en la actualidad se considera muy alta debido a la gran
cantidad de información que se genera cada día en todas las áreas de trabajo y uso cotidiano en la
vida de las personas, es decir, desde sectores laborales como la industria, la salud y el
entretenimiento. La capacidad de recopilar, almacenar y procesar grandes cantidades de datos ha
llevado a avances significativos en áreas como la inteligencia artificial (ANI, AGI y ASI), el
aprendizaje automático y la automatización de procesos empresariales (BI).
Para ampliar un poco más en el concepto y entender los tres tipos de la inteligencia
artificial que existen
5
ACTIVIDAD
Inteligencia artificial estrecha (ANI): “Es aquella que se enfoca principalmente en
una sola tarea estrecha, con un rango limitado de habilidades.” (Hutter, 2005),
podemos estar hablando algunas de uso cotidiano y común como Siri y Alexa
Inteligencia artificial general (AGI): Este tipo de inteligencia artificial seria capaz
de expresarse y tener una comprensión como lo haría un humano.
Super inteligencia artificial (ASI): Este tipo de inteligencia artificial es capaz de
emular el comportamiento humano, inclusive de tomar decisiones que pueden
superar la capacidad de un humano cualquiera (Hutter, 2005).
La generación de valor con los datos
En el caso de la generación de valor con los datos implica el uso de herramientas y
técnicas de ciencia de datos para descubrir patrones y relaciones entre estos que puedan ser
utilizados para mejorar los procesos organizacionales, tomar decisiones más informadas y
mejorar la rentabilidad, esto por medio del conocimiento tácito y explicito que genera la
información .
EL logro de esta generación de valor se logra a través del análisis y la interpretación de
los datos para identificar oportunidades y desafíos que puedan afectar o mejorar el desempeño
laboral o las áreas de la organización.
La importancia del uso y manipulación de los datos
La importancia del uso y manipulación de los datos radica en la capacidad de extraer
información valiosa para la toma de decisiones informadas lo que puede denominarse como
“Business intelligence” (BI), esta área organizacional ha venido implementándose en muchas
compañías con el fin de dar una oportunidad de mejora con el uso de los datos y la información;
6
ACTIVIDAD
sin embargo, también es importante tener en cuenta los aspectos éticos y legales de la
recopilación y el uso de datos, especialmente cuando se trata de datos personales y sensibles.
Las organizaciones deben tomar medidas para garantizar la privacidad y la seguridad de
los datos, y cumplir con las leyes y regulaciones aplicables por este motivo se han creado o
implementado normas y leyes a nivel internacional y hablando especialmente de Colombia como
lo son las normas ISO (9001 y 27001), además de la ley de protección de datos personales (ley
1581 de 2012) y por ultimo y no menos importante el derecho de Hábeas Data “El derecho de
hábeas data es aquel que tiene toda persona de conocer, actualizar y rectificar la información que
se haya recogido sobre ella en archivos y bancos de datos de naturaleza pública o privada”
(Superintendencia de industria y comercio, 2021).
La SIC nos permite conocer en su pagina web el derecho de Habeas data y la definición y
conceptos relacionados con datos e información a que a mi consideración debería saber cualquier
persona y mas si su laboral es la manipulación de datos.
La manipulación de datos nos aborda en un tema importante como es la seguridad de los
datos ya que es muy importante en hoy en día debido al gran volumen de información
confidencial y personal que se maneja en línea (redes sociales, páginas web con cookies y
entidades públicas y privadas). Los datos personales incluyen información sobre identidad,
finanzas, historial médico, entre otros y si esta información se pierde o se expone a terceros no
autorizados, puede tener consecuencias graves para los individuos afectados.
La seguridad de los datos puede verse comprometida de diversas maneras como los son:
la piratería informática, el robo de identidad los virus o ataques informáticos (malware y
phishing) que son los más comunes y la exposición accidental de información. Por lo tanto, es
importante implementar medidas de seguridad y protección para garantizar que los datos estén
7
ACTIVIDAD
protegidos en todo momento. Algunos métodos que pueden implementar las compañías y las
personas es el mejoramiento de contraseñas con caracteres especiales entre números y letras
mayúsculas y minúsculas, la autenticación de múltiples factores, la encriptación de datos, la
implementación de cortafuegos y la realización de pruebas de penetración regulares para
identificar posibles vulnerabilidades (auditorías internas y externas).
8
ACTIVIDAD
Conclusión
El objetivo guía del presente ensayo era investigar, analizar los conceptos, importancia,
uso y relación entre la ciencia de datos y el Big Data con el manejo de los datos, información y
conocimiento.
Se expuso los conceptos importantes para la elaboración de este ensayo y poder
comprender y exponer la importancia de los datos como material crudo sobre el cual se maneja la
ciencia de datos y el Big Data. Con la importancia que radica en su manipulación y la obtención
de información y generación de conocimiento en un entorno de organización empresarial y en el
uso en la vida cotidiana, junto con la relación de como puede llegar a generar valor y rentabilidad
sin dejar a un lago aspectos éticos, normativos y legales en la recopilación, manipulación y
almacenamiento de los datos.
9
ACTIVIDAD
Referencias
[1] Hutter, M. (2005). Universal Artificial Intelligence. Springer.
[2] Klippa. (04 de Agosto de 2022). Klippa.com. Obtenido de
https://www.klippa.com/es/blog/informativo/extraccion-datos/#:~:text=Extraer%20los
%20datos%20permite%20procesarlos,proceso%20de%20toma%20de%20decisiones.
[3] López Murphy, J. J. (2017). La ingeniería del big data ¿Cómo trabajar con datos? UOC.
[4] Naeem, T. (23 de Junio de 2020). Astera. Obtenido de
https://www.astera.com/es/type/blog/database-extraction/
[5] PowerData. (2022). PowerData.es. Obtenido de https://www.powerdata.es/seguridad-de-
datos
[6] Superintendencia de industria y comercio. (2021). SIC. Obtenido de
https://www.sic.gov.co/manejo-de-informacion-personal