UNIVERSIDAD DE GUAYAQUIL(UG)
TEMA: Tipos de datos
FACULTAD: Ingeniería industrial
DOCENTE: Ing. Ind. Joao Nieto Pacheco, Msc.
AULA: 2-4
Guayaquil – Ecuador
2021-2022
¿Qué es el minado de Datos o Data Mining?
El minado de datos es un conjunto de técnicas y tecnologías que permiten explorar grandes
bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones
repetitivos que expliquen el comportamiento de estos datos.
A pesar de que la idea del Data Mining puede parecer una innovación tecnológica muy
reciente, en realidad este término apareció en los años sesenta conjuntamente con otros
conceptos como, por ejemplo, el data fishing o data archeology. No obstante, no fue hasta los
años ochenta cuando empezó su consolidación.
La minería de datos surgió con la intención o el objetivo de ayudar a comprender una
enorme cantidad de datos y que estos pudieran ser utilizados para extraer conclusiones para
contribuir en la mejora y el crecimiento de las empresas. Sobre todo, por lo que hace a las
ventas o fidelización de clientes.
Su principal finalidad es explorar, mediante la utilización de distintas técnicas y
tecnologías, bases de datos enormes de manera automática. El objetivo es encontrar patrones
repetitivos, tendencias o reglas que expliquen el comportamiento de los datos que se han ido
recopilando con el tiempo. Estos patrones pueden encontrarse utilizando estadísticas o
algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
Por tanto, los datos son el medio o la base para llegar a conclusiones y transformar estos
datos en información relevante, para que las empresas puedan abarcar mejoras y soluciones
que les ayuden a conseguir sus objetivos.
Ventajas y desventajas del minado de datos
Los análisis de datos mediante el Data Mining pueden aportar numerosas ventajas a las
empresas para la optimización de su gestión y tiempo, pero también para la captación y
fidelización de clientes, que les permitirá aumentar sus ventas. Aquí te dejamos 8 ventajas que
nos puede aportar:
Permite descubrir información que no esperábamos obtener. Esto se debe a su
funcionamiento con algoritmos, ya que permite hacer muchas combinaciones
distintas.
Es capaz de analizar bases de datos con una enorme cantidad de datos.
Los resultados son muy fáciles de interpretar y no es necesario tener conocimientos
en ingeniería informática.
Permite encontrar, atraer y retener clientes.
La empresa puede mejorar la atención al cliente a partir de la información obtenida.
Da a las empresas la posibilidad de ofrecer a los clientes los productos o servicios
que necesitan.
Antes de usar los modelos, estos son comprobados mediante estadísticas para
verificar que las predicciones obtenidas son válidas.
Ahorra costes a la empresa y abre nuevas oportunidades de negocio.
Sin embargo, también puede aparecer algún inconveniente a la hora de utilizar técnicas de
Data Mining. Por ejemplo, dependiendo del tipo de datos que se quiera recopilar, nos puede
llevar mucho trabajo, o a veces la inversión inicial para obtener las tecnologías necesarias
para la recopilación de datos puede tener un coste elevado.
Cómo llevar a cabo un minado de datos
Los mineros o exploradores de datos a la hora de llevar a cabo un análisis de minería de
datos, deberán realizar los siguientes pasos:
1# Investigación comercial
Antes de empezar, deberás tener una idea completa de los objetivos de tu empresa, de los
recursos disponibles y de los diversos escenarios actuales en consonancia con los requisitos.
Esto sería muy útil de cara a crear un plan detallado que alcance los objetivos de la
organización.
2# Análisis de calidad
A medida que vamos recopilando los datos de distintas fuentes, necesitaremos verificarlos
y compararlos para garantizar que no hayan cuellos de botella en el proceso de integración de
datos. La garantía de calidad ayuda a detectar cualquier anomalía en los datos, como la
interpolación de datos faltantes, manteniendo los datos en plena forma antes de que se
sometan a una extracción.
3# Limpieza de datos
Se trata de la selección, limpieza, enriquecimiento, reducción y transformación de la base
de datos. Se calcula que el 90% del tiempo en este tipo de procesos se gasta en este paso.
4# Transformación de datos
Este paso consta de cinco sub-etapas. Los procesos involucrados hacen que los datos estén
listos en conjuntos de datos finales.
Suavizado de datos: Se elimina el ruido de los datos
Resumen de datos: La agregación de conjuntos de datos se aplica en este proceso
Generalización de datos: Los datos se generalizan reemplazando cualquier dato de bajo
nivel con conceptualizaciones de nivel superior
Normalización de datos: Los datos se definen en rangos establecidos
Construcción de atributos de datos: Los conjuntos de datos deben estar en el conjunto de
atributos antes de la minería de datos
5# Modelado de datos
Por último, para una mejor identificación de los patrones de datos, se implementan varios
modelos matemáticos en el conjunto de datos, basados en varias condiciones.
Actualmente este tipo de trabajos se están realizando en seguridad de datos, finanzas,
salud, marketing, detección de fraude, búsquedas online, procesamiento del lenguaje natural,
coches inteligentes, entre otros. Es por este motivo, que la minería de datos se está
convirtiendo en uno de los trabajos con mayor proyección para el futuro.