0% encontró este documento útil (0 votos)
67 vistas5 páginas

Data Mining

Este documento presenta una clase sobre tipos de datos impartida por el Ingeniero Industrial Joao Nieto Pacheco en la Universidad de Guayaquil, Ecuador. Explica qué es el minado de datos o data mining, sus ventajas y desventajas, y los pasos para llevar a cabo un análisis de minería de datos que incluyen investigación comercial, análisis de calidad de datos, limpieza de datos, transformación de datos y modelado de datos.

Cargado por

Jasmin Baque
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
67 vistas5 páginas

Data Mining

Este documento presenta una clase sobre tipos de datos impartida por el Ingeniero Industrial Joao Nieto Pacheco en la Universidad de Guayaquil, Ecuador. Explica qué es el minado de datos o data mining, sus ventajas y desventajas, y los pasos para llevar a cabo un análisis de minería de datos que incluyen investigación comercial, análisis de calidad de datos, limpieza de datos, transformación de datos y modelado de datos.

Cargado por

Jasmin Baque
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD DE GUAYAQUIL(UG)

TEMA: Tipos de datos

FACULTAD: Ingeniería industrial

DOCENTE: Ing. Ind. Joao Nieto Pacheco, Msc.

AULA: 2-4

Guayaquil – Ecuador
2021-2022
¿Qué es el minado de Datos o Data Mining?

El minado de datos es un conjunto de técnicas y tecnologías que permiten explorar grandes

bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones

repetitivos que expliquen el comportamiento de estos datos.

A pesar de que la idea del Data Mining puede parecer una innovación tecnológica muy

reciente, en realidad este término apareció en los años sesenta conjuntamente con otros

conceptos como, por ejemplo, el data fishing o data archeology. No obstante, no fue hasta los

años ochenta cuando empezó su consolidación.

La minería de datos surgió con la intención o el objetivo de ayudar a comprender una

enorme cantidad de datos y que estos pudieran ser utilizados para extraer conclusiones para

contribuir en la mejora y el crecimiento de las empresas. Sobre todo, por lo que hace a las

ventas o fidelización de clientes.

Su principal finalidad es explorar, mediante la utilización de distintas técnicas y

tecnologías, bases de datos enormes de manera automática. El objetivo es encontrar patrones

repetitivos, tendencias o reglas que expliquen el comportamiento de los datos que se han ido

recopilando con el tiempo. Estos patrones pueden encontrarse utilizando estadísticas o

algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

Por tanto, los datos son el medio o la base para llegar a conclusiones y transformar estos

datos en información relevante, para que las empresas puedan abarcar mejoras y soluciones

que les ayuden a conseguir sus objetivos.

Ventajas y desventajas del minado de datos

Los análisis de datos mediante el Data Mining pueden aportar numerosas ventajas a las

empresas para la optimización de su gestión y tiempo, pero también para la captación y


fidelización de clientes, que les permitirá aumentar sus ventas. Aquí te dejamos 8 ventajas que

nos puede aportar:

 Permite descubrir información que no esperábamos obtener. Esto se debe a su

funcionamiento con algoritmos, ya que permite hacer muchas combinaciones

distintas.

 Es capaz de analizar bases de datos con una enorme cantidad de datos.

 Los resultados son muy fáciles de interpretar y no es necesario tener conocimientos

en ingeniería informática.

 Permite encontrar, atraer y retener clientes.

 La empresa puede mejorar la atención al cliente a partir de la información obtenida.

 Da a las empresas la posibilidad de ofrecer a los clientes los productos o servicios

que necesitan.

 Antes de usar los modelos, estos son comprobados mediante estadísticas para

verificar que las predicciones obtenidas son válidas.

 Ahorra costes a la empresa y abre nuevas oportunidades de negocio.

Sin embargo, también puede aparecer algún inconveniente a la hora de utilizar técnicas de

Data Mining. Por ejemplo, dependiendo del tipo de datos que se quiera recopilar, nos puede

llevar mucho trabajo, o a veces la inversión inicial para obtener las tecnologías necesarias

para la recopilación de datos puede tener un coste elevado.

Cómo llevar a cabo un minado de datos

Los mineros o exploradores de datos a la hora de llevar a cabo un análisis de minería de

datos, deberán realizar los siguientes pasos:


1# Investigación comercial

Antes de empezar, deberás tener una idea completa de los objetivos de tu empresa, de los

recursos disponibles y de los diversos escenarios actuales en consonancia con los requisitos.

Esto sería muy útil de cara a crear un plan detallado que alcance los objetivos de la

organización.

2# Análisis de calidad

A medida que vamos recopilando los datos de distintas fuentes, necesitaremos verificarlos

y compararlos para garantizar que no hayan cuellos de botella en el proceso de integración de

datos. La garantía de calidad ayuda a detectar cualquier anomalía en los datos, como la

interpolación de datos faltantes, manteniendo los datos en plena forma antes de que se

sometan a una extracción.

3# Limpieza de datos

Se trata de la selección, limpieza, enriquecimiento, reducción y transformación de la base

de datos. Se calcula que el 90% del tiempo en este tipo de procesos se gasta en este paso.

4# Transformación de datos

Este paso consta de cinco sub-etapas. Los procesos involucrados hacen que los datos estén

listos en conjuntos de datos finales.

Suavizado de datos: Se elimina el ruido de los datos

Resumen de datos: La agregación de conjuntos de datos se aplica en este proceso

Generalización de datos: Los datos se generalizan reemplazando cualquier dato de bajo

nivel con conceptualizaciones de nivel superior

Normalización de datos: Los datos se definen en rangos establecidos


Construcción de atributos de datos: Los conjuntos de datos deben estar en el conjunto de

atributos antes de la minería de datos

5# Modelado de datos

Por último, para una mejor identificación de los patrones de datos, se implementan varios

modelos matemáticos en el conjunto de datos, basados en varias condiciones.

Actualmente este tipo de trabajos se están realizando en seguridad de datos, finanzas,

salud, marketing, detección de fraude, búsquedas online, procesamiento del lenguaje natural,

coches inteligentes, entre otros. Es por este motivo, que la minería de datos se está

convirtiendo en uno de los trabajos con mayor proyección para el futuro.

También podría gustarte