UNIVERSIDAD MAYOR DE SAN
MARCOS
ESCUELA DE ESTUDIOS GENERALES
CICLO1
NOMBRES: Darly Yadira
APELLIDOS: Melgarejo Gomez
CURSO: CINFO
CARRERA: Contabilidad
Minería de datos – CINFO 2020
LA MINERÍA DE DATOS
La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge
Discovery in Data bases" o KDD) es un campo de la estadística y las ciencias de la
computación referido al proceso que intenta descubrir patrones en grandes volúmenes
de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje
automático, estadística y sistemas de bases de datos. El objetivo general del proceso de
minería de datos consiste en extraer información de un conjunto de datos y
transformarla en una estructura comprensible para su uso posterior. Además de la etapa
de análisis en bruto, supone aspectos de gestión de datos y de bases de datos,
de procesamiento de datos, del modelo y de las consideraciones de inferencia, de
métricas de Intereses, de consideraciones de la teoría de la complejidad computacional,
de post-procesamiento de las estructuras descubiertas, de la visualización y de la
actualización en línea.
El término es un concepto de moda, y es frecuentemente mal utilizado para referirse a
cualquier forma de datos a gran escala o procesamiento de la información (recolección,
extracción, almacenamiento, análisis y estadísticas), pero también se ha generalizado a
cualquier tipo de sistema informático de apoyo a decisiones, incluyendo la inteligencia
artificial, aprendizaje automático y la inteligencia empresarial. En el uso de la palabra,
el término clave es el descubrimiento, comúnmente se define como "la detección de
algo nuevo". Incluso el popular libro "La minería de datos: sistema de prácticas
herramientas de aprendizaje y técnicas con Java" (que cubre todo el material de
aprendizaje automático) originalmente iba a ser llamado simplemente "la máquina de
aprendizaje práctico", y el término "minería de datos" se añadió por razones de
marketing. A menudo, los términos más generales "(gran escala) el análisis de datos", o
"análisis". O cuando se refieren a los métodos actuales, la inteligencia artificial y
aprendizaje automático, son más apropiados.
HISTORIA DE LA MINERIS DE DATOS
El proceso de hurgar en los datos para descubrir conexiones ocultas y predecir
tendencias futuras tiene una larga historia. Conocido algunas veces como
Darly Yadira Melgarejo Gomez pág. 2
Minería de datos – CINFO 2020
"descubrimiento de conocimientos en bases de datos", el término "minería de datos" no
se acuño sino hasta la década de 1990. Pero su base comprende tres disciplinas
científicas entrelazadas: estadística (el estudio numérico de relaciones de datos),
inteligencia artificial (inteligencia similar a la humana exhibida por software y/o
máquinas) y machine learning (algoritmos que pueden aprender de datos para hacer
predicciones). Lo que era antiguo es nuevo otra vez, ya que la minería de datos continúa
evolucionando para igualar el ritmo del potencial sin límites del big data y poder de
cómputo asequible.
En la última década, los avances en el poder y la velocidad de procesamiento nos han
permitido llegar más allá de las prácticas manuales, tediosas y que toman mucho tiempo
al análisis de datos rápido, fácil y automatizado. Cuanto más complejos son los
conjuntos de datos recopilados, mayor es el potencial que hay para descubrir insights
relevantes. Los comerciantes detallistas, bancos, fabricantes, proveedores de
telecomunicaciones y aseguradoras, entre otros, utilizan la minería de datos para
descubrir relaciones entre todas las cosas, desde precios, promociones y demografía
hasta la forma en que la economía, el riesgo, la competencia y los medios sociales
afectan sus modelos de negocios, ingresos, operaciones y relaciones con clientes
¡QUIENES UTILIZAN LA MINERIA DE DATOS?
Comunicaciones:
En un mercado sobrecargado donde la competencia es cerrada, las respuestas se
encuentran a menudo en los datos de sus consumidores. Las compañías de multimedia y
telecomunicaciones pueden utilizar modelos analíticos para entender montañas de datos
de clientes, ayudándoles así a predecir el comportamiento de sus clientes y ofrecer
campañas altamente dirigidas y relevantes.
Seguros:
Con conocimientos analíticos, las compañías de seguros pueden resolver problemas
complejos concernientes a fraude, cumplimiento, gestión de riesgo y separación de
Darly Yadira Melgarejo Gomez pág. 3
Minería de datos – CINFO 2020
clientes. Las compañías han utilizado técnicas de minería de datos para asignar precios a
productos con mayor eficacia en líneas de negocios y hallar nuevas formas de ofrecer
productos competitivos a su base de clientes existente.
Educación:
Con vistas unificadas basadas en datos del progreso de los estudiantes, los educadores
pueden predecir el desempeño de sus alumnos antes de que pongan un pie en el salón de
clases – y desarrollar estrategias de intervención para mantenerlos en curso. La minería
de datos ayuda a los educadores a acceder a datos de los estudiantes, a predecir niveles
de logro y a detectar estudiantes o grupos de estudiantes que necesitan atención extra.
Manufactura:
La alineación de planes de suministro con pronósticos de demanda es esencial, como lo
es también la detección temprana de problemas, garantía de calidad e inversión en
equidad de marca. Los fabricantes pueden predecir el desgaste de activos de producción
y anticipar su mantenimiento, lo cual puede maximizar el tiempo en operación y
mantener la línea de producción acorde a lo programado
Bancos:
Los algoritmos automatizados ayudan a los bancos a entender a su base de clientes y
también los miles de millones de transacciones en el corazón del sistema financiero. La
minería de datos ayuda a las compañías de servicios financieros a tener una mejor vista
de los riesgos del mercado, a detectar el fraude en menos tiempo, a gestionar las
obligaciones de cumplimiento de las regulaciones y a obtener retornos óptimos de sus
inversiones en marketing.
Retail:
Darly Yadira Melgarejo Gomez pág. 4
Minería de datos – CINFO 2020
Grandes bases de datos de clientes contienen insights ocultos que le pueden ayudar a
mejorar las relaciones con clientes, optimizar campañas de marketing y pronosticar
ventas. A través de modelos de datos más precisos, las compañías detallistas pueden
ofrecer campañas más enfocadas – y encontrar la oferta que tenga el mayor impacto en
el cliente.
MÉTODOOS DE LA MINERÍA DE DATOS
La minería de datos funciona como una disciplina compuesta, representa diversos
métodos o técnicas que se utilizan en diferentes capacidades analíticas que abordan una
gama de necesidades organizacionales, hacen diferentes tipos de preguntas y utilizan
diferentes niveles de aportación humana o reglas para llegar a una decisión. Requiere de
diferentes métodos.
Modelado descriptivo: Descubre similitudes o agrupaciones compartidas en datos
históricos para determinar razones detrás del éxito o el fracaso, como la clasificación de
clientes por preferencias de productos o sentimiento. Algunas técnicas de ejemplo
incluyen:
a) Agrupación de clústeres: Agrupación de registros similares.
b) Detección de anomalías: Identificación de valores atípicos multidimensionales.
c) Aprendizaje de reglas de asociación: Detección de relaciones entre registros
d) Análisis de componentes principales: Detección de relaciones entre variables.
e) Agrupación por afinidad: Agrupación de personas con intereses comunes o
metas similares (por ejemplo, personas que compran X a menudo compran Y y
posiblemente Z).
Modelado predictivo: Este modelado llega más a fondo para clasificar eventos en el
futuro o calcular resultados desconocidos – por ejemplo, el uso de evaluación de crédito
para determinar la probabilidad de que una persona pague un préstamo. El modelado
predictivo también ayuda a descubrir insights de cosas como la rotación de clientes,
respuesta a campañas o coberturas por impago de créditos.
Darly Yadira Melgarejo Gomez pág. 5
Minería de datos – CINFO 2020
Modelado prescriptivo: Con el incremento de los datos no estructurados de la Web,
campos de comentarios, libros, correo electrónico, PDF, audio y otras fuentes de texto,
la adopción de la minería de texto como disciplina relacionada con la minería de datos
también ha crecido de manera considerable. Necesita la posibilidad de analizar, filtrar y
transformar con éxito datos no estructurados para incluirlos en modelos predictivos para
mejorar la precisión de las predicciones.
Al final, no debe ver la minería de datos como una entidad independiente porque el
preprocesamiento (preparación y exploración de datos) y el posprocesamiento
(validación de modelos, calificación y monitoreo del desempeño de modelos) son
igualmente esenciales. El modelado prescriptivo se centra en variables y restricciones
internas y externas para recomendar uno o más cursos de acción – por ejemplo,
determinar la mejor oferta de marketing para enviar a cada cliente.
Darly Yadira Melgarejo Gomez pág. 6