0% encontró este documento útil (0 votos)
147 vistas7 páginas

Minería de Datos: Definición y Usos

Este documento proporciona una introducción básica a la minería de datos. Explica que la minería de datos implica el análisis de grandes conjuntos de datos para extraer información relevante y patrones. Luego describe algunos ejemplos comunes de aplicaciones de minería de datos como predecir el riesgo de crédito, realizar diagnósticos médicos preliminares y optimizar las estrategias de marketing. Finalmente, resume que la minería de datos tiene muchos campos de aplicación potenciales en empresas y investigación.
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas7 páginas

Minería de Datos: Definición y Usos

Este documento proporciona una introducción básica a la minería de datos. Explica que la minería de datos implica el análisis de grandes conjuntos de datos para extraer información relevante y patrones. Luego describe algunos ejemplos comunes de aplicaciones de minería de datos como predecir el riesgo de crédito, realizar diagnósticos médicos preliminares y optimizar las estrategias de marketing. Finalmente, resume que la minería de datos tiene muchos campos de aplicación potenciales en empresas y investigación.
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Definicion de Data Mining(Mineria de Datos) - qu es Data Mining?

La minera de datos (DM por su nombre en ingls: Data Mining) es un rea de estudio que surge de la conv disciplinas: Ciencias de la Computacin, Estadstica, Aprendizaje Maquinal, Inteligencia Artificial, Tecnol Datos y Reconocimiento de Patrones, entre otras. Comprende el anlisis de grandes conjuntos de datos y la bsqueda de relaciones entre variables, a travs d computacionalmente intensivos. Muchas veces se encuentran relaciones o coincidencia no esperadasy, po mtodos involucran el anlisis de enormes cantidades de datos multidimensionales.-

Datamining (Minera de datos)


El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Vea ms diferencias entre datos, informacin y conocimiento.

Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso comn a todos ellos se suele componer de cuatro etapas principales: Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining. Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial. Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

Carga de trabajo en las fases de un proyecto de datamining

En resumen, el datamining se presenta como una tecnologa emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Adems, no hay duda de que trabajar con esta tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra "toma de decisiones". En el artculo Data Mining: Torturando a los datos hasta que confiesen, Luis Carlos Molina proporciona una visin muy clarificadora sobre la minera de datos, incluyendo interesantes ejemplos de aplicaciones de la misma. Recomendamos su lectura. Si no est familiarizado con el concepto de Datamining, puede resultarle til, adems, examinar las siguientes definiciones:
Escrito por Csar Krall

Resumen: cuestiones bsicas sobre la minera de datos (data mining). Qu es? Para qu
sirve?. Campos de aplicacin y metodologa habitual en trabajos de minera de datos.

Codificacin [Link]: DV00105A

MINERA DE DATOS: QU ES? PARA QU SIRVE?

Hay diferentes definiciones para minera de datos. Una muy simple sera decir que es el estudio y tratamiento de datos masivos para extraer conclusiones e informacin relevante de ellos.

Vamos a tratar de explicar para qu sirve la minera de datos dando ejemplos de en qu situaciones se aplica.

a) Supongamos un banco que otorga crditos y va a estudiar la concesin de un crdito. El banco tiene una serie histrica de datos de clientes y concesin de crditos con m x n casillas. Por ejemplo los datos disponibles pueden ser: Cliente / Edad / Estado civil / Trabaja / Nmina / Casa / Hipoteca / Pag?. Cada una de estas columnas se llama atributo. El campo Pag? es binario (solo puede tomar como valores s o no) y es el atributo clave que tiene el banco para estudiar la concesin del crdito. No siempre existe un atributo clave. Para qu le sirve la minera de datos al banco? Pues para decidir si concede el crdito o no: por ejemplo, estudiando y tratando los datos puede llegar a la conclusin de que los varones menores de 20 aos que estn casados estadsticamente tienen un alto porcentaje de impagos. Si el cliente corresponde a ese perfil la decisin puede ser denegar el crdito.

b) Supongamos un hospital donde hay unos datos de pacientes y un diagnstico. Se puede tener una tabla de datos que incluya por ejemplo datos como Paciente / Edad / Glbulos rojos / Glbulos blancos / Tensin / Azcar / Diagnstico. Para qu le servira la minera de datos al hospital? Pues por ejemplo para hacer un prediagnstico de la dolencia que con mayor probabilidad pueda tener un paciente en base a sus datos asociados. Un tipo de dolencia se dice que es un dato discreto porque solo puede tomar unos valores concretos (por ejemplo que haya 30 tipos de dolencias). Estudiando y tratando los datos se pueden llegar a conclusiones, por ejemplo que si un paciente tiene ms de 60 aos, los glbulos blancos muy altos y el azcar alto es muy probable que est desarrollando diabetes. Si el paciente corresponde a ese perfil, la decisin puede ser hacer unas pruebas especficas o poner cierto tratamiento preventivo.

c) Supongamos un hipermercado. La minera de datos para grandes superficies se llama anlisis de cesta de la compra o Market Basket Analysis. Por cada compra realizada, especialmente las realizadas con tarjeta, podra almacenar datos que le permite conocer los gustos de los clientes, qu es lo que ms compran, qu cantidades compran, cmo se correlacionan los productos, etc. En una tabla de datos se podran tener campos como Cliente / Gasto en leche / Gasto en pan / Gasto en cerveza / Gasto en paales / Gasto en pescado. Para qu le servira la minera de datos a la gran superficie? Le permitira tomar decisiones como que si por ejemplo la leche y el pan estn muy correlacionados (cuando se compra leche se suele comprar pan), ambos productos se pueden colocar distanciados dentro del establecimiento para que el cliente recorra ms distancia y al ver ms productos compre ms. Estas tcnicas se incluyen dentro de lo que se llama Marketing Basado en Minera de Datos (en ingls, CRM, Client Relation Management) y son discutibles, pero de lo que no cabe duda es de que los grandes comercios estudian la psicologa y hbitos de los clientes para tratar de sacarles partido. Otro ejemplo sera que si un producto tiene alta demanda se puede ofrecer con descuentos promocionales para servir de gancho y que el cliente acuda a ese hipermercado

d) Supongamos una empresa de desarrollo de software. Un equipo de ingenieros puede desarrollar aplicaciones informticas y por cada una de ellas se recopilan distintos datos relacionados con la mtrica del software (por ejemplo Horas de trabajo / Lneas de cdigo / Nmero de errores por cada 1000 lneas de cdigo, etc.). Para qu le servira la minera de datos a la empresa de desarrollo de software? Pues por ejemplo para saber el nmero de errores que previsiblemente se va a encontrar en

un proyecto y el tiempo que puede necesitar para corregirlos, antes de que el proyecto en s se haya desarrollado completamente.

Resumiendo lo expuesto hasta ahora podemos decir que la funcionalidad de la minera de datos puede ser:

a)

Predictiva ([Link]. caso del banco, hospital): sirve para predecir cosas.

i. En base a una clasificacin: por ejemplo si el cliente pagar o no pagar, o el tipo de dolencia que puede tener un paciente.

ii. En base a una regresin: por ejemplo calcular el tiempo previsible que se emplear en corregir los errores de un desarrollo de software.

b)

Descriptiva:

i. Agrupamiento (clustering): clasificar individuos en grupos en base a sus caractersticas. Por ejemplo, clasificar pacientes del hospital en base a los datos de sus analticas.

ii. Reglas de asociacin: conocer cmo se relacionan los datos o campos. Por ejemplo conocer en el hipermercado que un cliente que compra leche muy probablemente comprar tambin pan.

iii. Secuenciacin: intentar predecir el valor de una variable en funcin del tiempo. Por ejemplo la demanda de energa elctrica.

CAMPOS DE APLICACIN DE LA MINERA DE DATOS

La minera de datos tiene muchos campos de aplicacin pues puede ser til en prcticamente todas las facetas de la actividad humana. Vamos a indicar algunas cuestiones relevantes sobre la posible aplicacin de la minera de datos:

a) La minera de datos tiene utilidad empresarial: las empresas pueden optimizar procesos y mejorar sus productos y ventas utilizando minera de datos.

b) Existen pocos especialistas o empresas especializadas en minera de datos. Teniendo en cuenta su importancia, es un campo de trabajo para emprendedores.

c) La minera de datos es una disciplina que se est desarrollando cada vez con mayores capacidades gracias al avance en tecnologa y a la cada vez ms alta capacidad de computacin de los ordenadores. Constituye un campo amplio de investigacin en el que cada vez trabajan ms investigadores y equipos de investigacin.

METODOLOGA DE LA MINERA DE DATOS

Un trabajo de minera de datos podramos decir que tpicamente consta de las siguientes partes:

1. Entendimiento del problema: se trata de hablar con el cliente, conocer sus necesidades, conocer su negocio o actividad, conocer qu datos relevantes tiene disponibles y cules seran necesarios pero no estn disponibles, etc.

2. Entendimiento de los datos: hay que saber qu significan los datos, si son continuos o discretos, qu tipo de valores toman, qu utilidad futura pueden tener y saber si estn bien capturados o no.

3. Preparacin de datos: se trata de reflexionar sobre cmo guardar los datos. Tpicamente hablaremos de tablas con filas y columnas, pero hay que ver cmo se organizan las tablas, cmo se interrelacionan entre ellas, etc. En definitiva organizar los datos para poder sacarles partido.

4. Modelamiento: una vez se tienen los datos organizados hay que definir los algoritmos que se van a utilizar para tratar los datos. Una vez tratados, los datos nos devolvern informacin til.

5. Evaluacin: los resultados obtenidos deben de ser sometidos a comprobacin, verificar que estn libres de errores, ratificar que son tiles para los objetivos perseguidos, etc.

6. Despliegue funcional-comercial: una vez se tiene automatizada la captura y tratamiento de datos para obtener unos resultados, se desarrollan herramientas, normalmente en forma de aplicaciones informticas que permiten generar alertas, informes, estadsticas, etc. que tienen una utilidad directa para la toma de decisiones y sistema de informacin del cliente.

REFERENCIAS Y MS INFORMACIN

Este artculo resume y comenta la conferencia pblica impartida por Jos C. Riquelme, profesor de la Universidad de Sevilla, en el marco de las V Jornadas Imagintica: La informtica del futuro, que tuvieron lugar en la Escuela Tcnica Superior de Informtica de la Universidad de Sevilla (Espaa) y a las que [Link] tuvo la oportunidad de asistir.

Para leer la continuacin de este artculo pulsa en este link: DV00106A

Para hacer un comentario o consulta utiliza los foros [Link], abiertos a cualquier persona independientemente de su nivel de conocimiento.

También podría gustarte