Machine Learning y Minería de Datos

Cargado por

hacknek

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

29 vistas21 páginas

Machine Learning y Minería de Datos

Cargado por

hacknek

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Machine Learning Aplicado

Docente: David Ruete

Table of Contents

1 Introducción

2 Introducción a la minería de datos

3 Big Data y sus desafíos

4 Aplicaciones
Introducción

• En 1960 fue utilizado el término ”data science” como sustituto a ”computer

science”,
• 15 años después se definió,
• en 1997 Jeff Wu sugirió que la estadística debía ser renombrada como ”data
science”,
• en 2001 fue introducido como disciplina independiente, y
• en 2012 Harvard Business Review publicó un artículo llamándola como
”the sexiest job of the 21st century”
Introducción
Introducción

Con el análisis de datos se podrían responder varias preguntas, tales como:

• ¿Cuál podría ser el precio de un producto particular?
• ¿Cómo encontrar segmentos de mercado y/o grupos de clientes dentro de un
segmento de mercado?
• ¿A qué grupo pertenece un cierto individuo, imagen, ...?
• ¿Dónde perforar para encontrar (oro, cobre, petróleo, ...)?
• ¿Cuál es el producto más vendido en navidad?
• ¿Quién ganará en las próximas elecciones presidenciales?
• ¿Cuáles son las series más vistas en Netflix? Netflix y YouTube utilizan algo-
ritmos de anális de datos para hacer recomendaciones personalizadas.
Estadística y minería de datos

Aunque algunos paquetes estadísticos son capaces de inferir patrones a partir de los
datos (utilizando métodos paramétricos o no paramétricos), el problema es que:
• resultan complejos para los no estadísticos,
• generalmente no funcionan bien para las bases de datos actuales (cientos de
tablas, millones de registros, talla de varios gigabytes y una alta
dimensionalidad), y
• no se integran bien con los sistemas de información.

Minería de Datos
Se define la minería de datos como el proceso de extraer conocimiento túil y com-
prensible, previamente desconocido, desde grandes cantidades de datos almacenados
en distintos formatos [?].
Estad´ıstica y miner´ıa de datos

Estad´ıstica Miner´ıa de Datos

-Confirmativa: Proporcionar -Explorativa: Primero excava los
primero la teoría y luego la prueba datos, descubre patrones novedosos y
usando varias herramientas es- luego hace teorías.
tadísticas.
-Aplica métodos estadísticos sobre -Inplica la limpieza de datos.
datos limpios.
-Trabajo con pequeños conjuntos -Trabajo con grandes volúmenes
de datos. de datos.
-Necesita la interacción del cliente -Necesita menos interacción con el
para aprobar el programa, por lo cliente para aprobar el modelo, por lo
tanto, es difícil de automatizar. tanto, es fácil de automatizar.
-Formalización de la relación en -Es un cálculo que aprende de los
los datos en forma de condición datos sin utilizar ninguna regla de
matemática. programación.
Introducción a la minería de datos

¿Qué tareas involucra la minería

de datos?
A Regresión, Clasificación y
Agrupación.
B Modelado de dependencias.
C Detección de cambios y
desviaciones.
D Todas las anteriores.
Introducción a la minería de datos
Las principales tareas son [Kantardzic, 2020]:
1. Clasificación: función de aprendizaje predictiva que clasifica un elemento de
datos en una de varias clases predefinidas.
2. Regresión: descubrimiento de una función de aprendizaje predictiva, que
asigna un elemento de datos a una variable de predicción de valor real.
3. Agrupación: tarea descriptiva común en la que se busca identificar un con-
junto finito de categorías o agrupaciones para describir los datos.
4. Resumen: tarea descriptiva adicional que involucra métodos para encontrar
una descripción compacta para un conjunto (o subconjunto) de datos.
5. Modelado de dependencias: encontrar un modelo local que describa depen-
dencias significativas entre variables o entre los valores de una característica
en un conjunto de datos o en una parte de un conjunto de datos.
6. Detección de cambios y desviaciones: descubrimiento de los cambios más
significativos en el conjunto de datos.
Introducción a la minería de datos
Flujo de trabajo:
• Definir el problema y objetivos. ¿Qué se quiere predecir o estimar?
• Obtener los datos. ¿Cuáles son los datos relevantes para el estudio?
• Análisis exploratorio de los datos, limpieza de datos. ¿Existen valores atípicos
y/o patrones?
• Modelar los datos. Construir un modelo, ajustar y validar dicho modelo.
• Visualizar los resultados. ¿Tienen sentido los resultados? Interpretación y
explicación.
• Retroalimentación.
Introducción a la minería de datos

Métodos o algoritmos más utilizados:

• Aprendizaje supervisado
• Regresión
• Análisis de componentes principales (Principal Component Analysis)
• Árboles de decisión (Decision tree)
• Bosques aleatorios (Random forests)
• Clasificación Bayesiana (Naive Bayes classifier)
• Redes neuronales (neural network)
• Máquina de soporte vectorial (Support Vector Machine)
• K-vecinos más cercanos (K-Nearest Neighbor)
• Aprendizaje no supervisado:
• K-medias (K-means)
• Clustering jerárquico (hierarchical clustering)
Big Data y sus desafíos

El Big Data representa el con-

junto de técnicas (informáticas)
que nos van a permitir gestionar,
explotar y realizar distintos usos
eficaces de estos datos volumi-
nosos y terriblemente complejos;
mientras data sciences permiten
explotar, manipular estos datos,
comprender, prever y establecer
usos.[?]
Big Data y fútbol: así aprovecha el Real
Madrid la tecnología
Big Data y sus desafíos
Big Data y sus desafíos

¿Cuáles son los deasfíos del Big Data?

Big Data y sus desafíos

4ta Revolución Industrial o Industria 4.0

interconectividad, automatización, aprendizaje automático y datos en tiempo real
• Sistema Ciberfísico: sistemas inteligentes conectados a dispositivos físicos
para la recolección de datos (tecnología 5G).
• Internet de las cosas (IoT): similar al anterior pero se le agregan dispositivos
electrónicos y sensores, para recopilar datos, análisis y acciones automatizadas.
• Big Data: permite organizar y almacenar la información recopilada anterior-
mente, para extraer información relevante.
• Computación en la nube: servidores remotos para almacenar, administrar y
procesar datos (Microsoft Azure o Amazon Web Services).
• Fábrica inteligente: hace que los procesos sean más sencillos y rentables
permitiendo la comunicación entre las tecnologías anteriores, con máquinas
funcionando de forma autónoma, para ayudar en la ejecución de tareas.
Big Data y sus desafíos
Algunos desafíos que enfrenta el Big Data:
• Muchas fuentes y tipos de datos. Datos: internet, móviles, experimentales,
de empresas. Tipos: estructurados, semi-estructurados (software, hojas de
cálculo, informes) y no estructurados (documentos, vídeos, audios, etc.).
• Volumen de datos es enorme por lo que se requiere más tiempo para realizar
un proceso de calidad de datos.
• Mucha volatilidad, se necesita un poder de procesamiento muy alto (orde-
nadores cuánticos).
• No existen estándares de calidad de datos unificados. En 2011, ISO publicó
las normas de calidad de datos ISO 8000, pero deben perfeccionarse en cuanto
a la calidad de datos de big data.
• Ciberseguridad: medidas de seguridad necesarias para evitar el robo, el se-
cuestro o incluso la destrucción de la información.
• Empleo: se requiere un personal más compotente, con nuevas habilidades.
Aplicaciones

¿Conoce algún ejemplo donde se haya aplicado alguno de los

algoritmos antes mencionados (Mundo, Chile, Ambiente de
trabajo)?
Algunas aplicaciones
Astronomía, arte, diseño creativo, bioinformática, servicios de consultoría, ecología,
medioambiente, comercio electrónico, mercado, educación, ingeniería, finanzas y
economía, industria de juegos, gobierno, medicina, deportes, manufactura, market-
ing, seguridad, ciencias, sostenibilidad, comunicaciones, ...
• Identificar tendencias y patrones
• Generar alertas de mantenimiento
• Disminuir tiempos de operación
• Mejorar la calidad
• Análisis comparativos
• Cuantificar el impacto del riesgo
• Predecir una situación y/o fenómeno
• Optimizar procesos y servicios
• Identificar y prevenir fraudes
Aplicaciones

Algunas aplicaciones en Chile:

• Inteligencia artificial en Minería
• Optimizando procesos en la construcción con Machine Learning
• Cambiando el futuro de la alimentación con Machine Learning
• Proyección de la Inflación en Chile con Métodos de Machine Learning
• Comprender las disputas por el agua en Chile con herramientas de minería de
datos y texto
R – Studio: [Link]
h t t p s : / / c r a n . r - pr o je c [Link] g/
Entorno de desarrollo integrado (IDE) para R
[Link]
Machine Learning Aplicado

Docente: David Ruete

También podría gustarte

Curso de Minería de Datos 2024
Aún no hay calificaciones
Curso de Minería de Datos 2024
24 páginas
Syllabus de Minería de Datos 2024
Aún no hay calificaciones
Syllabus de Minería de Datos 2024
36 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
72 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
64 páginas
Relación entre Minería de Datos y Ciencia de Datos
Aún no hay calificaciones
Relación entre Minería de Datos y Ciencia de Datos
4 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
9 páginas
Conferencia #5. Introducción A La Minería de Datos v2
Aún no hay calificaciones
Conferencia #5. Introducción A La Minería de Datos v2
41 páginas
Ciencia de Datos: Minería y Machine Learning
Aún no hay calificaciones
Ciencia de Datos: Minería y Machine Learning
9 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
7 páginas
Big Data: Conceptos y Aplicaciones
Aún no hay calificaciones
Big Data: Conceptos y Aplicaciones
30 páginas
Big Data y Minería de Datos: Sinergias Clave
Aún no hay calificaciones
Big Data y Minería de Datos: Sinergias Clave
20 páginas
Minería de Datos en Gobiernos
Aún no hay calificaciones
Minería de Datos en Gobiernos
8 páginas
Syllabus de Minería de Datos
Aún no hay calificaciones
Syllabus de Minería de Datos
74 páginas
Características y Procesamiento de Big Data
Aún no hay calificaciones
Características y Procesamiento de Big Data
28 páginas
Estadística en Minería de Datos y ML
Aún no hay calificaciones
Estadística en Minería de Datos y ML
15 páginas
Introducción a Minería de Datos y Big Data
Aún no hay calificaciones
Introducción a Minería de Datos y Big Data
7 páginas
Data Science With R A Step by Step Guide With Visual Illustrations and Examples (Andrew Oleksy) (Z-Library) (3) 1
Aún no hay calificaciones
Data Science With R A Step by Step Guide With Visual Illustrations and Examples (Andrew Oleksy) (Z-Library) (3) 1
187 páginas
Unidad-1 Big Data-1
Aún no hay calificaciones
Unidad-1 Big Data-1
29 páginas
Cib12 Cap02 1 Datascience
Aún no hay calificaciones
Cib12 Cap02 1 Datascience
80 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
49 páginas
1 Intro
Aún no hay calificaciones
1 Intro
36 páginas
Introducción a Big Data Analityc
Aún no hay calificaciones
Introducción a Big Data Analityc
25 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
19 páginas
Ciencia de Datos y Big Data
Aún no hay calificaciones
Ciencia de Datos y Big Data
16 páginas
Big Data Mining: Retos y Técnicas Clave
Aún no hay calificaciones
Big Data Mining: Retos y Técnicas Clave
3 páginas
Trabajo de Hoy 29-04
Aún no hay calificaciones
Trabajo de Hoy 29-04
11 páginas
Tarea 1 Mineria de Datos Roger
Aún no hay calificaciones
Tarea 1 Mineria de Datos Roger
5 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
6 páginas
Clase1 - IntroduccionCienciaDatos
Aún no hay calificaciones
Clase1 - IntroduccionCienciaDatos
20 páginas
Introducción a Big Data y Minería de Datos
Aún no hay calificaciones
Introducción a Big Data y Minería de Datos
6 páginas
Big Data en Minería de Datos Eléctricos
Aún no hay calificaciones
Big Data en Minería de Datos Eléctricos
61 páginas
Sitemas Informático Estratégico Unidad2 - Clase 4
Aún no hay calificaciones
Sitemas Informático Estratégico Unidad2 - Clase 4
31 páginas
Minería de Datos: Guía Universitaria
Aún no hay calificaciones
Minería de Datos: Guía Universitaria
7 páginas
1 Intro Ciencia Datos - ACM
Aún no hay calificaciones
1 Intro Ciencia Datos - ACM
88 páginas
UACH - Módulo 3 - Clase 2 - Modulo BI Conceptos Claves y Desafios
Aún no hay calificaciones
UACH - Módulo 3 - Clase 2 - Modulo BI Conceptos Claves y Desafios
81 páginas
Tema 1 Unidad 1
Aún no hay calificaciones
Tema 1 Unidad 1
13 páginas
Analisis Inteligente de Datos
Aún no hay calificaciones
Analisis Inteligente de Datos
431 páginas
DBDC Uc 16062022
Aún no hay calificaciones
DBDC Uc 16062022
8 páginas
Clase 1 Introduccion DM
Aún no hay calificaciones
Clase 1 Introduccion DM
29 páginas
Inteligencia de Negocios y Ciencia de Datos
Aún no hay calificaciones
Inteligencia de Negocios y Ciencia de Datos
18 páginas
Aguayo Padilla Victor Manuel A2.
Aún no hay calificaciones
Aguayo Padilla Victor Manuel A2.
9 páginas
Big Data y Control Estadístico en Industria
Aún no hay calificaciones
Big Data y Control Estadístico en Industria
10 páginas
Minería de Datos y Big Data
Aún no hay calificaciones
Minería de Datos y Big Data
33 páginas
Introducción al Big Data y su análisis
Aún no hay calificaciones
Introducción al Big Data y su análisis
3 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
36 páginas
Minería de Datos y Técnicas Clave
Aún no hay calificaciones
Minería de Datos y Técnicas Clave
34 páginas
Mineria de Datos
100% (1)
Mineria de Datos
17 páginas
Minería de Datos en Ciudades Inteligentes
Aún no hay calificaciones
Minería de Datos en Ciudades Inteligentes
133 páginas
Ensayo Introducción
Aún no hay calificaciones
Ensayo Introducción
7 páginas
Introducción a la Ciencia de Datos y Minería
Aún no hay calificaciones
Introducción a la Ciencia de Datos y Minería
131 páginas
Apuntes 2° Parcial
Aún no hay calificaciones
Apuntes 2° Parcial
39 páginas
Data Mining
Aún no hay calificaciones
Data Mining
4 páginas
Curso Introductorio a Minería de Datos
Aún no hay calificaciones
Curso Introductorio a Minería de Datos
8 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
9 páginas
Introducción a la Clasificación en Ciencia de Datos
Aún no hay calificaciones
Introducción a la Clasificación en Ciencia de Datos
66 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
43 páginas
Aplicaciones del Data Mining en Negocios
Aún no hay calificaciones
Aplicaciones del Data Mining en Negocios
4 páginas
Big Data vs Minería de Datos
100% (1)
Big Data vs Minería de Datos
16 páginas
Introducción a Big Data y Hadoop
Aún no hay calificaciones
Introducción a Big Data y Hadoop
56 páginas
Solicitud Acreditación Certificación Producto
Aún no hay calificaciones
Solicitud Acreditación Certificación Producto
16 páginas
Historial de Servicio Tvs Serie Apache
Aún no hay calificaciones
Historial de Servicio Tvs Serie Apache
1 página
Folleto Brazo Hidraulico San Carlos
100% (1)
Folleto Brazo Hidraulico San Carlos
2 páginas
Hablar Con Viejas
100% (2)
Hablar Con Viejas
8 páginas
Portafolio #2 - Analisis Matematico
Aún no hay calificaciones
Portafolio #2 - Analisis Matematico
49 páginas
Joins y Vistas en SQL: Guía Completa
Aún no hay calificaciones
Joins y Vistas en SQL: Guía Completa
6 páginas
Encuesta Requerimientos de Software
67% (45)
Encuesta Requerimientos de Software
2 páginas
Ventajas y Desventajas del E-Commerce
Aún no hay calificaciones
Ventajas y Desventajas del E-Commerce
11 páginas
Plan de Marketing para Dulces de Licor
Aún no hay calificaciones
Plan de Marketing para Dulces de Licor
26 páginas
Ejercicios de Torsión en Mecánica Industrial
Aún no hay calificaciones
Ejercicios de Torsión en Mecánica Industrial
2 páginas
Certificado - PDF 20250129 131513 0000
Aún no hay calificaciones
Certificado - PDF 20250129 131513 0000
1 página
Diseno de Circuitos Cocodrilo
Aún no hay calificaciones
Diseno de Circuitos Cocodrilo
82 páginas
Portafolio de Productos y Servicios Extintores Full
Aún no hay calificaciones
Portafolio de Productos y Servicios Extintores Full
25 páginas
Mega Gerencia: Innovación y Adaptación Empresarial
Aún no hay calificaciones
Mega Gerencia: Innovación y Adaptación Empresarial
2 páginas
Práctica de LibreOffice Writer 3
Aún no hay calificaciones
Práctica de LibreOffice Writer 3
4 páginas
Practica 1 de Laboratorio MTM-2
Aún no hay calificaciones
Practica 1 de Laboratorio MTM-2
6 páginas
Presupuesto Equipamiento Escolar 2020
Aún no hay calificaciones
Presupuesto Equipamiento Escolar 2020
3 páginas
Guia 10resuelto
Aún no hay calificaciones
Guia 10resuelto
12 páginas
Caso Practico 2, Aseguramiento de La Calidad
100% (1)
Caso Practico 2, Aseguramiento de La Calidad
6 páginas
Mantenimiento Preventivo de PC
Aún no hay calificaciones
Mantenimiento Preventivo de PC
5 páginas
Convergencia de Redes: Telecomunicaciones y Tecnología
Aún no hay calificaciones
Convergencia de Redes: Telecomunicaciones y Tecnología
6 páginas
Solucion de La Evaluacion C2
Aún no hay calificaciones
Solucion de La Evaluacion C2
1 página
Manual Proyecto de Ingenieria PDF
Aún no hay calificaciones
Manual Proyecto de Ingenieria PDF
25 páginas
C - Users - LEHONELL - Desktop - Taller Revit Architecture - Planos - Curso - 01
Aún no hay calificaciones
C - Users - LEHONELL - Desktop - Taller Revit Architecture - Planos - Curso - 01
1 página
Foda Corrupac
Aún no hay calificaciones
Foda Corrupac
3 páginas
Evaluacion Final - Escenario 8 - Primer Bloque-Teorico-Practico - Virtual - Programación Estocásti
80% (5)
Evaluacion Final - Escenario 8 - Primer Bloque-Teorico-Practico - Virtual - Programación Estocásti
5 páginas
Informe Mensual Septiembre 2024
Aún no hay calificaciones
Informe Mensual Septiembre 2024
15 páginas
Factura Electrónica Rutas de Lima S.A.C.
Aún no hay calificaciones
Factura Electrónica Rutas de Lima S.A.C.
1 página
Vlan DHCP
Aún no hay calificaciones
Vlan DHCP
4 páginas
Curso Intensivo de Python
14% (7)
Curso Intensivo de Python
7 páginas