0% encontró este documento útil (0 votos)

91 vistas23 páginas

Modulo 3

Este documento presenta un taller sobre aprendizaje automático que incluye tres módulos: introducción a aprendizaje automático y Python, análisis de datos y preprocesamiento, y modelos y técnicas de evaluación de aprendizaje automático. Explica varios algoritmos de aprendizaje automático como SVM, KNN, Random Forest y redes neuronales artificiales. También cubre temas como selección de modelos, evaluación de predicciones y validación cruzada.

Cargado por

Alejandra Noriega

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

91 vistas23 páginas

Modulo 3

Cargado por

Alejandra Noriega

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Machine Learning Workshop

Nicolas Känzig

Email: [email protected]
Workshop Repository: https://github.com/nkaenzig/ml-workshop
Contenido

Modulo 1 Modulo 2 Modulo 3

- Introducción ML - Análisis de datos - Modelos de ML
- Python - Preprocesamiento de datos - Técnicas de evaluación
Machine Learning – Modelos
𝑎𝑖𝑗 ∈ ℝ
SVM (Support Vector Machine)
▪ Supervised Classification
▪ Scikit-Learn:
▪ sklearn.svm.SVC()

▪ Time Complexity (Training):

▪ Linear SVM: O(n)
▪ Non-Linear SVM: O(n2) - O(n3)
K-NN (K-Nearest Neighbors)
▪ Supervised Classification
▪ Scikit-Learn:
▪ sklearn.neighbors.KNeighborsClassifier()

▪ Time Complexity (Training):

▪ O(n)
Random Forest
▪ Supervised Classification & Regression
▪ Scikit-Learn:
▪ sklearn.ensemble.RandomForestClassifier

▪ Time Complexity (Training):

▪ O(nlog(n))
Ridge Regression
▪ Supervised Regression
▪ Scikit-Learn: 𝑓 𝑥, 𝜃 = 𝜃0 + 𝜃1 𝑥1 + 𝜃2 𝑥2 + … + 𝜃𝑝 𝑥𝑝
▪ sklearn.linear_model.Ridge
𝑝

𝜃 ∗ = argmin 𝑓 𝑥, 𝜃 − 𝑦 2
+ 𝛼 ෍ 𝜃𝑖2
▪ Time Complexity (Training): 𝜃
𝑖=0
▪ O(n) Regularización
K-Means
▪ Unsupervised Clustering
▪ Scikit-Learn:
▪ sklearn.cluster.KMeans()

▪ Time Complexity (Training):

▪ O(n)
Artificial Neural Networks (Deep Learning)

Neurona artificial
Como funciona el Entrenamiento?
▪ Objetivo: 𝜃 ∗ = argmin 𝐿 𝑥, 𝑦, 𝜃
𝜃

▪ Gradient Descent

𝐿(𝜃)

Lmin (𝜃)

𝜃
Machine Learning Frameworks
▪ Los modelos y algoritmos de optimización ya están implementados!

Machine Learning:

Deep Learning
Model Selection

▪ Siempre empieza con el modelo mas simple!

Criterios para seleccionar un modelo
▪ Preguntas:
▪ ¿Es difícil configurar el modelo?
▪ ¿El modelo hace una suposición sobre la distribución de los datos?
▪ ¿El modelo funciona con features categoricos?
▪ ¿El modelo funciona con columnas correlacionadas?
▪ ¿El entrenamiento funciona con “imbalanced” datasets?
▪ ¿Que es la complejidad del modelo?
▪ ¿Qué rápido son las predicciones?

Consejo: Siempre empieza con el modelo mas simple / fácil de usar

Criterios para seleccionar un modelo
Model Feature Selection Class Balancing One-Hot Encoding Non-Linear Complexity
LinearSVM no yes yes no O(n)
SVM('rbf') yes yes yes yes O(n^2) - O(n^3)
K-NN yes yes yes yes O(n)
Random Forest no no no yes O(nlog(n))

▪ Empezar con Random Forest siempre es una buena idea!

▪ Muy fácil para configurar
▪ Muy poco preprocesamiento necesario
▪ Rápido (Entrenamiento & Prediccion)
▪ No hace ninguna suposición sobre la distribución de los datos
▪ ≈50% de los modelos ganadoros en Kaggle usan Random Forest
Machine Learning – Evaluación
Como medir la calidad de las predicciones?
▪ Clasificación:

# 𝑪𝒐𝒓𝒓𝒆𝒄𝒕 𝒑𝒓𝒆𝒅𝒊𝒄𝒕𝒊𝒐𝒏𝒔
𝑨𝒄𝒄𝒖𝒓𝒂𝒄𝒚 =
# 𝑷𝒓𝒆𝒅𝒊𝒄𝒕𝒊𝒐𝒏𝒔

# 𝑻𝒓𝒖𝒆 𝒑𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔 # 𝑻𝒓𝒖𝒆 𝒑𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔

𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 = 𝑹𝒆𝒄𝒂𝒍𝒍 =
# 𝑻𝒓𝒖𝒆 𝒑𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔 + # 𝑭𝒂𝒍𝒔𝒆 𝑷𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔 # 𝑻𝒓𝒖𝒆 𝒑𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔 + # 𝑭𝒂𝒍𝒔𝒆 𝑵𝒆𝒈𝒂𝒕𝒊𝒗𝒆𝒔
Problemas con accuracy
▪ Dataset:
▪ 1000 samples de pacientes sin cancer (N)
▪ 5 samples de pacientes con cancer (P)

▪ Modelo solamente diagnostica 1 de los 5 pacientes con cancer

# 𝐶𝑜𝑟𝑟𝑒𝑐𝑡 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑠
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = =?
# 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑠
# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = =?
# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 + # 𝐹𝑎𝑙𝑠𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠
# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠
𝑅𝑒𝑐𝑎𝑙𝑙 = =?
# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 + # 𝐹𝑎𝑙𝑠𝑒 𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑒𝑠
Problemas con accuracy
▪ Dataset:
▪ 1000 samples de pacientes sin cancer (N)
▪ 5 samples de pacientes con cancer (P)

▪ Modelo solamente diagnostica 1 de los 5 pacientes con cancer

# 𝐶𝑜𝑟𝑟𝑒𝑐𝑡 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑠 1001
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = = 1005 % = 99.6%
# 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑠

# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 1
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = # 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 + # 𝐹𝑎𝑙𝑠𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠
= 1+0 % = 100%

# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 1
𝑅𝑒𝑐𝑎𝑙𝑙 = = 1+4 % = 20%
# 𝑇𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒𝑠 + # 𝐹𝑎𝑙𝑠𝑒 𝑁𝑒𝑔𝑎𝑡𝑖𝑣𝑒𝑠
Como medir la calidad de las predicciones?
▪ Regresión:
▪ Mean Absolute Error
𝒏
𝟏
ෝ 𝒊 − 𝒚𝒊 |
𝑴𝑨𝑬 = ෍ | 𝒚
𝒏
𝒊=𝟏

▪ Root Mean Squared Error

𝒏
𝟏
𝑹𝑴𝑺𝑬 = 𝒚𝒊 −𝒚𝒊 )𝟐
෍(ෝ
𝒏
𝒊=𝟏
Training vs. Validation
Training
▪ División de los datos en 3 partes: (Training Set)

▪ Training set (70%)

▪ Validation set (20%)
▪ Test set (10%)
Parameter bad performance Validation
Tuning (Validation set)

good performance

Final
Evaluation
(Test set)
Cross-Validation
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# Data loading & preprocessing

# ...
# ...

# Define the model

model = SVC(kernel='linear');

# Train the model

model.fit(x_train, y_train)

# Make predictions
y_predicted = model.predict(x_test, y_test)

# Evaluate
accuracy_score(y_test, y_predicted)

También podría gustarte

Modulo4 Qué Es El Machine Learning
Aún no hay calificaciones
Modulo4 Qué Es El Machine Learning
5 páginas
Introducción al Machine Learning V2
Aún no hay calificaciones
Introducción al Machine Learning V2
9 páginas
Modelos ML
Aún no hay calificaciones
Modelos ML
9 páginas
Resumen Ampliado Introduction ML Python
Aún no hay calificaciones
Resumen Ampliado Introduction ML Python
3 páginas
5 +fase+de+modelado+ (Pres)
Aún no hay calificaciones
5 +fase+de+modelado+ (Pres)
50 páginas
Resumen Machine Learning
Aún no hay calificaciones
Resumen Machine Learning
11 páginas
ATD - Sesion 15-16 Supervised Models - NEW Format
Aún no hay calificaciones
ATD - Sesion 15-16 Supervised Models - NEW Format
51 páginas
Ejercicio 7
Aún no hay calificaciones
Ejercicio 7
21 páginas
ML Resumen Practico
Aún no hay calificaciones
ML Resumen Practico
6 páginas
Aprendizaje Automatico - Parte 1
Aún no hay calificaciones
Aprendizaje Automatico - Parte 1
88 páginas
Resolución de Problemas Matemáticos o Técnicos
Aún no hay calificaciones
Resolución de Problemas Matemáticos o Técnicos
14 páginas
Aprendizaje Automático y Mantenimiento de Aerogeneradores
Aún no hay calificaciones
Aprendizaje Automático y Mantenimiento de Aerogeneradores
50 páginas
Guía de Ejercicios de Aprendizaje Automático
Aún no hay calificaciones
Guía de Ejercicios de Aprendizaje Automático
11 páginas
Material Apoyo - N°2 - Modelo de Datos - U3 - Business Analytics
Aún no hay calificaciones
Material Apoyo - N°2 - Modelo de Datos - U3 - Business Analytics
17 páginas
Resumen Ampliado Introduction ML Python
Aún no hay calificaciones
Resumen Ampliado Introduction ML Python
3 páginas
Complejidad Computacional en ML
Aún no hay calificaciones
Complejidad Computacional en ML
4 páginas
Consulta - Brayan Jara
Aún no hay calificaciones
Consulta - Brayan Jara
2 páginas
Test
Aún no hay calificaciones
Test
9 páginas
Resumen Python 3 Machine Learning
Aún no hay calificaciones
Resumen Python 3 Machine Learning
3 páginas
Tarea3 Grupo 202016908 84
Aún no hay calificaciones
Tarea3 Grupo 202016908 84
23 páginas
Curso ML Aplicado con Python: Scikit-Learn
Aún no hay calificaciones
Curso ML Aplicado con Python: Scikit-Learn
62 páginas
P3 Jkdashtas
Aún no hay calificaciones
P3 Jkdashtas
10 páginas
Herramientas y Bibliotecas para Machine Learning
Aún no hay calificaciones
Herramientas y Bibliotecas para Machine Learning
4 páginas
Separata01 ML Uni Fim
Aún no hay calificaciones
Separata01 ML Uni Fim
58 páginas
PracticaSVM PDF
Aún no hay calificaciones
PracticaSVM PDF
8 páginas
Clase 08 - Parte I - Modelos Analíticos para DS II
Aún no hay calificaciones
Clase 08 - Parte I - Modelos Analíticos para DS II
15 páginas
2021UN AprendizajeAutomatico
Aún no hay calificaciones
2021UN AprendizajeAutomatico
127 páginas
Machine Learning para Recetar Medicamentos
Aún no hay calificaciones
Machine Learning para Recetar Medicamentos
11 páginas
Guía de Referencia de Scikit-Learn
Aún no hay calificaciones
Guía de Referencia de Scikit-Learn
1 página
Dia 5
Aún no hay calificaciones
Dia 5
38 páginas
Scikit Learn Es
Aún no hay calificaciones
Scikit Learn Es
27 páginas
Tarea 3 Algoritmos de Aprendizaje. Emel Pedrozo
Aún no hay calificaciones
Tarea 3 Algoritmos de Aprendizaje. Emel Pedrozo
21 páginas
Intro Machine Learning
Aún no hay calificaciones
Intro Machine Learning
14 páginas
Guía de Algoritmos de Clasificación
Aún no hay calificaciones
Guía de Algoritmos de Clasificación
45 páginas
Curso Profesional de Scikit Learn - 43223611 0b12 43ec b05b 1e95c5
Aún no hay calificaciones
Curso Profesional de Scikit Learn - 43223611 0b12 43ec b05b 1e95c5
115 páginas
IA - Clase 4 - Métricas y Algoritmos
Aún no hay calificaciones
IA - Clase 4 - Métricas y Algoritmos
41 páginas
Inteligencia Artificial
Aún no hay calificaciones
Inteligencia Artificial
9 páginas
Predicción Cáncer Colon con SVM
Aún no hay calificaciones
Predicción Cáncer Colon con SVM
30 páginas
N1 S6 S Presentacion
Aún no hay calificaciones
N1 S6 S Presentacion
89 páginas
Introducción - Machine Learning
Aún no hay calificaciones
Introducción - Machine Learning
31 páginas
Ejercicio 2
Aún no hay calificaciones
Ejercicio 2
7 páginas
Machine Learning Supervisado No Supervisado S8 D
Aún no hay calificaciones
Machine Learning Supervisado No Supervisado S8 D
57 páginas
Super Visa Do
Aún no hay calificaciones
Super Visa Do
19 páginas
Tarea 2 Iic1005
Aún no hay calificaciones
Tarea 2 Iic1005
9 páginas
Algoritmos de Aprendizaje Supervisado
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado
39 páginas
Técnicas Avanzadas de Aprendizaje Supervisado
Aún no hay calificaciones
Técnicas Avanzadas de Aprendizaje Supervisado
64 páginas
Clase 9
Aún no hay calificaciones
Clase 9
26 páginas
Ensemble Learning
Aún no hay calificaciones
Ensemble Learning
19 páginas
Clase 5 DAAF 2023
Aún no hay calificaciones
Clase 5 DAAF 2023
54 páginas
Guía Completa de Machine Learning
Aún no hay calificaciones
Guía Completa de Machine Learning
83 páginas
Sesion 5
Aún no hay calificaciones
Sesion 5
48 páginas
Fundamentos de Machine Learning en Python
Aún no hay calificaciones
Fundamentos de Machine Learning en Python
72 páginas
Algoritmos Machine Learning D6-7 8 12-06-2020
100% (1)
Algoritmos Machine Learning D6-7 8 12-06-2020
32 páginas
METODOLOGIA Machine
Aún no hay calificaciones
METODOLOGIA Machine
7 páginas
Clase 3 House Prices
Aún no hay calificaciones
Clase 3 House Prices
46 páginas
Aprendizaje Supervisado en Python
Aún no hay calificaciones
Aprendizaje Supervisado en Python
20 páginas
Formulación Del Problema
Aún no hay calificaciones
Formulación Del Problema
6 páginas
Fis4Pr02 PDF
Aún no hay calificaciones
Fis4Pr02 PDF
2 páginas
Energía y Potencial Eléctrico
Aún no hay calificaciones
Energía y Potencial Eléctrico
53 páginas
Formulario Único de Pago Caja Honor
Aún no hay calificaciones
Formulario Único de Pago Caja Honor
2 páginas
Lab No.1 - Comportamiento Del Voltaje en Funcion de La Distancia
100% (2)
Lab No.1 - Comportamiento Del Voltaje en Funcion de La Distancia
5 páginas
Diodo Semiconductor
Aún no hay calificaciones
Diodo Semiconductor
61 páginas
Trabajo-Energia Atwood
Aún no hay calificaciones
Trabajo-Energia Atwood
5 páginas
Taller Trabajo y Energia
Aún no hay calificaciones
Taller Trabajo y Energia
3 páginas
Practica 1 DAC
100% (2)
Practica 1 DAC
3 páginas
Examen N°1
Aún no hay calificaciones
Examen N°1
2 páginas
4.4. Metrado Instalaciones Eléctricas - FP
Aún no hay calificaciones
4.4. Metrado Instalaciones Eléctricas - FP
18 páginas
1 Introducción
Aún no hay calificaciones
1 Introducción
6 páginas
Robótica
Aún no hay calificaciones
Robótica
10 páginas
Protocolo de Medición de Tierra en BT/MT
100% (2)
Protocolo de Medición de Tierra en BT/MT
2 páginas
Infraestructura Educativa Santa Rosa
Aún no hay calificaciones
Infraestructura Educativa Santa Rosa
1 página
Redes Neuronales en Computación
Aún no hay calificaciones
Redes Neuronales en Computación
4 páginas
Crecimiento Poblacional en Chulucanas
Aún no hay calificaciones
Crecimiento Poblacional en Chulucanas
9 páginas
Metrado de Ie. Pronoi
Aún no hay calificaciones
Metrado de Ie. Pronoi
10 páginas
Redes Neuronales: Principios y Aplicaciones
Aún no hay calificaciones
Redes Neuronales: Principios y Aplicaciones
2 páginas
Perceptron Multicapa
Aún no hay calificaciones
Perceptron Multicapa
6 páginas
Introducción a la Robótica: Conceptos Clave
Aún no hay calificaciones
Introducción a la Robótica: Conceptos Clave
24 páginas
Bostrom, Nick - Superinteligencia (Completo)
91% (11)
Bostrom, Nick - Superinteligencia (Completo)
178 páginas
Antropometría. Enrique Bonilla Rodríguez. La Técnica Antropométrica Aplicada Al Diseño Industrial
100% (4)
Antropometría. Enrique Bonilla Rodríguez. La Técnica Antropométrica Aplicada Al Diseño Industrial
91 páginas
Machine PDF
Aún no hay calificaciones
Machine PDF
38 páginas
Hoja de Tareo Ayacucho Junio 2019
Aún no hay calificaciones
Hoja de Tareo Ayacucho Junio 2019
144 páginas
Métodos de Explotación Subterránea en Minería
Aún no hay calificaciones
Métodos de Explotación Subterránea en Minería
11 páginas
Protocolo Nivelacion
100% (1)
Protocolo Nivelacion
18 páginas
Registro de Operadores de Aeronaves RPA
Aún no hay calificaciones
Registro de Operadores de Aeronaves RPA
640 páginas
Inteligencia Artificial: © Fernando Berzal
Aún no hay calificaciones
Inteligencia Artificial: © Fernando Berzal
28 páginas
Aplicaciones Del Machine Learning
Aún no hay calificaciones
Aplicaciones Del Machine Learning
6 páginas
Antropometría y Ergonometría en Arquitectura
Aún no hay calificaciones
Antropometría y Ergonometría en Arquitectura
40 páginas
Ergonomia
Aún no hay calificaciones
Ergonomia
23 páginas
Joyce
Aún no hay calificaciones
Joyce
10 páginas
Presupuesto Instalaciones Electricas Mini Pachitea
Aún no hay calificaciones
Presupuesto Instalaciones Electricas Mini Pachitea
2 páginas
Proyección Poblacional y Agua Huayucachi
Aún no hay calificaciones
Proyección Poblacional y Agua Huayucachi
16 páginas
Seguridad en Independencia-Pisco
Aún no hay calificaciones
Seguridad en Independencia-Pisco
2 páginas
Análisis de Precipitaciones y Redes Neuronales
Aún no hay calificaciones
Análisis de Precipitaciones y Redes Neuronales
3 páginas
Certificado de Mantenimiento Recarga y
Aún no hay calificaciones
Certificado de Mantenimiento Recarga y
45 páginas