Esl ES
Esl ES
Modelización Predictiva
Tema 1. Introducción a la
modelización predictiva
Índice
Esquema
Ideas clave
1.2. Definiciones
A fondo
Un poco de teoría
Test
Esquema
Modelización Predictiva 3
Tema 1. Esquema
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
El análisis estadístico intenta, por lo general, estudiar una muestra de datos para
obtener conclusiones que son válidas más allá de esa muestra; es decir, para otros
datos que podríamos registrar sobre el mismo problema. A menudo, el interés reside
tiene que ver con entender esa variabilidad de forma que sea posible discernir qué
escribiremos a continuación.
acciones de bolsa.
Modelización Predictiva 4
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
▸ Nuestro correo electrónico retiene varios mensajes que considera peligrosos o spam.
Podemos escribir una lista muy extensa de ejemplos cotidianos de sistemas que
que queremos predecir y las variables que usamos para ello; solamente nos interesa
En las tareas predictivas, las variables juegan un papel asimétrico. Mientras que en
supone una distinción entre las variables que adoptan el papel de variables
La razón que lleva a explicar una variable en términos de otras es que unas de ellas
pueden ser fáciles de observar o controlables, por lo que resultaría sencillo obtener
algunos de sus valores; en tanto que, para las otras, la obtención de observaciones
tecnologías han conseguido, en los últimos años, tener un papel central en las tareas
predictivas y es fácil entusiasmarse con ellas como la primera solución a adoptar. Sin
embargo, veremos más adelante que la solución más conveniente para un problema
predictivo es, a menudo, la más simple que nos permite un error de predicción
Modelización Predictiva 5
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=adc64732-c21a-
4183-9726-b06801338054
Modelización Predictiva 6
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.2. Definiciones
nuestra tarea es, entonces, ajustar el valor de esos parámetros usando los datos que
para obtener un modelo predictivo que, en conjunto, es poderoso. ¿Cuáles son los
mínimos parciales o PLS). Por ello, en el contexto del modelado predictivo es común
aprendizaje.
Tipos de aprendizaje
forma que conocemos con certeza la respuesta verdadera asociada a cada ejemplo
Modelización Predictiva 7
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Por ello, los problemas predictivos típicos se abordan normalmente con estrategias
menudo resulta mucho más caro o costoso que recolectar ejemplos, aunque
más grande, pero etiquetada solo parcialmente. Este último escenario se conoce
experto que nos diga la respuesta o etiqueta asociada con los ejemplos que
disponemos. En este caso solo nos queda poder descubrir patrones en los datos que
agrupamientos o clustering.
ajuste de modelos predictivos. Otras tareas, como reducir la dimensión del conjunto
información de la respuesta.
ejemplo, en problemas en los que la cantidad de variables es mucho más grande que
Modelización Predictiva 8
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Modelización Predictiva 9
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
los datos de cada clase. La clasificación se efectúa, luego, verificando cuál de esos
Modelización Predictiva 10
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
interés para nuestro problema, podremos actualizar nuestro modelo predictivo sin
aprender la distribución de los datos, para luego construir con eso un modelo
predictivo, no es el camino más eficiente.
Por un lado, discriminar entre dos clases puede ser un problema más sencillo que
describir correctamente cada clase. Por otro lado, si las suposiciones de modelado
para cada clase no son correctas, el clasificador construido de esa manera indirecta
preocuparnos mucho por describir cómo se comportan los datos lejos de esa
frontera.
Modelización Predictiva 11
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
cada . Luego, querremos usar ese modelo para casos en los que conocemos
que sería el valor verdadero de la respuesta (aunque no podamos medirla para esos
nuevos puntos).
Para cuantificar qué tan bien se ajusta nuestra predicción al valor verdadero de la
sea posible la chance de cometer este tipo de errores con un modelo ya ajustado.
Luego, lo que quisiéramos es reducir el valor que podemos esperar para esta
respuesta , entonces:
Modelización Predictiva 12
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
ese problema. Es la solución ideal, que veremos más adelante que es impracticable
Esta expresión también nos muestra que para identificar explícitamente un problema
traduciremos este problema poblacional en una solución algorítmica con una muestra
Modelización Predictiva 13
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Regresión
costo cuadrática:
valor real.
Proposición
de los predictores.
Modelización Predictiva 14
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Esta solución ideal, no obstante, sirve de guía para otros métodos. Por ejemplo,
. Otra estrategia será adoptar un modelo paramétrico para esta esperanza y luego
estimar los parámetros del modelo a partir de los datos disponibles. Este es el caso
Clasificación
respuesta multivariada.
las clases por sobre las demás. Un caso extremo de esta situación es una en la que
Proposición
Supongamos que adoptamos una función de costo 0/1, que simplemente cuenta si
Modelización Predictiva 15
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
distribución real de los datos como para calcular estas probabilidades. No obstante,
una vez más, este resultado nos sirve de guía. Por ejemplo, podemos modelar la
las variables predictoras están dadas y son adecuadas para el problema. La única
consideración que haremos es que tal vez hemos recolectado más variables que las
importará, también, entender cuáles son las variables de mayor valor predictivo a fin
Modelización Predictiva 16
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Sin embargo, en problemas reales complejos a menudo existe un paso previo que
entre las amplitudes o entre las duraciones de las distintas fases del complejo QRS o
proceso completo, que incluye identificar primero cuáles son los predictores que
propiamente dicha.
cuáles son las características y variables importantes a partir de los datos? Esa es
modelos. En los métodos que abordaremos en este curso supondremos siempre que
datos.
Modelización Predictiva 17
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
predictivo.
Modelización Predictiva 18
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
área del modelado predictivo, como así también los dos problemas predictivos
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=18027b5c-4a6a-
4fd6-b317-b0680133802b
Modelización Predictiva 19
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
no es más que un estimador del riesgo, que se mide usando los datos de la
caso en todo el conjunto de datos, una predicción correcta se puntúa como 0 y una
clasificación errónea se puntúa como 1. El error aparente es la proporción de casos
mal clasificados:
Debido a que esta estimación del error de predicción usa los mismos datos que se
tener un buen desempeño predictivo sobre casos que todavía no hemos visto,
Modelización Predictiva 20
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
utilizados durante el ajuste del modelo. Para lograr esto, lo común en la actualidad es
A menudo, los datos disponibles no son tantos como para separarlos en tres
conjuntos y que cada uno tenga una cantidad de observaciones adecuada. Por
ejemplo, confiamos en que cuantos más datos usemos para entrenar los modelos,
más precisos serán los estimadores. Por lo tanto, quisiéramos reservar la mayor
Sin embargo, si los conjuntos de validación y prueba son muy chicos, la resolución
remuestreo, que asignan diferentes funciones a los datos a lo largo del proceso.
Modelización Predictiva 21
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Podemos pensar que los datos que medimos tienen una componente estructural útil
está bien, porque es claro que un modelo que funciona muy mal en la muestra de
de la solución. Vemos que podemos reducir a cero el error aparente, pero claro que
comenzamos a modelar el ruido en los datos más que la relación estructural entre las
variables representada por la curva negra. La mejor solución, en este caso, como
Modelización Predictiva 22
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
generalización, nuestro desafío será encontrar los modelos más simples que
producen un ajuste razonablemente bueno sobre los datos con que contamos.
que da lugar a un riesgo estructural que será el verdadero objetivo por optimizar.
La complejidad de una solución, muchas veces, estará dada por un parámetro de los
Figura 4. Ilustración del efecto de overfitting en un problema de regresión. Fuente: Izenman (2008).
Modelización Predictiva 23
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
La curva negra muestra la verdadera relación entre predictor y respuesta para estos
Modelización Predictiva 24
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=69d65981-3f21-
423c-99ab-b06801337fa0
Modelización Predictiva 25
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Ejercicio 1
Solución
Definimos nuestra función de predicción como , que es una función de los datos de
entrenamiento y los parámetros del modelo. Nuestro objetivo es encontrar la función de
predicción que minimice el riesgo cuadrático esperado, que aquí llamaremos MSE:
negativa, lo mejor que podemos hacer para minimizar este término es tomar
. Luego, la solución óptima es:
Modelización Predictiva 26
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Ejercicio 2
clasificación .
Solución
Notemos primero que la función de costo en este caso vale 0 cuando la clasificación es
correcta y 1 en cualquier otro caso. Podemos proceder de forma similar al caso de
Alcanza con minimizar esta expresión puntualmente para cada valor de . Luego,
buscamos una solución que satisfaga:
Ejercicio 3
¿Por qué la regla de Bayes deducida en el ejercicio 2 no es una solución de valor práctico
Solución
inaccesible. Podemos usar estimadores para esas distribuciones y adoptar estos valores
para obtener un estimador plug in que sí podemos usar en un problema real, pero
Ejercicio 4
Modelización Predictiva 27
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Solución
La ventaja principal reside en que la solución basada en la mediana será más robusta a la
Ejercicio 5
Solución
Ejercicio 6
Proponga dos formas de aproximar la regla de Bayes para el problema de regresión del
ejercicio 1.
Solución
▸ Vecinos más cercanos: sea una vecindad del punto , determinada por los
Modelización Predictiva 28
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Ejercicio 7
Implemente un clasificador de K vecinos más cercanos. Aplíquelo sobre los datos iris
(disponibles en el paquete {dataset} de ), considerando la longitud de sépalos y pétalos
como variables predictoras. Visualice la frontera de decisión obtenida por el clasificador
Solución
El siguiente código ofrece una versión básica. Por supuesto, no es la única implementación
posible.
sum((point1 - point2)^2)^(1/2)
Modelización Predictiva 29
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
for (i in 1:n_test) {
for (j in 1:n_train) {
return(predictions)
Modelización Predictiva 30
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
n = nrow(datos)
set.seed(123)
k <- 5
# Clasificamos
Modelización Predictiva 31
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
(mean(predicted_labels != datos[-idx_train,3]))
## [1] 0.04
Ejercicio 8
En este ejercicio vamos a utilizar los datos Boston, disponibles con el paquete {MASS} de
. Ese dataset recoge la mediana del valor (el precio mediano) de las viviendas ocupados
por sus propietarios (en miles de dólares) en 506 áreas residenciales de Boston. Junto con
el precio se han registrado 13 variables adicionales. Para una descripción de las variables
▸ ¿Cuántas filas hay en este conjunto de datos? ¿Cuántas columnas? ¿Qué representan las
▸ Realiza algunos diagramas de dispersión por pares de los predictores (columnas) en este
▸ ¿Alguno de los predictores está asociado con la tasa de criminalidad per cápita? Si es así,
explica la relación.
▸ ¿Alguno de los suburbios de Boston parece tener altas tasas de criminalidad? ¿Altas tasas
predictor.
▸ ¿Cuál es la proporción mediana de alumnos por profesor entre los suburbios de este
conjunto de datos?
▸ ¿Qué suburbio de Boston tiene el valor mediano más bajo de viviendas ocupadas por sus
propietarios? ¿Cuáles son los valores de los otros predictores para ese suburbio, y cómo se
comparan esos valores con el rango de valores observado para esos predictores?
▸ En este conjunto de datos, ¿cuántos de los suburbios promedian más de siete cuartos por
vivienda? ¿Y más de ocho habitaciones por vivienda? Comenta sobre los suburbios que
Modelización Predictiva 32
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Solución de la pregunta 1
library(MASS)
?Boston
dim(Boston)
Solución de la pregunta 2
library(GGally)
ggpairs(Boston)
No se puede concluir mucho más que el hecho de que algunas variables parecen estar
correlacionadas. Una matriz o un gráfico de correlaciones sería más útil.
Solución de la pregunta 3
La tasa de criminalidad por ciudad parece tener correlaciones de débiles a moderadas con
otros predictores. Los diagramas de dispersión dan la impresión de que el índice de
accesibilidad a las carreteras radiales o la tasa de impuestos a la propiedad no afectan la
tasa de criminalidad (a pesar de que el coeficiente de correlación sea alto en esos casos).
La distancia desde los centros de empleo de Boston tiene un efecto negativo sobre la tasa
proporción de unidades ocupadas por sus propietarios construidas antes de 1940 también
están correlacionadas positivamente, parece que la tasa de criminalidad es más alta en
Modelización Predictiva 33
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
suburbios con mayor antigüedad. La tasa de criminalidad parece ser más alta en los
suburbios donde la proporción de zona industrializada es mayor.
Solución de la pregunta 4
▸ Tasa de criminalidad per cápita por ciudad: esta variable tiene muchos valores atípicos en
el extremo superior. La mayoría de las ciudades tienen una tasa de criminalidad muy baja,
(aprox. un 80 % entre 0 y 5). Pero hay algunos suburbios (¡solo dos!) que tienen una tasa
de criminalidad muy alta, por encima de 70. Los valores atípicos de la tasa de criminalidad
oscilan entre 9,2 y 89, mientras que los datos de criminalidad para todos los suburbios van
▸ Tasa de impuesto a la propiedad en unidades de $10 000: no hay valores atípicos en las
tasas de impuesto a la propiedad; sin embargo, un valor medio cercano a 300 indica que
los datos de impuestos también están sesgados, ya que los datos varían de 200 a 700.
▸ Proporción alumno-profesor por suburbio: esta variable tiene valores atípicos en el extremo
inferior del diagrama de caja. Los datos oscilan entre 12,6 y 22. El valor medio de la
Solución de la pregunta 5
median(Boston$ptratio)
# 19.05
Solución de la pregunta 6
Los suburbios 399 y 406 tienen el valor mediano de las viviendas ocupadas por sus dueños
más bajo. Si comparamos los valores de los otros predictores para estos suburbios y los
# 399 406
Modelización Predictiva 34
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Vemos que estos suburbios no son los más deseables para vivir.
Solución de la pregunta 7
# 64
# 13
Modelización Predictiva 35
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
summary(Boston)
Los 13 suburbios que tienen un promedio de más de 8 habitaciones por vivienda tienen una
tasa de criminalidad más baja, la tasa de impuestos a la propiedad es baja con la excepción
de un suburbio, la proporción de zona industrializada es muy baja, excepto en dos
suburbios, lo que indican áreas más residenciales. Los suburbios parecen estar lejos de las
autopistas. La mayoría de las casas se construyeron antes de 1940, excepto unas pocas.
Ejercicio 9
En este ejercicio realizaremos un estudio con datos simulados para visualizar la regla de
clasificación de Bayes.
▸ Simula datos de cada una de las dos distribuciones Gaussianas con medias mu1 , mu2 e
▸ Simula m datos independientes de cada una las distribuciones anteriores. Para cada uno
▸ Colorea cada una de las 2m observaciones de prueba en función de la clase para la que se
Solución:
mu1 = 3
mu2 = 0
sigma = 2
Modelización Predictiva 36
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
n = 50
df = data.frame(X = c(X1,X2),
gg = ggpubr::ggscatter(df,
x = "X",
y = "yval",
color = "Grupo_mas_probable")
gg = gg +
Modelización Predictiva 37
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
ggplot2::stat_function(fun = dnorm,
color = "red3") +
ggplot2::stat_function(fun = dnorm,
color = "#0098cd")
gg
Modelización Predictiva 38
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=3b17ef44-2a87-4b58-
ad44-b06801337f7b
Ejercicio 10
obtenida en el ejercicio 9.
Solución
myK = 9
train_labels = df$Y,
Modelización Predictiva 39
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
k = myK)
gg = ggpubr::ggscatter(df2,
x = "X",
y = "yval",
color = "predicted")
gg = gg +
ggplot2::stat_function(fun = dnorm,
color = "red3") +
ggplot2::stat_function(fun = dnorm,
color = "#0098cd")
Modelización Predictiva 40
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Modelización Predictiva 41
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Meier, A. (2020, abril 4). Do we still need Traditional Pattern Recognition Machine
Learning and Signal Processing in the Age of Deep Learning? [Imagen]. Pattern
traditional-pattern-recognition-machine-learning-and-signal-processing-in-the-age-of-
deep-learning/
Rodriguez, J. (2020, mayo 4). Microsoft Research unveils three efforts to advance
https://www.kdnuggets.com/2020/05/microsoft-research-three-efforts-advance-deep-
generative-models.html#:~:text=Generative%20Models%20%2D%20KDnuggets-
,Microsoft%20Research%20Unveils%20Three%20Efforts%20to%20Advance%20Dee
p%20Generative%20Models,generative%20models%20at%20large%20scale.&text=
Generative%20models%20have%20been%20an,for%20the%20last%20few%20deca
des
Modelización Predictiva 42
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
A fondo
James, G., Witten, D., Hastie, T., Tibshirani, R. (2021). An Introduction to Statistical
estadístico con fines predictivos. Ofrece una introducción amena sin requerir un
del curso. Puedes acceder a todos los recursos desde el enlace de arriba.
Modelización Predictiva 43
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo
https://web.cs.ucdavis.edu/~matloff/RegClassBook/TOCPrefaceChap1Full.pdf
Modelización Predictiva 44
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo
Un poco de teoría
matemáticas.
Modelización Predictiva 45
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
Test
de regresión.
más cercanos.
más cercanos.
Modelización Predictiva 46
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test
Con
Unexpected text node: '{ω} rsub {i} =k left ({{x} rsub {i} -x} over {σ} right )' para una función
simétrica y positiva
Unexpected text node: 'k(x)' (por ejemplo,
Unexpected text node: 'k(x)' es la fdp correspondiente a la distribución normal). Note que
esto representa un promedio local de los valores de
Unexpected text node: 'Y' en un entorno de
Unexpected text node: 'x' . ¿Cuál es el efecto de reducir
Unexpected text node: 'σ' ?
Unexpected text node: '\{-1,+1\}' . En qué caso puede convenir adoptar una regla de
clasificación
Unexpected text node: 'C left (x right ) =signo left (p left (Y=+1|X=x right ) -η right )'para
entrenamiento.
Modelización Predictiva 47
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test
5. El error de predicción estimado usando los mismos datos que se usaron para
C. Insesgado.
A. Gráficos de dispersión.
B. Gráficos de barras.
C. Gráficos de torta.
D. Boxplots.
independiente.
Modelización Predictiva 48
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test
de prueba. -Repetimos el proceso veces, tomando cada vez una partición diferente
como partición de prueba. ¿Por qué los errores de predicción estimados en cada
partición no son independientes?
D. Porque los
H clases distintas nos damos cuenta de que en realidad es conveniente dividir una
A. Aprendizaje no supervisado.
B. Aprendizaje generativo.
C. Aprendizaje semisupervisado.
D. Aprendizaje discriminante.
Modelización Predictiva 49
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)