THE MACHINE LEARNING CANVAS Designed for: Netflix Designed by: David Jimenez y Steven Acosta Date: 20-
11-22 Iteration: 1 .
TAREA DE DECISIONES PROPUESTA DE RECOLECCIÓN DE FUENTE DE DATOS
PREDICCIÓN VALOR DATOS
¿Tipo de tarea?
Agrupamiento y recomendación. Dada una película o una serie el sistema Para suscriptores de Netflix que desean Los datos iniciales que se pasarán al Se cuenta inicialmente con una base de
¿Entidad sobre la que se realiza la la clasificaría y con base en información tener una recomendación del catálogo de modelo se harán a través de un archivo datos de csv en el servicio S3 de AWS
predicción? exógena de los gustos de la persona, el Netflix acorde a sus gustos, nuestro csv descargado de kaggle. con la información del catálogo de
Características de las películas y series del sistema retorna el nombre de una posible Nemore Sys (Netflix Movies películas y series de Netflix, el nombre
catálogo de Netflix. película acorde al gusto del suscriptor de Recommendation System) es una API Se programó una tarea con el servicio de de la tabla llamado catalogue.
¿Posibles salidas o resultados? Netflix. que genera la mejor recomendación DMS de AWS que se ejecuta Las características de la tabla son:
Clasificación de películas y series. basándose en características del catálogo semanalmente actualizando las nuevas show_id, type, title, director, cast,
¿Tiempo de espera antes de la Para la salida se debe tener en cuenta el tales como tipo, país, rating entre otras. incorporaciones del catálogo y country, date_added, release_year, rating,
observación? tipo de Cluster e información exógena la información exógena de los duration, listed_in, description.
Luego de correr el servicio y guarde la como las últimas 10 películas vistas por suscriptores.
clasificación de la película o serie, un suscriptor. Características Exgonenas:
inmediatamente se visualiza la salida. Date, show_id, like, user_id
SIMULACIÓN DE HACIENDO CONSTRUCIÓN DEL CARACTERISTICAS
IMPACTO PREDICCIONES MODELO
El modelo se puede desplegar una se vez La predicción se hace por baches en la Las características de la base de datos Se tiene un servicio Lambda
se valide la cantidad de grupos por medio nube de AWS de manera semanal, dicha son de tipo categóricas, por lo que solo se en AWS con el cual se hace ingeniería de
de la técnica del codo, en donde se tiene predicción se guarda en una base de datos usara el modelo de agrupamiento K- datos incluyendo procesos como
en cuenta el costo. para posteriormente ser mostrada al mode. imputación, completitud de los datos y
suscriptor una vez ingrese al aplicativo. Aunque el tiempo de reentrenamiento no eliminación de outlier.
En cuanto a los datos exógenos se evalúa es significativo, se debe tener en cuenta
con el porcentaje de aciertos de las ultimas que la librería para el uso de este modelo
10 películas vistas con like del suscriptor no esta instalada por defecto, por lo
respecto a las ultimas 20 películas vistas y tanto, se requiere ser instalada en el
se evalúa con una matriz de confusión. servicio de AWS.
MONITOREO Formula:
y si ninguna de las
La métrica de nuestro modelo utilizado recomendaciones
está dada por la matriz de confusión. Para gustó, pero todas las que el susc
El rango de valores de este KPI esta plant riptor busco si gustaron tiene una califica
el modelo de negoció se evalúa a través eado entre 1 y -1, en donde 1 significa qu
del KPI con la siguiente ción de -1.
e todas las películas recomendadas han g
ustado