Introducción al Aprendizaje Automático
Introducción al Aprendizaje Automático
1.1. Evolución de la IA
1
tareas cada vez más complejas. Algunos ejemplos de las primeras máquinas llamadas
“inteligentes” que han ido cambiado el curso de la historia de la inteligencia artificial
son:
2
tareas que es capaz de realizar un ser humano, de forma simultánea y de manera casi
inconsciente, la dejamos para la ciencia ficción. Por esta razón, existen varias
máquinas diferentes, una para cada uno de los diferentes campos de trabajo que se
necesiten. La robótica, la visión artificial, el procesado del lenguaje natural o el internet
de las cosas son algunos ejemplos de la especialización de las máquinas.
Como vemos en la siguiente imagen, cada una de las ramas de la inteligencia artificial
va profundizando cada vez más en la tarea de imitar a la inteligencia humana y de
conseguir una respuesta con la mayor rapidez y autonomía posible.
Para a dejar clara la diferencia entre estos dos conceptos vamos a ver dos ejemplos:
3
las reglas del juego y las aplica en cada turno. En programación, esto se hace
utilizando el comando “si”, “si hay alguna ficha en la fila de la torre, cómela”, “si hay
alguna ficha en la diagonal del alfil, cómela”. El sistema solamente tiene que seguir las
instrucciones que le ha indicado el programador, es como un niño al que se le dice lo
que tiene que hacer.
2. Introducción a la estadística
Como hemos mencionado anteriormente, el aprendizaje automático utiliza técnicas y
algoritmos para averiguar las relaciones y patrones entre los datos, para aprender de
ellos. Las máquinas no aprenden de la misma manera que nosotros los humanos, no
tienen emociones o intuiciones. Las máquinas aprenden basándose en los datos y
utilizando la estadística. La estadística es la ciencia que estudia la organización, el
análisis, la interpretación y representación de los datos. La estadística se divide en dos
grandes áreas:
4
La estadística descriptiva: se utiliza para describir las características de un
conjunto de datos.
La estadística inferencial: se utilizan para generar predicciones basadas en los
datos.
Variable independiente: Es
aquella variable cuyo valor no depende de ninguna otra variable. Esta variable
se suele representar con la letra “x”.
Además, existen otros factores o causas que no se pueden controlar y que influyen en
el valor final de la variable dependiente. Como ejemplo, en el gasto de luz mensual, la
variable dependiente sería el precio de la factura y la variables independiente sería el
precio del Kw/h. El precio final que pagaremos depende de más factores o causas que
no se pueden controlar como la avería de algún electrodoméstico o el mal
funcionamiento del contador de luz y a esta parte incontrolable la llamaremos error. Si
todos los meses pagamos 60 € en nuestra factura de la luz podemos llegar a
“predecir” que la siguiente factura será del mismo valor. Si la factura que nos llega es
de 80 € puede ser por dos razones: el precio del Kw/h ha subido o ha habido algún
error en la factura.
Para que el modelo que utilizamos se ajuste a la realidad, el error debería ser del
menor valor posible. En un mundo ideal, este error sería cero, pero en la realidad esto
nunca sucede. El error es la diferencia entre el valor observado y el valor de la
predicción del modelo.
5
Muestreo
Este es otro concepto que es importante tener claro cuando hablamos de la
estadística. Es el conjunto de datos que se obtienen cuando tomamos una muestra de
algo que queremos estudiar. Si medimos durante varios días la temperatura del
ambiente, obtendríamos varios valores con los que poder representar la variación que
tiene en un período de tiempo. Como es lógico, no haremos mediciones
constantemente a cada segundo. Realizaremos una o dos mediciones que
asignaremos a un día y poder ver la evolución a largo plazo. A estas mediciones las
llamamos muestras.
2.2. Predicciones
El análisis predictivo trata de buscar patrones y convertir los datos en predicciones y
de esa manera saber lo que ocurrirá en el futuro. Gracias al aprendizaje automático
junto con los métodos estadísticos se puede predecir cuando se va a agotar un
producto para reponerlo o cuando un cliente puede estar pensando en darse de baja.
Toda esta información tiene un valor incalculable para la empresa y genera un valioso
conocimiento.
6
Modelos de regresión: En estos modelos, lo que se intenta predecir es
un número una cantidad. Podemos estimar, la cantidad de clientes que
acudirán a un restaurante durante el fin de semana y así poder comprar
cantidad de comida necesaria sin desperdiciar nada.
2.3. Ejercicios
Para dejar claro los que hace realmente un modelo matemático de aprendizaje
automático, vamos a ver un ejemplo sencillo y a calcularlo por nosotros mismos.
7
¿Qué relación tienen estas variables entre sí? El
precio final de la carrera depende de los kilómetros recorridos. Si preguntamos a un
taxista por el precio de un viaje, nos informa de que el precio es de 1,26 € por cada
kilómetro y que la bajada de bandera nos costará 3 € adicionales.
En nuestra ecuación multiplicaremos la cantidad de 1,26 por los kilómetros que vamos
a recorrer en el trayecto. En nuestro caso la variable X es igual a 10 Km.
Con estos pasos ya hemos creado nuestro modelo de aprendizaje para predecir el
precio de cualquier viaje en taxi dentro de nuestra ciudad. Si hacemos los cálculo
obtenemos que la carrera nos costará 15,6 €. Este modelo nos seguirá funcionando
para calcular otros recorridos, siempre que el precio por kilómetro no sufra variaciones.
Hemos creado la ecuación del modelo por deducción y a partir de los datos que
teníamos. Esto no siempre es posible porque el cálculo puede ser mucho más
complicado. Otra manera de obtener la ecuación sería, a partir de muestras varios
viajes anteriores. Esto lo hacemos también en nuestra vida cuando le preguntamos a
algún amigo ¿cuanto te ha costado el taxi al aeropuerto desde tu casa?, y basándonos
en su respuesta nosotros hacemos una estimación aproximada de los que nos
costaría el trayecto desde nuestra casa.
En estos datos podemos reconocer que hay una variable independiente que es el año
en el que se producen las ventas, que no depende de ningún otro valor y que
llamaremos X. Además, tenemos una variable dependiente que es la cantidad de
8
ventas en euros que se realiza cada año y que está asociada a un valor de X concreto.
A este variable la llamaremos Y.
Por ejemplo, cuando X vale 2012 el valor de las ventas es 2000, o dicho de otro modo,
el valor de Y es 2000. Con todos estos datos vamos a hacer una representación
gráfica en la que mostraremos los valor de la X en el eje horizontal y los valores de Y
en el eje vertical. Nuestros valores quedaran representados como una serie de puntos
en la siguiente gráfica.
Vemos que los puntos siguen una cierta tendencia. Cuando se crea un modelo
estadístico con técnicas de aprendizaje automático lo que se hace en realidad en
calcular los puntos que hay entre medias de esas muestras. Se hace una estimación
de los datos de los que no tenemos ningún valor. La siguiente imagen muestra la línea
que genera un modelo sencillo de machine learning.
9
Figura 6: Modelo de predicción para las ventas de un negocio
Ahora solo nos que sustituir los valores de los puntos que hemos elegido, sabiendo
que cada uno de los puntos tiene la forma: P1 (X1,Y1) y P2 ( X2,Y2).
10
Realizando los cálculos y despejando la ecuación final sería la siguiente.
[Link]
Video 1: Abejas ()
Muy bueno !!!
Supervisado
No supervisado
Reforzado
Un ejemplo muy típico es aprender a diferenciar entre perros y gatos. Nosotros los
humanos realizamos esa categorización de forma automática. Simplemente, ¡sabemos
que es un gato!. Pero si nos paramos a pensar un poco, nos daremos cuenta de que
11
hay una serie de características que atribuimos a los gatos y otras diferentes a los
perros. Para saber que es un gato podemos fijarnos en sus ojos de color claro, sus
bigotes alargados, sus uñas afiladas, la forma lenta de moverse etc. Por otro lado,
para saber si es un perro nos fijaremos en que su tamaño más grande, su hocico muy
largo o si ladra. Para un ordenador no es tan sencilla la diferencia, primero tiene que
analizar las imágenes y decidir si es un animal u otro. Muy probablemente, si le
enseñamos un perro de raza chihuahua, la inteligencia artificial no acertará en su
respuesta, si no ha visto algún chihuahua con anterioridad. Estos perros por pequeño
tamaño se asemejan más a la fisiología de un gato.
12
Si se ha realizado el entrenamiento con los datos y al realizar la prueba estamos
satisfechos con el resultado podemos dar por completado el modelo. Lo que suele
pasar es que tengamos que repetir el proceso con un nuevo entrenamiento y otro test
hasta que el modelo es capaz de reconocer al “chihuahua”. Para algunos casos puede
ser más largo y complejo por lo que tendríamos que repetir varias veces el proceso y
puede que no lleguemos observar las respuestas correctas.
En todo momento estamos supervisando el aprendizaje y descartando las respuestas
incorrectas. El algoritmo se dice que está entrenado cuando es capaz de clasificar los
datos según la lógica esperada. La clasificación puede ser por categorías como perro
o gato, o por número como puede ser un algoritmo que adivine la edad de una
persona por la foto. En este tipo de entrenamiento se utilizan las etiquetas para
mostrar el modelo las respuestas que consideramos correctas. Otra característica que
debemos tener en cuenta al entrenar un modelo de machine learning es que los datos
de entrenamiento deben ser lo más variados posibles ya que, de lo contrario,
aprenderá de reglas muy rígidas para tomar las decisiones.
Los modelos que utilizan el aprendizaje no supervisado pueden realizar tareas más
complejas como reconocimiento facial o reconocimiento de voz. Pero también pueden
ser más impredecibles al no contar con supervisión humana durante el aprendizaje. No
en todos los casos se llega a realizar una clasificación correcta como en el caso de la
IA de Google Photos en en año 2015, que etiquetó por error una foto de personas de
raza negra como “gorilas”. Google pidió perdón por la equivocación de su software, un
error que se conoce como error de sesgo y que ocurre cuando los datos que se
utilizan para el aprendizaje no son lo suficientemente variados.
13
Figura 8: Procesamiento de imágenes. Fuente: Pixabay
Como resumen puedes ver este video de Google que habla sobre el aprendizaje de
las máquinas.
Video 2: Aprendizaje
14
Figura 9: Entrenamiento del modelo ¿perro o gato?
Del conjunto total de datos que tenemos haremos dos subconjuntos, uno para entrenar
al sistema de forma controlada y el resto, para realizar las pruebas y así poder
comprobar que el resultado es el que esperábamos. Los algoritmos de aprendizaje
automático aprenden de los datos con los que realizamos el entrenamiento. Es muy
importante guardar una pequeña parte de los datos para posteriormente realizar el test
de prueba, ya que si lo hacemos con el mismo conjunto de datos con el que hemos
entrenado no lo estaremos validando realmente. Para poder comprobar que un modelo
está funcionando debemos validarlo con un conjunto de datos diferente. Siempre que
estemos trabajando con modelos de aprendizaje automático debemos tener los datos
divididos en dos grupos.
Datos de prueba: Son los datos que reservamos para comprobar que nuestro
modelo funciona. Es importante que estos datos representen una amplia
variedad de situaciones. La cantidad de datos que guardamos será en torno a
un 30% del total de los datos.
4.2. Sobreajuste
Cuando un modelo está “sobre entrenado” quiere decir que la respuesta del sistema
está muy ajustada al conjunto de datos con el que que ha sido entrenado. Las
previsiones se ajustan al entrenamiento de tal manera que no son capaces de
15
responder de forma correcta a datos nuevos y diferentes. Estos son modelos
complejos que ya no podrían seguir siendo utilizados porque no tienen en cuenta la
posibilidad de error que siempre existe.
En nuestro ejemplo que diferencia entre perros y gatos, el tigre representa a ese error
que no se puede predecir pero que a veces ocurre. Y nuestro modelo ha sido capaz de
reaccionar bien a este error, encontrando parecidos comunes con la especie felina a la
que también pertenecen los gatos.
4.3. Subajuste
También puede pasar el caso contrario, en el que los datos de entrenamiento son
insuficientes y el algoritmo no aprende lo necesario para dar una buena respuesta. Los
datos pueden no estar bien procesados, no ser representativos del conjunto completo
o contener errores que engañan al modelo. Las salidas que obtendremos serán muy
simples y con poco valor por un entrenamiento defectuoso.
4.4. Generalización
Lo que buscamos con todo esto es que nuestro modelo haga una generalización de
nuestros datos para poder realizar una buena predicción aunque los datos no sean
conocidos. Como hemos visto, el algoritmo debe ajustarse a los datos de entrada lo
suficiente para que la respuesta sea satisfactoria en todas las situaciones, incluidas las
que son nuevas. La ecuación matemática que define un modelo puede ser tan simple
como la ecuación de una recta o tan compleja como una ecuación matricial. Encontrar
el equilibrio entre que el modelo se ajuste lo máximo posible a la realidad y la
complejidad del modelo estadístico no es siempre fácil.
En el siguiente video podrás ver otro ejemplo en el que se ve como hace falta volver a
repetir en entrenamiento porque el modelo falla en la predicción. Cuando
seleccionamos imágenes para entrenar debemos tener muy en cuenta el fondo para
no confundir al algoritmo.
16
5. Algoritmos y herramientas
Los ejemplos que hemos visto anteriormente sobre la estimación del coste de un
trayecto en taxi o la predicción de las ventas de nuestra tienda de electrónica son los
modelos más simples que se pueden utilizar para generar un algoritmo. En el método
de regresión lineal simple trazamos una línea que representa los valores genéricos
que dan respuesta a nuestro problema gracias una ecuación matemática, la de la
recta. Pero existen diferentes modelos que podemos generar dependiendo de la
complejidad de nuestros datos y de la similitud que queramos que tenga la respuesta
con la realidad. Recuerda que en la mayoría de los casos no será posible evitar un
cierto grado de error en el cálculo porque nunca podremos representar la realidad de
manera exacta. Se muestran a continuación los modelos más utilizados en el
aprendizaje automático.
Regresión lineal
La regresión lineal es la línea recta que mejor encaja con evolución de todos
los valores numéricos que se pueden representar. Es la línea que sigue la tendencia
de la variable Y, cuando vamos variando los valores de la variable X. La recta dibujada
será la que menor distancia tenga a todos los puntos de la gráfica. También se le
llama método de mínimos cuadrados por el nombre de la ecuación que utiliza.
17
Figura 10: Modelo de regresión lineal. Fuente: Imagen de Wikipedia
Las predicciones de los valores de la bolsa se basan en este modelo para mostrar las
gráficas que representan la cotización a largo plazo. Otro ejemplo en el que se utiliza
este algoritmo es un la predicción de la temperatura a partir de varias mediciones
realizadas. Cuando solo utilizamos una variable Y que depende de una sola variable
X, al modelo resultante se le llama modelo de regresión lineal simple. Si en nuestro
modelo utilizamos dos variables independientes como pueden ser el tiempo y la
humedad (X1, X2) estaríamos hablando de regresión lineal múltiple, y nuestro modelo
matemático estaría representado por un plano en lugar de una recta.
Para que puedas ver como una máquina calcula la línea recta que más se ajusta al
conjunto de datos que tenemos, puedes utilizar la herramienta Machine Learning
Playgrounds. Marca pulsando con el ratón los puntos de las coordenadas de nuestros
datos (la X para el eje de horizontal y la Y para el eje vertical) y presiona el botón
“Recalculate” para ver gráficamente en acción el método de los mínimos cuadrados
que calcula el lugar exacto de la recta. Puedes probar con la distribución de datos que
prefieras.
18
líneas curvas. Los procesos Gaussianos utilizan funciones de probabilidad como la
media o la varianza para generar un modelo predictivo a partir de los datos. Más
concretamente el algoritmo utiliza un vector de medias y una matriz de covarianzas
para realizar la estimación de la distribución de unas variables aleatorias. En definitiva,
nuestros datos se pueden representar mediante una distribución Gaussiana que es el
modelo calculado gracias a los procesos Gaussianos.
Sin entrar a explicar complejas cálculos matemáticos con matrices, vamos a ver
gráficamente qué es lo que hace este modelo y porqué se ajusta con mayor exactitud
a cualquier conjunto de datos que tengamos generalizando el resultado. Por ejemplo,
si medimos el clima en varios puntos del país, guardando datos de temperatura,
humedad y viento. Utilizando el algoritmo de proceso Gaussiano podremos generalizar
a todo el territorio y predecir el clima en todo el territorio.
Utiliza la herramienta anterior para marcar puntos aleatorios que serán nuestros datos
de trabajo, puedes distribuirlos como quieras en el espacio. Por medio del proceso
Gaussiano se encontrará una ecuación matemática que represente a todos esos
datos. Marca al menos diez o veinte puntos y pulsa el botón “Recalculate” para ver
gráficamente el modelo que se genera. ¿Se adapta al conjunto de datos que le has
suministrado?
5.2. Clasificación
El algoritmo de clasificación se usa cuando utilizamos etiquetas para dividir los datos
en categorías. También se utiliza en el aprendizaje supervisado cuando somos
nosotros los que decidimos si un dato entra en una categoría o en otra cuando nos
encontramos en la fase de entrenamiento. Un ejemplo sencillo que utiliza la
clasificación es la detección del correo no deseado en nuestra bandeja de entrada. Las
etiquetas en este caso serían “correo deseado” o “correo no deseado”. En algunos
casos se nos pregunta y nosotros mismos podemos marcar un correo sospechoso
como correo no deseado.
19
Figura 11: Modelo de máquina de vectores con ML Playgraund
Se llama máquina de vectores porque utiliza vectores para calcular el margen máximo
de separación entre las clases. El modelo de la figura 11 utiliza dos variables
independientes y por eso tiene dos dimensiones y el modelo se representa con una
recta. Podría ser, por ejemplo, la clasificación de los correos según si su remitente es
conocido y si se envían a mas personas. Si queremos añadir alguna variable más (si el
contenido del mensaje es sospechoso) estaríamos añadiendo una dimensión más y
nuestro modelo se representaría con un plano.
Cuando no es posible separar las diferentes clases mediante una línea recta, se utiliza
una función Kernel. Esta función añade una nueva dimensión para hacer posible la
separación de los datos, en el caso de tres dimensiones, por medio de un plano.
Árbol de decisión
Uno de los modelos de clasificación más utilizados en estadística son los árboles de
decisión, los cuáles buscas dividir el conjunto de datos en categorías que sigan una
cierta lógica. Cada una se va ramificando según las características que tengan los
20
datos similares. De esta manera se van descartando las opciones hasta llegar a la
solución del problema.
21
5.3. Clustering o asociación
Una aplicación de esta técnica podría ser para encontrar actividades en redes sociales
en momentos críticos como desastres naturales o situación de confinamiento. Si los
datos de entrada son los usuarios de una red social, el algoritmo es capaz de agrupar
a estos usuarios según el tipo de comportamiento que tenga cada uno. El modelo
busca una estructura con patrones a partir de los datos suministrados. Otra área de
aplicación sería el de las empresas aseguradoras para poder detectar los patrones
que miden la siniestralidad de los clientes y poder aceptar solamente a los clientes que
tengan un menor número de accidentes.
22
5.4.
Programación de algoritmos
También podemos utilizar los algoritmos que hemos creado con esta herramienta en
otras aplicaciones como páginas web o aplicaciones de móvil. La herramienta
Teacheable Machine genera automáticamente el código de programación y nos facilita
mucho el trabajo. En el siguiente vídeo podrás ver como exportar estos modelos para
poder utilizarlos en nuestro propio programa desarrollado en Python o Javascript.
5. Algoritmos y herramientas
23
5.5. Herramientas para utilizar en el aula
Existen varias herramienta que podemos utilizar con nuestros alumnos para introducir
el concepto de aprendizaje automático. Si cuentas con conocimientos de
programación, además podrás utilizar algunos de ellos programando con Scratch. La
inteligencia artificial tiene innumerables aplicaciones y podemos incluso introducir
contenidos de materias como lengua, matemáticas o cualquier otra sin que los niños
se den cuenta de que están adquiriendo conocimiento.
Machine Learning for Kids: Esta es una herramienta muy sencilla para
entrenamiento de modelos como reconocimiento de imágenes, texto, números
o sonidos. No es necesario registrarse para poder crear nuestro primer
proyecto. Cuando termines de entrenar tu modelo puedes descargarlo y
utilizarlo en lenguajes como Scratch o Python.
24
6. Ejemplos reales de uso
Interactuamos con asistentes virtuales que son IA entrenadas para mantener una
conversación de forma natural. Un chatbot es un pequeño asistente y muchas
empresas ya los utilizan en sus páginas web para resolver dudas sencillas. Si la
pregunta es más compleja o es una pregunta para la que no ha sido entrenada, no
podrás obtener una respuesta con sentido o te responderá que no entiende lo que
quieres preguntarle. También están los chatbots con reconocimiento de voz que tienen
que ser entrenados para entendernos cuando hablamos. Esto se consigue gracias a
otra área de la IA mucho más compleja que es el Procesamiento del Lenguaje Natural
o PNL.
Los algoritmos de clasificación son utilizados por Paypal para detectar posibles
fraudes. Para poder comprar en muchas página de Internet, es obligatorio que
facilitemos los datos de nuestra tarjeta bancaria. El algoritmo de Paypal identifica los
pagos de fuentes no fiables según patrones de comportamiento. Así es como también
los bancos y empresas de tarjetas de crédito clasifican las transacciones en correctas
o fraudulentas. Son capaces de detectar el fraude con mucha precisión gracias los
datos del historial de comportamiento de sus clientes y no permitir una compra
asociada a una tarjeta si esta se encuentra en el clúster o agrupación “no fiable”. Las
aseguradoras también pueden denegar la contratación de una póliza si consideran que
el perfil es de “siniestralidad alta” utilizando análisis estadísticos complejos que
estudian el comportamiento de los posibles clientes.
6.3. Captcha
Seguro que en más de una ocasión has tenido que completar alguna prueba de este
tipo para que un software compruebe que eres un humano. Esta herramienta se usa
para evitar que algún software o bot se haga pasar por una persona en la red. En
principio, un Captcha consistía en una cadena de caracteres que solamente podía ser
leída por una persona. Este sistema también puede funcionar, después de una primera
prueba que ya ha comprobado que el usuario es un humano, para entrenar a un
modelo de aprendizaje automático. De esta manera, cada vez que has resuelto un
reCaptcha, has estado colaborando en el proceso de entrenamiento de los programas
de conducción autónoma de Google. Así que la próxima vez, presta mucha atención
cuando estés seleccionando semáforos o pasos de peatones.
25
Uso en el aula: Una actividad interesante para niveles de primaria o secundaria sería
entrenar un modelo para reconocimiento de caligrafía. Se debe introducir cada una de
las letras del abecedario con sus respectivas etiquetas, entrenar el modelo y cuando
hagamos el test comprobar con diferentes caligrafías. La detección y comprensión de
todo tipo de letra es complicada hasta para nosotros los humanos y es una tarea que
mejora con la práctica.
7. Práctica
Para finalizar vamos a realizar una práctica con otra de las herramientas que hemos
visto en este curso [Link] En este caso entrenaremos a
un modelo de aprendizaje automático para que sea capaz de diferenciar entre dos
idiomas diferentes. Para ello seguiremos los siguientes pasos:
Separamos los datos de test: Vamos a reservar algunos de los textos para
realizas la prueba y así determinar si nuestro modelo necesita un nuevo
entrenamiento o no.
Fase de test: Por último realizamos la prueba de funcionamiento con los datos
que teníamos reservados y comprobamos si el funcionamiento es válido o no.
Por últimos si quieres profundizar un poco más y utilizar este modelo de detección de
idiomas para un proyecto en Scratch, aquí tienes un vídeo que te puede servir de
ejemplo. Se incorpora un bloque exportado desde Machine Learning for Kids en el
código de un proyecto creado con Scratch para reconocer el idioma de una frase
escrita.
8. Información adicional
Artículo de IBM [Link]
Teachable Machine [Link]
26
Actividad final
Hazme feliz con Machine Learning for Kids
Como tarea final vamos a realizar el entrenamiento de un modelo de aprendizaje
automático. Para ello será necesario que dispongas de los siguientes recursos:
Conexión a Internet
Crear un proyecto
Crea tu primer proyecto llamado “Hazme feliz” que sea capaz de reconocer texto.
Entrenar el modelo
Crea dos etiquetas para entrenar a tu modelo, una con el nombre “Feliz” y otra con el
nombre “Triste”. Añade frases de ejemplo que te hagan feliz en la parte de la primera
etiqueta y frases que te pongan triste en la parte de la segunda etiqueta. Por ejemplo,
puedes añadir “Eres una persona maravillosa” a la etiqueta de “Feliz”. Recuerda añadir
una gran variedad de textos para que el entrenamiento sea exitoso.
Probar el modelo
Vuelve al proyecto (en el link de la parte superior a la izquierda). Comienza a probar el
modelo pulsando en “Entrena un nuevo modelo” y espera a que se cargue el modelo.
Añade los textos de prueba para validar las respuestas del modelo y recuerda añadir
textos que no hayas incluido en la fase de entrenamiento para comprobar como
reacciona nuestro algoritmo a situaciones nuevas. ¿Como ha reaccionado tu modelo?
¿Necesitas volver a entrenarlo? Si lo necesitas, vuelve al entrenamiento y añade mas
textos. Cuando obtengas los resultados esperados (mas de un 70% de confianza)
realiza algunas capturas de pantalla donde aparezcan los textos y como lo ha
reconocido el algoritmo. Debe de aparecer algo así.
27
Exportar el modelo
Exporta tu algoritmo y haz una prueba con Scratch. Haz una captura de pantalla donde
aparezcan los bloques generados de tu modelo.
NOTA: Puedes seguir los pasos del video tutorial que aparece al final del curso en la
parte de práctica.
Preguntas:
Explica con tus palabras ¿qué es el aprendizaje automático?.
Entrega
28