Facultad de Ingeniería de Sistemas y
Electrónica
INTELIGENCIA DE NEGOCIOS
MACHINE LEARNING
Prof.: Ing. Luis Dávila Hurtado
BENITES SANDOVAL, Franklin David.
Chiclayo - Perú
2019
1
MACHINE LEARNING
Contenido
HISTORIA DE MACHINE LEARNIG .................................................................................................. 3
DEFINICION.................................................................................................................................... 5
Inteligencia Artificial frente a Aprendizaje Automático ............................................................ 5
COMPONENTES DEL MACHINE LEARNING ................................................................................ 6
MODELOS ...................................................................................................................................... 7
Regresión................................................................................................................................... 7
Clasificación (binaria o multiclase) ............................................................................................ 7
Ranking ...................................................................................................................................... 7
TECNICAS DE MACHINE LEARNING ............................................................................................... 8
APRENDIZAJE SUPERVISADO (SUPERVISED LEARNING) ............................................................ 8
LAS REDES NEURONALES....................................................................................................... 8
LAS MÁQUINAS DE VECTOR SOPORTE (SUPPORT VECTOR MACHINE O SVM) ..................... 9
LOS CLASIFICADORES BAYESIANOS ..................................................................................... 10
LOS ÁRBOLES DE CLASIFICACIÓN (CUANDO LA VARIABLE OBJETIVO ES CATEGÓRICA) Y DE
REGRESIÓN (CUANDO LA VARIABLE OBJETIVO ES CONTINUA) .......................................... 10
APRENDIZAJE NO-SUPERVISADO (UNSUPERVISED LEARNING) .............................................. 11
EL CLUSTERING .................................................................................................................... 11
LOS MÉTODOS DE REDUCCIÓN DE DIMENSIONALIDAD ..................................................... 11
................................................................................................................................................. 12
APRENDIZAJE REFORZADO (REINFORCEMENT LEARNING) ..................................................... 12
APLICACIONES DEL MACHINE LEARNIG EN LA ACTUALIDAD .................................................. 13
Bibliografía .................................................................................................................................. 14
2
HISTORIA DE MACHINE LEARNIG
Los inicios del Machine Learning los encontramos en los años 50s, cuando Arthur Samuel,
pionero en el campo de los juegos informáticos e IA, escribió el primer programa de aprendizaje
informático.
El programa de Samuel era el juego de “damas”, que contribuyó a que la computadora mejorara
en el juego conforme jugaba más, esto fue posible al estudiar qué movimientos componían
estrategias ganadoras e incorporarlos en su programa.
Por su parte, Frank Rosenblatt, en la misma década, inventó el Perceptron, tecnología que
asemeja al cerebro humano, ya que se trataba de un tipo de red neuronal. En sus principios,
Perceptron conectaba una red de puntos donde se toman decisiones simples que se unen al
programa más grande para resolver problemas complejos.
En los 60s, la creación del algoritmo conocido como “nearest neighbor” permitió a las
computadoras utilizar un reconocimiento de patrones muy básico. Incluso tuvo fines
comerciales, pues éste logró trazar un mapa de una ruta para vendedores ambulantes.
Tuvo que pasar una década, para que estudiantes de la Universidad de Stanford escribieran un
programa de computadora que conducía un carrito a través de espacios desordenados,
obteniendo su conocimiento del mundo entero a partir de imágenes transmitidas por un sistema
de televisión integrado.
A principios de los 80s, Gerald Dejong plantea el concepto “Aprendizaje Basado en Explicación”
(EBL, por sus siglas en inglés). Se trata de un conocimiento en el que la computadora analiza
datos de entrenamiento y crea una regla general que puede seguir para descartar datos.
3
En la década de los 90s, el Machine Learning ganó popularidad gracias a la intersección de la
informática y la estadística que dio lugar a enfoques probabilísticos en la IA. Esto generó un gran
cambió al campo del ML, ya que se trabajaría con más datos.
Fue en este periodo que se comenzó a utilizar esta tecnología en áreas comerciales para la
minería de datos, software adaptable y aplicaciones web, aprendizaje de texto y aprendizaje de
idiomas.
La llegada del nuevo milenio trajo consigo una explosión en el uso del Machine Learning, debido
a que Geoffrey Hinton acuña el término “Deep Learning”, con el que se explican nuevas
arquitecturas de Redes Neuronales profundas que permiten a las computadoras “ver” y
distinguir objetos y texto en imágenes y videos.
Después del 2010, los grandes “jugadores” tecnológicos comenzaron sus propios desarrollos en
Machine Learning:
IBM. Su tecnología Watson, sistema informático de IA que es capaz de responder a
preguntas formuladas en lenguaje natural, logra vencer a un humano en el juego de
Jeopardy.
Google. El ciéntifico informático Jeff Dean, empleado de Google, y Andrew Ng, de la
Universidad de Stanford, lideran el proyecto GoogleBrain, que desarrolla una red
neuronal profunda que puede aprender a descubrir y categorizar objetos de forma
similar a como lo hace un gato.
Facebook. Los responsables en el área desarrollan DeepFace, un algoritmo de software
que puede reconocer o verificar individuos en fotos al mismo nivel que los humanos.
Amazon. Esta empresa crea su propia plataforma de machine learning.
Microsoft. Logran que Kinect pueda rastrear 20 funciones humanas a una velocidad de
30 veces por segundo, lo que permite a las personas interactuar con la computadora a
través de movimientos y gestos.
4
DEFINICION
Aprendizaje Automático (AA, o Machine Learning, por su nombre en inglés) es la rama de la
Inteligencia Artificial que tiene como objetivo desarrollar técnicas que permitan a las
computadoras aprender. De forma más concreta, se trata de crear algoritmos capaces de
generalizar comportamientos y reconocer patrones a partir de una información suministrada en
forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento, es decir, un
método que permite obtener por generalización un enunciado general a partir de enunciados
que describen casos particulares. (Caparrini, 2017)
El Machine Learning en su uso más básico es la práctica de usar algoritmos para parsear datos,
aprender de ellos y luego ser capaces de hacer una predicción o sugerencia sobre algo. Los
programadores deben perfeccionar algoritmos que especifiquen un conjunto de variables para
ser lo más precisos posibles en una tarea en concreto. La máquina es entrenada utilizando una
gran cantidad de datos dando la oportunidad a los algoritmos a ser perfeccionados.
Desde los primeros albores de la temprana inteligencia artificial, los algoritmos han
evolucionado con el objetivo de analizar y obtener mejores resultados: árboles de decisión,
programación lógica inductiva (ILP), clustering para almacenar y leer grandes volúmenes de
datos, redes Bayesianas y un numeroso abanico de técnicas que los programadores de data
science pueden aprovechar. (RODRIGUEZ, 2017)
Inteligencia Artificial frente a Aprendizaje Automático
La inteligencia artificial y el aprendizaje automático (ML) son palabras de moda que se usan
indistintamente, pero no son lo mismo.
La inteligencia artificial es un concepto amplio donde las máquinas pueden hacer una tarea
específica mejor que cualquier humano y Machine Learning se basa en la idea de que a las
máquinas se les debe dar acceso a los datos, dejar que descubran patrones y perspectivas y que
aprendan por sí mismos a lo largo del tiempo. ML puede ser referido como un subconjunto de
AI ya que AI es un término general amplio y quién sabe, habrá más innovaciones que salgan de
este espacio en el futuro. Sin embargo, el centro de atención actual está en ML.
5
COMPONENTES DEL MACHINE LEARNING
Bajo esta definición pueden englobarse los distintos componentes del aprendizaje automático:
Las fuentes de información, que reflejan la experiencia E de la que se aprende:
Datos estructurados: bases de datos relacionales, sistemas de ficheros, etc.
Datos no estructurados: transaccionales, mailing, CRM, voz, imágenes, etc.
Las técnicas y algoritmos, que se relacionan con las tareas a ejecutar T:
Técnicas para el tratamiento de la información no estructurada: tf-idf, parsing, mapas
auto-organizativos, etc.
Modelos supervisados y no supervisados: modelos de clasificación, modelos
estocásticos, simulación, optimización, boosting, etc.
La capacidad de autoaprendizaje, que mejora las medidas de desempeño P:
Reentrenamiento automático a partir de nueva información.
Combinación de modelos y reponderación/calibración.
El uso de sistemas y software para la visualización de la información y la programación:
Visualización: QlikView, Tableau, SAS Visual Analytics, Pentaho, TIBCO Spotfire, Power
BI.
Programación: R, Python, Scala, Ruby, SAS, Java, SQL, Matlab, C, Google, AWS, Azure.
6
MODELOS
Hay un gran número de problemas que caen dentro de lo que llamamos aprendizaje inductivo.
La principal diferencia entre ellos estriba en el tipo de objetos que intentan predecir. Algunas
Modelos habituales son:
Regresión
Intentan predecir un valor real. Por ejemplo, predecir el valor de la bolsa mañana a partir del
comportamiento de la bolsa que está almacenado (pasado). O predecir la nota de un alumno en
el examen final basándose en las notas obtenidas en las diversas tareas realizadas durante el
curso.
Clasificación (binaria o multiclase)
Intentan predecir la clasificación de objetos sobre un conjunto de clases prefijadas. Por ejemplo,
clasificar si una determinada noticia es de deportes, entretenimiento, política, etc. Si solo se
permiten 2 posibles clases, entonces se llama clasificación binaria; si se permiten más de 2
clases, estamos hablando de clasificación multiclase.
Ranking
Intentar predecir el orden óptimo de un conjunto de objetos según un orden de relevancia
predefinido. Por ejemplo, el orden en que un buscador devuelve recursos de internet como
respuesta a una búsqueda de un usuario.
Normalmente, cuando se aborda un nuevo problema de AA lo primero que se hace es
enmarcarlo dentro de alguna de las clases anteriores, ya que dependiendo de cómo se clasifique
será la forma en que podemos medir el error cometido entre la predicción y la realidad. En
consecuencia, el problema de medir cómo de acertado es el aprendizaje obtenido deberá ser
tratado para cada caso particular de metodología aplicada, aunque en general podemos
adelantar que necesitaremos "embeber" la representación del problema en un espacio en el
que tengamos definida una medida. (Caparrini, 2017)
7
TECNICAS DE MACHINE LEARNING
APRENDIZAJE SUPERVISADO (SUPERVISED LEARNING)
Depende de datos previamente etiquetados, como podría ser el que una computadora logre
distinguir imágenes de coches, de las de aviones. Para esto, lo normal es que estas etiquetas o
rótulos sean colocadas por seres humanos para asegurar la efectividad y calidad de los datos.
En otras palabras, son problemas que ya hemos resuelto, pero que seguirán surgiendo en un
futuro. La idea es que las computadoras aprendan de una multitud de ejemplos, y a partir de ahí
puedan hacer el resto de cálculos necesarios para que nosotros no tengamos que volver a
ingresar ninguna información.
Ejemplos: reconocimiento de voz, detección de spam, reconocimiento de escritura, entre otros.
LAS REDES NEURONALES
son modelos matemáticos multivariantes no lineales que utilizan procedimientos
iterativos, con el objetivo de minimizar una determinada función de error y clasificar así
las observaciones. Las redes neuronales se componen de neuronas conectadas entre sí
a través de nodos y capas. Dichas conexiones emulan las dendritas y los axones en los
sistemas nerviosos biológicos, por los que se traspasa información. Se emplean tanto en
problemas supervisados como no supervisados, con la ventaja de que pueden separar
regiones de forma no lineal. Su mayor desventaja es el carácter de “caja negra”, es decir,
la dificultad en la interpretación de los resultados y la limitación a la hora de incorporar
el sentido de negocio sobre la compleja estructura de pesos.
Como una extensión de las redes neuronales, pueden destacarse las redes profundas,
que consisten en el uso de redes neuronales con múltiples capas. Estos modelos,
englobados en lo que se denomina aprendizaje profundo o deep learning, pueden tener
millones de parámetros, en función de la complejidad del problema que se quiera
abordar. No obstante, dada la dificultad de estimación, caben múltiples aproximaciones
en el uso de este tipo de métodos49 (por ejemplo, el uso de algoritmos de optimización
para ajustar los parámetros en las redes profundas en función de los errores de sus
outputs; algoritmos greedy para el entrenamiento de redes específicas, como las redes
dirigidas; auto-encoders para reducción de la dimensionalidad, etc.).
8
Gracias al desarrollo tecnológico, esos métodos se han podido incorporar, por ejemplo,
en procesos de reconocimiento y generación automática de textos, o en computer
vision.
LAS MÁQUINAS DE VECTOR SOPORTE (SUPPORT VECTOR MACHINE O SVM)
son modelos de clasificación que tratan de resolver las dificultades que pueden suponer
muestras de datos complejas, donde las relaciones no tienen por qué ser lineales. Es
decir, se pretende clasificar a las observaciones en varios grupos o clases, pero estas no
son separables vía un hiperplano en el espacio dimensional definido por los datos. Para
ello, el conjunto de datos se embebe en un espacio de dimensión superior a través de
una función que permita poder separar los datos en el nuevo espacio a través de un
hiperplano en dicho espacio. Entonces, se busca un hiperplano equidistante a los puntos
más cercanos de cada clase (es decir, el objetivo es encontrar el hiperplano que separa
las clases y que más dista de las observaciones de las mismas de forma simultánea).
9
LOS CLASIFICADORES BAYESIANOS
son modelos basados en el teorema de probabilidad condicionada de Bayes, que
utilizan la información conocida de las variables explicativas, es decir, los denominados
priors, para clasificar las observaciones. Dicho de otro modo, un clasificador bayesiano
asume que la presencia o ausencia de ciertas características permite asignar cierta
probabilidad a la ausencia o presencia de otra característica, o a definir una variable
objetivo en función de la relación existente en una muestra entre estas características y
la variable objetivo definida. Es una técnica simple pero robusta para clasificar
observaciones en un conjunto de clases. El clasificador bayesiano toma formas
específicas según la distribución que se asuma que siguen las variables explicativas
(normal, multinomial, etc.).
LOS ÁRBOLES DE CLASIFICACIÓN (CUANDO LA VARIABLE OBJETIVO ES
CATEGÓRICA) Y DE REGRESIÓN (CUANDO LA VARIABLE OBJETIVO ES CONTINUA)
son técnicas de análisis que permite predecir la asignación de muestras a grupos
predefinidos en función de una serie de variables predictivas. Los árboles de decisión
son modelos sencillos y fácilmente interpretables, lo que hace que sean muy valorados
por los analistas. Sin embargo, su poder predictivo puede ser más limitado que el de
otros modelos, porque realizan una partición ortogonal del espacio, lo que convierte en
silos la muestra y limita la capacidad predictiva debido a que este tipo de algoritmo
tiende al sobreentrenamiento.
10
APRENDIZAJE NO-SUPERVISADO (UNSUPERVISED LEARNING)
En esta categoría lo que sucede es que al algoritmo se le despoja de cualquier etiqueta, de modo
que no cuenta con ninguna indicación previa. En cambio, se le provee de una enorme cantidad
de datos con las características propias de un objeto (aspectos o partes que conforman a un
avión o a un coche, por ej.), para que pueda determinar qué es, a partir de la información
recopilada.
Ejemplos: detectar morfología en oraciones, clasificar información, etc.
EL CLUSTERING
es un modelo no supervisado que se utiliza para identificar grupos (clusters) o patrones
de observaciones similares en un conjunto de datos. Una de las técnicas más utilizadas
es el método de k-means, que consiste en definir un punto central de referencia de cada
cluster (denominado centroide) y asignar a cada individuo al cluster del centroide más
próximo en función de las distancias existentes entre los atributos de entrada. El
algoritmo parte de la fijación de k centroides aleatoriamente y, mediante un proceso
iterativo, se asigna cada punto al cluster con el centroide más próximo, procediendo a
actualizar el valor de los centroides. Este proceso termina cuando se alcanza un
determinado criterio de convergencia.
LOS MÉTODOS DE REDUCCIÓN DE DIMENSIONALIDAD
pretenden reducir el número de dimensiones del espacio de análisis, determinado por
el conjunto de variables explicativas.
Una de las técnicas es el análisis de componentes principales (principal component
analysis o PCA), que convierte un conjunto de variables correlacionadas en otro (con
menor cantidad de variables) sin correlación, llamadas componentes principales. La
principal desventaja de aplicar PCA sobre el conjunto de datos es que estos pierden su
interpretabilidad.
11
APRENDIZAJE REFORZADO (REINFORCEMENT LEARNING)
En este caso particular, la base del aprendizaje es el refuerzo. La máquina es capaz de aprender
con base a pruebas y errores en un número de diversas situaciones.
Aunque conoce los resultados desde el principio, no sabe cuáles son las mejores decisiones para
llegar a obtenerlos. Lo que sucede es que el algoritmo progresivamente va asociando los
patrones de éxito, para repetirlos una y otra vez hasta perfeccionarlos y volverse infalible.
Ejemplos: navegación de un vehículo en automático, toma de decisiones, etc.
12
APLICACIONES DEL MACHINE LEARNIG EN LA ACTUALIDAD
Netflix utiliza algoritmos ML que se adaptan al comportamiento del usuario para
proporcionarles contenido extremadamente personalizado.
UberEATS predice el tiempo estimado para la entrega de comida, la clasificación de
búsqueda y restaurantes con la ayuda de su plataforma de aprendizaje automático
Michelangelo. Los algoritmos de aprendizaje automático de Yelp ayudan al personal
humano de la compañía a compilar, categorizar y etiquetar imágenes de manera más
eficiente.
Pinterest usa ML para procesar millones de búsquedas de imágenes por mes, para
identificar patrones visuales y unirlos a otras imágenes, ayudando a los usuarios a
encontrar contenido que se parece a las imágenes que han anclado.
Facebook usa algoritmos ML para impulsar el software de reconocimiento facial y para
muchos más proyectos.
Instagram utilizó el aprendizaje automático para identificar el significado contextual de
los emoji. Por ejemplo, ‘lol’ slang sería reemplazado con un emoji de risa.
Snapchat utiliza el aprendizaje automático para rastrear los movimientos en video e
introdujo filtros faciales que permiten a los usuarios agregar efectos animados o
máscaras digitales que se ajustan cuando se mueven sus rostros.
Twitter evalúa cada tweet en tiempo real con ML y los “puntúa” de acuerdo con varias
métricas.
Amazon ha estado utilizando el aprendizaje automático para construir sofisticados
sistemas de recomendación desde hace un tiempo. Amazon ha integrado
recomendaciones en casi todas las partes del proceso de compra desde el
descubrimiento del producto hasta el pago. Junto con las recomendaciones de
productos, “Comúnmente comprados juntos” u otros artículos que los clientes también
compraron también se muestran en las páginas de detalles del producto. Amazon
también envía recomendaciones a los usuarios por correo electrónico.
Apple es bastante famosa por sus labios cerrados acerca de sus innovaciones, pero no
es ningún secreto que Siri está usando ML para entender la intención del usuario y
pronto estará en posición de convertirse en su asistente personal utilizando el
aprendizaje automático para que pueda aprender todo sobre usted y tratar de ofrecer
sugerencias más inteligentes.
Google Maps aplica ML para analizar la velocidad del movimiento del tráfico en un
momento dado. Google ha estado invirtiendo en esta área durante muchos años en
todos los aspectos del aprendizaje automático con varios proyectos que resultan en
procesamiento de lenguaje natural, traducción de voz, clasificación de búsqueda y
sistemas de predicción.
13
Bibliografía
Caparrini, F. S. (23 de Septiembre de 2017). Introducción al Aprendizaje Automático. Obtenido
de [Link]
ManagementSolutions. (15 de Diciembre de 2018). Machine Learning. Obtenido de Una Pieza
clave en la transformacion de los modelos de negocio:
[Link]
[Link]
Pasillas, A. (8 de Agosto de 2017). Adext. Obtenido de ¿Qué es machine learning?:
[Link]
RecluIT. (3 de Agosto de 2018). Historia y evolución del Machine Learning. Obtenido de
[Link]
RODRIGUEZ, T. (27 de Enero de 2017). xataca. Obtenido de Machine Learning y Deep Learning:
cómo entender las claves del presente y futuro de la inteligencia artificial:
[Link]
entender-las-claves-del-presente-y-futuro-de-la-inteligencia-artificial
14