0% encontró este documento útil (0 votos)
13 vistas17 páginas

Introducción al Machine Learning con R

El documento presenta un e-book sobre Machine Learning, explicando su definición, problemas que resuelve y aplicaciones prácticas en diversas áreas como e-commerce y transporte. Se detalla la evolución histórica del Machine Learning desde sus inicios en la década de 1960 hasta su desarrollo como disciplina autónoma, así como los retos actuales y el proceso de resolución de problemas en este campo. Además, se destaca la importancia del software R en el aprendizaje automático y su creciente relevancia profesional en el mercado laboral.

Cargado por

Cristian Torres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
13 vistas17 páginas

Introducción al Machine Learning con R

El documento presenta un e-book sobre Machine Learning, explicando su definición, problemas que resuelve y aplicaciones prácticas en diversas áreas como e-commerce y transporte. Se detalla la evolución histórica del Machine Learning desde sus inicios en la década de 1960 hasta su desarrollo como disciplina autónoma, así como los retos actuales y el proceso de resolución de problemas en este campo. Además, se destaca la importancia del software R en el aprendizaje automático y su creciente relevancia profesional en el mercado laboral.

Cargado por

Cristian Torres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

7 DATA SCIENCE E-BOOKS

MACHINE
LEARNING
CON

ASÍ APRENDEN LAS MÁQUINAS


Contenidos
MACHINE LEARNING CON

Rosana Ferrero
QUÉ ES EL MACHINE LEARNING
[Link]

¿QUÉ PROBLEMAS RESUELVE EL MACHINE LEARNING?

APLICACIONES PRÁCTICAS DEL MACHINE LEARNING

CRONOLOGÍA DEL MACHINE LEARNING

¿CÓMO APRENDEN LAS MÁQUINAS?

LOS RETOS DEL MACHINE LEARNING

PROCESO DE RESOLUCIÓN EN MACHINE LEARNING

PANORAMA PROFESIONAL DEL MACHINE LEARNING

MACHINE LEARNING CON R SOFTWARE


PAGINA 1 MACHINE LEARNING CON R SOFTWARE

Qué es el Machine Learning

El Machine Learning, conocido en español como aprendizaje

automático o aprendizaje de máquina, estudia y diseña herramientas

informáticas que se basan en la experiencia para la toma de decisiones

futuras. Fundamenta su operatividad en programas capaces de

aprender de los datos, como R Software.

¿Subdisciplina o campo de conocimiento autónomo?

Hagamos un poco de historia.

El Machine Learning surge en la década de los 60 del siglo XX como una

subdisciplina de la Inteligencia Artifical (IA) que tiene su origen en las

ciencias de la computación y las neurociencias.

Entendida como subdisciplina, es un método que permite otorgar a los

ordenadores la capacidad de reconocer patrones, establecer relaciones

y aprender basándose en datos sin que el ser humano tenga que

escribir instrucciones o códigos para lograrlo.

Tres décadas después, en los años 90, los avances del Machine

Learning comenzaron a aplicarse a diferentes áreas de conocimiento

como: el razonamiento probabilístico, la investigación estadística, la

recuperación de información y el reconocimiento de patrones. Esta

evolución propició que se disgregara de la IA para convertirse en una

disciplina autónoma, teniendo como principal objetivo el dar solución a

problemas prácticos en los distintos ámbitos de aplicación: ingeniería,

matemáticas, computación, etc.

El Machine Learning es un campo de las ciencias computacionales


que proporciona a las máquinas la capacidad
de aprender sin ser explícitamente programadas.
PAGINA 2 MACHINE LEARNING CON R SOFTWARE

Qué problemas resuelve el Machine Learning

Dependiendo del tipo de datos de los que dispongamos, el Machine

Learning nos permitirá resolver los siguientes problemas:

Aprendizaje supervisado

El algoritmo aprende de unos datos previos en los cuales se da una

variable etiquetada que es la variable a predecir. Su objetivo es

aprender de estos datos etiquetados para identificar los patrones y

reglas que le permitan predecir la etiqueta al enfrentarse a nuevos

casos.

Dentro del aprendizaje supervisado nos podemos encontrar con

problemas de regresión y problemas de clasificación.

Aprendizaje no supervisado

En estos problemas no existen etiquetas con las que el algoritmo

aprende, es decir, no requiere de ningún etiquetado previo de los

datos.

El fin de este tipo de aprendizaje es obtener relaciones, diferencias o

asociaciones entre las distintas observaciones.

Aprendizaje semiestructurado

Es una combinación de los dos aprendizajes anteriores. El algoritmo

aprende tanto de datos etiquetados como no etiquetados.

"Duda de los datos hasta que los datos no dejen lugar a dudas"
Henry Poincaré
PAGINA 3 MACHINE LEARNING CON R SOFTWARE

Aplicaciones prácticas del Machine Learning

El Machine Learning supone un enorme avance en el terreno de la

computación. Gracias a esta disciplina hoy son posibles aplicaciones

prácticas como:

E-COMMERCE

La activación de sistemas de

recomendación personalizada en

e-commerce.

COMUNICACIÓN

El filtrado de los correos indeseados,

basura o spam.

TRANSPORTES

La optimización del funcionamiento de las

redes ferroviarias.

MOVILIDAD

La implementación a gran escala del

coche autónomo.

Pero ¿qué avances tecnológicos nos han llevado hasta el momento

presente en el que creamos máquinas capaces de aprender sin estar

programadas para ello?


PAGINA 4 MACHINE LEARNING CON R SOFTWARE

Solo necesitas mirar a tu alrededor para ver el poder del Machine

Learning en la vida cotidiana.

Cuando realizamos una búsqueda en Google, cuando Facebook

reconoce los rostros en nuestras fotos, cuando nuestro correo filtra

correos sospechosos de SPAM, los asistentes virtuales como Siri o

Alexa, cuando los navegadores GPS predicen el tráfico, cuando se nos

recomienda contenido similar en Youtube, Netflix o Pinterest, gente

que conocemos en Twitter o Instagram, cuando nos ofrecen productos

de Amazon, cuando Paypal o las aseguradoras realizan análisis de

detección de fraude, etc.

Todo esto es Machine Learning.


PAGINA 5 MACHINE LEARNING CON R SOFTWARE

Cronología del Machine Learning

Estos son las principales contribuciones científicas contemporáneas que

hicieron posible el origen y la evolución del Machine Learning:

1950. Maquinaria computacional e inteligencia

En 1950 el matemático inglés Alan Turing publicó su artículo académico

“Computing machinery and intelligence” (“Maquinaria computacional e

inteligencia”).

Dentro del primer epígrafe de este texto “el padre” de la Inteligencia

Artificial contemporánea se planteaba la siguiente cuestión “¿Pueden

pensar las máquinas?”

Leer texto completo

"Una computadora puede


ser llamada inteligente si
logra engañar a una
persona haciéndole creer
que es un humano."
PAGINA 6 MACHINE LEARNING CON R SOFTWARE

1957. El algoritmo de Perceptron

En 1957 el psicólogo norteamericano, Frank Rosenblatt, diseña el

algoritmo Perceptron para el aprendizaje supervisado de clasificadores

binarios.

Este algoritmo se utilizó para el reconocimiento de imágenes y es el

origen de las redes neuronales. El esquema del perceptrón funciona

como el de una neurona artificial.

Los avances de Rosenblatt en el campo de la Inteligencia Artificial

culminaron con la construcción del hardware del súper ordenador Mark I

en 1960, el primero capaz de aprender nuevas habilidades basadas en

acciones de prueba y error, utilizando un tipo de red neuronal que

simulaba el proceso de pensamiento humano.

Frank Rosenblatt trabajando en el proyecto Mark I


PAGINA 7 MACHINE LEARNING CON R SOFTWARE

1990. La era del data driven

En esta década el científico de la computación, Peter

J. Denning publicó un artículo en American Scientist

en el que planteaba lo siguiente:

"¿Qué máquinas podemos construir para monitorizar


un flujo de datos, o filtrar una base de datos grabada y
proponernos un resumen estadístico de lo que hay?
[…] es posible construir máquinas que puedan
reconocer o predecir patrones en flujos de datos sin
entender el significado de los patrones."

A partir de los 90 y hasta la actualidad, el progreso del Machine Learning

se basará en dos premisas:

DATA DRIVEN

El avance de esta disciplina depende directamente de la capacidad de

análisis de grandes cantidades de datos.

ESPECIALIZACIÓN

El conocimiento se diversifica y adquiere sentido en su aplicación

práctica.
PAGINA 8 MACHINE LEARNING CON R SOFTWARE

¿Cómo aprenden las máquinas?

Según el científico de la computación estadounidense, Tom M.

Mitchell:

"Una máquina aprende si es capaz de


experimentar y utilizar dicha experiencia para
mejorar su rendimiento en experiencias
similares en el futuro".

El aprendizaje automático de las máquinas se da a través de tres

componentes que se producen de forma sucesiva:

1. ENTRADA DE DATOS

Entran en juego la observación, el almacenamiento en la memoria y la

recuperación de la información para proporcionar una base fáctica de

razonamiento.

2. ABSTRACCIÓN

Implica la traducción de datos en representaciones más amplias.

3. GENERALIZACIÓN

Supone el uso de datos abstractos para formar una base para la acción.
PAGINA 9 MACHINE LEARNING CON R SOFTWARE

Los retos del Machine Learning

El aprendizaje automático surgido en la era del Big Data precisa dar

solución a tres retos fundamentales que surgen al analizar grandes

volúmenes de datos, como :

VARIEDAD DE LOS DATOS

Han surgido nuevos tipos de datos, los datos no estructurados,

datos binarios que no tienen estructura interna identificable.

ESCALABILIDAD

Se busca la rapidez en el rendimiento y en el procesamiento de los

datos, por lo que se escala en horizontal.

VELOCIDAD

La velocidad de generación de datos precisa cada vez más velocidad de

procesamiento.
PAGINA 10 MACHINE LEARNING CON R SOFTWARE

Proceso de resolución en Machine Learning

La resolución de problemas de Machine Learning precisa la aplicación

de un método sistemático, paso a paso.

Punto de partida

1. Definir el objetivo

Es fundamental concretar la meta que queremos alcanzar

que debe adecuarse a los datos de los que disponemos.

Una vez definido el objetivo hemos de:

2. Obtener y comprender los datos

Obtener, describir y unificar los datos en un mismo formato puede ser

una de las tareas más costosas del proceso.

3. Preparar los datos

En esta fase es importante limpiar los datos y prepararlos para entrenar

el modelo.

4. Entrenar el Modelo

Que supone elegir el modelo más adecuado en función del problema, y

también los parámetros que mejor se ajusten a nuestros datos sin caer en

el sobreajuste.

5. Resultado del Modelo

Una vez entrenado nuestro modelo debemos probarlo sobre datos nuevos

con los que no haya sido entrenado (conjunto de validación) para valorar

como ajusta a nuevos datos y medir la precisión de la predicción.

6. Implantación

Como fase final instauramos el modelo y establecemos un seguimiento

sobre posibles variaciones.


PAGINA 11 MACHINE LEARNING CON R SOFTWARE

Panorama profesional del Machine Learning

El auge del Machine Learning crea innumerables oportunidades

laborales. Una carrera como experto en Machine Learning abre

rápidamente las puertas a algunas de las oportunidades profesionales

más emocionantes y de mayor demanda en la actualidad.

Aquí tienes algunos datos:

Un informe reciente de la consultora Gartner proyecta que se espera

que los campos de la Inteligencia Artificial y el Machine Learning

creen 2.3 millones de nuevos empleos para 2020.

En los últimos años, las ofertas de trabajo relacionadas con la IA han

aumentado en más del 100% en los principales sitios de carrera como

Indeed.

Los roles de Data Scientist han aumentado en un 650% desde 2012, y

se prevé que haya 20 millones de puestos para expertos en Machine

Learning en el año 2026.


PAGINA 12 MACHINE LEARNING CON R SOFTWARE

Machine Learning con R Software

¿Por qué es esencial para el Machine Learning?

R es una de las plataformas de aprendizaje automático más potentes y

es utilizada por los mejores científicos de datos del mundo.

Si deseas dar el gran salto para convertirte en un experto en Machine

Learning, ¡aprender y dominar R es una necesidad absoluta!

Te damos 8 razones:

es FLEXIBLE porque cuenta con numerosas extensiones

(paquetes o bibliotecas) de código abierto para la manipulación y

visualización de datos, el aprendizaje automático y el procesamiento

del lenguaje natural, por nombrar solo algunas.

es POTENTE debido a la variedad de técnicas que ofrece.

Proporciona excelentes funciones de visualización, que es esencial

para explorar los datos antes de enviarlos a cualquier aprendizaje

automatizado, así como evaluar los resultados del algoritmo de

aprendizaje.

es GRATUITO porque es un software de código abierto. En

consecuencia, cualquiera se puede usarlo sin comprar una licencia y

puede modificarlo para crear nuevas funciones.

es MULTIPLATAFORMA. Da la capacidad de ejecutarse en

muchos sistemas operativos. R está diseñado para ejecutarse en

cualquier entorno, sea Mac, Windows o Linux.


PAGINA 13 MACHINE LEARNING CON R SOFTWARE

es LO ÚLTIMO EN TECNOLOGÍA porque lo usan los

académicos. R es un lenguaje de programación creado para el

análisis estadístico. Por eso es de vanguardia en ciencia de datos. R

es utilizado por los mejores científicos de datos del mundo. Los

académicos que desarrollan nuevos algoritmos los están

desarrollando en R y lanzándolos como paquetes de R.

está BIEN RESPALDADO porque es uno de los principales

idiomas para la ciencia de datos. Afortunadamente, R tiene muchos

seguidores y se usa mucho en los círculos académicos e industriales,

lo que significa que cuentas con numerosos paquetes de análisis

útiles y actualizados.

también es utilizado en la actualidad por las EMPRESAS

COMERCIALES. Existe una larga lista de empresas que declaran

públicamente su adopción de la plataforma, desde Google,

Facebook, Twitter, Microsoft, New York Times, Deloitte, NOAA, etc.

Incluso las principales compañías vendedoras de software y servicios

de análisis de datos, como Oracle, IBM, Mathematica, MATLAB, SPSS

y SAS, proporcionan integración con R y sus plataformas.

es FÁCIL DE APRENDER. R es desarrollado por estadísticos

para estadísticos. No es necesario tener experiencia en informática,

ni años de experiencia en codificación, ni un doctorado en

estadística para comenzar a aprender R. Cualquiera puede aprender

la herramienta más poderosa para el análisis y visualización de datos.

R Software es un lenguaje estadístico


desarrollado por y para estadísticos.
Inicio

Marzo

2020

Máster de Estadística Aplicada

con R Software

Descarga la Guía Didáctica


DATA SCIENCE
Máxima Formación e-books

¡Síguenos en redes sociales!

También podría gustarte