Machine Learning

Este documento describe una investigación sobre el uso de técnicas de machine learning para el procesamiento masivo de datos. El proyecto busca investigar diferentes algoritmos de machine learning y seleccionar los más adecuados para clasificar y predecir señales provenientes de diversas fuentes. El objetivo final es desarrollar modelos inteligentes capaces de clasificar automáticamente datos para apoyar la toma de decisiones, por ejemplo en agricultura de precisión. El proyecto es llevado a cabo por investigadores de la UNNOBA con el fin de aplicar estas

Cargado por

karen

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

133 vistas4 páginas

Machine Learning

Cargado por

karen

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Tratamiento Masivo de Datos Utilizando Técnicas de Machine Learning

Claudia Russo1, Hugo Ramón1, Nicolás Alonso1, Benjamin Cicerchia2, Leonardo Esnaola1,
Juan Pablo Tessore2

1
Instituto de Investigación y Transferencia en Tecnología (ITT) / Escuela de
Tecnología/ Universidad Nacional del Noroeste de la Provincia de Buenos Aires
(UNNOBA)
Sarmiento y Newbery, 236-4636945/44

2
Becario de la Comisión de Investigaciones Científicas de la Provincia de Buenos
Aires (CIC)
[email protected] / [email protected] /
[email protected] / [email protected] /
[email protected] /
[email protected]

Resumen Machine Learning, Big Data, Sistemas

Inteligentes.
Machine Learning es un área de la
inteligencia artificial que engloba un Contexto
conjunto de técnicas que hacen posible el
aprendizaje automático a través del Esta línea de investigación forma parte
entrenamiento con grandes volúmenes de del proyecto “Tecnologías exponenciales
datos. Hoy en día existen diferentes en contextos de realidades mixtas e
modelos que utilizan esta técnica y interfaces avanzadas.” aprobado por la
consiguen una precisión incluso superior a Secretaría de Investigación, Desarrollo y
la de los humanos en las mismas tareas, Transferencia de la UNNOBA en el marco
por ejemplo en el reconocimiento de de la convocatoria a Subsidios de
objetos en una imagen. Investigación Bianuales (SIB2015). A su
La construcción de modelos de vez se enmarca en el contexto de planes de
Machine Learning requiere adaptaciones trabajo aprobados por la Comisión de
propias debido a la naturaleza de los datos Investigaciones Científicas de la Provincia
o a la problemática a la que se aplica. Así, de Buenos Aires y por la Secretaría de
surge la necesidad de investigar las Investigación de la UNNOBA en el marco
diferentes técnicas que permitan obtener de la convocatoria “Becas de Estudio
resultados precisos y confiables en un Cofinanciadas 2015 CIC Universidades
tiempo razonable. del interior bonaerense”.

El proyecto se desarrolla en el Instituto

Palabras clave: de Investigación en Tecnologías y
Transferencia (ITT) dependiente de la

131
mencionada Secretaría, y se trabaja en  Algoritmos supervisados: estos
conjunto con la Escuela de Tecnología de algoritmos utilizan un conjunto de
la UNNOBA. datos de entrenamiento etiquetados
(preclasificados), los cuales procesan
El equipo está constituido por docentes
para realizar predicciones sobre los
e investigadores pertenecientes al ITT y a
mismos, corrigiéndolas cuando son
otros Institutos de Investigación, así como
incorrectas. El proceso de
también, estudiantes de las carreras de
entrenamiento continúa hasta que el
Informática de la Escuela de Tecnología
modelo alcanza un nivel deseado de
de la UNNOBA.
precisión.
Introducción  Algoritmos semi-supervisados:
combinan tanto datos etiquetados como
Desde que las primeras computadoras no etiquetados para generar una función
programables fueron concebidas, las deseada o clasificador. Este tipo de
personas se preguntaron si tendrían la modelos deben aprender las estructuras
capacidad de pensar, de aprender y de para organizar los datos así como
convertirse en “máquinas inteligentes”. también realizar predicciones.
 Algoritmos no supervisados: El
El campo de la ciencia que se encarga
conjunto de datos no se encuentra
de resolver este interrogante se denomina
etiquetado y no se tiene un resultado
inteligencia artificial. Se trata de un área
conocido. Por ello deben deducir las
multidisciplinaria, que a través de ciencias
estructuras presentes en los datos de
como las ciencias de la computación, la
entrada, lo puede conseguir a través de
matemática, la lógica y la filosofía, estudia
un proceso matemático para reducir la
la creación y diseño de sistemas capaces de
redundancia sistemáticamente u
resolver problemas cotidianos por sí
organizando los datos por similitud.
mismos, utilizando como paradigma la
inteligencia humana [1]. Para que una Dentro de esta clasificación podemos
maquina pueda comportarse de manera además encontrar un gran número de
inteligente debería ser capaz de resolver algoritmos específicos con diferentes
problemas de la manera en que lo hacen los características para el tratamiento de los
humanos, es decir, en base a la experiencia datos. Entre los más relevantes
y el conocimiento [2]. Esto implica que encontramos:
debería ser capaz de modificar su  Deep Learning: consiste en la
comportamiento en base a cuan precisos utilización de algoritmos para hacer
son los resultados obtenidos comparados representaciones abstractas de la
con los esperados. información y facilitar el aprendizaje
automático [4].
En este sentido podemos encontrar tres
 Active Learning: es un caso especial
grandes grupos de algoritmos de Machine
de aprendizaje semi-supervisado
Learning [3]:
donde el algoritmo de aprendizaje

132
puede interactuar con un usuario u real y optimización de su
otra fuente de información para funcionamiento.
obtener los resultados deseados [5].
 Support Vector Machines: busca la  Análisis y selección de los distintos
maximización de la distancia entre la algoritmos de Machine Learning
recta o el plano y las muestras que se apropiados para el tipo de señal
encuentran a un lado u otro. En el recibida (imágenes, video, sonido o
caso que las muestras no sean incluso texto) y para la problemática
linealmente separables se utiliza una de su aplicación.
transformación llamada kernel [6] [7].  Evaluación de fiabilidad y desempeño
de las diferentes técnicas de Machine
Líneas de Investigación, Learning aplicadas.
Desarrollo e Innovación Resultados y Objetivos
La presente investigación se encuadra Se espera que la presente línea de I/D
dentro del eje “Tratamiento masivo de permita adquirir conocimientos
datos” y su procesamiento a través de específicos sobre las diferentes técnicas de
sistemas inteligentes. En este sentido se Machine Learning, con el propósito de
pretende procesar señales provenientes de desarrollar modelos capaces de predecir y
fuentes diversas, según la problemática clasificar las señales involucradas en la
investigada, para construir los conjuntos problemática que se intenta resolver,
de entrenamiento necesarios. Así como obteniendo un comportamiento inteligente
también, la selección, diseño y desarrollo de manera automática.
de un modelo que utilice alguno de los
algoritmos relevados para lograr una Debido a que la universidad se
correcta clasificación y predicción. encuentra dentro de la pampa húmeda, una
de las regiones más relevantes en lo que
Se deberán abarcar las siguientes respecta a producción agrícola, se
cuestiones: pretende combinar agricultura de precisión
con técnicas de machine learning y remote
 Obtención de un conjunto de datos
sensing [8] con el objetivo de dar soporte
suficientemente representativo para la
a la toma de decisiones en el sector.
problemática que se desea abordar y
su clasificación. Por otro lado, debido a las necesidades
de los municipios de la región, se
 Pre procesamiento de las señales para
vislumbra la posibilidad de trabajar en la
lograr su normalización y adecuación.
prevención y la detección de diferentes
 Resolver cuestiones relacionadas con tipos de comportamiento, problemática
el procesamiento de datos en tiempo que también puede ser atacada con este
tipo de técnicas.

133
También se prevé la aplicación de [3] Machine Learning An Algorithmic
machine learning en el análisis del texto en Perspective Second Edition, Stephen
publicaciones periodísticas, contenido en Marsland, CRC Press, 2015.
foros y redes sociales, con la finalidad de
encontrar patrones dentro de esos datos [4] A Deep Learning. Book in preparation
que permitan predecir comportamientos for MIT Press. Bengio, Y.,
futuros en ámbitos específicos. Goodfellow, I. and Courville, USA,
2015.
Así mismo, se busca generar informes
técnicos en base al trabajo realizado, en [5] Active Learning Literature Survey,
donde se registren los avances, el grado de Settles Burr, Computer Sciences
implementación y los resultados Technical Report 1648. University of
obtenidos. Como así también difundir y Wisconsin–Madison, 2014.
transferir los resultados y logros
alcanzados mediante la presentación y [6] A Tutorial on Support Vector Machines
participación en diferentes congresos, for Pattern Recognition, Christopher
jornadas y workshops de carácter nacional J.C. Burges, Kluwer Academic
e internacional vinculados a la temática de Publishers, 1998.
estudio.
[7] Top 10 algorithms in data mining,
Formación de Recursos Humanos Xindong Wu et al. Knowledge and
Information Systems 2008.
En esta línea de I/D se han obtenido y
se encuentran desarrollando actualmente [8] Machine learning in remote sensing
dos Becas de Estudio Cofinanciadas data processing, Gustavo Camps-
otorgadas por la Comisión de Valls, IEEE International Workshop on
Investigaciones Científicas (CIC) y la Machine Learning for Signal
UNNOBA. Asimismo se espera Processing, 2009.
desarrollar cuatro tesis doctorales y dos
tesinas de grado, dirigidas por miembros
de este proyecto.

Bibliografía
[1] Assessment of the Commercial
Applicability of Artificial Intelligence
in Electronic Businesses. Thomas
Kramer. Diplom.de. 2002.

[2] Data Classification Algorithms and

Applications, Charu C. Aggarwal,
CRC Press, 2015.

134

También podría gustarte

Proyecto de Ia
Aún no hay calificaciones
Proyecto de Ia
5 páginas
Ensayo de Algoritmos Inteligentes
Aún no hay calificaciones
Ensayo de Algoritmos Inteligentes
11 páginas
Inteligencia Artificial
Aún no hay calificaciones
Inteligencia Artificial
27 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
9 páginas
Unidad VII y VIII
Aún no hay calificaciones
Unidad VII y VIII
9 páginas
Introducción al Machine Learning
Aún no hay calificaciones
Introducción al Machine Learning
9 páginas
Investigación de Machine Learning
Aún no hay calificaciones
Investigación de Machine Learning
3 páginas
Chumo - Wendy - EnsayoU1
Aún no hay calificaciones
Chumo - Wendy - EnsayoU1
6 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
9 páginas
INFORMÁTICA CICLOS V y VI - SEPTIEMBRE 3 de 2024
Aún no hay calificaciones
INFORMÁTICA CICLOS V y VI - SEPTIEMBRE 3 de 2024
3 páginas
Introducción al Machine Learning y Deep Learning
Aún no hay calificaciones
Introducción al Machine Learning y Deep Learning
3 páginas
Case 2023
Aún no hay calificaciones
Case 2023
6 páginas
Fundamentos de Métodos Kernel
Aún no hay calificaciones
Fundamentos de Métodos Kernel
73 páginas
Torres Torres, Camilo Andrés - 2018
Aún no hay calificaciones
Torres Torres, Camilo Andrés - 2018
25 páginas
Tema 6
Aún no hay calificaciones
Tema 6
65 páginas
Machine Learnig PDF
Aún no hay calificaciones
Machine Learnig PDF
14 páginas
Machine Learning en Industria 4.0
Aún no hay calificaciones
Machine Learning en Industria 4.0
21 páginas
Ensayo Algoritmos de Clasificación de ML-1
Aún no hay calificaciones
Ensayo Algoritmos de Clasificación de ML-1
3 páginas
Inteligencia Artificial Enfocada en El Machine Learning-Avance de Anteproyecto de Investigación
Aún no hay calificaciones
Inteligencia Artificial Enfocada en El Machine Learning-Avance de Anteproyecto de Investigación
9 páginas
Fundamentos y Aplicaciones de Machine Learning
Aún no hay calificaciones
Fundamentos y Aplicaciones de Machine Learning
14 páginas
Uoc2000 192 M1.304 Inteligencia Artificial Avanzada
0% (1)
Uoc2000 192 M1.304 Inteligencia Artificial Avanzada
13 páginas
Inteligencia Artificial Apartados I, Ii, Iii
Aún no hay calificaciones
Inteligencia Artificial Apartados I, Ii, Iii
12 páginas
Introducción al Machine Learning
Aún no hay calificaciones
Introducción al Machine Learning
28 páginas
Deep Learning: Fundamentos y Aplicaciones
Aún no hay calificaciones
Deep Learning: Fundamentos y Aplicaciones
69 páginas
Act 4
Aún no hay calificaciones
Act 4
9 páginas
Aprendizaje Automático para Flujos de Datos Autor Javier Ramos Fernández
Aún no hay calificaciones
Aprendizaje Automático para Flujos de Datos Autor Javier Ramos Fernández
146 páginas
Investigacion ML
Aún no hay calificaciones
Investigacion ML
9 páginas
Información Útil para Cada Tema
Aún no hay calificaciones
Información Útil para Cada Tema
2 páginas
Algoritmos de Machine Learning
Aún no hay calificaciones
Algoritmos de Machine Learning
5 páginas
Evolución y Aplicaciones del Machine Learning
Aún no hay calificaciones
Evolución y Aplicaciones del Machine Learning
5 páginas
Tipos y Fases del Aprendizaje Automático
Aún no hay calificaciones
Tipos y Fases del Aprendizaje Automático
4 páginas
Mapa
Aún no hay calificaciones
Mapa
3 páginas
Machine Learning en Manufactura Inteligente
Aún no hay calificaciones
Machine Learning en Manufactura Inteligente
7 páginas
Introducción al Machine Learning
Aún no hay calificaciones
Introducción al Machine Learning
15 páginas
La Inteligencia Artificial en La Programación: Innovación y Desafíos
Aún no hay calificaciones
La Inteligencia Artificial en La Programación: Innovación y Desafíos
5 páginas
MACHINE LEARNING Reconocimiento Facial-1
Aún no hay calificaciones
MACHINE LEARNING Reconocimiento Facial-1
8 páginas
FD Gc70 Toma de Decisiones
Aún no hay calificaciones
FD Gc70 Toma de Decisiones
4 páginas
Fase 4 - G#28 - Representacion Del Conocimiento en IA
Aún no hay calificaciones
Fase 4 - G#28 - Representacion Del Conocimiento en IA
15 páginas
Clasificacion de Suelos Usando Redes Neuronales
Aún no hay calificaciones
Clasificacion de Suelos Usando Redes Neuronales
24 páginas
PRES adigitalDataScienceS03 1a EN v1.0 20170415
Aún no hay calificaciones
PRES adigitalDataScienceS03 1a EN v1.0 20170415
59 páginas
Informe - Final - Proyecto REDES NEURONALES
Aún no hay calificaciones
Informe - Final - Proyecto REDES NEURONALES
82 páginas
T12340 Inteligencia Artificial - Programa
Aún no hay calificaciones
T12340 Inteligencia Artificial - Programa
9 páginas
Tarea10 Roberto Giron
Aún no hay calificaciones
Tarea10 Roberto Giron
9 páginas
IA en Mantenimiento Predictivo Industrial
Aún no hay calificaciones
IA en Mantenimiento Predictivo Industrial
177 páginas
App Médica: Diagnóstico por Voz
Aún no hay calificaciones
App Médica: Diagnóstico por Voz
17 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
28 páginas
2do Trabajo de Informatica, IA, DL y ML
Aún no hay calificaciones
2do Trabajo de Informatica, IA, DL y ML
4 páginas
Tecnicas Actuales de IA
Aún no hay calificaciones
Tecnicas Actuales de IA
4 páginas
Esparza David R2 U5
Aún no hay calificaciones
Esparza David R2 U5
5 páginas
Introducción al Machine Learning
Aún no hay calificaciones
Introducción al Machine Learning
7 páginas
Ciberseguridad
Aún no hay calificaciones
Ciberseguridad
8 páginas
Diferencias entre Big Data, IA, ML y DL
Aún no hay calificaciones
Diferencias entre Big Data, IA, ML y DL
6 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
31 páginas
Guía Introductoria al Machine Learning
Aún no hay calificaciones
Guía Introductoria al Machine Learning
26 páginas
Aprendizaje Supervisado en IA
Aún no hay calificaciones
Aprendizaje Supervisado en IA
186 páginas
Introducción al Machine Learning y sus Aplicaciones
Aún no hay calificaciones
Introducción al Machine Learning y sus Aplicaciones
4 páginas
GUIA GRATUITA. Machine Learning. Por Donde Empiezo
100% (9)
GUIA GRATUITA. Machine Learning. Por Donde Empiezo
19 páginas
Curso de Reconocimiento de Patrones y Aprendizaje
100% (1)
Curso de Reconocimiento de Patrones y Aprendizaje
3 páginas
Estimación de Pérdida de Suelo en Cajamarca
Aún no hay calificaciones
Estimación de Pérdida de Suelo en Cajamarca
143 páginas
Introduccion A La Percepcion Remota
Aún no hay calificaciones
Introduccion A La Percepcion Remota
134 páginas
Capítulos 13.5 y 13.6
Aún no hay calificaciones
Capítulos 13.5 y 13.6
22 páginas
Capítulos 13.5 y 13.6
Aún no hay calificaciones
Capítulos 13.5 y 13.6
22 páginas
ENSAYO-Historia de La Cartografía
Aún no hay calificaciones
ENSAYO-Historia de La Cartografía
6 páginas
Vulcanología para Ingenieros
Aún no hay calificaciones
Vulcanología para Ingenieros
23 páginas
Prevención ante erupciones volcánicas
Aún no hay calificaciones
Prevención ante erupciones volcánicas
13 páginas
Funciones del Puente Norte en Placas Base
Aún no hay calificaciones
Funciones del Puente Norte en Placas Base
6 páginas
Singularidad Tecnológica: Conceptos y Riesgos
Aún no hay calificaciones
Singularidad Tecnológica: Conceptos y Riesgos
13 páginas
(Sap Abap Examen Hindu Español
Aún no hay calificaciones
(Sap Abap Examen Hindu Español
16 páginas
Unidad II. Compuertas Lógicas
Aún no hay calificaciones
Unidad II. Compuertas Lógicas
6 páginas
Curso de Hacking en Windows 2018
Aún no hay calificaciones
Curso de Hacking en Windows 2018
4 páginas
Diseño VLSI con VHDL en FPGA
Aún no hay calificaciones
Diseño VLSI con VHDL en FPGA
32 páginas
Configuración de Servidores Vinculados SQL
Aún no hay calificaciones
Configuración de Servidores Vinculados SQL
12 páginas
Concepto Básicos de Centros de Cómputo
Aún no hay calificaciones
Concepto Básicos de Centros de Cómputo
12 páginas
Seguridad en Redes y Sistemas PDF
Aún no hay calificaciones
Seguridad en Redes y Sistemas PDF
86 páginas
Conversión de Binario a ASCII
Aún no hay calificaciones
Conversión de Binario a ASCII
7 páginas
Sistema Web para Citas Médicas
0% (1)
Sistema Web para Citas Médicas
88 páginas
Universidad Autonoma de La Ciudad de Mexico
Aún no hay calificaciones
Universidad Autonoma de La Ciudad de Mexico
3 páginas
2 Analisis Numérico Octave
Aún no hay calificaciones
2 Analisis Numérico Octave
70 páginas
Herramientas SAGA en QGIS para Hidrología
Aún no hay calificaciones
Herramientas SAGA en QGIS para Hidrología
10 páginas
Ejercicio Teórico de PAQUETES 2
67% (6)
Ejercicio Teórico de PAQUETES 2
5 páginas
Guía de Instalación de FdcGrd 3.00
Aún no hay calificaciones
Guía de Instalación de FdcGrd 3.00
5 páginas
RSA y DES: Algoritmos de Cifrado
Aún no hay calificaciones
RSA y DES: Algoritmos de Cifrado
4 páginas
1.2 Estructura Externa de Un Controlador Autómata Programable
Aún no hay calificaciones
1.2 Estructura Externa de Un Controlador Autómata Programable
20 páginas
Guía HMI RTU560: Uso y Control
Aún no hay calificaciones
Guía HMI RTU560: Uso y Control
12 páginas
Funciones ODE en MATLAB
Aún no hay calificaciones
Funciones ODE en MATLAB
5 páginas
Guía de Expresiones Regulares
Aún no hay calificaciones
Guía de Expresiones Regulares
17 páginas
Segundo Avance Del Proyecto de Ingeniería de Software II
Aún no hay calificaciones
Segundo Avance Del Proyecto de Ingeniería de Software II
2 páginas
Componentes Básicos de una Computadora
Aún no hay calificaciones
Componentes Básicos de una Computadora
5 páginas
Algoritmo de Dijkstra: Camino Más Corto
Aún no hay calificaciones
Algoritmo de Dijkstra: Camino Más Corto
5 páginas
HONEYWELL
Aún no hay calificaciones
HONEYWELL
18 páginas
S7200 1hora PDF
Aún no hay calificaciones
S7200 1hora PDF
55 páginas
Fundamentos de Programación SilaboUPN 2011-2
Aún no hay calificaciones
Fundamentos de Programación SilaboUPN 2011-2
6 páginas
Operaciones Con Números Binarios
Aún no hay calificaciones
Operaciones Con Números Binarios
8 páginas
Características de RIP Versión 2: La Máscara de Subred Con La Actualización de La Ruta
Aún no hay calificaciones
Características de RIP Versión 2: La Máscara de Subred Con La Actualización de La Ruta
11 páginas
Uso de DEFAULT en SQL Server
Aún no hay calificaciones
Uso de DEFAULT en SQL Server
3 páginas