0% encontró este documento útil (0 votos)

51 vistas6 páginas

Introducción a Redes Neuronales AI

Cargado por

rodrigo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

51 vistas6 páginas

Introducción a Redes Neuronales AI

Cargado por

rodrigo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

1.

Introducción a las Redes Neuronales

1.1. Introducción y herramientas de programación

¿Qué son las redes neuronales artificiales?
Las redes neuronales artificiales son modelos matemáticos inspirados en las células del sistema
nerviosos central. Es importante tratar de modelar a estas células porque, dentro del sistema
nervioso central, el cerebro es el único ejemplo que conocemos en la naturaleza con la capacidad
de procesar información para una variedad de tareas tan distintas y con tan alta efectividad.

Sin embargo, como todo modelo, vamos a considerar solo una simplificación de su contraparte
biológica, tomando unicamente los aspectos mínimos necesarios para conseguir las propiedades
deseadas y sin tener en cuenta los detalles del resto de su funcionamiento.

Podemos decir que las neuronas se conectan entre sí mediante sinapsis, y estas sinapsis
transmiten impulsos electro-químicos a través de las dendritas hasta el núcleo o soma de la
célula. Si el estímulo recibido es suficientemente grande, la neurona va a producir un disparo que
se va a propagar por el axón hacia nuevas sinapsis en otras neuronas, y el proceso se vuelve a
repetir.

Esto lo podemos modelar matemáticamente mediante un vector x para representar los estímulos
de entrada, un vector de pesos w que representan la eficacia con que los estímulos se transmiten
al núcleo de la célula, un umbral b que es la cantidad de estímulo total que se tiene que superar
para producir un disparo, y una función de transferencia que determina qué forma va a tener la
activación de respuesta de la neurona.

Trasladando el proceso a una ecuación, lo podemos escribir como la sumatoria entre el producto
de los estímulos x y los pesos w, menos el umbral b, pasado por la función de transferencia. Pero
como este valor de umbral b también va a ser modificado de la misma forma que los pesos w
durante el aprendizaje, podemos simplificar la expresión asumiendo que existe un valor de
estímulo adicional fijo en -1 y entonces b se convertirá simplemente en un peso extra.

Sabiendo que estas son las partes esenciales del modelo, hay dos cuestiones que siempre deben
tenerse en cuenta: ¿cómo producir una respuesta del modelo?, y ¿cómo hacer que el modelo
aprenda? Es decir, lo que vamos a querer hacer es modificar estos pesos w y este umbral b para
que, en presencia de cierto estímulo, la neurona responda de cierta forma.

Estas neuronas artificiales son unidades de procesamiento muy sencillas, pero trabajando en
conjunto mediante conexiones mutuas, son capaces de actuar como un paradigma computacional
aparte, logrando soluciones muy eficaces y robustas. Esto es lo que se conoce como propiedad
emergente, es decir, el total es mayor que la simple suma de sus partes.
Su relación con otras disciplinas
La Inteligencia Artificial es una rama de las Ciencias de la Computación encargada de tratar de
simular la inteligencia humana. Una definición tan general abarca una enorme diversidad de
métodos y subdisciplinas.

La IA clásica (mediados del siglo pasado) dependía de tratar de capturar conocimiento y

programarlo directamente en el sistema (por ejemplo, los sistemas expertos). Es decir que el
aprendizaje de un problema particular tenía lugar en la cabeza de la persona que debía programar
el sistema.

Por el contrario, lo que ahora llamamos Aprendizaje Automático (Machine Learning), se enfoca en
técnicas que tratan de capturar el conocimiento mediante ejemplos. Esta idea es muy similar a lo
que se viene realizando en estadística desde hace mucho tiempo, sin embargo lo que actualmente
se considera como Aprendizaje Automático apareció por primera vez con las Redes Neuronales
Artificiales.

Pero además las Redes Neuronales tiene algunas ventajas sobre los métodos puramente
estadísticos y sobre los modelos alternativos de Aprendizaje Automático. Las funciones de
distribución estadísticas son buenas para modelar las tendencias generales sobre un conjunto de
datos. Las redes neuronales pueden aprender estas distribuciones, pero también pueden aprender
sobre excepciones particulares. Y las técnicas de Aprendizaje Automático por lo general utilizan
modelos poco flexibles que son adecuados solo para un tipo de problema en particular, por lo que
suelen depender fuertemente del procesamiento previo de los datos. Las Redes Neuronales son
modelos más flexibles que se pueden adaptar a distintos tipos de problemas y no suelen requerir
importantes transformaciones de los datos para poder producir resultados. Además, otra de las
virtudes de las Redes Neuronales es que, por ser un modelo biológicamente inspirado, nos
permiten entender mejor el funcionamiento de nuestro propio cerebro.

Los avances teóricos de las últimas décadas en estos modelos, junto con la facilidad de acceso a
más y mejores datos, y el mayor poder de procesamiento, permitieron desarrollar lo que
actualmente se conoce como Aprendizaje Profundo (Deep Learning). Estas nuevas técnicas
permiten que redes de neuronas con más etapas de procesamiento puedan aprender
eficientemente problemas más complejos.

El Aprendizaje Profundo actualmente tiene una justificada muy alta reputación, cultivada no solo
en el éxito obtenido en competencias de muy distinta índole, en donde desde sus primeras
apariciones produjo significativos avances en los respectivos campos, sino también por la más
reciente aparición de los modelos generativos como los Grandes Modelos de Lenguaje (Large
Language Models, LLM). Sin embargo un modelo más complejo no es necesariamente una mejor
solución, y en muchos casos modelos de Redes Neuronales Artificiales sencillos pueden ser una
solución más práctica y aplicarse a una mayor variedad de problemas.

Tanto las Redes Neuronales Artificiales como el Aprendizaje Profundo son temas en constante
investigación, y es posible que sigan apareciendo nuevas alternativas que conviertan a algunos de
los mejores modelos actuales en obsoletos. Pero es importante entender que los fundamentos en
que se basan, de unidades sencillas trabajando en conjunto conectadas entre sí para aprender una
tarea, probablemente seguirán siendo los mismos.

Tipos de modelos y aprendizaje

Existen varios tipos de redes neuronales artificiales. Vamos a empezar hablando del tipo de
modelo que probablemente sea el más utilizado y con la que vamos a trabajar en las primeras
etapas.

Las neuronas o unidades están organizadas en capas. Vamos a tener una capa de entrada que
recibe los estímulos y una capa de salida en donde obtenemos la respuesta de la red. Además
puede haber varias capas intermedias que vamos a llamar capas ocultas.

Cada unidad va a estar conectada mediante pesos con todas las unidades de la capa anterior,
salvo la capa de entrada que no va a tener conexiones. A este tipo de conexiones lo vamos a
llamar “completamente conectado” o “fully-connected”.

Vamos a tener además en todas las capas, menos en la de salida, una unidad extra con un valor
fijo en -1 para que su peso represente el umbral máximo de estímulo que tiene que superar la
neurona para disparar. El incorporar este umbral como un peso extra nos va a facilitar los cálculos
en el proceso de aprendizaje. A esta unidad extra la vamos a llamar unidad umbral.

El estímulo se va a propagar en una sola dirección, desde la capa de entrada, pasando por todas
las capas ocultas, hasta la capa de salida. Este tipo de propagación de los estímulos hacia adelante
se lo llama “feed-forward”.

El estímulo neto que recibe cada unidad se calcula mediante una función de estímulo. Esta función
generalmente es el producto interno entre el vector de activación de la capa anterior y los pesos
correspondientes, aunque en algunos casos es posible utilizar otro tipo de funciones como una
inversa de la distancia vectorial.

Una vez que tenemos el estímulo neto que recibe cada unidad, le vamos a aplicar una función de
activación o función de transferencia para obtener el valor de respuesta de la unidad. Hay varios
tipos de funciones de activación. La más sencilla es la función lineal, es decir la respuesta de la
unidad es exactamente el estímulo neto que recibió. También es muy sencilla la función signo,
que tiene una forma de escalón. Esto es, si el estímulo total es positivo responde con +1 y si es
negativo responde con -1. Otro tipo de función de activación muy usada son las sigmoideas, por
ejemplo la logística, que tiene una forma de escalón suavizado acotada entre 0 y 1, o la tangente
hiperbólica que también tiene una forma de escalón suavizado pero acotada entre -1 y 1. En
algunos casos, cuando la activación o los datos están acotados entre 0 y 1 se los llama binarios y
se asume que representan la presencia o no de estímulo, y cuando están acotados entre -1 y +1
se los llama bipolares y representan la presencia de estímulos inhibitorios o excitatorios.
Por arquitectura de una red neuronal vamos a entender que se trata de la elección de cantidad de
capas ocultas, cantidad de unidades por capa, tipo de conexiones entre capas, funciones de
estímulo y funciones de activación.

Y finalmente, por aprendizaje nos vamos a referir al proceso de modificar los pesos, que serán los
parámetros entrenables del modelo, para obtener una respuesta deseada específica. Este proceso
de aprendizaje generalmente estará guiado por el postulado de Hebb, formulado originalmente
para su contraparte biológica, que dice “Cuando el axón de una célula A está lo suficientemente
cerca como para excitar a una célula B y repetidamente toma parte en la activación, ocurren
procesos de crecimiento en una o ambas células de manera que tanto la eficiencia de la célula A,
como la capacidad de excitación de la célula B son aumentadas”.

Todo esto sirve como una introducción a algunos términos y nomenclatura que vamos a utilizar,
pero se debe destacar que no existe un consenso generalizado y que es muy común encontrar que
distintos autores utilizan diferentes nombres para referirse a la misma cosa, o el mismo nombre
para referirse a cosas distintas.

Datos y aprendizaje supervisado

Para poder hacer cualquier tipo de aprendizaje vamos a necesitar datos. Es decir, aprender a partir
de datos es lo que llamamos aprendizaje automático o aprendizaje de máquina.

Esto lo podemos pensar como que tenemos un problema que puede ser descripto en forma
numérica. Los distintos elementos numéricos, o variables, que describen al planteo del problema
los podemos organizar en un vector. Además podemos asumir que conocemos muchos ejemplos
de ese problema, es decir, contamos con muchos de sus casos particulares. Si cada ejemplo del
problema puede ser representado como un vector, entonces el conjunto de ejemplos que tenemos
lo podemos representar en una matriz, en donde cada fila va a representar un caso del problema y
cada columna va a representar una de las variables que describe el planteo del problema.

Pero además podemos pensar que para cada caso que conocemos del problema, para cada planteo
particular del problema, también conocemos la solución correspondiente y esta también puede ser
expresada en forma vectorial. Estos van a ser nuestros vectores objetivo o targets. A este conjunto
de vectores que describen las soluciones conocidas también los vamos a organizar en una matriz.
Con lo cual nuestro conjunto de datos va a estar formado por una matriz con datos de entrada y
otra con datos objetivo.

Cada uno de los vectores, de entrada u objetivo, los vamos a llamar patrones, y a cada caso
consistente en el patrón de entrada y su correspondiente patrón objetivo, lo vamos a llamar
instancia del problema.

El utilizar datos de entrada junto a datos objetivo es lo que se conoce como aprendizaje
supervisado. Es decir, le vamos a enseñar a nuestro modelo que para estos ejemplos de este
problema, esta es una solución válida. Y el objetivo final es que, a partir de estos casos conocidos,
cuando el modelo vea un nuevo ejemplo, es decir una instancia del problema que no fue parte de
los datos iniciales, responda con una solución válida del problema.

En general para que un modelo pueda aprender efectivamente necesita ver los datos muchas
veces. Una pasada por todas las instancias del conjunto de datos se lo llama una época. El proceso
de ir haciendo correcciones a los parámetros entrenables del modelo durante varias épocas para ir
aproximándose a la solución deseada se llama entrenamiento.

Gracias a todo esto es posible utilizar redes neuronales artificiales exitosamente en distintos tipos
de problemas como regresión, clasificación, reducción de dimensión, clustering, etc. con
potenciales aplicaciones en diferentes áreas del comercio, la industria, la administración, las
finanzas, el transporte, la educación, la seguridad, la salud, la energía y el entretenimiento.

Herramientas de programación
La mejor forma de entender cómo funciona algo es siendo el responsable de hacerlo funcionar.
Por esto, para entender mejor el funcionamiento de las redes neuronales, lo siguiente que vamos a
hacer es encargarnos de hacer nuestra propia implementación de este tipo de modelo.

Bibliografía
 Haykin, S. (2009). Neural Networks and Learning Machines. (Capítulo 0)

 Prince, S.J.D. (2024). Understanding Deep Learning. (Capítulo 1)

 Goodfellow, I., Bengio, Y., Courville, A. (2016). Deep Learning. (Capítulos 1 y 5)

También podría gustarte

Ensayo sobre Redes Neuronales Artificiales
100% (1)
Ensayo sobre Redes Neuronales Artificiales
7 páginas
Redes Neuronales en Inteligencia Artificial
Aún no hay calificaciones
Redes Neuronales en Inteligencia Artificial
13 páginas
BHSRNJRD
Aún no hay calificaciones
BHSRNJRD
8 páginas
Redes Neurunales
Aún no hay calificaciones
Redes Neurunales
5 páginas
Redes Neuronales Artificiales
Aún no hay calificaciones
Redes Neuronales Artificiales
22 páginas
R1-A2-S2 Y Donde Aplicar Las Redes Neuronales Artificiales (RNA)
Aún no hay calificaciones
R1-A2-S2 Y Donde Aplicar Las Redes Neuronales Artificiales (RNA)
11 páginas
Algoritmo de Retropropagación en Redes Neuronales
Aún no hay calificaciones
Algoritmo de Retropropagación en Redes Neuronales
14 páginas
Red Neuronal Artificial
Aún no hay calificaciones
Red Neuronal Artificial
21 páginas
Unidad 1. 03. Redes Neuronales
Aún no hay calificaciones
Unidad 1. 03. Redes Neuronales
49 páginas
Introducción a la Computación Neuronal
Aún no hay calificaciones
Introducción a la Computación Neuronal
15 páginas
N 1 A 24
Aún no hay calificaciones
N 1 A 24
7 páginas
Conceptos Clave de Redes Neuronales
Aún no hay calificaciones
Conceptos Clave de Redes Neuronales
33 páginas
Tarea 6 Inteligencia Artifiical Roger
Aún no hay calificaciones
Tarea 6 Inteligencia Artifiical Roger
12 páginas
Redes Neuronales Artificiales: Guía Completa
Aún no hay calificaciones
Redes Neuronales Artificiales: Guía Completa
20 páginas
Introducción a las Redes Neuronales
Aún no hay calificaciones
Introducción a las Redes Neuronales
23 páginas
Redes Neuronales y Aprendizaje Automático
Aún no hay calificaciones
Redes Neuronales y Aprendizaje Automático
60 páginas
Redes Neuronales y Aprendizaje Automático
Aún no hay calificaciones
Redes Neuronales y Aprendizaje Automático
32 páginas
Trabajo Red NN by Marta
Aún no hay calificaciones
Trabajo Red NN by Marta
13 páginas
Redes Neuronales: Fundamentos y Aplicaciones
Aún no hay calificaciones
Redes Neuronales: Fundamentos y Aplicaciones
4 páginas
Partes de la Neurona en Redes Neuronales
Aún no hay calificaciones
Partes de la Neurona en Redes Neuronales
23 páginas
Tipos y Funciones de Neuronas Artificiales
Aún no hay calificaciones
Tipos y Funciones de Neuronas Artificiales
9 páginas
Fundamentos de Redes Neuronales
Aún no hay calificaciones
Fundamentos de Redes Neuronales
54 páginas
Red Neuronal Artificial: Conceptos Clave
Aún no hay calificaciones
Red Neuronal Artificial: Conceptos Clave
11 páginas
Redes Neuronales en Inteligencia Artificial
Aún no hay calificaciones
Redes Neuronales en Inteligencia Artificial
3 páginas
Introducción a Redes Neuronales ANNs
Aún no hay calificaciones
Introducción a Redes Neuronales ANNs
12 páginas
Redes Neuronales: Mitos y Aplicaciones
Aún no hay calificaciones
Redes Neuronales: Mitos y Aplicaciones
11 páginas
Enfoques de Aprendizaje en IA
Aún no hay calificaciones
Enfoques de Aprendizaje en IA
11 páginas
Redes Neuronales Artificiales
Aún no hay calificaciones
Redes Neuronales Artificiales
5 páginas
Introducción a Redes Neuronales
Aún no hay calificaciones
Introducción a Redes Neuronales
18 páginas
Redes Neuronales en Machine Learning
Aún no hay calificaciones
Redes Neuronales en Machine Learning
12 páginas
Redes Neuronales: Fundamentos y Aplicaciones
Aún no hay calificaciones
Redes Neuronales: Fundamentos y Aplicaciones
4 páginas
Clase 8. Redes Neuronales
Aún no hay calificaciones
Clase 8. Redes Neuronales
23 páginas
Introducción a Redes Neuronales AI
Aún no hay calificaciones
Introducción a Redes Neuronales AI
14 páginas
Redes Neuronales
Aún no hay calificaciones
Redes Neuronales
14 páginas
Redes Neuronales: Origen y Modelos
Aún no hay calificaciones
Redes Neuronales: Origen y Modelos
8 páginas
Redes Neuronales en Inteligencia Artificial
Aún no hay calificaciones
Redes Neuronales en Inteligencia Artificial
2 páginas
Fundamentos de Redes Neuronales Artificiales
Aún no hay calificaciones
Fundamentos de Redes Neuronales Artificiales
8 páginas
Qué Es La Inteligencia Artificial
Aún no hay calificaciones
Qué Es La Inteligencia Artificial
10 páginas
Funcionamiento de Redes Neuronales
Aún no hay calificaciones
Funcionamiento de Redes Neuronales
222 páginas
14 - Redes Neuronales Artificiales
Aún no hay calificaciones
14 - Redes Neuronales Artificiales
5 páginas
Informe - Redes Neuronales
Aún no hay calificaciones
Informe - Redes Neuronales
16 páginas
Semana 12
Aún no hay calificaciones
Semana 12
4 páginas
Introducción a Redes Neuronales AI
100% (1)
Introducción a Redes Neuronales AI
44 páginas
Redes Neuronales Artificiales: Guía Completa
Aún no hay calificaciones
Redes Neuronales Artificiales: Guía Completa
6 páginas
Aplicaciones de IA en Redes Neuronales
Aún no hay calificaciones
Aplicaciones de IA en Redes Neuronales
14 páginas
Introducción a Redes Neuronales en Python
Aún no hay calificaciones
Introducción a Redes Neuronales en Python
1 página
Introduccion A Las Redes Neuronales
Aún no hay calificaciones
Introduccion A Las Redes Neuronales
64 páginas
Introducción a Redes Neuronales AI
Aún no hay calificaciones
Introducción a Redes Neuronales AI
16 páginas
Redes Neuronales: Aplicaciones y Tipos
Aún no hay calificaciones
Redes Neuronales: Aplicaciones y Tipos
6 páginas
Historia y Función de Redes Neuronales
Aún no hay calificaciones
Historia y Función de Redes Neuronales
35 páginas
Redes Neuronales: Impacto y Futuro
Aún no hay calificaciones
Redes Neuronales: Impacto y Futuro
19 páginas
Introducción a las Redes Neuronales
Aún no hay calificaciones
Introducción a las Redes Neuronales
6 páginas
Redes Neuronales - I2025
Aún no hay calificaciones
Redes Neuronales - I2025
36 páginas
Redes Neuronales en Voladura de Rocas
100% (1)
Redes Neuronales en Voladura de Rocas
52 páginas
Red Neuronal Artificial - Wikipedia
Aún no hay calificaciones
Red Neuronal Artificial - Wikipedia
21 páginas
Red Neuronal Artificial: Conceptos Clave
Aún no hay calificaciones
Red Neuronal Artificial: Conceptos Clave
4 páginas
Citoesqueleto
Aún no hay calificaciones
Citoesqueleto
22 páginas
La Pirámide de La Estrategia Organizacional y Su Aplicación en Recursos Humanos
Aún no hay calificaciones
La Pirámide de La Estrategia Organizacional y Su Aplicación en Recursos Humanos
5 páginas
Experimentos de refracción de luz
100% (2)
Experimentos de refracción de luz
1 página
Harina de Roca
Aún no hay calificaciones
Harina de Roca
14 páginas
Dinámica de Fluidos en Física Médica
Aún no hay calificaciones
Dinámica de Fluidos en Física Médica
31 páginas
EFC: Líder en Abastecimiento Industrial
Aún no hay calificaciones
EFC: Líder en Abastecimiento Industrial
6 páginas
Reglamento de Transporte Terrestre
Aún no hay calificaciones
Reglamento de Transporte Terrestre
2 páginas
Aparatos de Medicion
100% (1)
Aparatos de Medicion
10 páginas
Uso Antibióticos en Niños Odontología @vale - Studentist
Aún no hay calificaciones
Uso Antibióticos en Niños Odontología @vale - Studentist
3 páginas
Chicha de Arroz Venezolana
0% (1)
Chicha de Arroz Venezolana
3 páginas
Proyecto Casco Inteligente y Seguro
Aún no hay calificaciones
Proyecto Casco Inteligente y Seguro
8 páginas
Plan de Manejo Integral de Residuos Solidos Dulazar
Aún no hay calificaciones
Plan de Manejo Integral de Residuos Solidos Dulazar
42 páginas
Transcripción y Traducción
Aún no hay calificaciones
Transcripción y Traducción
48 páginas
Actividad 03
Aún no hay calificaciones
Actividad 03
5 páginas
Esmaltes Borax
100% (2)
Esmaltes Borax
3 páginas
Caso Clínico de Amebiasis Intestinal
Aún no hay calificaciones
Caso Clínico de Amebiasis Intestinal
27 páginas
Clasificación y características de bacterias
Aún no hay calificaciones
Clasificación y características de bacterias
11 páginas
Barniz Vitrificador Al Agua
Aún no hay calificaciones
Barniz Vitrificador Al Agua
2 páginas
VW 50180 ESP (Emisión)
Aún no hay calificaciones
VW 50180 ESP (Emisión)
26 páginas
Proyecto Huerto 1a
Aún no hay calificaciones
Proyecto Huerto 1a
7 páginas
Historia de la Medicina Tradicional Peruana
100% (3)
Historia de la Medicina Tradicional Peruana
14 páginas
Ejemplos y Clasificación de Juicios
Aún no hay calificaciones
Ejemplos y Clasificación de Juicios
6 páginas
Nº Cant. Referencia Descripción: Tarjeta Conversora Rs232-Fibra Óptica CRF (Tci-2560695R0)
Aún no hay calificaciones
Nº Cant. Referencia Descripción: Tarjeta Conversora Rs232-Fibra Óptica CRF (Tci-2560695R0)
4 páginas
Evaluación Continua de Química Inorgánica
50% (2)
Evaluación Continua de Química Inorgánica
4 páginas
Hoja de Seguridad del Insecticida Phantom
Aún no hay calificaciones
Hoja de Seguridad del Insecticida Phantom
12 páginas
Para Diseño de Cines
Aún no hay calificaciones
Para Diseño de Cines
171 páginas
Promueve la Movilidad a Pie con Metrominuto
Aún no hay calificaciones
Promueve la Movilidad a Pie con Metrominuto
18 páginas
Proceso de Crianza de Trucha: Etapas Clave
Aún no hay calificaciones
Proceso de Crianza de Trucha: Etapas Clave
2 páginas
Tablas Organulos (Ross 7ed 2016)
Aún no hay calificaciones
Tablas Organulos (Ross 7ed 2016)
2 páginas
1 Estrategia Palitos Con Nombre
Aún no hay calificaciones
1 Estrategia Palitos Con Nombre
2 páginas