0% encontró este documento útil (0 votos)
892 vistas9 páginas

Hernandez Nancy R5 U2

El documento aborda el aprendizaje de máquinas y la minería de datos, destacando su importancia en la inteligencia artificial y su aplicación en diversas industrias. Se exploran sus diferencias, métodos de clasificación y algoritmos, así como su relevancia en la toma de decisiones empresariales. La conclusión enfatiza la necesidad de comprender la relación entre estas disciplinas para optimizar el uso de datos en proyectos de IA.

Cargado por

Nancy Hernandez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
892 vistas9 páginas

Hernandez Nancy R5 U2

El documento aborda el aprendizaje de máquinas y la minería de datos, destacando su importancia en la inteligencia artificial y su aplicación en diversas industrias. Se exploran sus diferencias, métodos de clasificación y algoritmos, así como su relevancia en la toma de decisiones empresariales. La conclusión enfatiza la necesidad de comprender la relación entre estas disciplinas para optimizar el uso de datos en proyectos de IA.

Cargado por

Nancy Hernandez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

INTELIGENCIA ARTIFICIAL

Reto 5. ¿Reconoces los usos y aplicaciones del


aprendizaje de máquinas?

Nombre completo: Nancy Hernández Morales

Fecha de elaboración: 02 de abril del 2024

Nombre del asesor: Dora Alicia Álvarez Medina


INTRODUCCIÓN

El aprendizaje de máquinas o “machine learning” es la acción que realizan los


ordenadores para obtener conocimiento por si solos, mediante la recopilación de
información que reciben, con el fin de realizar tareas especificas sin la necesidad de ser
programados por terceros. Coches que se conducen solos, asistentes que traducen
instantáneamente de un idioma a otro o sugerencias de compra personalizadas, todo
esto es posible gracias al 'Machine Learning'. Por otro lado, la minería de datos (Data
Mining) es la técnica para explorar una gran cantidad de datos con el fin de encontrar
patrones que sean repetitivos y que expliquen el comportamiento de estos.
Las empresas ahora están aprovechando la minería de datos y el aprendizaje
automático para mejorar todo, desde sus procesos de ventas hasta la interpretación de
finanzas con fines de inversión. Como resultado, los científicos de datos se han
convertido en empleados vitales en organizaciones de todo el mundo a medida que las
compañías buscan alcanzar objetivos más grandes con la ciencia de datos como
nunca.
En este ensayo se abordará la relación entre el machine learning y el data mining, así
como sus diferentes aplicaciones, también se tocará el tema de los datos y su
importancia para estas herramientas, así como la taxonomía del aprendizaje de
maquina y los diferentes métodos de ordenamiento para la clasificación de IA. Daremos
una conclusión personal dando una opinión constructiva al uso de estas tecnologías
que están teniendo un gran impacto tanto en la industria como en nuestra vida
personal.

APRENDIZAJE DE MAQUINAS Y MINERIA DE DATOS

El aprendizaje de máquinas (machine learning) es una disciplina del campo de la


Inteligencia Artificial que, a través de algoritmos, dota a los ordenadores de la
capacidad de identificar patrones en datos masivos y elaborar predicciones (análisis
predictivo). Las técnicas de aprendizaje automático son, de hecho, una parte
fundamental del Big Data. El ML es, en definitiva, un tipo de inteligencia artificial (IA)
centrada en construir sistemas informáticos que aprenden a partir de los datos. La
amplia gama de técnicas que abarca el aprendizaje automático permite que las
aplicaciones de software mejoren su rendimiento con el tiempo.
La minería de datos o data mining es un proceso técnico, automático o semiautomático,
que analiza grandes cantidades de información dispersa para darle sentido y convertirla
en conocimiento. Gracias a la acción conjunta de analítica y minería de datos, que
combina estadística, Inteligencia Artificial y aprendizaje automático, las empresas
pueden crear modelos para descubrir conexiones entre millones de registros. Su
principal finalidad es explorar, mediante la utilización de distintas técnicas y
tecnologías, bases de datos enormes de manera automática. El objetivo es encontrar
patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos
que se han ido recopilando con el tiempo. Estos patrones pueden encontrarse
utilizando estadísticas o algoritmos de búsqueda próximos a la IA y a las redes
neuronales.
El aprendizaje de máquinas y la minería de datos son dos campos estrechamente
relacionados de la inteligencia artificial (IA). Desde nuestro punto de vista, la principal
diferencia radica en el objetivo que tiene cada una de las disciplinas. Mientras que la
minería de datos descubre patrones anteriormente desconocidos, el machine learning
se usa para reproducir patrones conocidos y hacer predicciones basadas en los
patrones. En pocas palabras se podría decir que la minería de datos tiene una función
exploratoria mientras que el machine learning se focaliza la predicción.

Aplicaciones con la minería de datos


El aprendizaje automático y la minería de datos se pueden combinar para generar
resultados que puedan ayudar a tomar mejores decisiones comerciales y aumentar los
márgenes de beneficio de una organización. Ambos utilizan procesos analíticos y son
buenos para reconocer patrones. A veces, se pueden utilizar técnicas de aprendizaje
automático en la minería de datos para obtener resultados precisos.
Aplicaciones de aprendizaje de maquina relacionadas con la minería de datos
Estos son algunos de los escenarios en los que el aprendizaje automático puede
ayudar a afrontar los desafíos de la minería de datos.

 La calidad del resultado de las herramientas de minería de datos depende de la


calidad de los datos. A veces es posible que ni siquiera resuelva los problemas
de calidad. Esto conduce a resultados incorrectos cuando la herramienta analiza
datos defectuosos. Por eso, es importante limpiar los datos antes de
procesarlos. En tales situaciones, se recomiendan los algoritmos de aprendizaje
automático, ya que pueden incorporarse a herramientas de minería de datos
para automatizar el proceso de entrada de datos y obtener datos de calidad.
Esta combinación puede identificar fácilmente cualquier dato duplicado y
eliminarlo. Después de esto, se puede utilizar un algoritmo de bosque aleatorio
para clasificar los datos.
 Se pueden utilizar herramientas de minería de datos para identificar problemas
relacionados con los procesos, pero no pueden encontrar la causa raíz de los
problemas. Los algoritmos de aprendizaje automático, por el contrario, pueden
ayudar a resolver el problema. También podemos introducir software con
análisis de causa raíz y herramientas de extracción de datos que puedan
abordar este tipo de problemas.
 En ocasiones, las herramientas de minería de datos brindan menos claridad al
procesar una gran cantidad de variables. La adición de datos aumenta la
complejidad de los resultados de la minería de datos, lo que es difícil de
entender para los humanos. Las herramientas de minería de datos integradas
con algoritmos de aprendizaje automático y visión por computadora ayudan a
superar este problema. Por lo tanto, se pueden capturar los datos procesados y
generar el resultado relevante.

Taxonomía del aprendizaje de maquina


La IA y el aprendizaje automático requieren información estructurada para entrenar a
las máquinas para que aprendan y comprendan cómo replicar el comportamiento
humano. El proceso de crear información estructurada a partir de datos no
estructurados y utilizarla para enseñar a las máquinas a pensar como humanos
comienza con la creación de datos estructurados limpios para los procesos de IA y ML.
Las taxonomías proporcionan los medios para que las máquinas comprendan las
jerarquías en la información.
Una taxonomía de datos es la clasificación de datos en categorías y subcategorías.
Proporciona una vista unificada de los datos de un sistema e introduce terminologías y
semánticas comunes en múltiples sistemas. Las taxonomías representan la estructura
formal de clases o tipos de objetos dentro de un dominio. Una taxonomía es estática.
Cuando estamos diseñando o implementando métodos de inteligencia artificial
avanzados, uno de los valores más importantes a tener en cuenta es la bondad de los
resultados, es decir, que datos tenemos sobre «como de bueno» tiene que ser el
resultado de la salida de un sistema de IA.
Métodos de ordenamiento y clasificación para la IA
En entornos de aprendizaje reales, lo más común es encontrar 3 escenarios posibles.
En los más fiables, tendremos datos relevantes y demostrativos de cómo debe ser un
resultado. Este escenario es el más favorable, ya que podemos decidir si el resultado
es bueno.
Estos 3 escenarios son (normalmente esta clasificación es bastante aceptada por la
comunidad):

 El aprendizaje supervisado
 El aprendizaje por refuerzo
 El aprendizaje no supervisado
Aprendizaje supervisado
Si tenemos una idea exacta de los resultados de salida, además sabemos la respuesta
que nuestro sistema debería dar dadas ciertas circunstancias, estamos ante un sistema
de aprendizaje supervisado. Un ejemplo clásico son las regresiones para predecir
números o fechas, o las clasificaciones de categorías. Un sistema bien entrenado
puede deducir según la información que tiene de un usuario que categorías de
anuncios debe mostrarle con una exactitud pasmosa. Sus métodos más comunes son:

 k Nearest Neighbors (kNN): Este algoritmo es clásico en aprendizaje


supervisado basado en distancias, se utiliza un conjunto de datos (generalmente
vectores) y al obtener nuevos datos, estos se clasifican utilizando medidas de
similitud con los datos de entrenamiento.
 Árboles de decisión: Un árbol de decisión es una estructura similar a un
diagrama de flujo donde un ítem interno representa un atributo, la rama
representa una regla y cada ítem hoja representa el resultado del de salida.
 Support Vector Machines (SVM): Se basan en estadísticas y pueden, dado un
modelo de datos de entrenamiento (con clases etiquetadas), predecir las clases
de un conjunto de datos nuevos.
 Redes neuronales: Las redes neuronales intentan emular la biología creando
unidades (neuronas) que trabajan entre sí mediante interconexiones tratando
entradas dentro de la red. Una vez tratadas las entradas, la red ofrece salidas
con los resultados de las neuronas.
Aprendizaje por refuerzo
La parcialidad es la clave de este método, no sabemos a ciencia cierta el resultado de
la salida del sistema, pero disponemos de cierta información valiosa, aunque
incompleta, normalmente podemos asegurar que un resultado es bueno y dar una
recompensa, o si es malo, dar una penalización. Estos dos simples apuntes que va a ir
tomando la IA, le harán tender a evitar los muros y las trampas, acercándose a las
recompensas para conseguir la meta. Sus métodos más comunes son:

 Caramelo contra golpe de remo: Este tipo de aprendizaje se basa en aprender


de la respuesta del entorno, la retroalimentación de este es la manera de
determinar si las decisiones son buenas o no.
 Métodos Q-learning: El agente debe aprender, actuar y decidir si las acciones
que toma son buenas o no para su cometido. No hay una manera de definir
recompensas, estas pueden ser puntos de un juego, piezas llevadas a destino
sin tirarlas, pegatinas de «eres la mejor IA del mundo» esto no importa la idea
ese que el algoritmo sea capaz de discernir que la acción tomada está bien.
 Algoritmos genéticos: Están inspirados en la teoría Darwiniana de la evolución
natural, los predecesores serán mejores y más fuertes que los antecesores.
Estos algoritmos simulan la aleatoriedad de la evolución y producen cambios
basados en estas simulaciones, posteriormente tienen funciones que determinan
que resultado es más evolucionado, por lo tanto, descartan los anteriores y
continúan con los resultados «mejor evolucionados».
Aprendizaje no supervisado
Este es el escenario donde no hay conocimiento de las salidas, no tenemos noción de
que es lo que los algoritmos deben producir a partir de las entradas. Se trata de que se
extraiga información útil a partir de información disponible, la magia es que no sabemos
que es lo útil de esos datos. Si no se dispone de salidas claras, el aprendizaje no
supervisado puede desentrañar conexiones o patrones ocultos que dan valor real a un
conjunto inconexo y desordenado, por tanto, debemos aplicarlo cuando no sabemos lo
que estamos buscando.
En los conjuntos de datos desordenados donde no se tiene una idea clara de la
clasificación de estos, se usan algoritmo de agrupamiento para determinar mediante
el aprendizaje no supervisado la idoneidad de agrupar un grupo de datos según
sus características.

CONCLUCIÓN

El mundo del machine learning es muy extenso y tiene unas fuertes raíces
matemático/algorítmicas que dan soporte a toda la teoría que hemos visto arriba. Por
otro lado, el Data mining, es una técnica de suma importancia para la recolección y
clasificación de datos para generar información más detallada y precisa. Es importante
conocer la relación entre estas dos partes fundamentales de la IA para tener un mejor
razonamiento de lo que es la construcción de esta. No se trata simplemente de
programación o de diseño o crear una base de datos, es una cuestión de cálculos,
obtención de datos, crear diferentes métodos de clasificación, algoritmos de
agrupamiento, y un sinfín de herramientas que, en un caso particular de un proyecto de
IA, se debe tener muy en cuenta y es un largo camino por recorrer para obtener los
resultados deseados con nuestra IA, así como identificar los datos correctos para
alimentarla de un conocimiento aceptable y que no recibamos repercusiones o existan
diferentes problemas como se ha visto a lo largo de estos años con las diferentes
propuestas que existen en la materia. Juntos, el ML y la minería de datos se pueden
usar para resolver una amplia variedad de problemas. También se utilizan en una
amplia gama de industrias, incluidas la atención médica, finanzas y el comercio
minorista.
 Fáciles de entender
Permite que un individuo  Pueden manejar cualquier
Mapa de los posibles o una organización tipo de datos
resultados de una serie de comparen posibles  Te ayudan a ver las
decisiones relacionadas. acciones entre sí consecuencias de tus
Árboles decisiones
de Según sus costos,
probabilidades y  Son inestables
decisión beneficios  Pueden ser imprecisos
 Los cálculos complejos
pueden no ser adecuados
Dirigir un intercambio
Se pueden de ideas informal
usar para: Determina qué proyecto
es más rentable
Trazar un algoritmo que
anticipe matemáticamente Analiza los posibles resultados de cada proyecto
la mejor opción. y elige el proyecto que tiene más posibilidades
de generar mayores ganancias.

 Alta capacidad de
aprendizaje
Se componen de capas de Cada nodose conecta a  Capaces de crear
nodos, que contienen capa otro y tiene un peso y un modelos no lineales
de entrada, ocultas, y de umbral asociados.  Pueden entrenar un
Redes salida. modelo online
Se basan en datos para
neuronales aprender y mejorar su  Grandes cantidades
precisión con el tiempo. de datos
 Difíciles de interpretar
 Sobrentrenarse con
clasificar y agrupar datos mucha facilidad
Se pueden a gran velocidad.
usar para: Una de las redes neuronales
TIPOS DE Tareas de reconocimiento más conocidas es el algoritmo
ALGORITMOS DE de voz o reconocimiento de búsqueda de Google.
de imágenes.
APRENDIZAJE Están presentes en diagnóstico médico,
predicciones financieras, previsión de la
carga eléctrica, proceso y control de
calidad, identificación de compuestos
químicos.

Los datos se agrupan  Rapidez computacional


Método de agrupamiento  Todo punto pertenece a un
para ser más similares
que divide un conjunto cluster
K-means de datos en k grupos o
entre sí.
 Explicitar el numero de grupos
Clustering clusters. a buscar
Recopilar grandes
cantidades de  Depende mucho la semilla
información similar en inicial
un mismo lugar.  Especificar el numero de datos
a buscar
Se pueden Segmentación de clientes,  Sensible a outliers
usar para: clasificación de texto,
detección de anomalías
se utiliza cada vez más cuando las
empresas intentan inferir patrones y
Herramienta útil para la
optimizar sus ofertas de servicios.
agrupación de datos y el
aprendizaje automático.
Agrupar una base de datos de clientes en
distintos segmentos con características,
intereses o comportamientos similares

Permite entrenar Los algoritmos Requiere una pequeña cantidad de


modelos de IA correspondientes asignan datos de entrenamiento para
utilizando datos. objetos a distintas clases. estimar los parámetros necesarios.
Teorema de
Naive Bayes Atendiendo a determinadas Se sabe que Naive Bayes es un
Referencias características. mal estimador.
AM, P. (13 de Jul de 2023). medium. Obtenidodescribir
de medium:
la probabilidad Como filtrado de spam, clasificación de
Se pueden
de un evento
[Link]
texto, análisis de sentimientos y sistemas
usar para:
de recomendación.
y-miner%C3%ADa-de-datos-d37d5fdd8f22 basado en conocimientos
previos de condiciones

Bello, E. (31 de OCTUBRE de 2023). IEBS. Obtenido de IEBS:


[Link]
Computing, R. (2 de ago de 2023). computing. Obtenido de computing:
[Link]
que-es-como-funciona/
[Link]. (31 de 08 de 2020). [Link]. Obtenido de [Link]:
[Link]
sus-diferentes-tipos
designs, C. w. (2022). Cerpa web designs. Obtenido de Cerpa web designs:
[Link]
González, A. (2021). Cleverdata. Obtenido de Cleverdata:
[Link]
Iberdrola. (2024). Iberdrola. Obtenido de Iberdrola:
[Link]
automatico#:~:text=El%20Machine%20Learning%20es%20una,elaborar
%20predicciones%20(an%C3%A1lisis%20predictivo).
Iberdrola. (2024). Iberdrola. Obtenido de Iberdrola:
[Link]
aplicaciones
Ibero, J. (2023). iberasync.e. Obtenido de iberasync.e: [Link]
aprendizaje-computacional-machine-learning-aprendizaje-por-refuerzo-
supervisado-y-no-supervisado/
Innodata. (2024). Innodata. Obtenido de Innodata: [Link]
the-role-of-taxonomies-ontologies-schemas-and-knowledge-graphs/#:~:text=A
%20data%20taxonomy%20is%20the,of%20objects%20within%20a%20domain.
Marketer, B. D. (21 de 05 de 2023). Big Data Social. Obtenido de Big Data Social:
[Link]
de-la-ia/
Muñoz, L. M. (24 de 05 de 19). El periodico de aragon. Obtenido de El periodico de
aragon: [Link]
[Link]
Plan de Recuperación, T. y. (19 de 04 de 2023). Plan de Recuperación,
Transformación y Resiliencia. Obtenido de Plan de Recuperación,
Transformación y Resiliencia: [Link]
inteligencia-artificial-ia-prtr
Turing. (2024 ). turing. Obtenido de turing: [Link]
learning-can-be-helpful-in-data-mining

También podría gustarte