0% encontró este documento útil (0 votos)

97 vistas27 páginas

Algoritmo K-Means

Este documento describe el algoritmo no supervisado K-Means para agrupamiento de datos. K-Means divide los datos de entrada en K grupos, asignando cada dato al centroide más cercano y actualizando periódicamente la posición de los centroides. Se utiliza comúnmente para segmentar clientes, categorizar inventario y detectar anomalías. Si bien no existe un método definitivo para elegir K, se suele seleccionar el valor que minimice la distancia intra-grupo.

Cargado por

santiago navarro

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

97 vistas27 páginas

Algoritmo K-Means

Cargado por

santiago navarro

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Clustering: K-Means

ALGORITMO NO SUPERVISADO

Álvaro Ruiz
Andrés Rojas
Santiago Navarro
Bayron Tovar
Aprendizaje no Supervisado

- Algoritmos de clustering (K-Means)

- Análisis de componentes principales

- Descomposición en valores singulares (singular value decomposition)

- Análisis de componentes independientes (Independent Component Analysis)

CARACTERISTICAS

- Cluster

- Centroides

- Actualización de los centroides

K-Means
Capaz de definir el número de clusters.

Determina las coordenadas del centroide.

Determina la distancia de cada objeto a los centroides.

Agrupa los objetos basados en la menor distancia.

ALGORITMO DE K-MEANS

- Este algoritmo consta en dividir los datos de entradas en grupos diferentes.

- Recibe como entrada el número de grupos K y los datos de entrada.

- Las datos de entrada son un conjunto de características de las variables en

cuestión.

- Se inicia con valores estimados iniciales para los Kappa centroides

ETAPAS DEL ALGORITMO

1. Inicialización: una vez escogido el número de grupos, k, se

establecen k centroides en el espacio de los datos, por ejemplo,
escogiéndolos aleatoriamente.
2. Asignación objetos a los centroides: cada objeto de los datos es
asignado a su centroide más cercano.
3. Actualización centroides: se actualiza la posición del centroide de
cada grupo tomando como nuevo centroide la posición del promedio
de los objetos pertenecientes a dicho grupo.
FUNCION A OPTIMIZAR

S es el conjunto de datos

Xj está representado en vectores que representa una caracteristica

K es el numero de grupos

Ui es el centroide de cada grupo k

ACTUALIZACION DE CENTROIDES

La forma de actualizar los centroides se recalcula de tal

manera que se toma la media de todos los puntos de datos
asignados al grupo de ese centroide.
ELIGIENDO EL MEJOR K

- No existe un método como tal para elegir el mejor valor para K. El usuario
varía este valor en un rango que el permite obtener excelentes resultados.
- Una técnica muy usada comúnmente es comparar los diferentes
resultados de las distancias medias del conjunto de datos con su
centroide de grupo.
- A medida que K aumenta, la distancia entre los grupos de datos aumenta
hasta llegar a 0.
- validación cruzada, los criterios de información, el método de salto teórico
de la información, el método de silueta y el algoritmo G-medias.
USOS COMERCIALES
DEL ALGORITMO K-MEANS
USOS COMERCIALES
DEL ALGORITMO K-MEANS

El algoritmo de agrupamiento K- means se utiliza para encontrar

grupos que no se han etiquetado explícitamente en los
datos. Esto se puede usar para confirmar las suposiciones
empresariales sobre qué tipos de grupos existen o para identificar
grupos desconocidos en conjuntos de datos complejos.
Segmentación de usuarios/clientes basado en el
comportamiento:

• Utilizando datos como el comportamiento web, el patrón de

consume, se pueden agrupar clientes o usuarios en distintos
grupos.
• Segmento por historial de compra
• Segmentar por actividades en aplicación, sitio web o plataforma
• Definir personas basadas en intereses.
• Crear perfiles basados en el seguimiento de la actividad.
• Categorización de
inventario: agrupando
productos por su patrón de
venta.

• Inventario grupal por

actividad de ventas.
• Inventario grupal por
métricas de fabricación
• Detección de anomalías: según el comportamiento web es posible diferenciar
distintos grupos. Por ejemplo, usuarios humanos, bots, arañas web o trolls.

• Separe los grupos de actividad válidos de los bots.

• Grupo de actividad válida para limpiar la detección de valores atípicos.

NOTAS ADICIONALES Y
ALTERNATIVAS
INGENIERÍA DE CARACTERÍSTICAS

La ingeniería de características es el proceso de utilizar el conocimiento

del dominio para elegir qué métricas de datos se ingresarán como
características en un algoritmo de aprendizaje automático.
• El uso de características significativas
capturar la variabilidad de los datos
encuentra todos los grupos por medio de el algoritmo
• Los datos categóricos
las etiquetas de categoría como género, país, tipo de navegador
codificarse o separarse para que pueda funcionar el algoritmo
• Las transformaciones de características
Representan tasas en lugar de mediciones.
Ayudar a normalizar los datos.
ALTERNATIVAS

- Existe una serie de algoritmos - Un posible resultado es que no hay grupos en

alternativos de agrupación en los datos; en su lugar, todos los datos caen a lo
clústerin incluyen DBScan , agrupación largo de los rangos de características continuas
espectral y modelado con mezclas dentro de un solo grupo.
gaussianas. - Es posible revisar las características de los
- Una técnica de reducción de datos y será necesario incluir diferentes
dimensionalidad, como el análisis de mediciones o si la transformación de una
componentes principales, utilizada para característica mejora la variabilidad de los
separar grupos de patrones en los datos.
datos. - Es posible que desee imponer categorías o
etiquetas en función del conocimiento del
dominio
- modificar su enfoque de análisis.
EJEMPLO
GRACIAS…

También podría gustarte

Inteligencia Artificial2
Aún no hay calificaciones
Inteligencia Artificial2
21 páginas
K-means: Clustering Eficiente y Versátil
Aún no hay calificaciones
K-means: Clustering Eficiente y Versátil
18 páginas
K Means
Aún no hay calificaciones
K Means
17 páginas
Ensayo Bse de K-MEANS Y DBSCAN Hector Jhefferson Herrera Choque
Aún no hay calificaciones
Ensayo Bse de K-MEANS Y DBSCAN Hector Jhefferson Herrera Choque
9 páginas
Tema 3 No Supervisado
Aún no hay calificaciones
Tema 3 No Supervisado
40 páginas
Aprendizaje Automatico No Supervisado
Aún no hay calificaciones
Aprendizaje Automatico No Supervisado
40 páginas
Algoritmo K-means: Segmentación y Variantes
Aún no hay calificaciones
Algoritmo K-means: Segmentación y Variantes
9 páginas
Guía del Algoritmo K-Means en Clustering
Aún no hay calificaciones
Guía del Algoritmo K-Means en Clustering
6 páginas
Clustering K-means en Aprendizaje No Supervisado
Aún no hay calificaciones
Clustering K-means en Aprendizaje No Supervisado
20 páginas
Clustering en Minería de Datos
Aún no hay calificaciones
Clustering en Minería de Datos
49 páginas
Agrupamiento en Minería de Datos IA
Aún no hay calificaciones
Agrupamiento en Minería de Datos IA
39 páginas
Tecnicas de Clustering en Machine Learning
Aún no hay calificaciones
Tecnicas de Clustering en Machine Learning
12 páginas
Clustering - Algoritmo K-Means Power Bi
Aún no hay calificaciones
Clustering - Algoritmo K-Means Power Bi
21 páginas
5 AprendizajeNoSupervisado
Aún no hay calificaciones
5 AprendizajeNoSupervisado
54 páginas
Algoritmo K-Means: Clasificación No Supervisada
Aún no hay calificaciones
Algoritmo K-Means: Clasificación No Supervisada
4 páginas
Agrupación de Jugadores con K-Means
Aún no hay calificaciones
Agrupación de Jugadores con K-Means
20 páginas
K Means
Aún no hay calificaciones
K Means
25 páginas
Ensayo Bse de Datos
Aún no hay calificaciones
Ensayo Bse de Datos
4 páginas
K-Means y X-Means: Clustering Efectivo
Aún no hay calificaciones
K-Means y X-Means: Clustering Efectivo
14 páginas
Análisis de Agrupamiento y Clustering
Aún no hay calificaciones
Análisis de Agrupamiento y Clustering
22 páginas
Comparativa de K-means y Clustering Jerárquico
Aún no hay calificaciones
Comparativa de K-means y Clustering Jerárquico
11 páginas
K-Means Clustering: Guía y Proceso
Aún no hay calificaciones
K-Means Clustering: Guía y Proceso
1 página
Clase 10
Aún no hay calificaciones
Clase 10
53 páginas
Algoritmos de Clústering y Aplicaciones
Aún no hay calificaciones
Algoritmos de Clústering y Aplicaciones
75 páginas
Algoritmos de Clustering en IA
Aún no hay calificaciones
Algoritmos de Clustering en IA
7 páginas
APUNTE - No Supervisado
Aún no hay calificaciones
APUNTE - No Supervisado
6 páginas
K-Means: Clustering en Python
Aún no hay calificaciones
K-Means: Clustering en Python
14 páginas
2 1AprendizajeNoSupervisado
Aún no hay calificaciones
2 1AprendizajeNoSupervisado
33 páginas
Clase 6 Minería de Datos
Aún no hay calificaciones
Clase 6 Minería de Datos
64 páginas
Grupo 4 Practica 11
Aún no hay calificaciones
Grupo 4 Practica 11
7 páginas
K Means
Aún no hay calificaciones
K Means
4 páginas
Algoritmos y Medidas de Agrupamiento
Aún no hay calificaciones
Algoritmos y Medidas de Agrupamiento
6 páginas
Agrupamiento K-Means en Análisis de Datos
Aún no hay calificaciones
Agrupamiento K-Means en Análisis de Datos
6 páginas
Técnicas de Clustering: Análisis y Comparación
Aún no hay calificaciones
Técnicas de Clustering: Análisis y Comparación
4 páginas
Slides Clustering
Aún no hay calificaciones
Slides Clustering
22 páginas
Aprendizaje Automático - Teoría Tema6
Aún no hay calificaciones
Aprendizaje Automático - Teoría Tema6
21 páginas
Clase 2 - Machine Learning - Unsupervised
Aún no hay calificaciones
Clase 2 - Machine Learning - Unsupervised
32 páginas
Introducción al Aprendizaje No Supervisado
Aún no hay calificaciones
Introducción al Aprendizaje No Supervisado
37 páginas
Clustering: Análisis y Algoritmos Esenciales
Aún no hay calificaciones
Clustering: Análisis y Algoritmos Esenciales
13 páginas
Mejores Prácticas en Clustering K-means
Aún no hay calificaciones
Mejores Prácticas en Clustering K-means
87 páginas
Análisis de Clúster: Métodos y Aplicaciones
Aún no hay calificaciones
Análisis de Clúster: Métodos y Aplicaciones
33 páginas
Introducción al Clustering y Minería de Datos
Aún no hay calificaciones
Introducción al Clustering y Minería de Datos
20 páginas
Introducción al Clustering en Machine Learning
Aún no hay calificaciones
Introducción al Clustering en Machine Learning
40 páginas
LAD01347 DataMiningMachine U3
Aún no hay calificaciones
LAD01347 DataMiningMachine U3
71 páginas
Fundamentos del Aprendizaje No Supervisado
Aún no hay calificaciones
Fundamentos del Aprendizaje No Supervisado
39 páginas
Algoritmos de Clustering en Python
Aún no hay calificaciones
Algoritmos de Clustering en Python
11 páginas
Métodos de Clustering en SPSS
Aún no hay calificaciones
Métodos de Clustering en SPSS
27 páginas
Algoritmos de Clustering en Aprendizaje Automático
Aún no hay calificaciones
Algoritmos de Clustering en Aprendizaje Automático
3 páginas
Algoritmo K-means en Machine Learning
Aún no hay calificaciones
Algoritmo K-means en Machine Learning
33 páginas
Clase 08 - Parte II - Modelos Analíticos para DS III
Aún no hay calificaciones
Clase 08 - Parte II - Modelos Analíticos para DS III
13 páginas
Algoritmo Matematico
Aún no hay calificaciones
Algoritmo Matematico
7 páginas
Aprendizaje No Sup
Aún no hay calificaciones
Aprendizaje No Sup
14 páginas
Análisis de K-Means, DBSCAN y Fuzzy C-means
Aún no hay calificaciones
Análisis de K-Means, DBSCAN y Fuzzy C-means
5 páginas
Aprendizaje No Supervisado: Técnicas y Usos
Aún no hay calificaciones
Aprendizaje No Supervisado: Técnicas y Usos
49 páginas
Fundamentos del Aprendizaje No Supervisado
Aún no hay calificaciones
Fundamentos del Aprendizaje No Supervisado
19 páginas
Batería Gel 150AH
Aún no hay calificaciones
Batería Gel 150AH
2 páginas
Batería Gel 150AH
Aún no hay calificaciones
Batería Gel 150AH
2 páginas
Balance Neto
Aún no hay calificaciones
Balance Neto
19 páginas
Herramientas Esenciales para Fibra Óptica
Aún no hay calificaciones
Herramientas Esenciales para Fibra Óptica
4 páginas
Control Digital Con Matlab
Aún no hay calificaciones
Control Digital Con Matlab
176 páginas
Ejercicio 10
100% (3)
Ejercicio 10
11 páginas
Leccion 1 Evaluacion de Integrales
Aún no hay calificaciones
Leccion 1 Evaluacion de Integrales
2 páginas
Optimización del Problema de la Mochila
Aún no hay calificaciones
Optimización del Problema de la Mochila
20 páginas
EjerciciosNumeración PDF
Aún no hay calificaciones
EjerciciosNumeración PDF
2 páginas
Optimización de Documentos para SEO
Aún no hay calificaciones
Optimización de Documentos para SEO
19 páginas
Métodos de Resolución de Ecuaciones Numéricas
Aún no hay calificaciones
Métodos de Resolución de Ecuaciones Numéricas
31 páginas
Expresiones Regulares en Lenguajes Formales
Aún no hay calificaciones
Expresiones Regulares en Lenguajes Formales
14 páginas
Solución Ejercicio 3 - Punto A - Analisis Post-Optimo - Tarea 2
Aún no hay calificaciones
Solución Ejercicio 3 - Punto A - Analisis Post-Optimo - Tarea 2
81 páginas
Operaciones en Circuitos Digitales BCD
Aún no hay calificaciones
Operaciones en Circuitos Digitales BCD
13 páginas
Fundamentos de Algoritmos Numéricos
Aún no hay calificaciones
Fundamentos de Algoritmos Numéricos
3 páginas
Método de Ramificación y Acotamiento
Aún no hay calificaciones
Método de Ramificación y Acotamiento
1 página
Ejemplo de Solver Resuelto
Aún no hay calificaciones
Ejemplo de Solver Resuelto
5 páginas
Taller Final de Algoritmia: Pruebas y Resultados
Aún no hay calificaciones
Taller Final de Algoritmia: Pruebas y Resultados
2 páginas
Multígrafos: Propiedades y Teoremas
Aún no hay calificaciones
Multígrafos: Propiedades y Teoremas
11 páginas
Tarea 1
Aún no hay calificaciones
Tarea 1
2 páginas
Evaluacion Final - Escenario 8 - Segundo Bloque-Teorico-Practico - Virtual - Scheduling e Inventarios - (Grupo b01)
Aún no hay calificaciones
Evaluacion Final - Escenario 8 - Segundo Bloque-Teorico-Practico - Virtual - Scheduling e Inventarios - (Grupo b01)
11 páginas
Clasificación de Problemas Algorítmicos
Aún no hay calificaciones
Clasificación de Problemas Algorítmicos
16 páginas
Ordenar Nombres en Java
Aún no hay calificaciones
Ordenar Nombres en Java
42 páginas
Soluciones a Ejercicios de Grafos y Árboles
Aún no hay calificaciones
Soluciones a Ejercicios de Grafos y Árboles
14 páginas
Algoritmo de Transporte: Métodos y Ejemplo
Aún no hay calificaciones
Algoritmo de Transporte: Métodos y Ejemplo
10 páginas
Ejercicios de Planificación de CPU 2016
Aún no hay calificaciones
Ejercicios de Planificación de CPU 2016
3 páginas
Guía de Bucle For en Python
Aún no hay calificaciones
Guía de Bucle For en Python
9 páginas
Contadores Sincronos Ascendente-Decendentes
Aún no hay calificaciones
Contadores Sincronos Ascendente-Decendentes
8 páginas
Tarea Regresion Vs Interpolacion y Calculo R2
Aún no hay calificaciones
Tarea Regresion Vs Interpolacion y Calculo R2
4 páginas
Trabajo Práctico Individual Sistemas Digitales 1
Aún no hay calificaciones
Trabajo Práctico Individual Sistemas Digitales 1
10 páginas
Optimización de Flujos en Redes Logísticas
Aún no hay calificaciones
Optimización de Flujos en Redes Logísticas
13 páginas
Grafos: Ciclos de Euler y Hamilton
Aún no hay calificaciones
Grafos: Ciclos de Euler y Hamilton
9 páginas
Fundamentos de Complejidad Computacional
Aún no hay calificaciones
Fundamentos de Complejidad Computacional
3 páginas
Introducción a Programación y Algoritmos
Aún no hay calificaciones
Introducción a Programación y Algoritmos
18 páginas
Presentación (Ficha 8 - Ing. Karina Ligorria - 2024)
Aún no hay calificaciones
Presentación (Ficha 8 - Ing. Karina Ligorria - 2024)
30 páginas
Lab2 IOIIModeloRedes-SOLUCIÓN
100% (1)
Lab2 IOIIModeloRedes-SOLUCIÓN
25 páginas