0% encontró este documento útil (0 votos)

42 vistas13 páginas

Cluster y Metodos Graficos

Cargado por

Henry Jimenez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

42 vistas13 páginas

Cluster y Metodos Graficos

Cargado por

Henry Jimenez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD DE CUENCA

FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS

Docente:

Econ. Fabian Patricio Cordero Méndez

Integrantes:

Andrés Fabricio Guaman López

Henry Marcelo Jimenez Jimbo

Grupo:

EC – 05 – 01

Asignatura:

Análisis Multivariante

Tema:

Métodos gráficos y aplicación clúster

Índice
Análisis clúster ................................................................................................................. 3

Representación gráfica de una clasificación jerárquica (dendrograma) ....................... 3

Distintas formas de medir la distancia entre clusters: ................................................... 3

Método de la media (average linkage) ...................................................................... 3

Método del vecino más próximo ............................................................................... 4

Método del vecino más lejano (complete linkage).................................................... 4

Método de Ward (método de varianza mínima)........................................................ 4

Aplicación ......................................................................................................................... 6

Métodos gráficos ............................................................................................................ 10

Método Nubes dinámicas ............................................................................................ 10

Método grafico glyph .................................................................................................. 11

Método Caras de Chernoff .......................................................................................... 11

Análisis difuso ............................................................................................................ 12

Bibliografía ..................................................................................................................... 13
Análisis clúster

El Análisis Clúster es una técnica de análisis exploratorio de datos que sirve para resolver
problemas de clasificación. Consiste en ordenar objetos (personas, cosas, animales,
plantas, variables, etc.) en grupos o conglomerados de tal manera que el grado de
asociación entre miembros del mismo clúster sea más fuerte que el grado de asociación
entre miembros de diferente clúster.

Encontramos dos tipos de métodos de clasificación: jerárquicos y no jerárquicos. En los

primeros, la clasificación resultante tiene un número creciente de clases anidadas mientras
que en el segundo las clases no son anidadas. (Villardon, 2007)

Representación gráfica de una clasificación jerárquica (dendrograma)

Un dendrograma es una representación gráfica en forma de árbol que resume el proceso
de agrupación en un análisis clúster. Los objetos similares se conectan mediante enlaces
cuya posición en el diagrama está determinada por el nivel de similitud/disimilitud entre
los objetos. (Villardon, 2007)

Distintas formas de medir la distancia entre clusters:

Método de la media (average linkage)
En el método de la media, la distancia entre clusters se calcula como la distancia media
entre pares de observaciones, una de cada cluster. (Villardon, 2007)

Características:
– Proporciona clusters ni demasiado grandes ni demasiado pequeños.

- Pueden utilizarse medidas de la similitud o de la disimilitud.

- No es invariante por transformaciones monótonas de las distancias.

- Tiende a fusionar clusters con varianzas pequeñas y tiende a proporcionar clusters con
la misma varianza.

- Buena representación gráfica de los resultados.

Método del vecino más próximo

En el método del vecino más próximo la distancia entre dos clusters es el mínimo de las

distancias entre un objeto de un cluster y un objeto del otro. (Villardon, 2007)

Características:
- No es útil para resumir datos.

- Útil para detectar outliers (estarán entre los últimos en unirse a la jerarquía).

- Pueden usarse medidas de la similitud o de la disimilitud.

- Tiende a construir clusters demasiado grandes y sin sentido.

- Invariante bajo transformaciones monótonas de la matriz de distancias.

Método del vecino más lejano (complete linkage)

En el método del vecino más lejano la distancia entre dos clusters es el máximo de las
distancias entre un objeto de un cluster y un objeto del otro. (Villardon, 2007)

Características:
- Útil para detectar outliers.

- Pueden usarse medidas de la similitud o de la disimilitud.

- Tiende a construir clusters pequeños y compactos.

- Invariante bajo transformaciones monótonas de la matriz de distancias.

Método de Ward (método de varianza mínima)

La distancia entre dos clusters se calcula como la suma de cuadrados entre grupos en el
ANOVA sumando para todas las variables. En cada paso se minimiza la suma de
cuadrados dentro de los clusters sobre todas las particiones posibles obtenidas fusionando
dos clusters del paso anterior. Las sumas de cuadrados son más fáciles de entender cuando
se expresan como porcentaje de la suma de cuadrados total. (Villardon, 2007)
Características:
- El método suele ser muy eficiente.

- Tiende a crear clusters de pequeño tamaño.

- Se puede usar la matriz de distancias, así como una tabla de contingencia.

- Invariante bajo transformaciones monótonas de la matriz de distancias.

- Puede ser sensible a los outliers.

Método del centroide

El método del centroide es el que se utilizó en el ejemplo ilustrativo para la construcción

del dendrograma. La distancia entre dos clusters se calcula como la distancia entre los
centroides de los mismos, por tanto es necesario disponer de los valores originales de las
variables. (Villardon, 2007)

Características:
- Las variables deben estar en escala de intervalo.

- Las distancias entre grupos se calculan como las distancias entre los vectores medios.

- Si los tamaños de los dos grupos a mezclar son muy diferentes, entonces el centroide
del nuevo grupo será muy próximo al de mayor tamaño y probablemente estará dentro de
este grupo
Aplicación

Los fabricantes de automóviles deben adaptar sus estrategias de desarrollo de productos

y de marketing en función de cada grupo de consumidores para aumentar las ventas y el
nivel de fidelidad a la marca. Para esto se desea hacer un estudio de mercado sobre las
preferencias de los consumidores al adquirir automóviles y camiones. (Granada, s.f.)

Para realizar esta tarea se usaron las siguientes variables: ventas (en miles de unidades);
reventa (Valor de reventa en 4 años); tipo (Tipo de vehículo: 0 si es Automóvil; 1 si es
Camión); precio (en miles de dólares); motor (Tamaño del motor); CV (Caballos); pisada
(Base de neumáticos); ancho (Anchura); largo (Longitud); peso neto (Peso neto); depósito
(Capacidad de combustible); mpg (Consumo). (Granada, s.f.)

El estudio de mercado se va a ejecutar sólo para aquellos automóviles de mayor venta y

para realizarlo se usará el procedimiento Análisis de conglomerados jerárquico para
agrupar los automóviles de mayor venta en función de sus precios, fabricante, modelo y

En primer lugar, restringiremos el archivo de datos sólo a los automóviles de los que se
vendieron al menos 100.000 unidades. Para ello seleccionamos los casos que cumplan
esa condición.

Una vez seleccionada la muestra con la que vamos a trabajar, utilizamos el Análisis de
Conglomerados Jerárquicos para agrupar los automóviles de mayor venta en función de
sus precios, fabricante, modelo y propiedades físicas.
Utilizamos el método del vecino más lejano y estandarizamos las variables por
puntuaciones Z, lo que quiere decir que tiene media 0 y desviación típica 1.

Mediante el método de conglomeración del vecino más lejano se realiza una clasificación
fuerte de dos o tres grupos.
La primera gran diferencia es entre las etapas 5 y 6 (6 clusters), la segunda entre 8 y 9 (3
clusters) y entre 9 y 10 (2 clusters).
La decisión de esta clasificación se refleja en el dendrograma.

La división inicial del árbol forma dos grupos, (8, 11, 1, 6, 7, 10) y (2, 9, 3, 5, 4). El
clúster primero contiene los automóviles más pequeños y el segundo contiene los coches
más grandes.

El grupo de coches más pequeños se puede dividir en dos subgrupos, uno de ellos formado
por los coches más pequeños y más baratos. Así la división siguiente en 3 clusters:
(Accord (8), Camry (11), Cavalier (1)), (Focus (6), Civic (7), Corolla (10)), estos tres
coches son más pequeños y más baratos que los tres anteriores) y (Malibu (2), Gran Am
(9), Impala (3), Taurus (5), Mustang (4)), que son los coches más grandes.

Usando como Método de conglomeración la vinculación completa (Vecino más lejano),

se puede determinar la competencia que hay entre los vehículos en la fase de diseño.

A continuación, vamos a mostrar la Matriz de distancias y los conglomerados de

pertenencia
Métodos gráficos

Método Nubes dinámicas

El método de nubes dinámicas está dentro de los métodos de reasignación que permite
asignar un individuo a un grupo en un determinado paso del proceso, sea reasignado a
otro grupo en un paso posterior y dando como finalizado el proceso cuando no quedan
individuos que permitan optimizar el resultado que se ha conseguido.

Señalaremos a U como el conjunto de individuos (n) que se deducirá y clasificara que

están descritos por variables cuantitativas (p) 𝑥1 , 𝑥 2 , 𝑥 3 , … , 𝑥 𝑝 . El método de nubes
dinámicas este compuesto de dos tipos, en los cuales cada clase se representan por un
núcleo, estos son:

• Individuo promedio: se calculará el promedio de los individuos que conforman la

clase utilizando el centro de gravedad.
• Grupo de objetos representativos: Grupo de individuos escogidos de tal manera
que sean mas representativos de la clase.

Además, el método de nubes dinámicas se basa en reiterar dos operaciones: representar

una clasificación de grupo y hacer clasificaciones de los individuos mediante la
asignación de los individuos al núcleo más cercano.
Al tener una representación mediante k núcleos, los que estén más cerca al núcleo
formaran una partición y a su vez calcularan nuevos núcleos, ya sea como centros de
gravedad o pequeños grupos de elementos representativos de la clase, teniendo un leve
cambio a los núcleos que sirvieron para crear las clases. De esta manera se puede observar
que el método va aproximando poco a poco la solución que se obtendrá al final cuando
no núcleos sean estables. (Zelaya)

Método grafico glyph

Es una de las técnicas de visualización basadas en glifos aplicada a datos multivariantes,
proporciona una representación de los datos donde el conjunto es presentado como una
colección de objetos visuales, en este caso, estrellas.

La visualización de un glifo de estrella representa un conjunto de datos en la cada estrella

corresponde a un registro de datos independientes. Cada variable se representa por una
rama dentro de esa estrella que parte desde el origen y cuya longitud se corresponde al
valor de la variable en cuestión. Así, registros que compartan características similares
presentarían ramas del mismo tamaño, hasta el punto de que si son idénticos en todos los
aspectos llegarían a tener la misma forma. (Robledo, 2019)

Método Caras de Chernoff

Es importante saber que un análisis estadístico tradicional puede ser representado por
graficas de dispersión cuando se trate de graficar una variable, pero al tratarse de dos o
más variables, el análisis se vuelve más complejo.

Herman Chernoff es un matemática, estadístico y físico que invento las caras de chernoff
en 1973, lo que consiste en una representación gráfica donde variables cuantitativas de
un grupo se asocian a rostros humanos con sus diferentes partes individuales como: boca,
nariz, oídos y ojos. Además de representar valores de las variables por su forma, tamaño,
orientación y ubicación. Las caras de chernoff tiene como objetivo que las personas
puedan reconocer los rostros con pequeñas variaciones sin ninguna dificultad.

Edward Tufte, menciona que este tipo de gráfico de caras de Chernoff

"se reduciría bien, manteniendo la legibilidad incluso con áreas individuales de 0,05
pulgadas cuadradas como se muestra ... con caras de dibujos animados e incluso números
convirtiéndose en medidas de datos, pareceríamos haber llegado al límite de la economía
gráfica de presentación, imaginación y, admitámoslo, excentricidad”.
Otro punto de Tufte, sugiere que las caras sean asimétricas debido a que al tener caras
simétricas el lado izquierdo como el derecho, estas serán iguales presentando resultados
no útiles en tal estudio. (Reyes, 2018)

Análisis difuso
Es la lógica que utiliza expresiones que nos son ni completamente ciertas ni falsas. Para
ejemplificar lo antes dicho podemos pensar en un desierto, este no deja de serlo si se le
quita un particular grano de arena. Es más real afirmar que conforme el Sahara pierde
arena, la afirmación de que es un desierto va haciéndose menos verdad y que al quitar el
ultimo grano, la verdad desaparece por completo. (Morillas)
Bibliografía

Granada, U. d. (s.f.). Estadistica. Obtenido de estadistica:

http://wpd.ugr.es/~bioestad/guia-spss/practica-8/#10

Morillas, A. (s.f.). eumed. Obtenido de eumed: https://www.eumed.net/libros-

gratis/2006b/amr/index.htm

Reyes, I. L. (6 de Abril de 2018). reyesestadistica. Obtenido de reyesestadistica:

http://reyesestadistica.blogspot.com/2018/04/analisis-grafico-de-datos-
multivariados.html

Robledo, C. (Julio de 2019). digibuo. Obtenido de digibuo:

https://digibuo.uniovi.es/dspace/bitstream/handle/10651/59630/TFM_CristianRo
bledoLete.pdf?sequence=4

Villardon, J. (2007). academia. Obtenido de academia:

https://www.academia.edu/download/32334872/cluster.pdf

Zelaya, J. T. (s.f.). scalahed. Obtenido de scalahed:

https://gc.scalahed.com/recursos/files/r161r/w24529w/S10/NotasAMD.pdf

También podría gustarte

Analisis Cluster
Aún no hay calificaciones
Analisis Cluster
22 páginas
Análisis Cluster en Mercados
Aún no hay calificaciones
Análisis Cluster en Mercados
4 páginas
Análisis Cluster para Marketing
Aún no hay calificaciones
Análisis Cluster para Marketing
16 páginas
Grupo 2 - Analisis Cluster
Aún no hay calificaciones
Grupo 2 - Analisis Cluster
11 páginas
Análisis de Agrupación Jerárquica
Aún no hay calificaciones
Análisis de Agrupación Jerárquica
27 páginas
CLUSTER
Aún no hay calificaciones
CLUSTER
32 páginas
UNEXPO Doctorado - Tema 5 16122022 AM Conglomerados
Aún no hay calificaciones
UNEXPO Doctorado - Tema 5 16122022 AM Conglomerados
121 páginas
Análisis Cluster
Aún no hay calificaciones
Análisis Cluster
11 páginas
3F03 Aparicio Saul AMult2023
Aún no hay calificaciones
3F03 Aparicio Saul AMult2023
10 páginas
Analisis Cluster Métodos de Analisis Multivariante
Aún no hay calificaciones
Analisis Cluster Métodos de Analisis Multivariante
134 páginas
Cluster
Aún no hay calificaciones
Cluster
43 páginas
Diapositivas de Analisis Cluster
Aún no hay calificaciones
Diapositivas de Analisis Cluster
25 páginas
Análisis de Clúster: Métodos y Aplicaciones
Aún no hay calificaciones
Análisis de Clúster: Métodos y Aplicaciones
4 páginas
IMPRIME - Modelos - Clasificacion - y - Segmentacion - P1 - 2021
Aún no hay calificaciones
IMPRIME - Modelos - Clasificacion - y - Segmentacion - P1 - 2021
7 páginas
Analisis Cluster
Aún no hay calificaciones
Analisis Cluster
25 páginas
T4
Aún no hay calificaciones
T4
13 páginas
Análisis Multivariado y Métodos de Agrupamiento
Aún no hay calificaciones
Análisis Multivariado y Métodos de Agrupamiento
23 páginas
Analisis Por Conglomerados
Aún no hay calificaciones
Analisis Por Conglomerados
19 páginas
Clase Cluster
Aún no hay calificaciones
Clase Cluster
54 páginas
Clustering Jerárquico en Python
Aún no hay calificaciones
Clustering Jerárquico en Python
16 páginas
Análisis Cluster en SPSS: Guía Práctica
Aún no hay calificaciones
Análisis Cluster en SPSS: Guía Práctica
33 páginas
Regresión
Aún no hay calificaciones
Regresión
12 páginas
Análisis de Conglomerados Estadísticos
100% (2)
Análisis de Conglomerados Estadísticos
46 páginas
Análisis de Conglomerados Jerárquicos
Aún no hay calificaciones
Análisis de Conglomerados Jerárquicos
33 páginas
Aprendizaje No Supervisado Clustering
Aún no hay calificaciones
Aprendizaje No Supervisado Clustering
57 páginas
SESION 5 Cluster
Aún no hay calificaciones
SESION 5 Cluster
46 páginas
Clase 8 Análisis de Conglomerados
Aún no hay calificaciones
Clase 8 Análisis de Conglomerados
45 páginas
Modelos de Agrupacion - Analisis Cluster - SPSS
Aún no hay calificaciones
Modelos de Agrupacion - Analisis Cluster - SPSS
137 páginas
Analisis Expo Nubes Dispersion
Aún no hay calificaciones
Analisis Expo Nubes Dispersion
11 páginas
Agrupamientos
Aún no hay calificaciones
Agrupamientos
8 páginas
Trabajo Con Clusters
Aún no hay calificaciones
Trabajo Con Clusters
21 páginas
Análisis de Conglomerados (Cluster 1)
Aún no hay calificaciones
Análisis de Conglomerados (Cluster 1)
22 páginas
Guía de Análisis Cluster con SPSS
Aún no hay calificaciones
Guía de Análisis Cluster con SPSS
84 páginas
Análisis de Conglomerados
Aún no hay calificaciones
Análisis de Conglomerados
34 páginas
11-Análisis de Clúster
Aún no hay calificaciones
11-Análisis de Clúster
4 páginas
Analisis Cluster
Aún no hay calificaciones
Analisis Cluster
20 páginas
Minería de Datos de Informes Comerciales
Aún no hay calificaciones
Minería de Datos de Informes Comerciales
20 páginas
Clustering en R: Métodos y Evaluación
Aún no hay calificaciones
Clustering en R: Métodos y Evaluación
6 páginas
Análisis de Conglomerados PDF
100% (1)
Análisis de Conglomerados PDF
26 páginas
TRABAJOMULTIVARIADO 3 Final
Aún no hay calificaciones
TRABAJOMULTIVARIADO 3 Final
6 páginas
Análisis de Conglomerados: Técnicas y Métodos
Aún no hay calificaciones
Análisis de Conglomerados: Técnicas y Métodos
5 páginas
Clustering Jerárquico: Algoritmos y Ejemplo
Aún no hay calificaciones
Clustering Jerárquico: Algoritmos y Ejemplo
20 páginas
Graficos
Aún no hay calificaciones
Graficos
11 páginas
TIF Intro - Analisis Por Conglomerados
Aún no hay calificaciones
TIF Intro - Analisis Por Conglomerados
26 páginas
Analytics 2 - Semana 2
Aún no hay calificaciones
Analytics 2 - Semana 2
103 páginas
Aplicacion Del Metodo Cluster en R
Aún no hay calificaciones
Aplicacion Del Metodo Cluster en R
26 páginas
Estadística Aplicada al Mercado
Aún no hay calificaciones
Estadística Aplicada al Mercado
22 páginas
Práctica 8 - Estadística
Aún no hay calificaciones
Práctica 8 - Estadística
112 páginas
No Super Visa Do Agr Up Amien To
Aún no hay calificaciones
No Super Visa Do Agr Up Amien To
61 páginas
Análisis de Cluster Con SPSS
Aún no hay calificaciones
Análisis de Cluster Con SPSS
29 páginas
Analisis Cluster PDF
Aún no hay calificaciones
Analisis Cluster PDF
84 páginas
1 - Segmentación de Mercados
Aún no hay calificaciones
1 - Segmentación de Mercados
23 páginas
Expo Cluster
Aún no hay calificaciones
Expo Cluster
33 páginas
Conglomerados
Aún no hay calificaciones
Conglomerados
2 páginas
Tema 6.análisis de Cluster
Aún no hay calificaciones
Tema 6.análisis de Cluster
49 páginas
Apuntes Métodos Final
Aún no hay calificaciones
Apuntes Métodos Final
13 páginas
Análisis Clúster en Campos Petroleros
Aún no hay calificaciones
Análisis Clúster en Campos Petroleros
27 páginas
Practica - Quimica 3-1
Aún no hay calificaciones
Practica - Quimica 3-1
2 páginas
Lenguaje Literal vs. Figurado
Aún no hay calificaciones
Lenguaje Literal vs. Figurado
2 páginas
Experiencias Docentes Después Del Confinamiento: Comunovirus en El Aula
Aún no hay calificaciones
Experiencias Docentes Después Del Confinamiento: Comunovirus en El Aula
10 páginas
Planes de Clase Bloque 4 Basica Superior
Aún no hay calificaciones
Planes de Clase Bloque 4 Basica Superior
8 páginas
Las Normas Técnicas Más Utilizadas para Trabajos Escritos
Aún no hay calificaciones
Las Normas Técnicas Más Utilizadas para Trabajos Escritos
2 páginas
Feria de Salud-Información Inicial Docentes y Alumnos
Aún no hay calificaciones
Feria de Salud-Información Inicial Docentes y Alumnos
1 página
Sesiones Ansiedad
100% (2)
Sesiones Ansiedad
13 páginas
Dirección y Motivación en Administración
Aún no hay calificaciones
Dirección y Motivación en Administración
20 páginas
Mecánica de Fluidos: Contenidos y Evaluación
Aún no hay calificaciones
Mecánica de Fluidos: Contenidos y Evaluación
11 páginas
Guía n4 Textos Instructivos 5to 21 Copias
Aún no hay calificaciones
Guía n4 Textos Instructivos 5to 21 Copias
5 páginas
Municipio
Aún no hay calificaciones
Municipio
7 páginas
Investigación Simuladores
Aún no hay calificaciones
Investigación Simuladores
245 páginas
Modelo Psicodinámico PDF
50% (2)
Modelo Psicodinámico PDF
47 páginas
10 Ecuaciones de Balance
Aún no hay calificaciones
10 Ecuaciones de Balance
22 páginas
Esmalte de Poliuretano
Aún no hay calificaciones
Esmalte de Poliuretano
4 páginas
Cox y Venegas (2021)
Aún no hay calificaciones
Cox y Venegas (2021)
16 páginas
Plantilla Procedimiento
Aún no hay calificaciones
Plantilla Procedimiento
2 páginas
Didáctica General
100% (1)
Didáctica General
12 páginas
Ensayos No Destructivos en Aceros
100% (1)
Ensayos No Destructivos en Aceros
5 páginas
PROYECTO DE APRENDIZAje
Aún no hay calificaciones
PROYECTO DE APRENDIZAje
2 páginas
6 Examen Semanal Pre U Puno Con Claves
Aún no hay calificaciones
6 Examen Semanal Pre U Puno Con Claves
5 páginas
Oferta Habilitación Unimarc Rancagua
Aún no hay calificaciones
Oferta Habilitación Unimarc Rancagua
32 páginas
Especificaciones del Ventilador SLE6000
Aún no hay calificaciones
Especificaciones del Ventilador SLE6000
2 páginas
Agropecuaria Prod Pecuaria 11
Aún no hay calificaciones
Agropecuaria Prod Pecuaria 11
258 páginas
Quimica General
Aún no hay calificaciones
Quimica General
11 páginas
Análisis de Corrientes Psicopedagógicas
Aún no hay calificaciones
Análisis de Corrientes Psicopedagógicas
20 páginas
Hormigon Armado
Aún no hay calificaciones
Hormigon Armado
8 páginas
HOMEOPATIA
Aún no hay calificaciones
HOMEOPATIA
15 páginas
Tríptico Biología Marina
Aún no hay calificaciones
Tríptico Biología Marina
2 páginas
Trabajo de Quimica General
Aún no hay calificaciones
Trabajo de Quimica General
17 páginas