91% encontró este documento útil (11 votos)
5K vistas1321 páginas

Analisis Multivariado

anlisis multivariado de variables estadisticas

Cargado por

sergio
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
91% encontró este documento útil (11 votos)
5K vistas1321 páginas

Analisis Multivariado

anlisis multivariado de variables estadisticas

Cargado por

sergio
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ANÁLISIS

MULTIVARIADO
Javier Bech Vertti
Análisis Multivariado

Primera edición 2019

D.R. © Universidad Autónoma de Aguascalientes


Av. Universidad No. 940
Ciudad Universitaria
C.P. 20131, Aguascalientes, Ags.
www.uaa.mx/direcciones/dgdv/editorial/

© Javier Bech Vertti

ISBN 978-607-8652-68-6

Hecho en México / Made in Mexico


_________________________________Cuaderno de trabajo de: Análisis Multivariado. PRÓLOGO

PRÓLOGO

El “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO”, es una obra


elaborada durante mi jubilación para apoyar en particular al estudiante de
la carrera de Mercadotecnia y a otros estudiantes de carreras afines
adscritas al Centro de Ciencias Económicas y Administrativas de la
U.A.A., en el estudio de los conceptos estadísticos durante el desarrollo de su
curso “Análisis Multivariado”, o bien como fuente de consulta general, por
medio de una gran variedad de ejemplos ilustrativos resueltos en detalle,
actividades de aprendizaje, autoevaluaciones, ejercicios de refuerzo y
sesiones de inducción a los software estadísticos Excel y Minitab, así
como un sin número de ayudas didácticas que incluyen ejercicios
complementarios, autoevaluaciones con reactivos de falso o verdadero y de
opción múltiple, un amplio glosario de términos, simbología utilizada, fórmulas
claves utilizadas en cada capítulo. Las respuestas a gran parte de los ejercicios
planteados en el “Cuaderno de Trabajo: Análisis multivariado” se
desarrolará por separado como guía adicional.

Este “Cuaderno de Trabajo: Análisis Multivariado”, fue diseñado en


principio como auxiliar para el estudiante y en forma opcional para el
profesor que lo desee utilizar como guía del curso en el planteamiento y
resolución de los ejercicios aquí planteados coadyuvando con esto en el
proceso enseñanza-aprendizaje durante el desarrollo del curso de “Análisis
Multivariado” o como fuente de consulta general. Debo hacer hincapié en que
NO pretende suplir en forma alguna la labor del docente en el aula, sin
embargo la forma de abordar los contenidos de la materia permite ampliar y
reforzar los temas tratados en el curso así como estimular nuevas
prácticas pedagógicas y herramientas, para construir un aprendizaje
significativo en el aula de clase y que en forma muy puntual debe llevar al
estudiante a ser capaz de: comprender los principios del análisis
multivariado y aplicar algunos métodos de reducción y de clasificación en
problemas de su área de estudio en el ámbito de los fenómenos económicos,

3
_________________________________Cuaderno de trabajo de: Análisis Multivariado. PRÓLOGO
financieros, comerciales y administrativos, demostrando capacidad para
analizar e interpretar resultados numéricos estadísticos en contextos
específicos.

El “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO” está organizado


en tres capítulos en principio para la carrera de Mercadotecnia:
Introducción y análisis previo de los datos multivariados, Métodos de
reducción y Métodos de clasificación. En cada uno de ellos se tratan
contenidos relevantes del tema y por eso, todos se inician con la descripción
de los aprendizajes esperados que debe lograr el estudiante. Cada
contenido a partir del segundo capítulo se estructura en las siguientes secciones:

1. Síntesis de los conceptos básicos: es un resumen de los conceptos


centrales involucrados en los aprendizajes en el aula de clase.
Asimismo, se encuentran las principales fórmulas y relaciones
numéricas que sustentan la Estadística.
2. Ejemplos ilustrativos resueltos: en esta sección se plantean
ejercicios representativos de la clase y se resuelven en detalle.
3. Actividades de aprendizaje: esta sección le permitirá al estudiante
fijar las ideas y están diseñados para ser resueltos primero en forma
convencional, es decir a mano, y posteriormente utilizando un software
estadístico para comparar sus resultados, fomentando así la
retroalimentación correspondiente.
4. Autoevaluaciones: esta sección le permitirá al estudiante ejercitar los
aprendizajes en el aula de clase y podrá autoevaluar su desempeño y
darse cuenta en que puntos o áreas se encuentra más débil y en cuales
más fuerte para así enfocar sus esfuerzos en los puntos más débiles,
ahorrándole tiempo en la preparación de su examen departamental.
5. Ejercicios de refuerzo: en esta sección, se presentan varios ejercicios
para su resolución, orientados a la preparación del estudiante para el
examen departamental del capítulo.
6. Ejemplos ilustrativos resueltos en Excel y/o Minitab: esta
sección utiliza pantallas de captura, cuadros de dialogo, gráficos y
salidas de resultados que le permitirá al estudiante familiarizarse con los
comandos básicos necesarios para lograr buenos resultados con estos
software estadísticos.
7. Notas al margen izquierdo: esta sección le permitirá advertir al
estudiante de algún aspecto a remarcar o alertar de lo que se dice en el
texto desarrollando su capacidad de análisis al tener que comprender y
examinar el texto minuciosamente.

4
_________________________________Cuaderno de trabajo de: Análisis Multivariado. PRÓLOGO
Uso de calculadora y software estadístico: Para trabajar con el presente
“Cuaderno de trabajo: Análisis Multivariado”, el estudiante debe usar
calculadora y algún software estadístico. En cuanto al uso de la
calculadora, se tomó como referencia la calculadora Casio fx.82MS, El uso
de un software estadístico como Excel y/o Minitab, entre otros, reduce de
gran manera el tiempo de cálculo y la probabilidad de cometer errores en los
cálculos aritméticos, sin embargo se deben comprender primero los pasos del
proceso. Por lo mismo es muy importante que primero se resuelva el
ejercicio en forma manual y posteriormente se utilice un software para
comparar los resultados. Es importante mencionar que pueden existir
diferencias en las respuestas debido a la cantidad de dígitos que se
utilizan en los cálculos manuales. Dado que en algunos contenidos se utiliza
álgebra matricial, se sugiere utilizar en general aproximaciones de al
menos 5 dígitos.

Al final de cada capítulo se presenta la siguiente ayuda didáctica:

• Autoevaluaciones con reactivos de falso o verdadero y de opción


múltiple que permitirá reforzar el aprendizaje del alumno.

Al final del “Cuaderno de trabajo: Análisi Multivariado”, se presenta:

• Un glosario de términos de los conceptos expuestos.


• Simbología utilizada.
• Fórmulas clave que apoyan la resolución de los ejercicios propuestos
en cada sección.
• Apéndice con Tablas.
• Bibliografía.

Y en un anexo aparte al “Cuaderno de trabajo: Análisis Multivariado”, se


presentan las:

• Respuestas a los ejercicios planteados en las actividades de


aprendizaje, autoevaluaciones y ejercicios, así como de las
autoevaluaciones con reactivos de de falso o verdadero y de opción
múltiple y/o llenado del enunciado de cada capítulo.

5
_________________________________Cuaderno de trabajo de: Análisis Multivariado. PRÓLOGO
Finalmente… el viejo refrán que dice que “La práctica hace al maestro”
tiende a ser mas cierto de lo que muchas veces pensamos. La práctica, y no la
genética, es lo que hace al maestro. Y es la perseverancia, a lo largo del
tiempo, lo que verdaderamente saca adelante a los triunfadores, por eso este
“Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO” se ha elaborado
con la finalidad de que el estudiante ejercite los procedimientos que se
sugieren a lo largo del curso de “Análisis Multivariado”, pensando que
entre más se practique, mucho mayor será la comprensión que se tenga de
ellos. Este material pude ser de estudio independiente o combinado con las
instrucciones del docente en caso de que se opte por utilizarlo como guía de
estudio. Se recomienda utilizarlo como material de apoyo, para reforzar
conocimientos, para autoevaluarse, o como preparación para la
evaluación presencial. Lo importante es que le sirva al estudiante para
que identifique cuáles son los temas que necesita reforzar y para darse
cuenta de los logros que ha alcanzado. Espero que sea de
utilidad.

6
_______________________________Cuaderno de trabajo de: Análisis Multivariado. PROYECTO

PROYECTO DE
JUBILACIÓN 2019
ARQ. Y M. EN ADMÓN. JAVIER
BECH VERTTI

P.1 PROBLEMÁTICA Y
NECESIDADES.

Ante la carencia de un Cuaderno de Trabajo para el estudio y la enseñanza


de las metodologías estadísticas necesarias para entender el
comportamiento de algunos fenómenos aleatorios relacionados con el
área de Mercadotecnia, que permita desarrollar en el alumno habilidades
para aplicar dichas metodologías asociadas al análisis de datos y dado que se
requiere de la consulta de una vasta bibliografía , se ha observado, a través
de 30 años de experiencia docente, que los alumnos suelen limitarse a los
apuntes que el profesor les ofrece, eventualmente consultan algún
texto y en pocas ocasiones acuden a asesoría; lo que redunda en un bajo
nivel de aprovechamiento, evidente en los trabajos y exámenes que realizan.

Por lo que hace a los profesores, también se ha observado que eligen como
apoyo algún texto base, que puede no apegarse completamente al
programa de la materia y complementan con otros textos los temas
faltantes para la elaboración de apuntes y trabajos, con lo que dejan
puntos del programa parcialmente cubiertos o sin cubrir además de la
falta de uniformidad en la nomenclatura al utilizar varios textos lo que
crea conflicto en los alumnos que por alguna razón, deben repetir el curso.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI________________________________________7


_______________________________Cuaderno de trabajo de: Análisis Multivariado. PROYECTO

En la mayoría de los textos no se incluye ningún apartado para realizar


actividades extra clase ni de autoevaluación, con el que los alumnos
puedan en forma personal reafirmar y evaluar sus conocimientos a
medida que avanza el semestre y retroalimentarse para preparar sus
exámenes, por lo que no se puede fomentar en forma efectiva el
proceso de auto aprendizaje que marca tanto el programa de la materia
como el modelo educativo adoptado por la Institución donde el alumno
debe ser un agente activo con una orientación constructivista.

P.2 JUSTIFICACIÓN
DEL PROYECTO

De acuerdo a la problemática y necesidades planteadas, se justifica el


esfuerzo para remediarlas mediante la elaboración de un “Cuaderno de
Trabajo para la Materia de Análisis Multivariado” principalmente para la
carrera de Mercadotecnia, con posibilidad de utilizarse en carreras afines
adscritas al Centro de Ciencias Aconómicas y Administrativas. La materia
de Análisis Multivariado en la carrera de Mercadotecnia se cursa hasta la
elaboración del presente trabajo en el quinto semestre y el cuaderno de
trabajo conducirá a los alumnos en su estudio permitiéndoles ampliar de
forma importante su horizonte de conocimientos. Asimismo, servirá de
apoyo para el desarrollo del trabajo de los profesores uniformizando por
un lado tanto los criterios, niveles y alcances establecidos por la
Academia correspondiente al curso por el Departamento de Estadística
para cada contenido, como la nomenclatura que pudiera utilizar el
profesor, evitando así la confusión de los alumnos que por algún motivo
tuvieran que recursar la materia; además el profesor podrá contar como
apoyo con una serie de actividades individuales y/o grupales así como
reactivos o ítems para que los alumnos desarrollen y/o realicen
autoevaluaciones ya sea en forma presencial en el aula de clase o bien
mediante alguna plataforma ó Software de cómputo estadístico como
pudieran ser Moodle, Minitab y/o Excel, que ya tiene habilitado el
Departamento de Estadística como apoyo para algunos cursos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI________________________________________8


_______________________________Cuaderno de trabajo de: Análisis Multivariado. PROYECTO

P.3 OBJETIVO GENERAL Y


OBJETIVOS PARTICULARES

a) General:

Elaborar un documento que sirva como “Cuaderno de Trabajo:


ANÁLISIS MULTIVARIADO” para la materia de “Análisis
Multivariado” de la Carrera de Licenciado en Mercadotecnia y/o
carreras afines adscritas al Centro de Ciencias Administrativas
de la U.A.A., o como de consulta general, que contenga material útil
para estudiar y entender el comportamiento de fenómenos aleatorios
relacionados con el área de la Mercadotecnia dentro del programa de
Análisis Multivariado para la carrera de Mercadotecnia, ofreciendo a
alumnos y profesores información diversa y actualizada, así como
herramientas para construir un aprendizaje significativo en el
aula de clase, que contribuya a mejorar la calidad de la educación,
cercanos a la realidad que viven los estudiantes de nuestro Estado y por
ende del país.

b) Específicos:

• Que el “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO”


impacte en los procesos educativos y de enseñanza-aprendizaje
por medio de la interacción de los alumnos con los contenidos
pedagógicos incorporados en el mismo.
• Que el “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO” se
pueda utilizar como una herramienta de apoyo docente en el
tratamiento de los temas y contenidos de los libros de Texto, con base
en el programa de la materia de Análisis Multivariado de
Mercadotecnia, o como de consulta general, con la finalidad de
ampliar y reforzar los temas que en ellos se traten, así como
estimular nuevas prácticas pedagógicas y herramientas, para
construir un aprendizaje significativo en el aula de clase.
• Que el “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO”
defina al profesor como guía y mediador del proceso de debate,
reflexión y participación que se genere en el aula y le sugiera
estrategias didácticas e innovadoras para el tratamiento de los

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI________________________________________9


_______________________________Cuaderno de trabajo de: Análisis Multivariado. PROYECTO

contenidos curriculares, a fin de integrarlas a sus experiencias y


métodos propios.
• Que el “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO”
indique la posible incorporación de las TIC´S en los procesos
educativos, a fin de establecer un puente natural entre la forma
tradicional de presentar los contenidos curriculares y las
posibilidades que brindan las nuevas tecnologías.

P.4 METAS Y/O


ACTIVIDADES

Desarrollar contenidos marcados en el programa de la materia de Análisis


Multivariado de la carrera de Mercadotecnia, mediante:

a) La revisión bibliográfica para la selección y compilación del material


idóneo para el programa de la materia.
b) Estructuración del material.
• Breve introducción de conceptos básicos.
• Elaboración de ejemplos ilustrativos.
• Actividades para desarrollar en clase y/o laboratorio, en forma
individual y/o grupal.
• Sesiones de inducción y/ o prácticas de laboratorio para ser
realizadas con algún paquete de cómputo, con ejemplos
ilustrativos.
• Propuestas de problemas, ejercicios y/o tareas para reforzar los
temas con y sin respuestas.
c) Autoevaluaciones para resolver en clase o para que el profesor pueda
capturarlas y aplicarlas en algún medio digital como la plataforma Moodle
que el Departamento de Estadística ya tiene a disposición de los
docentes.
d) Apéndices.
e) Glosario de términos.
f) Formularios.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI________________________________________10


_______________________________Cuaderno de trabajo de: Análisis Multivariado. PROYECTO

P.5 OBSERVACIONES
GENERALES

El “Cuaderno de Trabajo: ANÁLISIS MULTIVARIADO” aunque va dirigido


específicamente a la carrera de Mercadotecnia podrá ser utilizado
perfectamente como apoyo o consulta general durante el desarrollo de la
materia de “Análisis Multivariado” en carreras afines adscritas al Centro
de Ciencias Económicas y Administrativas u otros Centros Académicos
de la U.A.A y/o equivalentes a la Academia correspondiente del
Departamento de estadística de la U.A.A.

P.6 AGRADECIMIENTOS

A IMELDA, mi esposa, por la paciencia y apoyo A ANGÉLICA, mi hija, por la ardua labor de
tan grande que ha tenido siempre conmigo y en transcribir el presente trabajo de la forma
particular, durante el desarrollo de este trabajo. manuscrita a la forma digital.

A CRISTINA VALDERRAMA, mi exalumna, por A la U.A.A., mi «alma mater» ,a los CENTROS


su gran ayuda durante su servicio social al BÁSICO Y ECONÓMICO ADMINISTRATIVO,
desarrollar manualmente los ejercicios que se DEPARTAMENTOS DE ESTADÍSTICA Y
presentan en este trabajo. MERCADOTECNIA, , por todas las facilidades
que me otorgaron para poder llegar hasta este
momento.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI________________________________________11


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

CONTENIDO

_______________________________________________________

CAPÍTULO 1. INTRODUCCIÓN AL ANÁLISIS MULTIVARIANTE

CAPÍTULO
Capítulo 1. Introducción al Análisis Multivariante …………………….…………………………………………… 22
Objetivo 1.1 …………………………………………………………………………………………..……………………….. 22
Antecedentes………………………………………………………………………………………………………………………… 22
Introducción al análisis multivariante………………………………………………………………………………………. 23
Conceptos Básicos. Análisis Multivariante………………………………………………..………………………………. 23
Objetivo 1.2………………………………………………………………………………………..…………………………….. 27
Antecedentes………………………………………………………………………….………………………….………………… 27
1.2.1. Valor teórico. Escalas de medición y su relación con las técnicas
multivariantes………………………………………………………………………………………………………..…………. 27
Conceptos básicos. Valor Teórico…………………………………………………..………………………………………. 28
1.2.2. Base de Datos. Formato de Encuesta sobre Bienes Raíces. Código para la
computadora. Construcción de la Base de datos “BIENES1”…………………………………………... 32
Conceptos Básicos. Base de Datos………………………………………………………………………………..………… 32
1.2.2.1. Ejemplo Ilustrativo en Minitab 17. Construcción de la Base de datos “BIENES1”……………… 40
Objetivo 1.3……………………………………………………………………………………………………….…….……….. 44
Antecedentes………………………………………………………………………………………………………..……………… 45
1.3.1. Análisis Previo de los datos multivariantes. Examen gráfico de los datos
multivariantes. Datos Ausentes. Casos Atípicos………………………………………………………………. 45
Conceptos Básicos. Examen gráfico de los datos multivariantes. Datos Ausentes. Datos ó Casos
Atípicos………………………………………………………………………………………………………………………………… 45
1.3.1.1. Ejemplo Ilustrativo. Datos Atípicos. Diagrama de Caja y Brazos Simple………..………………… 57
1.3.1.1 Actividad de Aprendizaje. Datos Atípicos. Diagrama de Caja y Brazos Simple…………………… 60
1.3.1.1 Ejercicio de Autoevaluación. Datos Atípicos. Diagrama de Caja y Brazos Simple………..…….. 61
1.3.1.1 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de Caja y Brazos Simple………………………. 62
1.3.1.1.1 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de caja y Brazos Simple……….… 62
1.3.1.1.2 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de Caja y Brazos Simple………… 62
1.3.1.1.3 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de Caja y Brazos Simple…..……. 63

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________12


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

1.3.1.2. D.A. Ejemplo Ilustrativo en Minitab 17. Datos Atípicos………………………………………………….. 63


1.3.1.2 Actividad de Aprendizaje en Minitab 17. Datos Atípicos……………………………..………………….. 65
1.3.1.2 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos……………………………………………… 65
1.3.1.2 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos……………………………………………………… 66
1.3.1.2.1 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos……………………..……………….. 66
1.3.1.2.2 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos………………………..…………….. 66
1.3.1.2.3 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos…………………………..………….. 66
1.3.1.3. D.A. Ejemplo Ilustrativo en Minitab 17. Datos Atípicos. Un Nivel de Factor……………..……… 67
1.3.1.3 Actividad de Aprendizaje en Minitab 17 . Datos Atípicos. Un Nivel de Factor…………………… 71
1.3.1.3 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Un Nivel de Factor……….......... 72
1.3.1.3 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de Factor………………………. 72
1.3.1.3.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de Factor……….. 72
1.3.1.3.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de Factor……….. 73
1.3.1.3.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de
Factor………………………………………………………………………………………………………………………………… 73
1.3.1.4. D.A. Ejemplo Ilustrativo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 74
1.3.1.4 Actividad de Aprendizaje en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 77
1.3.1.4 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 77
1.3.1.4 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 78
1.3.1.4.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 78
1.3.1.4.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 78
1.3.1.4.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 79
1.3.1.5. D.A. Ejemplo Ilustrativo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple…………………………………………………………………………………………………………………………….. 80
1.3.1.5 Actividad de Aprendizaje en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 87
1.3.1.5 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 87
1.3.1.5 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 88
1.3.1.5.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 88
1.3.1.5.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 88
1.3.1.5.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple……………………………………………………………………………………………………………………………… 89
1.3.2. Análisis Previo de los datos multivariantes. Verificación de los supuestos del
Análisis Multivariante. Normalidad Homocedasticidad y linealidad……………………………….. 89
1.3.2.1. P.N. Ejemplo Ilustrativo en Minitab 17. Prueba de Normalidad. Prueba de Anderson

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________13


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

Darling………………………………………………………………………………………………………………………………. 94
1.3.2.1 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de Normalidad.
Prueba de Anderson Darling………………………………………………………………………………………………… 98
1.3.2.1 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
Normalidad. Prueba de Anderson Darling………………………………………………………………………………. 99
1.3.2.1 Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de Normalidad.
Prueba de Anderson Darling…………………………………………………………………………………………………. 99
1.3.2.1.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Normalidad. Prueba de Anderson Darling………………………………………………………………………………. 99
1.3.2.1.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Normalidad. Prueba de Anderson Darling………………………………………………………………………………. 100
1.3.2.1.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Normalidad. Prueba de Anderson Darling………………………………………………………………………………. 100
1.3.2.2. P.H. Ejemplo Ilustrativo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos…………………… 100
1.3.2.2 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos…………………… 100
1.3.2.2 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos…………………… 117
1.3.2.2 Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos…………………… 118
1.3.2.2.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de
Gráficos……………………………………………………………………………………………………………………………… 119
1.3.2.2.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de
Gráficos……………………………………………………………………………………………………………………………… 119
1.3.2.2.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de
Gráficos……………………………………………………………………………………………………………………………… 120
1.3.2.3. P.H. Ejemplo Ilustrativo en Minitab 17. Prueba de Homocedasticidad. Prueba de
Barlett……………………………………………………………………………………………………………………………….. 121
1.3.2.3 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 128
1.3.2.3 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 128
1.3.2.3 Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 129
1.3.2.3.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 129
1.3.2.3.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 129
1.3.2.3.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………. 130
Objetivo 1.4 Sistema de Ecuaciones Lineales…………………………………………………................. 130
Antecedentes………………………………………………………………………………………………………………………… 130

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________14


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

1.4.1 Sistemas matriciales de resolución de Sistemas de Ecuaciones Lineales……………… 131


Conceptos Básicos. Sistemas matriciales de resolución de sistemas lineales de
ecuaciones……………………………………………………………………………………………………………..……………. 131
1.4.1.1. Ejemplo ilustrativo. Resolución de un Sistema Lineal de Ecuaciones mediante el Método
de matriz Inversa………………………………………………………………………………………………………….……… 133
1.4.1.1 Actividad de Aprendizaje. Resolución de un Sistema Lineal de Ecuaciones mediante el
Método de matriz Inversa………………………………………………………………………………………………………. 135
1.4.1.1 Ejercicio de Autoevaluación. Resolución de un Sistema Lineal de Ecuaciones mediante el
Método de matriz Inversa……………………………………………………………………………………………………. 135
1.4.1.1 Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante el Método
de matriz Inversa………………………………………………………………………………………………………………….. 136
1.4.1.1.1. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante
el Método de matriz Inversa…………………………………………………………………………………………………… 136
1.4.1.1.2. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante
el Método de matriz Inversa…………………………………………………………………………………………………… 136
1.4.1.1.3. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante
el Método de matriz Inversa…………………………………………………………………………………………………… 136
1.4.1.2. Ejemplo Ilustrativo en Excel. Resolución de un sistema lineal de ecuaciones mediante el
método de matriz inversa………………………………………………………………………………………………………. 137
1.4.1.2 Actividad de Aprendizaje en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa…………………………………………………………………………………….. 145
1.4.1.2 Ejercicio de Autoevaluación en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa…………………………………………………………………………………….. 145
1.4.1.2 Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones mediante
el Método de matriz Inversa…………………………………………………………………………………………………… 147
1.4.1.2.1. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa…………………………………………………………………………………….. 147
1.4.1.2.2. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa…………………………………………………………………………………….. 147
1.4.1.2.3. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa…………………………………………………………………………………….. 147
Autoevaluación con reactivos de Falso ó Verdadero……………………………………………………….. 148
Autoevaluación con reactivos de Opción Múltiple…………………………………………………………… 151
ANÁLISISARIANTE
ULO 2. MÉTODOS

CAPÍTULO 2. MÉTODOS DE REDUCCIÓN

DE REDUCCIÓN
Capítulo 2. Métodos de Reducción..………………………………………..……………………………………… 155
Objetivo 2.1 Componentes Prtincipales, Factor Análisis…………………………………..…………… 155
Antecedentes…………………………………………………………………………………………………………………..…. 155
2.1.1. Factor, Carga de Factor, Porcentaje de variación explicada, Comunalidad…………………..…… 155
Conceptos Básicos. Análisis de Factores………………………………………………………………………………. 155

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________15


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

2.1.1.1. Ejemplo Ilustrativo………………………………………………………………………………………………… 162


Ejemplo Ilustrativo 2.1.1.1. Factor Análisis…………………………………………………………………………… 162
2.1.1.1. Actividad de Aprendizaje………………………………………………………………………………………… 168
Actividad de Aprendizaje 2.1.1.1. Factor Análisis………………………………………………………………….. 168
2.1.1.1. Ejercicio de Autoevaluación. ………………………………………………………………………………….. 171
Autoevaluación 2.1.1.1. Factor Análisis………………………………………………………………………………... 171
2.1.1.1. Ejemplo Ilustrativo en Minitab 17…………………………………………………………………………….. 172
Ejemplo ilustrativo Integral en Minitab 17 2.1.1.1. Factor Análisis……………………………………………. 172
2.1.1.1. Ejercicios de Refuerzo……………………………………………………………………………………………. 185
Ejercicios de Refuerzo 2.1.1.1. Factor Análisis………………………………………………………………………. 185
2.1.1.1.1. Ejercicios de Refuerzo. Factor Análisis……………………………………………………….. 185
2.1.1.1.2. Ejercicios de Refuerzo. Factor Análisis……………………………………………………….. 186
2.1.1.1.3. Ejercicios de Refuerzo. Factor Análisis……………………………………………………….. 186
Objetivo 2.2. Análisis de Conglomerados. (Cluster Análisis)……………….……………………….. 187
Antecedentes…………………………………………………………………………………………………………………….. 187
2.2.1 Análisis de Conglomerados. Medidas de distancia y similitud. Método jerárquico
aglomerativo…………………………………………………………………………………………………………………….. 187
Conceptos básicos. Análisis de Conglomerados……………………………………………………………………… 187
2.2.1.1. Ejemplo ilustrativo………………………………………………………………………………………………….. 194
Ejemplo ilustrativo 2.2.1.1. Análisis de Conglomerados. Matriz de distancia……………………………… 194
2.2.1.1. Actividad de Aprendizaje…………………………………………………………………………………………. 225
Actividad de Aprendizaje 2.2.1.1. Análisis de Conglomerados. Matriz de distancia…………………….. 225
2.2.1.1. Ejercicio de Autoevaluación……………………………………………………………………………………… 226
Autoevaluación 2.2.1.1. Análisis de Conglomerados. Matriz de distancia…………………………………… 226
2.2.1.1. Ejemplo ilustrativo Minitab 17………………………………………………………………………………….. 227
Ejemplo ilustrativo integral en Minitab 17. Análisis de Conglomerados. Medida de distancia……….. 227
2.2.1.1. Ejercicios de Refuerzo…………………………………………………………………………………………….. 251
Ejercicios de Refuerzo 2.2.1.1. Análisis de Conglomerados. Matriz de distancia………………………… 251
2.2.1.1.1. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de distancia…………… 251
2.2.1.1.2. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de distancia……………. 251
2.2.1.2. Ejemplo ilustrativo………………………………………………………………………………………………….. 252
Ejemplo ilustrativo 2.2.1.2. Análisis de Conglomerados. Matriz de similitud……………………………… 252
2.2.1.2. Actividad de aprendizaje………………………………………………………………………………………… 294
Actividad de aprendizaje 2.2.1.2. Análisis de Conglomerados. Matriz de similitud……………………… 294
2.2.1.2. Ejercicio de autoevaluación…………………………………………………………………………………….. 295
Autoevaluación 2.2.1.2. Análisis de Conglomerados. Matriz de similitud………………………………….. 295
2.2.1.2. Ejemplo ilustrativo en Minitab 17……………………………………………………………………………… 297
Ejemplo ilustrativo integral en Minitab 17. Análisis de Conglomerados. Medida de similitud……….. 297
2.2.1.2. Ejercicios de refuerzo. ……………………………………………………………………………………………. 323
Ejercicios de refuerzo 2.2.1.2. Análisis de Conglomerados. Matriz de similitud………………………….. 323
2.2.1.2.1. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud……………. 323
2.2.1.2.2. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud…………….. 324
2.2.1.2.3. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud…………….. 325
Autoevaluación con reactivos de Falso ó Verdadero…………………………………………………….. 326
Autoevaluación con reactivos de Opción Múltiple………………………………………………………… 330

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________16


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

CAPÍTULO 3. MÉTODOS DE CLASIFICACIÓN

Capítulo 3. Métodos de Clasificación……………………………..……………………………………………………. 333


Objetivo 3.1. Análisis discriminante…………………………………………………………………………….. 333
Antecedentes……………………………………………………………………………………………………………………. 333
3.1.1. El análisis discriminante………………………………………………………………………………………. 333
Conceptos Básicos. Análisis Discriminante……………………………………………………………………………… 334
3.1.1.1. Ejemplo Ilustrativo……………………………………………………………………………………………….. 343
Ejemplo Ilustrativo. 3.1.1.1. Análisis Discriminante………………………………………………………………. 343
3.1.1.1. Actividad de Aprendizaje……………………………………………………………………………………….. 357
Actividad de Aprendizaje. 3.1.1.1. Análisis discriminante………………………………………………………. 357
3.1.1.1. Ejercicio de Autoevaluación…………………………………………………………………………………… 358
Autoevaluación. 3.1.1.1. Análisis discriminante……………………………………………………………………. 359
3.1.1.1. Ejercicios de Refuerzo………………………………………………………………………………………….. 361
Ejercicios de Refuerzo. 3.1.1.1. Análisis discriminante…………………………………………………………. 361
3.1.1.1.1. Ejercicios de Refuerzo. Análisis discriminante…………………………………………… 361
3.1.1.1.2. Ejercicios de Refuerzo. Análisis discriminante…………………………………………… 362
3.1.1.1.3. Ejercicios de Refuerzo. Análisis discriminante…………………………………………… 363
Objetivo 3.2. Pruebas de hipótesis con datos multivariados………………………………………. 365
Antecedentes………………………………………………………………………………………………………………….. 365
3.2.1. Pruebas sobre varias variables. (Vector de Medias)…………………………………………… 365
Conceptos básicos. Inferencia para un vector de medias…………………………………………………….. 366
3.2.1.1. Ejemplo Ilustrativo………………………………………………………………………………………………. 368
Ejemplo Ilustrativo- 3.2.1.1. Vector de Medias……………………………………………………………………. 368
3.2.1.1. Actividad de Aprendizaje………………………………………………………………………………………. 376
Actividad de Aprendizaje. 3.2.1.1. Vector de Medias……………………………………………………………. 376
3.2.1.1. Ejercicio de Autoevaluación…………………………………………………………………………………… 377
Autoevaluación. 3.2.1.1. Vector de Medias………………………………………………………………………….. 377
3.2.1.1. Ejercicios de Refuerzo…………………………………………………………………………………………… 378
Ejercicios de Refuerzo 3.2.1.1. Vector de Medias………………………………………………………………….. 378
3.2.1.1.1. Ejercicios de Refuerzo. Vector de Medias……………………………………………………. 378
3.2.1.1.2. Ejercicios de Refuerzo. Vector de Medias……………………………………………………. 379
3.2.1.1.3. Ejercicios de Refuerzo. Vector de Medias……………………………………………………. 380
3.2.2. Pruebas de hipótesis para una comparación de medias para varias muestras….. 382
Conceptos básicos. Diferencia de medias multivariada……………………………………………………………. 382
3.2.2.1. Ejemplo Ilustrativo………………………………………………………………………………………………….. 386
Ejemplo Ilustrativo. 3.2.2.1. Diferencia de medias multivariada……………………………………………….. 386
3.2.2.1. Actividad de Aprendizaje…………………………………………………………………………………………. 408
Actividad de Aprendizaje. 3.2.2.1. Diferencia de medias multivariada………………………………………. 408
3.2.2.1. Ejercicio de Autoevaluación……………………………………………………………………………………… 409
Autoevaluación. 3.2.2.1. Diferencia de medias multivariada……………………………………………………. 409
3.2.2.1. Ejercicios de Refuerzo…………………………………………………………………………………………….. 411
Ejercicios de Refuerzo 3.2.2.1. Diferencia de medias multivariada…………………………………………... 411
3.2.2.1.1. Ejercicios de Refuerzo. Diferencia de medias multivariada………………………….… 411

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________17


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

3.2.2.1.2. Ejercicios de Refuerzo. Diferencia de medias multivariada……………………………. 412


3.2.2.1.3. Ejercicios de Refuerzo. Diferencia de medias multivariada………………………….… 413
3.2.3. Análisis de Varianza Multivariada ( MANOVA)………………………………………………….…. 415
Conceptos básicos. Manova…………………………………………………………………………………………….…… 415
3.2.3.1. Ejemplo Ilustrativo…………………………………………………………………………………………….……. 421
Ejemplo Ilustrativo. 3.2.3.1. Manova……………………………………………………………………………….……. 421
3.2.3.1. Actividad de Aprendizaje………………………………………………………………………………….……… 446
Actividad de Aprendizaje. 3.2.3.1. Manova…………………………………………………………………….……… 446
3.2.3.1. Ejercicio de Autoevaluación……………………………………………………………………………………… 447
Autoevaluación. 3.2.3.1. Manova……………………………………………………………………………….…………. 447
3.2.3.1. Ejemplo Ilustrativo en Minitab 17………………………………………………………………….…………. 449
Ejemplo Ilustrativo Integral en Minitab 17. 3.2.3.1. Manova……………………………………….…………… 449
3.2.3.1. Ejercicios de Refuerzo……………………………………………………………………………….……………. 470
Ejercicios de Refuerzo. 3.2.3.1. Manova………………………………………………………………….……………. 470
3.2.3.1.1. Ejercicios de Refuerzo. Manova………………………………………………….……………… 470
3.2.3.1.2. Ejercicios de Refuerzo. Manova………………………………………………….……………… 471
3.2.3.1.3. Ejercicios de Refuerzo. Manova………………………………………………….……………… 472
Autoevaluación con reactivos de Falso y Verdadero…………………….……………………….………………… 474
Autoevaluación con reactivos de Opción Múltiple……………..……………………………………………………. 477
Glosario General……………………………………………………………………………………..………………………….. 482
Tabla A1. Puntos porcentuales del rango estudentizado…………………………………………..…………….. 492
Tabla A2. Valores críticos de t………………………………………………………………………………………………. 498
Tabla A3. Valores críticos de F α=0.05………………………………………………………………………………….. 504
Tabla A4. Valores críticos de F α=0.01………………………………………………………………………………….. 510
Bibliografía…………………………………………………………………………………………………………………………. 516

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________18


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

ANEXO DE RESPUESTAS CAPÍTULO 1. INTRODUCCIÓN AL ANÁLISIS


MULTIVARIANTE

1.3.1.1 Actividad de Aprendizaje. Datos Atípicos. Diagrama de Caja y Brazos Simple………………… 520
1.3.1.2 Actividad de Aprendizaje en Minitab 17. Datos Atípicos……………………………………………….. 523
1.3.1.3 Actividad de Aprendizaje en Minitab 17 . Datos Atípicos. Un Nivel de Factor………………… 525
1.3.1.4 Actividad de Aprendizaje en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple……………………………………………………………………………………………………………………………….. 530
1.3.1.5 Actividad de Aprendizaje en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
533
Múltiple………………………………………………………………………………………………………………………………
1.3.2.1 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de Normalidad.
540
Prueba de Anderson Darling…………………………………………………………………………………………………
1.3.2.2 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de
543
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos……………………
1.3.2.3 Actividad de Aprendizaje en Minitab 17. Verificación de Supuestos. Prueba de
558
Homocedasticidad. Prueba de Barlett…………………………………………………………………………………….
1.4.1.1 Actividad de Aprendizaje. Resolución de un Sistema Lineal de Ecuaciones mediante el
Método de matriz Inversa…………………………………………………………………………………………………….
564
1.4.1.2 Actividad de Aprendizaje en Excel. Resolución de un Sistema Lineal de Ecuaciones
mediante el Método de matriz Inversa……………………………………………………………………………………..
566
1.3.1.1 Ejercicio de Autoevaluación. Datos Atípicos. Diagrama de Caja y Brazos Simple………………..
574
1.3.1.2 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos………………………………………………
578
1.3.1.3 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Un Nivel de Factor………….........
1.3.1.4 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Simple………………………………………………………………………………………………………………………..………..
580
1.3.1.5 Ejercicio de Autoevaluación en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos
Múltiple…………………………………………………………………………………………………………………………………
584
1.3.2.1 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
587
Normalidad. Prueba de Anderson Darling…………………………………………………………………..…………….
1.3.2.2 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
593
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de Gráficos……………………..…
1.3.2.3 Ejercicio de Autoevaluación en Minitab 17. Verificación de Supuestos. Prueba de
596
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………….
1.4.1.1 Ejercicio de Autoevaluación. Resolución de un Sistema Lineal de Ecuaciones mediante el
610
Método de matriz Inversa……………………………………………………………………………………………………….
615
1.4.1.2 Ejercicio de Autoevaluación en Excel. Resolución de un Sistema Lineal de Ecuaciones
618
mediante el Método de matriz Inversa……………………………………………………………………………………..
625
1.3.1.1.1 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de caja y Brazos Simple…………………..…
629
1.3.1.1.2 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de Caja y Brazos Simple……………….……
632
1.3.1.1.3 Ejercicios de Refuerzo. Datos Atípicos. Diagrama de Caja y Brazos Simple……….………..….
635
1.3.1.2.1 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos……………………………….…………………..
637
1.3.1.2.2 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos………………………………….………………..
638
1.3.1.2.3 Ejercicios de Refuerzo en Minitab 17. Datos Atípicos…………………………….……………………..
641
1.3.1.3.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de Factor……………………..

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________19


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

1.3.1.3.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de Factor……………………..


1.3.1.3.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Un Nivel de 645
Factor…………………………………………………………………………………………………………………..………………
1.3.1.4.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 649
Simple………………………………………………………………………………………………………………………………....
1.3.1.4.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 653
Simple………………………………………………………………………………………………………………………..………..
1.3.1.4.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 655
Simple…………………………………………………………………………………………………………………………..……..
1.3.1.5.1. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 658
Múltiple…………………………………………………………………………………………………………………………………
1.3.1.5.2. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 661
Múltiple…………………………………………………………………………………………………………………………………
1.3.1.5.3. Ejercicios de Refuerzo en Minitab 17. Datos Atípicos. Diagrama de Caja y Brazos 667
Múltiple…………………………………………………………………………………………………………………………………
1.3.2.1.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de Normalidad. 674
Prueba de Anderson Darling……………………………………………………………………………………………..…….
1.3.2.1.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de Normalidad. 680
Prueba de Anderson Darling……………………………………………………………………………………..…………….
1.3.2.1.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de Normalidad. 683
Prueba de Anderson Darling……………………………………………………………………………………..…………….
1.3.2.2.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de 685
Gráficos………………………………………………………………………………………………………………..………………
1.3.2.2.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de 687
Gráficos………………………………………………………………………………………………………………..………………
1.3.2.2.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de
Homocedasticidad. Prueba de Levene. Transformaciones. Etiquetado de 702
Gráficos………………………………………………………………………………………………………………………..………
1.3.2.3.1. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de 716
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………….
1.3.2.3.2. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de 731
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………….
1.3.2.3.3. Ejercicios de Refuerzo en Minitab 17. Verificación de Supuestos. Prueba de 736
Homocedasticidad. Prueba de Barlett……………………………………………………………………………………….
1.4.1.1.1. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante el 741
Método de matriz Inversa……………………………………………………………………………………………….………
1.4.1.1.2. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante el 746
Método de matriz Inversa…………………………………………………………………………………………………….…
1.4.1.1.3. Ejercicios de Refuerzo. Resolución de un Sistema Lineal de Ecuaciones mediante el 749
Método de matriz Inversa…………………………………………………………………………………………………….…
1.4.1.2.1. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones 751
mediante el Método de matriz Inversa……………………………………………………………………………………..
1.4.1.2.2. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones 753
mediante el Método de matriz Inversa…………………………………………………………………………………….. 760

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________20


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

1.4.1.2.3. Ejercicios de Refuerzo en Excel. Resolución de un Sistema Lineal de Ecuaciones


mediante el Método de matriz Inversa…………………………………………………………………………………….. 766
Autoevaluación con reactivos de Falso ó Verdadero……………………………………………………….. 774
Autoevaluación con reactivos de Opción Múltiple………………………………………………………….… 774
ANÁLISISARI

ANEXO DE RESPUESTAS. CAPÍTULO 2. MÉTODOS DE REDUCCIÓN

DE REDUCCIÓN
2.1.1.1. Actividad de Aprendizaje. Factor Análisis…………………………………………………………………… 775
2.2.1.1. Actividad de Aprendizaje. Análisis de Conglomerados. Matriz de distancia……………………. 780
2.2.1.2. Actividad de aprendizaje. Análisis de Conglomerados- Matriz de Similitud……………..……… 805
2.1.1.1. Ejercicio de Autoevaluación. Factor Análisis……………………………………………………..……….. 824
2.2.1.1. Ejercicio de Autoevaluación. Análisis de Conglomerados. Matriz de distancia………………… 828
2.2.1.2. Ejercicio de autoevaluación. Análisis de Conglomerados. Matriz de similitud.………………... 856
2.1.1.1.1. Ejercicios de Refuerzo. Factor Análisis……………………………………………………………..…….. 874
2.1.1.1.2. Ejercicios de Refuerzo. Factor Análisis……………………………………………………..…………….. 876
2.1.1.1.3. Ejercicios de Refuerzo. Factor Análisis………………………………………………..………………….. 878
2.2.1.1.1. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de distancia………………..……… 882
2.2.1.1.2. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de distancia……………….………. 908
2.2.1.2.1. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud………………..………. 936
2.2.1.2.2. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud…………………….….. 949
2.2.1.2.3. Ejercicio de refuerzo. Análisis de Conglomerados. Matriz de similitud………………….…….. 966
Autoevaluación con reactivos de Falso ó Verdadero………………………………………….………….. 983
Autoevaluación con reactivos de Opción Múltiple……………………………………………….………… 983

ANEXO DE RESPUESTAS. CAPÍTULO 3. MÉTODOS DE CLASIFICACIÓN

3.1.1.1. Actividad de Aprendizaje. Análisis Discriminante………………………………………………….…….. 984


3.2.1.1. Actividad de Aprendizaje. Vector de medias………………………………………………………………. 994
3.2.2.1. Actividad de Aprendizaje. Diferencia de medias Multivariada………………………………………. 1000
3.2.3.1. Actividad de Aprendizaje. Manova…………………………………………………………………….………
1019
3.1.1.1. Ejercicio de Autoevaluación. Análisis Discriminante……………………………………………..……… 1041
3.2.1.1. Ejercicio de Autoevaluación. Vector de Medias…………………………………………………………… 1052
3.2.2.1. Ejercicio de Autoevaluación. Diferencia de Medias Multivariada…………………………………… 1059
3.2.3.1. Ejercicio de Autoevaluación. Manova………………………………………………………………………… 1078
3.1.1.1.1. Ejercicios de Refuerzo. Análisis discriminante……………………………………………………….…
3.1.1.1.2. Ejercicios de Refuerzo. Análisis discriminante……………………………………………………….… 1101
1111
3.1.1.1.3. Ejercicios de Refuerzo. Análisis discriminante…………………………………………………….……
1122

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________21


______________________________________Cuaderno de trabajo: Análisis Multivariado. CONTENIDO

3.2.1.1.1. Ejercicios de Refuerzo. Vector de Medias……………………………………………………….………. 1131


3.2.1.1.2. Ejercicios de Refuerzo. Vector de Medias…………………………………………………….…………. 1139
3.2.1.1.3. Ejercicios de Refuerzo. Vector de Medias………………………………………………………….……. 1146
1153
3.2.2.1.1. Ejercicios de Refuerzo. Diferencia de medias multivariada……………………………….…….…
1171
3.2.2.1.2. Ejercicios de Refuerzo. Diferencia de medias multivariada………………………………….…….
1188
3.2.2.1.3. Ejercicios de Refuerzo. Diferencia de medias multivariada……………………………….…….…
1205
3.2.3.1.1. Ejercicios de Refuerzo. Manova………………………………………………….………………….………
1223
3.2.3.1.1. Ejercicios de Refuerzo. Manova con Minitab 17……………………………………….………………
1243
3.2.3.1.2. Ejercicios de Refuerzo. Manova………………………………………………….……………………….…
1260
3.2.3.1.2. Ejercicios de Refuerzo. Manova con Minitab 17……………………………………….………………
1279
3.2.3.1.3. Ejercicios de Refuerzo. Manova………………………………………………….……………………….…
1298
3.2.3.1.3. Ejercicios de Refuerzo. Manova con Minitab 17……………………………………….………………
1319
Autoevaluación con reactivos de Falso y Verdadero…………………….……………………….…………………
1319
Autoevaluación con reactivos de Opción Múltiple……………..…………………………………………………….

CAPÍTULO 3. MÉTODOS DE CLASIFICACIÓN

E REDUCAPÍTULO 3. MÉTODOS DE CLASIFICACIÓN

CAPÍTULO 3. MÉTODOS DE CLASIFICACIÓN

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________22


_Cuaderno de trabajo: Análisis Multivariado.C21. INTRODUCIÓN AL ANÁLISIS
MULTIVARIANTE

CAPÍTULO 1. INTRODUCCIÓN AL ANÁLISIS


MULTIVARIANTE

OBJETIVO 1.1. El alumno entenderá los conceptos del


análisis multivariante en situaciones del área
administrativa así como los objetivos del mismo y los
tipos de técnicas multivariantes existentes.

ANTECEDENTES CONCEPTOS DE:

Método Científico, protocolo de investigación, recolección y compendio de


datos, organización de conjuntos de datos, diseño de experimentos y
reconocimientos, medición de la variación, tanto de datos experimentales como
de reconocimiento, estimación de parámetros de población y suministro de
varias medidas de la exactitud y precisión de esas estimaciones, ensayo de
hipótesis respecto a poblaciones, relación entre dos variables.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI_______________________________________23


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.1.1
INTRODUCCIÓN AL ANÁLISIS MULTIVARIANTE .

CONCEPTOS 1.- DEFINICIONES:


BÁSICOS 1.- Conjunto de métodos ó técnicas diseñados con el fin de examinar e interpretar
ANÁLISIS la información contenida en un conjunto de variables, sin perder la interacción ó
MULTIVARIANTE grado en que se afectan unas con otras. 1

2.- Es el conjunto de métodos estadísticos cuya finalidad es analizar


simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias
variables medidas para cada individuo u objeto estudiado.2

3.- Todos los métodos estadísticos que analizan simultáneamente medidas múltiples
de cada individuo u objeto sometido a investigación.3

2.- OBJETIVOS DEL ANÁLISIS MULTIVARIANTE:

1.- Proporcionar métodos cuya finalidad es el estudio conjunto de datos


multivariantes que el análisis estadístico uni y bidimensional es incapaz de
En el análisis multivariado conseguir.
tanto la variable
dependiente como las 2.- Ayudar al analista o investigador a tomar decisiones óptimas en el contexto en
independientes pueden ser el que se encuentra teniendo en cuenta la información disponible por el conjunto de
categóricas o cuantitativas. datos analizado.
Las variables categóricas
deben ser dicotómicas o 3.- TIPOS DE TÉCNICAS MULTIVARIANTES:
ser transformadas en
En general se pueden clasificar en dos grandes grupos:
dicotómicas. Las variables
independientes pueden 1) Métodos de dependencia.
ser: 2) Métodos de Interdependencia.

Todas cuantitativas. 1.- Métodos de dependencia:


Todas categóricas. Supone que las variables analizadas están divididas en dos grupos: las
variables dependientes y las variables independientes. El objetivo de los
Algunas cuantitativas y
métodos de dependencia consiste en determinar si el conjunto de variables
otras categóricas
independientes afecta al conjunto de variables dependientes y de qué forma
y cuya relación causa-efecto se puede representar por medio de una
Variables dummy Dijimos
función ó ecuación.
más arriba que las
variables cualitativas deben Dentro de los métodos de dependencia se pueden ubicar las siguientes técnicas:
ser dicotómicas o deben
transformarse en

1
Jorge de la Garza García (1995) Análisis de la información Mercadológica a través de la estadística multivariante.
Ed. Alambra Mexicana.
2
Manuel Salvador Figueras. Introducción al Analisis Multivariante
3
Hair, Anderson, Tatham y Black (1999) Análisis Multivarriante. Prentice Hall

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________24


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

dicotómicas. Para las 1.1. Análisis de regresión y correlación múltiple.


variables independientes
esta transformación se Su objetivo consiste en obtener, a partir de los datos, una ecuación que
efectúa creando las así permita conocer la relación causa-efecto que se presenta entre las variables
llamadas variables dummy, independientes y una dependiente y cuantificar el grado de relación que existe
que son variables entre las variables independientes con respecta a la dependiente.
dicotómicas inexistentes
Las variables que intervienen en ambas técnicas son de naturaleza
pero que las creamos para
cuantitativa es decir pueden medirse en forma numérica.
poder efectuar el análisis
estadístico. Ejemplo: Predecir el gasto anual en el cine de una persona a partir de su
nivel de ingresos, nivel educativo, sexo y edad.
El Análiis de regresión
genera una ecuación para 1.2. Análisis discriminante.
describir la relación
estadística entre uno o más Esta técnica permite explicar las diferencias entre grupos de personas u
predictores y la variable de objetos, por medio de variables independientes, con el objeto de llegar a clasificar
respuesta y para predecir nuevas observaciones en los grupos establecidos.
nuevas observaciones. La
regresión generalmente El análisis discriminante maneja “n” variables independientes cuantitativas
utiliza el método de todas ellas y una variable dependiente cualitativa dicotómica ó que tenga como
mínimos cuadrados
máximo cuatro categorías.
ordinarios, del cual se
obtiene la ecuación al
minimizar la suma de los
Ejemplo: Distinción entre usuarios habituales u ocasionales de un producto
residuos cuadrados. con base en el precio, calidad, etc.

1.3. Análisis de varianza y covarianza.


Los resultados de regresión
indican la dirección, el
La técnica de análisis de varianza, conocida también como ANOVA, se utiliza
tamaño y la significancia
estadística de la relación
básicamente para la experimentación. Aquí se pueden manejar un conjunto de
entre un predictor y una variables independientes de naturaleza cualitativa, para explicar otro conjunto de
respuesta. variables dependientes de naturaleza cuantitativa.

Ejemplo: Determinar si la posición en que se puede colocar un producto en


· El signo de cada
coeficiente indica la un estante (alta, media ó baja) afecta las ventas de dicho producto.
dirección de la relación.
En el ejemplo anterior la posición es la variable independiente cualitativa y
las ventas la dependiente cuantitativa.
· Los coeficientes
representan el cambio de
El análisis de covarianza, conocido como ANCOVA, se aplica en conjunto
la media en la respuesta
para una unidad de cambio con ANOVA para experimentos en los que existen variables que quedan fuera de
en el predictor mientras control del investigador y que afectan directamente las mediciones de las variables
mantiene constantes otros dependientes. Con ANCOVA se trata de encontrar como afecta la variable
predictores en el modelo. incontrolable a la variable dependiente, para aislar dicho efecto y por decirlo así
controlarlo en cierto modo, después de llevar acabo el experimento.
· El valor p de cada
coeficiente prueba la 1.4. Análisis de correlación canónica.
hipótesis nula de que el
coeficiente es igual a cero Esta técnica consiste en determinar el grado de relación entre dos
(no tiene efecto). Por lo conjuntos de variables.
tanto, los valores p bajos
sugieren que el predictor Su objetivo es relacionar simultáneamente varias variables métricas
es una adición significativa dependientes e independientes calculando combinaciones lineales de cada conjunto
de variables que maximicen la correlación existente entre los dos conjuntos de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________25


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

a su modelo. variables.

· La ecuación predice Ejemplo: Analizar como están relacionadas el tiempo dedicado al trabajo y
nuevas observaciones el ocio de una persona con su nivel de ingresos, su edad y su nivel de educación.
dados valores predictores
específicos. Casos particulares de él son el coeficiente de correlación y el coeficiente de
determinación; la diferencia es que éstos se refieren a las relaciones de variables de
Utilice el Análisis “una a una” y de “ una a muchas”, respectivamente y en la correlación canónica se
discriminante para busca la relación de “muchas a muchas”.
clasificar las observaciones
en dos o más grupos si 2.- Métodos de interdependencia ó estructurales:
usted tiene una muestra
con grupos conocidos. El Estos métodos no distinguen entre variables dependientes e independientes y su
Análisis discriminante objetivo principal es resumir información. Consiste en identificar que variables están
también se puede utilizar relacionadas, como lo están y porqué.
para investigar en que
manera las variables Ejemplo: Describir el comportamiento del mercado con un menor número
contribuyen a la separación
de variables.
de grupos.
En estas técnicas, todas las variables se manejan como independientes,
ANCOVA o análisis de pues a diferencia de las técnicas dependientes, no trata de buscar relaciones de
covarianza es una
causa-efecto entre las variables, sino que busca algo común entre ellas para unirlas
extensión del análisis de
varianza (ANOVA) que
y así resumir la información que se tiene.
permite modelar y realizar
ajustes para las variables Algunas de estas técnicas son las siguientes:
de entrada que se
midieron, pero que no se 2.1. Análisis de componentes principales o de factor común.
aleatorizaron o controlaron
en el experimento. Conocida como análisis de factores, se utiliza para analizar las relaciones
ANCOVA prueba si los entre un gran número de variables métricas y así explicarlas solamente por medio
factores tienen un efecto de factores (también llamados atributos, características ó dimensiones), los cuales
después de eliminar la describen al grupo.
varianza debido a las
covarianzas. Ejemplo:

Se utiliza el Análisis de Si se tratara de evaluar el desempeño en la operación de un restaurante y


Componentes Principales se estuvieran manejando las variables sabor, cantidad servida, rapidez, amabilidad,
como una ayuda para variedad del platillo, limpieza, iluminación, ambiente, temperatura y precio, éstas
comprender la estructura mediante el análisis de factores, tal vez quedarían resumidas bajo las siguientes
de datos subyacente y/o dimensiones:
conformar un número
menor de variables no • SERVICIO: rapidez y amabilidad.
correlacionadas (por • LOCAL: limpieza, iluminación, ambiente y temperatura.
ejemplo, para evitar la
• CALIDAD DEL PRODUCTO: sabor, cantidad servida, variedad del platillo.
multicolinealidad en la
regresión).
• PRECIO.

2.2. Análisis de conglomerados o de agrupamiento o análisis cluster.


Se utiliza un Análisis de
Factoresal igual que el
análisis de componentes
Esta técnica se usa principalmente en la segmentación de mercados, con base
principales, a fin de en similitudes; y consiste en formar grupos conteniendo elementos lo más parecido
resumir la estructura de posibles entre sí y lo más diferente posible al compararse con otros. Puede servir
covarianzas de los datos en como entrada al análisis discriminante, porque los grupos se forman con el análisis
algunas dimensiones de los de agrupamiento y la diferencia entre ellos se encuentra con el discriminante, o sea,

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________26


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

datos. Sin embargo, el que este último comprueba si en realidad segmentados correctamente en el
énfasis en el análisis agrupamiento.
factorial es la identificación
de los "factores"
La diferencia de esta técnica con el análisis de factores consiste en que se trata
subyacentes que pudieran
explicar las dimensiones
de agrupar a objetos ó individuos con base en sus actitudes o comportamientos
asociadas con una comunes, es decir, se busca agrupar a las personas según sus respuestas que
variabilidad grande de los demuestren comportamientos comunes y no trata de agrupar variables como el
datos. análisis de factores. El de agrupamiento tiene como objetivo clasificar una muestra
de entidades en grupos mutuamente excluyentes con base en la similitud de dichas
Se utiliza el Análsiis de entidades.
conglomerados o Cluster
Analisis para clasificar las Por otra parte, a diferencia del análisis discriminante, en el de agrupamiento los
observaciones en grupos grupos no se encuentran predefinidos, sino que se busca identificarlos.
cuando los grupos se
desconocen inicialmente. El análisis de agrupamiento generalmente involucra dos etapas. En la primera se
busca medir la similitud o asociación entre las entidades, para determinar en
Este procedimiento utiliza cuantos grupos se hará la clasificación. En una segunda etapa se trata de definir el
un método jerárquico
perfil de las personas; esto se puede hacer aplicando el discriminante a los grupos
aglomerativo que comienza
con todas las
identificados en el agrupamiento.
observaciones separadas,
cada una de ellas Ejemplo: Clasificar grupos de alimentos (pescados, carnes, vegetales y leche)
formando su propio en función de sus valores nutritivos.
conglomerado. En el
primer paso, las dos
observaciones más
cercanas entre sí se unen. BIBLIOGRAFIA:
En el siguiente paso, una
tercera observación se une 1. Hair, Anderson, Tatham y Black (1999) Análisis Multivariante. Prentice
a las dos primeras u otras
Hall
dos observaciones se unen
para formar un
2. Jorge de la Garza García (1995) Análisis de la información
conglomerado diferente. Mercadológica a través de la estadística multivariante. Ed. Alhambra
Este proceso continuará Mexicana.
hasta que todos los 3. Kinner, C.T. y Taylor (1993) Investigación de mercados. Mc Graw hill,
conglomerados se unan en México.
un solo conglomerado; sin
embargo, este
conglomerado individual no
es útil para propósitos de
clasificación Por lo tanto,
usted debe decidir cuántos
grupos son lógicos para
sus datos y clasificarlos
adecuadamente.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________27


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

OBJETIVO 1.2. El alumno entenderá el significado del


valor teórico como elemento esencial del análisis
multivariante así como las escalas de medición y su
relación con las técnicas multivariantes.

ANTECEDENTES CONCEPTOS DE:

Experimento. Unidad experimental. Medidas. Variable de respuesta. Ensayos ó


réplicas. Aleatorización. Agrupamiento. Bloqueo. Balanceo. Factores controlados.
Factores no controlados. Tratamientos ó niveles de un factor. Error
experimental. Efectos del tratamiento. Variación total. Variación entre
tratamientos. Variación dentro de tratamientos. Análisis de varianza (ANOVA).

VALOR TEÓRICO, ESCALAS DE MEDICIÓN Y SU RELACIÓN


1.2.1
CON LAS TÉCNICAS MULTIVARIANTES.

CONCEPTOS BÁSICOS VALOR TEÓRICO, ESCALAS DE MEDICIÓN Y SU RELACIÓN CON LAS


TÉCNICAS MULTIVARIANTES.
VALOR TEÓRICO

Aunque el análisis multivariante tiene sus orígenes en la estadística uni y


bivariante, la extensión al dominio multivariante introduce conceptos y cuestiones
adicionales. Estos conceptos van desde la necesidad de entender el concepto del
elemento básico del análisis multivariante - el valor teórico - a las cuestiones
específicas acerca de los tipos de escalas de medida utilizadas y los resultados
estadísticos de los tests de significación y los intervalos de confianza. Cada
concepto juega un papel importante en la correcta aplicación de cualquier técnica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________28


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

multivariante.

El valor teórico.

El elemento esencial del análisis multivariante es el valor teórico, una


combinación lineal de variables con ponderaciones determinadas empíricamente.
El investigador especifica las variables, mientras que las ponderaciones son objeto
específico de determinación por parte de la técnica multivariante. Un valor teórico
de “n” variables ponderadas (X1 a Xn) puede expresarse matemáticamente así:

Valor teórico = w1X1 + w2X2 + w3X3 + ... + wnXn

Aunque el
Donde Xn es la variable observada y wn es la ponderación determinada por la
análisis multivariante tiene técnica multivariante.
sus raíces en la estadística
univariante y bivariante, la El resultado es un valor único que indica una combinación de todo el conjunto de
extensión al variables que mejor se adaptan al objeto del análisis multivariante específico. En
dominio multivariante
introduce conceptos y
regresiones múltiples, el valor teórico se determina de tal forma que guarde la
cuestiones adicionales, que mejor correlación con la variable que se está prediciendo. En el análisis
van desde el “valor discriminante, el valor teórico se forma de tal manera que produzca resultados
teórico” hasta las escalas de para cada observación que diferencien de forma máxima entre grupos de
medida utilizadas, los errores
de medición, los resultados observaciones y en el análisis factorial, los valores teóricos se forman para
estadísticos representar mejor las estructuras subyacentes o la dimensionalidad de las
de las pruebas de variables tal y como se representan en sus intercorrelaciones.
significación y los
intervalos de confianza. La
El valor teórico capta el carácter multivariante del análisis por lo que es el punto
utilización de un modelo
multivariante conlleva la central del análisis ya que se debe entender no solo su impacto conjunto para
elaboración de un plan de lograr el objetivo de cada técnica, sino también la contribución de cada variable
investigación bien definido separada al efecto del valor teórico en su conjunto.
que incluye los
objetivos analíticos en
Escalas de medida.
términos conceptuales, la
selección de la técnica, la
evaluación de los La medida es importante para representar con precisión el concepto de interés y
supuestos básicos de dicha es vital en la selección del método de análisis multivariante apropiado. El análisis
técnica, la estimación del de los datos trae consigo la separación, identificación y medida de la variación en
modelo y su interpretación,
un conjunto de variables, tanto entre ellas mismas como entre una variable
para finalizar con
la aplicación de las técnicas dependiente y una o más variables independientes por lo tanto se requiere
de validación para entender cómo se miden las variables para determinar qué técnicas multivariantes
determinar la estabilidad de pueden aplicarse a las investigaciones.
los resultados obtenidos
Existen dos tipos de variables:

Como posible clasificación, Variables cualitativas o no métricas. Estas variables describen o identifican
según el grado de
a un objeto o individuo tomando un atributo, una característica o propiedad
información que contienen
categórica, es decir no numérica.
unas variables, se pueden
dividir a éstas en: (i)
Estas variables se pueden medir con base en dos tipos de escalas de
Variables Nominales:Sólo

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________29


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

distinguen entre varias medición:


categorías, sin que exista
ninguna jerarquía entre 1.- Nominal. Esta escala asigna un número a una característica ó atributo
ellas; (ii) Variables Ordinales del objeto o persona, con el fin de manejarla en forma cuantitativa.
Además de distinguir
distintas categorías para una Por ejemplo:
variable, se puede distinguir
una relación de orden entre Género: M___ F___
ellas; (iii) Variables de
Intervalo Además de En el caso de la variable “género”, los valores que se toman no son
contener las características cuantitativos sino cualitativos (femenino, masculino). Para manejarla de manera
de las dos anteriores cuantitativa se asigna un número, por ejemplo, el 1 a m (masculino) y el 2 a f
(distingue entre valores y (femenino).
entre la distinta jerarquía de
valores) añade el hecho de 2.- Ordinal. Esta escala de medición gradúa los datos con base en la
dotar de sentido a la jerarquización de las marcas ó clases evaluadas, según la cantidad de atributos
diferencia entre los valores que el entrevistado otorga al objeto ó persona.
de la variable. Es decir, la
distancia o diferencia entre Ejemplo:
dos valores consecutivos de
la variable es siempre el Organice los siguientes productos por orden de importancia, de acuerdo
mismo; (iv) Variables de con su gusto por las siguientes marcas de cigarrillos ( 1º = me gusta más que
razón. Son idénticas a las todos, 5º = que gusta menos que todos):
anteriores salvo que
presentan un origen absoluto ___ Marlboro
de medida. En estas
variables tiene sentido tomar ___ Raleigh
fracciones de sus valores o
razones. Se puede decir que ___Vantage
un valor es el doble que
otro. ___Viceroy

___Montana

Los métodos estadísticos Variables cuantitativas o métricas. Estas variables identifican a un objeto o
multivariados se pueden individuo en forma cuantitativa o numérica, pues se puede decir que es diferente
seleccionar o clasificar
teniendo en cuenta varios
de otro en cantidad o grado.
aspectos
pero todos ellos deben Estas variables se pueden medir con las siguientes escalas de medición:
incluir: a) la estructura de la
matriz de datos, b) el 1.- Intervalo. A diferencia de la escala ordinal, permite diferenciar a un
objetivo perseguido, y c) objeto o persona de otra en cantidad o grado, indicando que al pasar de un valor
la naturaleza de esos datos
a otro de la escala, el atributo está cambiando en la misma proporción. En la
(Dagnelie, 1981).
escala de intervalo, el cero no es absoluto, no significa “ ausencia de algo “.

a) Según la estructura de Las escalas de intervalo más familiares son las escalas de temperatura
la matriz de datos, los Celsius y Fahrenheit. Ambas tienen un punto de cero arbitrario, pero ese cero no
métodos pueden indica una cantidad cero o ausencia de temperatura, dado que podemos registrar
clasificarse según sean las

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________30


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

variables o los individuos de temperaturas por debajo del punto cero de esa escala.
la matriz de datos de base.
La estructura se refiere a si 2.- Razón. Esta escala es muy similar a la de intervalo, con la diferencia
las variables o
los individuos son de que el cero sí tiene un significado absoluto de “ausencia de”. Por lo tanto, no
diferentes, o si pertenecen se tiene que establecer un significado para cada número y la escala es comparable
a un grupo o a más entre sí, ya que el cero es absoluto.
grupos de variables o de
individuos:
- sin ninguna
estructura en particular,
(análisis de componentes
Por ejemplo:
principales y análisis
factorial; conglomerados) Estatura ____
- una estructura
entre variables, (métodos Clasificación de las técnicas del análisis multivariante .4
de regresión múltiple ó
análisis de correlación Existen muy diversas técnicas multivariantes para analizar información
canónica)
mercadológica. Para llegar a clasificar una técnica y así saber cuál es factible para
- una estructura
entre individuos, (análisis ser utilizada, se deben considerar los siguientes aspectos:
discriminante)
- ambas estructuras 1.- Primero, debe verificarse si, de acuerdo con la naturaleza de la
(análisis de correspondencias investigación, el conjunto de variables puede ser dividido en independientes y
múltiples)
dependientes.

2.- Si la respuesta fue afirmativa, debe cuestionarse cuántas variables


b) Según el objetivo
perseguido, los métodos son dependientes serán manejadas
muy difíciles de clasificar,
pues puede haber 3.- Por último, debe identificarse el tipo de escala de medición en el que
muchos y muy diferentes, se están manejando las variables.
pero los agruparemos en
dos grandes grupos: los A continuación se presenta la clasificación de las técnicas de multivariante,
descriptivos, y los
considerando los tres aspectos explicados anteriormente.
inferenciales.

c) Según la naturaleza de los


datos
• En el caso de los
métodos descriptivos:
- si las “p” variables son
cuantitativas (Análisis
Factorial Clásico (Análisis
de Componentes
Principales y Análisis
Factorial común)
- si las “p” variables son
cualitativas y/o cuantitativas
( Métodos de Conglomerados
(clusters) y

4
Jorge de la Garza García (1995) Análisis de la información Mercadológica a través de la estadística multivariante.
Ed. Alambra Mexicana.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________31


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Análisis de Métodos multivariados

Correspondencias (Simple y
Múltiple) No
¿Algunas variables dependen de
Si
• En el caso de los otras?

métodos inferenciales:
En este caso, siempre Métodos de
interdependencia
Métodos de
dependencia

hay dos grupos de variables


y casi siempre se reconocen ¿Predominan las variables de
¿Cuántas variables son
como variables
escala de intervalo o de 1 >1
dependientes?
razón?

independientes y variables ¿Escala de variables

dependientes . Por esto, Si No


dependientes
¿Escala de variables
dependientes

tenemos que tener en Intervalo Ordinal Nominal


cuenta la Análisis de
factores
Escala
multidimensional
Intervalo

naturaleza y la cantidad de no métrica


¿Escala de variables ¿Escala de variables ¿Escala de variables ¿Escala de variables

variables de cada uno de los


independientes? independientes? independientes? independientes?
Análisis de
agrupamiento

grupos. Intervalo Nominal Ordinal Intervalo Nominal Intervalo Nominal

Escala
multidimensional
métrica Analisis de varianza Correlación
Regresión múltiple
y covarianza canónica

Análisis conjunto Análisis


discriminante de Analisis de varianza
variable nominal o multivariado
dummy

Análisis
discriminante

BIBLIOGRAFIA:

1. Hair, Anderson, Tatham y Black (1999) Análisis Multivariante. Prentice


Hall
2. Jorge de la Garza García (1995) Análisis de la información
Mercadológica a través de la estadística multivariante. Ed. Alhambra
Mexicana.
3. Kinner, C.T. y Taylor (1993) Investigación de mercados. Mc Graw hill,
México.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________32


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.2.2 BASE DE DATOS. FORMATO DE ENCUESTA SOBRE BIENES


RAICES. CÓDIGO PARA LA COMPUTADORA. CONSTRUCCIÓN
DE LA BASE DE DATOS “BIENES1”.

CONCEPTOS BÁSICOS Una BASE DE DATOS es una colección de información organizada de forma que
un programa de ordenador pueda seleccionar rápidamente los fragmentos de
BASE DE DATOS. datos que necesite. Una base de datos es un sistema de archivos electrónico.
1.2.2.
Las bases de datos tradicionales se organizan por campos, registros y archivos.
Un campo es una pieza única de información; un registro es un sistema
completo de campos; y un archivo es una colección de registros. Por ejemplo,
una guía de teléfono es análoga a un archivo. Contiene una lista de registros,
cada uno de los cuales consiste en tres campos: nombre, dirección, y número de
teléfono.
A veces se utiliza DB, de database en inglés, para referirse a las bases de
datosActualmente, y debido al desarrollo tecnológico de campos como
la informática y la electrónica, la mayoría de las bases de datos están en formato
digital, siendo este un componente electrónico, por tanto se ha desarrollado y se
ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
Una base de datos es un
conjunto de datos Las bases de datos se utilizan primordialmente para almacenar datos históricos o
pertenecientes a un mismo actuales que posteriormente se pueden utilizar para estudiar el comportamiento
contexto y almacenados de un conjunto de datos a través del tiempo, realizar proyecciones, tomar
sistemáticamente para su decisiones y realizar análisis de datos para inteligencia empresarial o de tipo
posterior uso. En este científico en investigaciones.
sentido; una biblioteca
puede considerarse una base Entre las principales características de los sistemas de base de datos podemos
de datos compuesta en su mencionar:
mayoría por documentos y
textos impresos en papel e • Independencia lógica y física de los datos.
indexados para su consulta. • Redundancia mínima.
• Acceso concurrente por parte de múltiples usuarios.
• Integridad de los datos.
• Consultas complejas optimizadas.
• Seguridad de acceso y auditoría.
• Respaldo y recuperación.
• Acceso a través de lenguajes de programación estándar.

Una base de datos posee el siguiente orden jerárquico:

• Tablas
• Campos
• Registros
• Lenguaje

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________33


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

FORMATO DE ENCUESTA DE BIENES RAICES DENOMINADA “BIENES1”

CODIGO (Por favor, INSERTE en los espacios correspondientes el número ó valor apropiado)
________________________________________________________________________________

_ _ _ . _ 1. Valor de avalúo ( Dlls. $ 000) _ _ _ . _


1 2 3 4 5
_ _ . _ _ 2. Tamaño del lote ( 00 de pies cuadrados) _ _ . _ _
7 8 9 10 11
_ 3. Número de recámaras
13
_ . _ 4. Número de baños _ . _
15 16 17
_ _ 5. Número de habitaciones _ _
19 20
_ _ 6. Antiguedad de la casa ( en años) _ _
22 23
_ _ _ _ 7. Impuestos anuales. ($) _ _ _ _
25 26 27 28
_ 8. Tipo de estacionamiento interior: (0) Ninguno (1) Cochera de un automóvil
30 (2) Cochera de dos automoviles (3) Cochera de tres automóviles.

_ 9. Ubicación geográfica de la casa: (1) Norte (2) Sur (3) Este


32
_ 10. Estilo arquitectónico: (1) Moderno (2) Hacienda
34 (3) Colonial (4) Granja (5) Con desniveles.

_ 11. Tipo de combustible para la calefacción: (1) Gas (2) Petroleo


36
_ 12. Tipo de sistema de calefacción: (1) Aire caliente
38 (2) Agua caliente (3) Otro

_ 13. Tipo de alberca ubicada en la propiedad: (1) Ninguna


40 (2) Sobre el nivel del piso (3) En el piso

_ 14. Cocina con antecomedor: (0) Ausente (1) Presente.


42
_ 15. Aire acondicionado: (0) Ausente (1) Presente
44
_ 16. Chimenea: (0) Ausente (1) Presente.
46
_ 17. Drenaje municipal: (0) Ausente (1) Presente
48
_ 18. Sótano (0) Ausente (1) Presente
50
_ 19. Cocina integral: (0) Ausente (1) Presente
52
_ 20. Tina de hidromasaje: (0) Ausente (1) Presente
54
_ _ _ 21. Código del entrevistado.
56 57 58

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________34


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

EJEMPLO DE CODIFICACIÓN DE LAS RESPUESTAS DEL ENCUESTADO CODIFICADO 001


PREGUNTA TIPO DE CODIGO PARA LA COLUMNA RESPUESTA RESPUESTA
PREGUNTA COMPUTADORA ASIGNADA DEL CODIFICADA
PARA LA ENCUESTADO
CAPTURA
DE DATOS
1 Valor del Avalúo VALOR 1-5 $ 190,000 190.0

2 Tamaño del TAMAÑO 7-11 690 Pies 6.90


Lote Cuadrados
3 Recámaras RECAMARAS 13 4 4

4 Baños BAÑOS 15-17 2 2.0

5 Habitaciones HABITACIONES 19-20 8 8

6 Antigüedad ANTIGÜEDAD 22-23 38 38

7 Impuestos IMPUESTOS 25-28 $ 3,750 3750

8 Estacionamiento ESTACIONAMIENTO 30 Un Auto 1

9 Ubicación UBICACIÓN 32 Este 3

10 Estilo ESTILO 34 Colonial 3

11 Combustible COMBCALEF 36 Petroleo 2


Calefacción
12 Sistema SISTCALEF 38 Agua Caliente 2
Calefacción
13 Alberca ALBERCA 40 Ninguna 1

14 Cocina con ANTECOMEDOR 42 Presente 1


antecomedor
15 Aire AIREACOND 44 Ausente 0
Acondicionado
16 Chimenea CHIMENEA 46 Ausente 0

17 Drenaje DRENAJEMUN 48 Presente 1

18 Sótano SOTANO 50 Ausente 0

19 Cocina Integral COCINAINTE 52 Ausente 0

20 Hidromasaje HIDROMASAJ 54 Ausente 0

21 Código CODIGO 56-58 001 001


entrevistado

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________35


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

BASE DE DATOS “BIENES 1”


OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1 190 6.9 4 2 8 38 3750 1 3 3 2 2 1 1 0 0 1 0 0 0 1
2 215 6 2 2 7 30 2856 1 1 4 2 2 1 1 1 0 1 1 0 0 2
3 160 6 3 2 6 35 3240 0 3 1 2 2 1 1 0 1 1 0 1 1 3
4 195 6 5 2 8 35 4000 1 1 4 2 1 1 1 0 0 1 0 1 1 4
5 163 7 3 1 6 39 2700 1 3 1 2 1 1 1 0 0 1 0 0 0 5
6 181 7 4 1.5 7 32 3959 1 2 4 2 2 2 1 0 0 1 1 0 0 6
7 220 9.75 4 1.5 7 60 3142 2 2 3 2 2 1 1 0 0 0 1 0 0 7
8 159.9 6 4 1 7 38 2800 1 3 1 1 2 1 1 0 0 1 0 1 1 8
9 160 6 2 1 7 35 2250 1 1 1 2 1 1 1 0 0 1 1 1 1 9
10 195 6 3 2 7 38 2995 1 3 4 2 2 1 1 0 1 1 0 1 1 10
11 165 9 4 1 6 32 2500 1 3 4 2 2 1 1 0 1 1 0 0 0 11
12 190 7 4 2 6 27 2600 1 2 4 1 1 1 1 0 0 1 1 1 1 12
13 180 11.2 4 1 9 32 2800 1 3 1 2 2 1 1 0 0 1 0 0 0 13
14 181 6 5 2 10 35 2500 0 3 1 2 2 1 1 0 0 1 0 0 0 14
15 160 5.6 3 1 6 37 2027 0 3 1 2 2 1 1 0 1 1 0 1 1 15
16 160 6.5 2 1 5 35 2250 1 2 1 2 2 1 0 0 0 1 1 0 0 16
17 185 6 3 1.5 8 37 2500 1 3 2 2 2 1 1 0 1 1 0 1 1 17
18 160 6 4 1 6 39 2200 1 3 1 2 2 1 1 0 0 1 0 1 1 18
19 176 6 4 2 7 37 3156 0 3 1 2 2 1 1 0 1 1 0 1 1 19
20 179.9 8.7 4 1 6 36 2741 1 3 1 2 2 1 1 0 1 1 0 0 0 20
21 147 6 4 1 6 39 2100 0 3 1 2 2 1 1 0 0 1 0 0 0 21
22 189 6.5 3 2 7 36 2400 0 3 1 2 2 2 1 0 0 1 0 1 1 22
23 176 6 4 1.5 10 30 2857 1 2 1 1 1 1 1 0 1 1 0 1 1 23
24 181 7 3 1.5 7 28 3959 1 2 3 2 2 1 1 0 0 1 1 0 1 24
25 151 6.5 3 1 6 35 2280 0 3 1 2 2 1 0 0 0 1 0 0 1 25
26 189 9.41 3 1.5 8 24 2900 1 1 4 1 1 1 1 0 0 0 1 1 1 26
27 170 6 3 2 8 38 2700 1 3 1 2 2 1 1 0 0 1 0 1 1 27
28 249 11.25 4 2.5 9 22 4600 1 1 3 2 2 1 1 0 0 1 1 1 1 28
29 267 9.88 6 2.5 6 33 4300 0 1 3 2 2 1 1 0 1 1 1 0 0 29
30 185 5.82 3 1 8 27 3700 1 2 4 2 2 1 1 0 0 0 1 0 0 30
31 269.9 10 4 2 6 28 4500 2 2 4 2 2 1 1 1 0 1 1 1 1 31
32 199.9 6 4 2 6 38 2700 1 1 1 2 2 1 1 0 0 0 1 1 1 32
33 180 6 3 1.5 7 35 2300 1 3 4 2 2 1 1 0 1 1 0 1 1 33
34 189.9 7.2 3 2 8 35 2860 1 2 1 2 2 3 1 0 1 0 1 0 0 34
35 299.9 7.5 4 2.5 7 14 4343 1 2 3 2 2 1 1 0 0 0 1 0 0 35
36 179.9 8 3 1 7 35 2911 1 2 5 1 1 2 1 0 0 1 1 1 1 36
37 210 10 3 1.5 6 30 3930 1 2 5 2 2 1 1 1 0 1 1 1 1 37
38 163 6 3 1 7 36 1889 0 3 1 2 2 1 1 0 0 1 0 1 1 38
39 159.9 6 3 1 6 39 2378 0 2 1 1 1 2 1 0 0 0 1 0 0 39
40 165 6.25 3 1 8 30 1800 0 2 4 2 1 1 1 0 1 1 0 1 1 40
41 180 6 4 1 6 35 2900 0 3 4 2 2 1 1 0 1 1 0 1 1 41
42 169 6 3 1 6 37 2671 1 1 4 2 1 1 1 0 0 1 0 1 1 42
43 179 6 3 1 7 35 3060 1 1 4 2 2 1 1 0 0 1 1 0 0 43
44 180 6 4 1 7 39 2400 0 3 1 2 1 1 0 0 0 1 0 1 1 44
45 218 6 3 2 9 31 3100 1 1 5 2 2 1 1 0 0 1 1 0 0 45
46 150 6 5 2 8 39 3177 1 3 1 2 2 2 1 0 0 0 0 1 1 46
47 247 8 4 2 6 30 3100 1 1 1 2 3 2 1 1 1 1 1 1 1 47
48 173.5 6 4 1 7 39 3000 1 3 1 2 2 1 1 0 1 1 0 1 1 48
49 218 7.4 3 2 6 30 3000 1 1 1 2 2 2 1 0 0 1 1 1 1 49
50 152 6 4 2 8 36 2700 1 3 1 2 2 1 1 0 0 0 0 0 1 50

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________36


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
51 300 5.18 4 3.5 6 15 4762 2 1 3 2 2 1 1 1 0 1 1 1 1 51
52 185 7 1 1 8 28 2700 1 2 4 2 2 1 1 0 0 1 1 1 1 52
53 200 7.5 4 2 6 36 3606 1 3 2 2 2 1 1 0 1 1 0 1 1 53
54 172 6 3 1 7 35 2752 1 1 4 2 2 1 1 0 0 1 0 1 1 54
55 230 7.2 3 2.5 7 31 3400 1 1 5 2 2 1 1 0 0 1 1 1 1 55
56 235 5 3 1.5 7 34 3148 1 1 1 2 2 1 1 0 0 0 1 1 1 56
57 186 6 5 2 7 30 3344 1 3 3 2 2 1 1 0 0 1 0 1 1 57
58 200 9.9 3 1.5 8 30 3871 1 2 5 2 2 1 1 0 0 1 1 1 1 58
59 190 6 4 1.5 7 44 3300 1 1 1 2 2 1 1 0 0 1 1 1 1 59
60 140 6 3 1 5 38 2450 1 3 1 2 2 1 0 0 0 0 0 1 1 60
61 180 7.2 3 1 8 40 1900 0 1 4 2 3 1 1 0 0 1 0 0 0 61
62 213 7 4 2 6 35 3600 0 1 4 2 2 1 1 0 0 1 1 1 1 62
63 115 18.9 3 1 10 16 2400 0 2 4 2 2 1 1 0 0 0 0 1 1 63
64 200 10.9 5 2 6 28 2540 1 2 4 2 2 1 1 0 0 1 1 0 0 64
65 153 6.18 4 1 8 39 2158 0 3 1 2 2 1 1 0 1 1 0 1 1 65
66 180 9.1 4 1.5 6 33 2853 1 3 2 2 2 1 1 0 1 1 0 1 1 66
67 163 6 4 1 6 38 2160 0 3 1 2 2 1 1 0 1 0 0 1 0 67
68 160 6.5 3 1 6 33 2500 1 3 4 2 2 1 0 0 1 1 0 0 0 68
69 175 6 4 1 6 38 2594 2 1 1 2 2 1 1 0 0 1 1 0 0 69
70 170 5 3 2 6 41 2300 1 1 1 2 3 1 1 0 0 1 1 1 1 70
71 155 6 4 1 6 35 2436 1 3 1 2 2 1 1 0 0 1 0 0 1 71
72 163 8.4 4 1 6 37 2400 1 3 2 2 2 1 1 0 1 1 0 0 1 72
73 160 6 4 2 7 38 2500 1 3 4 2 2 1 1 0 1 1 0 1 1 73
74 175 6 5 2 7 36 3024 1 3 1 2 2 1 1 0 0 1 1 1 1 74
75 177 6.42 4 2 9 39 3100 0 3 4 2 2 2 1 0 1 1 0 1 1 75
76 190 31.5 5 2 6 31 4200 0 2 5 2 2 1 1 0 0 1 1 1 1 76
77 158 6 4 1 7 35 1900 0 3 1 2 2 1 1 0 0 1 0 0 0 77
78 179 6 3 1 7 37 2950 2 3 2 2 2 1 1 0 1 1 0 1 1 78
79 215 7 4 2 7 35 3860 1 1 1 2 1 1 1 0 0 1 1 0 0 79
80 190 8.25 3 2 8 31 3600 0 2 4 2 2 1 1 0 0 1 1 1 1 80
81 170 11.8 4 2 7 34 3500 2 3 3 2 2 1 1 1 0 1 0 1 1 81
82 230 7 3 1.5 10 28 3500 1 1 5 1 1 1 1 0 0 1 1 1 1 82
83 185 16 5 1.5 8 38 3200 2 3 2 2 2 2 1 0 1 1 0 1 1 83
84 230 10 4 1.5 6 61 3638 2 2 3 2 2 1 1 0 1 1 1 0 0 84
85 180 7.2 3 2 8 14 1582 1 1 1 2 2 1 1 0 0 1 1 1 1 85
86 200 10.3 4 1.5 7 37 4079 1 3 3 2 2 1 1 0 1 1 0 1 1 86
87 180 11 4 1 8 40 2500 1 3 1 2 2 2 1 0 0 1 0 1 1 87
88 190 6 4 2 6 38 2890 0 3 1 2 2 1 1 0 0 1 0 1 1 88
89 225 6.86 3 2 5 30 3000 0 1 4 2 2 1 1 0 1 1 1 1 0 89
90 155 6.48 3 1 6 35 2483 1 1 4 2 1 1 1 0 0 0 0 0 1 90
91 179 7 4 1 8 37 2800 1 1 2 2 2 1 1 0 1 0 0 1 1 91
92 218 6 4 2 7 37 3460 0 3 2 2 2 3 1 0 1 1 0 1 1 92
93 173 10.6 4 2 6 36 2634 1 3 1 2 2 1 1 0 0 1 0 1 1 93
94 183 6 3 2 7 39 2708 1 2 4 2 2 2 1 0 0 1 1 1 1 94
95 215 7.7 4 1 6 31 2989 1 2 5 1 1 2 1 0 0 1 1 1 1 95
96 159 7.5 3 1 7 55 1814 1 2 4 2 2 1 0 0 0 1 0 1 1 96
97 195 7.75 3 1.5 6 34 3175 1 1 5 2 2 1 1 0 0 1 1 1 1 97
98 180 6.95 3 2 6 32 2800 1 2 4 2 2 2 1 0 0 1 1 1 1 98
99 161 6 4 1.5 6 36 2400 1 3 4 2 2 1 1 0 1 1 0 1 1 99

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________37


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

100 180 6 4 1 9 25 2750 1 1 4 2 2 1 1 0 0 0 1 0 0 100

OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
101 175 6 4 1 7 34 2500 1 2 1 2 2 1 1 0 0 1 1 1 1 101
102 225 6 3 2 10 33 3701 0 1 5 2 2 1 1 0 0 1 1 1 1 102
103 100 12 7 1 8 21 1775 0 2 4 2 2 1 1 0 0 1 1 1 1 103
104 165 6 4 1.5 6 36 2640 0 3 4 2 2 2 1 0 1 0 0 1 1 104
105 173 8 4 1.5 7 36 2700 1 3 4 2 1 1 1 0 1 1 0 1 1 105
106 175 10 4 2 7 34 3000 1 2 1 2 2 1 1 0 0 1 1 1 1 106
107 176 6 3 1.5 8 31 3276 0 3 1 2 2 1 1 0 0 1 0 1 1 107
108 198 6.3 4 1 7 34 3454 1 1 1 2 2 1 1 0 0 1 1 1 1 108
109 190 5 4 2 10 38 2386 1 2 1 2 2 1 1 0 0 1 1 1 1 109
110 185 28.1 6 2 8 44 4000 1 3 3 2 3 1 0 0 1 0 1 0 1 110
111 195 7.75 4 2.5 8 22 3000 1 1 4 2 2 1 1 0 0 1 1 1 1 111
112 224 6 4 2 7 37 3200 2 3 2 2 2 3 1 0 1 1 0 1 1 112
113 190 7 4 2 7 35 3465 1 1 1 2 1 1 1 0 0 1 1 1 1 113
114 245 6 3 1.5 10 30 3900 1 1 5 2 2 1 1 1 0 1 1 0 0 114
115 207 11.7 3 2 9 28 4200 1 1 5 2 1 1 1 0 0 1 1 0 0 115
116 210 6.9 4 1.5 8 24 3500 1 2 5 2 2 2 1 0 0 1 1 0 0 116
117 170 8 4 1 7 35 3000 2 3 4 2 2 1 1 0 1 1 0 0 0 117
118 185 9.01 3 1.5 6 25 2400 1 2 4 2 2 1 1 0 1 0 1 1 1 118
119 170 6 3 2 6 39 3040 2 3 4 2 2 2 1 0 1 1 0 1 1 119
120 199 10 3 2 7 38 3512 2 1 1 2 3 2 1 0 1 1 1 1 1 120
121 175 6 3 2 6 39 2800 1 3 1 2 2 1 1 0 0 1 0 1 1 121
122 190 3.55 4 2 7 35 2300 0 1 1 2 1 1 1 0 0 1 1 0 0 122
123 153 7.2 4 1 7 39 2513 1 3 1 2 2 1 0 0 0 1 0 1 1 123
124 190 5 3 1.5 7 85 1481 1 2 3 2 2 1 1 0 0 1 0 1 1 124
125 170 7.5 4 2 7 35 3616 1 3 1 2 1 1 0 0 0 1 1 1 1 125
126 180 7 4 2.5 6 32 2500 0 2 1 2 2 1 1 0 0 1 1 1 1 126
127 165 6 3 1.5 7 39 2100 0 3 1 2 2 1 1 0 0 1 0 0 0 127
128 193 6 4 2 7 35 3000 0 3 3 2 2 1 1 0 0 1 0 1 1 128
129 170 6 4 2 7 38 2500 0 3 2 2 2 1 1 0 1 1 0 1 1 129
130 188 11.1 4 2 6 36 4089 1 3 1 2 3 1 1 0 0 1 0 1 1 130
131 167 8.2 4 1 9 39 2225 0 3 4 2 2 1 1 0 1 0 0 1 1 131
132 298 12.2 5 2.5 8 24 5200 1 1 3 2 2 1 1 0 0 1 1 1 0 132
133 178 6 4 2 6 36 3250 1 3 4 2 2 3 1 0 1 1 0 1 1 133
134 160 7.8 3 1 7 20 3300 1 2 4 2 2 1 1 0 0 1 1 1 1 134
135 229 7 3 2 7 35 4100 1 1 3 1 2 1 1 0 0 1 0 0 0 135
136 215 7.5 4 2 8 35 3100 1 1 1 2 1 1 1 0 0 1 1 0 0 136
137 180 6 5 2 6 19 3500 0 3 4 2 2 1 1 0 1 1 0 1 1 137
138 190 6.78 4 2 6 39 2500 1 1 1 2 3 1 1 0 0 1 1 1 1 138
139 151 6 3 1 8 37 2074 0 3 1 2 2 1 1 0 0 1 0 1 1 139
140 240 6.48 4 2.5 9 16 4909 2 3 3 2 2 1 1 1 1 0 1 1 1 140
141 290 10.5 4 2.5 9 29 5000 2 1 5 2 2 1 1 0 1 1 1 0 0 141
142 305 12.1 3 2 7 46 3640 0 2 2 2 2 1 1 1 1 1 1 1 0 142
143 190 7 3 1.5 11 28 2948 1 2 5 1 1 2 1 0 0 1 1 1 1 143
144 310 7.32 4 2.5 9 32 3717 1 1 5 2 2 1 1 0 0 1 1 1 1 144
145 220 7 3 1.5 7 30 3200 1 2 5 1 2 1 1 0 0 1 1 0 0 145
146 160 7.85 4 2 6 28 2850 0 3 3 2 2 1 1 0 0 1 0 0 0 146

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________38


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

147 150 6 4 1 9 38 2400 1 3 1 2 2 1 1 0 0 1 0 1 1 147


148 190 7 5 1.5 6 28 4100 1 2 5 1 1 1 1 0 1 1 1 0 0 148
149 165 6 3 1 6 34 2836 1 3 1 2 2 1 1 0 0 1 0 0 0 149
150 160 6 3 1 7 39 2650 1 3 1 2 2 1 1 0 0 1 0 1 1 150
OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
151 187 6 3 1 8 36 2700 1 3 1 2 2 2 1 0 0 1 0 0 0 151
152 160 12.1 5 1 7 37 2800 1 3 4 2 2 1 1 0 1 1 0 1 1 152
153 206 11 4 1 6 35 2886 1 1 1 2 2 1 1 0 0 1 1 0 0 153
154 180 8.4 3 2 6 36 2900 0 3 4 2 2 1 1 0 1 1 0 1 1 154
155 163 8.87 3 1 6 37 1900 1 2 4 2 3 1 1 0 1 0 1 0 0 155
156 170 6 4 2 7 32 3000 1 3 4 2 1 1 1 0 1 1 0 0 0 156
157 190 7 4 2 7 28 2935 1 2 1 2 2 1 1 0 0 1 1 1 1 157
158 175 6 4 2 7 37 3000 1 3 2 2 2 1 1 0 1 1 0 1 1 158
159 225 10.4 3 2 6 15 3500 2 1 4 2 2 1 1 0 0 0 1 1 1 159
160 160 10 3 1 7 40 2307 1 3 1 2 2 1 1 0 0 1 0 1 1 160
161 175 7 3 1.5 8 31 2850 1 2 5 2 2 1 1 0 0 1 1 1 1 161
162 177 6 5 2 7 39 3200 0 3 4 2 2 1 1 0 0 1 0 1 1 162
163 220 6 3 1.5 7 31 3000 1 1 5 2 2 1 1 0 0 1 1 1 1 163
164 168 6 3 1 6 35 3000 0 3 1 2 2 1 1 0 1 1 0 1 1 164
165 160 6 4 1 7 35 2400 0 3 1 2 2 1 1 0 0 1 0 1 1 165
166 270 10.3 3 2.5 6 26 5400 2 1 5 2 2 1 1 0 0 1 1 0 0 166
167 185 6 3 1 8 30 2500 1 2 4 2 2 1 1 0 0 1 1 1 1 167
168 205 6 4 1 7 36 2827 0 1 1 2 2 1 0 0 0 1 1 0 0 168
169 174 9.12 4 1 7 36 2800 0 3 2 2 2 1 1 0 1 1 0 1 1 169
170 169 6 4 2 6 37 2911 0 3 4 2 2 1 1 0 1 1 0 1 1 170
171 175 7.63 4 2 7 37 2800 1 3 2 2 2 1 1 0 1 1 0 1 1 171
172 190 9 3 2 6 39 2945 1 2 1 2 2 1 1 0 0 1 1 0 0 172
173 167 6 4 1.5 7 36 2400 1 3 4 2 2 1 1 0 1 1 0 1 1 173
174 193 6 3 2.5 6 27 3450 1 3 5 2 2 1 1 0 1 1 1 0 1 174
175 155 6 3 1 8 35 2200 1 3 1 2 2 1 1 0 0 1 1 1 1 175
176 240 7 4 2.5 8 29 4100 1 1 5 2 2 1 1 1 0 1 1 1 1 176
177 166 7.3 4 1 7 35 2850 0 3 1 2 2 1 1 0 0 1 0 1 1 177
178 210 12.2 5 2 7 30 4400 1 1 1 2 2 3 1 0 0 1 1 0 0 178
179 180 6 4 2 6 38 3048 1 3 4 2 2 1 1 0 1 1 0 1 1 179
180 154 8.4 4 2 7 40 2550 0 3 1 2 2 1 1 0 0 1 0 0 0 180
181 177 7.5 3 1 9 65 1300 1 2 3 2 3 1 1 0 0 1 1 0 0 181
182 214 5.5 4 2 6 23 3800 1 3 5 2 2 1 1 0 1 1 1 0 0 182
183 165 6 3 1 7 39 2500 1 3 1 2 2 1 1 0 0 1 0 1 1 183
184 184 9.1 3 1.5 5 30 4134 1 2 5 2 2 1 1 0 1 1 1 0 0 184
185 149 6 3 1 7 37 2000 0 3 1 2 2 1 1 0 0 1 0 0 0 185
186 215 7.48 3 2 6 35 3200 1 1 1 2 2 1 1 0 0 1 1 0 0 186
187 159 6 4 2 10 30 2400 1 3 4 2 2 1 1 0 1 1 0 0 0 187
188 205 8 5 2 8 36 2900 0 3 1 2 2 3 1 0 1 0 1 1 1 188
189 210 7.2 4 2 7 30 3600 1 1 1 2 2 1 1 0 0 1 1 0 0 189
190 171 10 3 1.5 6 30 3115 1 2 5 2 1 2 1 0 0 1 1 1 0 190
191 185 6.25 3 1 9 80 1000 0 2 3 1 2 1 1 0 0 1 1 1 1 191
192 189 8 3 1.5 7 32 3698 1 2 5 2 2 2 1 0 1 1 1 0 0 192
193 176 6 3 2 6 34 2800 1 3 1 2 2 1 1 0 1 1 0 1 1 193
194 229 10.8 4 1 8 36 3100 0 1 1 2 2 1 1 0 1 1 0 1 1 194

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________39


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

195 188 7 4 1.5 7 30 3815 1 2 5 2 2 1 1 0 0 1 1 1 0 195


196 230 7.3 3 1.5 8 31 3814 1 2 5 2 2 2 1 0 0 1 1 1 1 196
197 280 8 3 3 9 32 3200 1 1 5 2 2 1 1 1 0 1 1 1 1 197
198 198 6 5 3 6 33 2800 0 2 1 2 2 1 0 0 0 1 1 1 1 198
199 153 6 3 1.5 10 36 2650 0 3 1 2 2 1 1 0 1 1 0 1 1 199
200 200 11 3 2 7 33 2767 0 2 4 2 1 2 1 1 1 1 1 0 0 200
OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
201 280 6 3 2.5 6 30 4058 2 1 5 2 2 1 1 0 0 1 1 1 1 201
202 175 6 3 1 8 35 2200 1 1 4 2 1 1 1 0 1 0 0 1 1 202
203 195 6.5 4 2 6 30 3700 0 2 1 2 2 2 1 0 1 1 1 1 1 203
204 185 4.1 3 1 7 38 2589 1 1 1 2 3 1 1 0 0 1 1 1 0 204
205 180 7.2 4 1 7 30 2900 1 1 1 2 2 1 0 0 0 1 1 0 0 205
206 205 7.5 4 2 6 26 3235 0 1 1 2 2 1 1 0 0 1 1 0 0 206
207 180 6 4 2 7 35 2784 1 2 1 2 1 1 1 0 0 1 1 0 0 207
208 190 6 4 2 9 39 3480 1 1 3 2 1 1 1 0 0 1 1 0 0 208
209 225 6.8 4 2.5 7 23 3600 1 2 5 2 2 1 1 0 0 1 1 1 1 209
210 160 6 4 1 8 35 2800 1 3 1 2 2 2 1 0 0 1 0 1 1 210
211 200 7 4 2 5 33 4163 2 2 5 2 1 3 1 0 1 1 1 1 1 211
212 180 8.5 3 1 7 35 2725 1 2 4 2 2 2 1 0 0 1 1 0 0 212
213 195 6 4 2 7 32 3000 0 1 1 2 2 1 1 0 0 1 1 0 0 213
214 170 6 4 2 10 38 2200 1 3 1 2 2 1 1 0 0 1 0 0 0 214
215 260 6.5 3 2.5 7 31 4400 0 1 5 2 2 1 1 1 0 1 1 1 1 215
216 175 6.3 3 1 5 39 3000 1 3 4 2 2 1 1 0 1 0 0 1 1 216
217 168 6 2 1 6 38 2400 1 1 1 2 2 1 1 0 0 1 1 1 1 217
218 180 6 4 1 7 50 2419 1 1 1 2 1 1 1 1 1 1 1 0 0 218
219 185 6 4 1 11 35 2200 1 1 1 1 2 1 1 0 0 1 1 1 1 219
220 287 6 5 2.5 6 32 4000 1 1 5 2 2 3 1 0 0 1 1 1 1 220
221 166 6 3 1 6 45 1600 0 1 1 2 2 1 1 0 0 1 1 1 1 221
222 265 6 3 1 7 31 2900 1 1 5 1 1 1 1 0 0 1 1 1 0 222
223 182 9.97 4 2 7 30 3739 0 2 4 2 2 1 1 0 1 0 1 0 0 223
224 230 6 4 2 6 35 3558 1 1 1 2 2 1 1 0 0 1 1 0 0 224
225 194 8.3 2 2 6 35 3440 1 1 4 2 2 3 1 1 1 1 1 1 1 225
226 295 12.2 5 3 8 28 6470 2 1 2 2 2 1 1 0 1 1 1 0 0 226
227 170 6.5 3 2 6 35 2303 1 1 4 2 2 1 1 0 1 1 0 0 0 227
228 175 5.4 5 1.5 8 37 3500 2 3 3 2 2 1 1 0 0 1 0 1 1 228
229 275 6 3 2 9 32 4400 2 1 5 2 2 1 1 1 1 1 1 1 1 229
230 150 6 3 1 6 37 2300 2 3 1 2 2 1 0 0 0 0 0 0 1 230
231 225 7.7 3 2.5 10 34 4100 1 1 5 2 2 1 1 0 0 1 1 0 0 231
232 178 7 4 2 7 35 3100 1 2 1 2 2 1 0 0 1 1 1 0 0 232
233 232 6.8 4 2.5 8 10 4980 1 2 3 2 2 1 1 0 0 0 1 1 1 233

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________40


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.2.2.1.B.D. EJEMPLO ILUSTRATIVO EN MINITAB 17. Base de Datos

EJEMPLO Para crear una base de datos en MINITAB17, accede a MINITAB VERSIÓN
ILUSTRATIVO 17. Cuando aparezca la pantalla da un clic en la opción Archivo de la barra menú
y selecciona Nuevo. Aparecerá la ventana Nuevo. Selecciona la opción
INTEGRAL EN
Proyecto Minitab y Aceptar
MINITAB 17.
1.2.2.1. CREACIÓN DE
UNA BASE DE
DATOS

Utilice el menú Archivo para


abrir, cerrar, guardar,
imprimir o ejecutar diversos
tipos de archivo que Minitab
puede utilizar.

Tipos de archivo de
Minitab que contienen
datos Procede a editar la base de datos de la siguiente manera:

Dos de los tipos de archivos Coloca los nombres de las variables debajo de cada número de variable conforme
principales que usted al código para la computadora de la encuesta:
utilizará contienen datos:

· Proyectos – contienen
hojas de trabajo, junto
con la salida de la
ventana Sesión y gráficas

· Hojas de trabajo –

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________41


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

contienen todos sus


datos: columnas,
constantes y matrices.

Usted puede tener múltiples


hojas de trabajo abiertas en
un proyecto. Cuando usted
abre un archivo de proyecto,
todas las hojas de trabajo
que estaban dentro de ese
proyecto cuando las guardó
la última vez están
disponibles para usted.
Cuando usted guarda un
proyecto, las hojas de
trabajo se guardan dentro de
ese archivo de proyecto.

Usted puede agregar hojas


de trabajo a su proyecto al
copiar datos de un archivo
utilizando Archivo > Abrir
hoja de trabajo. Observe que
se copian los datos. Esto Una vez termines de colocar los nombres de cada variable (CÓDIGO PARA LA
quiere decir que cuando
COMPUTADORA), coloca el cursor en el primer nombre de la variable y da clic
usted cambia los datos
dentro de un proyecto, no con el botón derecho del mouse. Aparecerá un sub-menú con varias opciones.
está afectando al archivo Selecciona la opción columna. Aparece otro sub-menú con varias opciones.
original. Usted puede abrir Selecciona la opción descripción.
un proyecto, cambiar datos y
guardar el proyecto una y
otra vez sin afectar al
archivo original.

Usted también puede


guardar una hoja de trabajo
como un archivo separado
que puede utilizarse en otros
proyectos de Minitab o en
otras aplicaciones. Véase
Archivo > Guardar hoja de
trabajo actual (como).

Generalmente, los archivos


de datos que usted incluye y
guarda en su proyecto serán
hojas de trabajo de Minitab.
Dichas hojas de trabajo
pueden ser archivos
autónomos (archivos con la
extensión MTW) o partes de
un archivo de proyecto
(MPJ). Usted puede tener
una vista preliminar para ver
una lista de todas las hojas
de trabajo en el archivo y

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________42


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

puede utilizar Archivo > Abrir En la ventana de cuadro que aparece escribe la pregunta tal como viene en el
hoja de trabajo para abrir cuestionario precodificado.
una o más hojas de trabajo
de ese proyecto para
agregar a su proyecto actual.

Una vez escrita la pregunta da Aceptar y se colocará un pequeño recuadro rojo


que servirá posteriormente para leer el texto de la pregunta cuando pongas el
cursor en dicho triángulo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________43


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Repite el procedimiento anterior con todas las variables. Una vez terminado de
completar la información en todas las variables, introduce en cada celda el valor
correspondiente.

Tipos de archivos que no


son de Minitab que
contienen datos

Usted también puede abrir y


guardar archivos de datos en
los formatos de muchas
aplicaciones, como Excel y
Lotus 1-2-3. Véase Abrir
archivos con otras
aplicaciones. Para
intercambiar datos con otras
aplicaciones, tales como
programas de computación
centrales, usted puede abrir
y guardar archivos de texto.
Finalmente, usted puede
intercambiar datos con las
versiones de Minitab en otras
plataformas utilizando las
Cuando termines de introducir todos los datos selecciona con el puntero del
hojas de trabajo portátiles de
Minitab (archivos MTP). mouse en el menú de ARCHIVO de la barra principal, la opción Guardar
Véase Abrir y guardar con proyecto como y da un clic con el botón izquierdo del mouse.
versiones anteriores de
Minitab u otras plataformas. El sistema presenta la pantalla Guardar proyecto como:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________44


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Coloca en el campo Nombre el nombre del archivo, en este caso BIENES1 y la


extensión correspondiente que te indique el sistema. En el campo Guardar en,
selecciona en que disco deseas guardar la información y con el puntero del mouse
selecciona el botón Guardar de la ventana y da un clic con el botón izquierdo del
mouse.

Con lo anterior queda terminada la creación de la base de datos en el paquete


MINITAB17. Para salir del sistema selecciona con el puntero del mouse en el
menú Archivo de la barra la opción Salir y da un clic con el botón izquierdo del
mouse. El sistema te mandará al escritorio de Windows en la pantalla.

OBJETIVO 1.3. El alumno entenderá la importancia de aplicar las


técnicas de examen de datos al proceso estadístico multivariado que
requiere el análisis de datos ausentes así como la comprobación de
los supuestos subyacentes en todos los métodos multivariados.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________45


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ANTECEDENTES CONCEPTOS DE:

Datos estadísticos, concepto de variable y su clasificación, escalas de medición


de una variable, muestreo estadístico, error de muestreo, diseño de una
muestra, tipos de muestreo, análisis descriptivo, presentación de los datos con
una y/o dos variables, estadísticos o estimadores más usuales, medidas de
tendencia central, medidas de dispersión, medidas de posición, medidas de
sesgo, medidas de curtosis, diagrama de caja y brazos.

ANÁLISIS PREVIO DE LOS DATOS


1.3.1 MULTIVARIADOS.EXAMEN GRÁFICO DE LOS DATOS. DATOS
AUSENTES. CASOS ATÍPICOS

CONCEPTOS BÁSICOS ANÁLISIS PREVIO DE LOS DATOS:


EXAMEN GRAFICO DE
LOS DATOS.
Introducción:
DATOS AUSENTES.
CASOS ATÍPICOS La potencia estadística de las técnicas multivariadas requiere grandes conjuntos de
datos supuestos más complejos que los que encontramos en el análisis
univariante, por ejemplo, los efectos de los datos ausentes, los cuales por
definición no se representan directamente en los resultados pueden ser
sustanciales por el impacto que producen sobre la naturaleza y carácter de los
resultados.

El propósito de este contenido es proporcionar una visión general de las técnicas


de examen de datos, que van desde el simple proceso de inspección visual de los
gráficos al proceso estadístico Multivariado que requiere el análisis de datos
ausentes y la comprobación de los supuestos subyacentes en todos los métodos
multivariados.

Aunque puede parecer que es malgastar tiempo, esfuerzo y recursos al proceso de


examinar los datos previamente, los problemas “ocultos” que surgen del análisis
previo de los datos puede conducir a problemas potencialmente catastróficos que

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________46


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

se pueden evitar al seguir estos análisis previos cada vez que se aplique una
técnica multivariada evitando cometer errores serios.

Podemos distinguir cuatro fases distintas en el examen de datos. La primera


incluye un examen gráfico de la naturaleza de las variables a analizar y las
relaciones que forman las bases del análisis multivariado. La segunda, un proceso
de evaluación para entender el impacto que pueden tener los datos ausentes
sobre el análisis y alternativas que se pueden usar cuando se presentan en forma
relativa. Una tercera fase la forman las técnicas que mejor se ajustan para la
identificación de casos atípicos que puedan distorsionar las relaciones sobre una o
más variables estudiadas y finalmente una cuarta que consiste en los métodos
analíticos necesarios para evaluar la capacidad de los datos para cumplir con los
supuestos estadísticos específicos de muchas técnicas multivariadas.

1. EXAMEN GRÁFICO DE LOS DATOS:


Utilice un histograma para
evaluar la forma y la
tendencia central de sus Este examen ayuda a la comprensión de las características básicas de los datos y
datos y para evaluar si sus sus relaciones subyacentes, cuando se considera el análisis univariado, el nivel de
datos siguen o no una comprensión puede ser muy simple, pero a medida que el investigador se
distribución específica, tal
introduce en los más complejos análisis multivariados, la necesidad y el nivel de
como la distribución normal
. comprensión aumentan considerablemente, por lo que es necesario revisar los
métodos gráficos básicos que existen para ayudar a la obtención de una
Las barras representan el comprensión de las características de los datos, particularmente en un sentido
número de observaciones multivariado.
que se ubican dentro de
intervalos consecutivos o
La mayoría del software estadístico tiene módulos particularmente comprensivos
secciones. Debido a que
cada barra representa de técnicas graficas preparadas para el examen previo de los datos que se ven
muchas observaciones, un mejorada muchas veces con medidas estadísticas más detalladas de la descripción
histograma es más útil de los datos.
cuando se tiene una gran
cantidad de datos.
La naturaleza de la variable: Análisis de la forma de la distribución:
Utilice una gráfica de puntos
Para entender la naturaleza de cualquier variable, el punto de inicio es caracterizar
para evaluar la forma y la
tendencia central de sus la forma de su distribución. Aunque algunas medidas descriptivas que se
datos. Igual que un analizarán paralelamente para analizar la normalidad, el investigador puede
histograma, una gráfica de obtener una perspectiva adecuada de la variable a través de un histograma que
puntos se divide en
representa gráficamente la frecuencia de los datos en cada categoría. Si el examen
secciones. Sin embargo, una
gráfica de puntos puede ser de la distribución tiene como objetivo evaluar su normalidad, se puede superponer
más útil que un histograma la curva normal sobre la distribución.
cuando se tiene una
cantidad pequeña de datos
porque:

· Por opción
predeterminada, una gráfica
de puntos tiene muchas más
secciones que un

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________47


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

histograma.
Histograma de VALOR
· Cada punto representa 100 98
95
una observación (o un
número pequeño de
observaciones).
80

Las gráficas de puntos


también son útiles para

Frecuencia
60
comparar grupos de datos.

40

22
20 14

2 2
0
0
80 120 160 200 240 280 320
VALOR

Una variante del histograma es el diagrama de tallo y hojas que presenta el


Utilice una gráfica de tallo y
hoja para mostrar los mismo cuadro de gráfico, pero que también proporciona una enumeración de los
valores de datos reales en valores de los datos reales. El tallo es la raíz al cual se añaden las hojas.
un formato de secciones.
Aunque es similar a una Diseño de tallo y hoja: VALOR
gráfica de puntos, una
gráfica de tallo y hoja:
Tallo y hoja de VALOR N = 233
· Se proyecta hacia un Unidad de hoja = 10
lado.
2 1 01
· Utiliza las cifras iniciales
de los valores de muestra
2 1
para determinar las
secciones (por ejemplo, una
sección puede tener valores 25 1 44455555555555555555555
entre 0 y 9, otra sección
pudiera tener valores entre 100 1
10 y 19, y así 66666666666666666666666666666666667777777777777777777777777777777+
sucesivamente).
(73) 1
· Muestra las cifras de los 88888888888888888888888888888888888888888888899999999999999999999+
valores individuales en lugar
de puntos.
60 2 0000000111111111111111

38 2 222222222223333333

20 2 4444

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________48


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

16 2 666677

10 2 88899999

2 3 01

Análisis de la relación entre variables:


Utilice una gráfica de
dispersión para evaluar la Una vez realizado un meticuloso examen de la distribución de una variable, el
relación entre dos variables. investigador está interesado en examinar las relaciones entre dos o más variables.
Los valores de las dos El método más común de análisis bivariante es el gráfico de dispersión, un
variables sirven como las gráfico de puntos de datos basados en dos variables. Se representa una variable
coordenadas de x y las
en el eje horizontal y la otra en vertical. Las variables pueden ser valores
coordenadas de y para
observados, valores esperados o incluso residuos. Los puntos del gráfico
graficar cada observación.
representan los correspondientes valores conjuntos de las variables para cualquier
caso dado.

Gráfica de dispersión de VALOR vs. IMPUESTO

300

250
VALOR

200

150

100

1000 2000 3000 4000 5000 6000 7000


IMPUESTO

Cuando los puntos se organizan a lo largo de una línea recta, tendremos una
relación lineal de correlación. Un conjunto de puntos curveados puede indicar una
relación no lineal, que se puede tratar de varias formas. También puede suceder
que no existan patrones tratándose de puntos aparentemente aleatorios, en este
caso no existe relación.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________49


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Existen diversos tipos de gráficos de dispersión, sin enbargo un formato que se


adapta particularmente a las técnicas multivariadas, es la matriz del grafico de
dispersión que muestra todas las combinaciones de variables en la posición inferior
de la matriz y la diagonal muestra los histogramas de las variables. En la parte
superior de la matriz se incluyen las correlaciones correspondientes para que el
investigador pueda valorar la correlación representada en cada gráfico.

Análisis de las diferencias entre grupos:

El investigador se enfrenta también con la tarea de entender el carácter y la


diferencia entre dos o más grupos de una variable para dos o más variables
métricas, tal como ocurre en el análisis discriminante, análisis de varianza y
MANOVA. En estos casos se necesita entender cómo se distribuyen los valores
para cada grupo para tener significancia estadística, además de otro aspecto
importante como la identificar los casos atípicos, que pueden resultar ser
aparentes sólo cuando los valores de los datos se separan en grupos.

El método que se utiliza para esta tarea es el grafico de caja y brazos múltiple.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de
la distribución de los datos, es decir la longitud de la caja es la distancia entre el
primer y el tercer cuartil conocida como el Rango intercuartílico (RIQ) y contiene el
50% de los datos centrales de la distribución. La línea dentro de la caja representa
la posición de la mediana y conforme a si ésta cae cerca del final de la caja, se
indica la presencia de la asimetría o de sesgo hacia alguno de los lados. Las líneas
que se extienden desde la caja (llamadas bigotes o brazos) representan la
distancia entre la mayor y la menor de las observaciones que están a menos de un
cuartil de la caja. Los casos atípicos son observaciones que se sitúan entre 1.5 y
3.0 RIQ fuera de la caja.

Utilice una gráfica de caja


para evaluar y comparar las Gráfica de caja de VALOR
características de
distribución, tales como
300
mediana, rango y simetría,
así como para identificar
valores atípicos.
250

Las opciones de
VALOR

presentación incluyen 200


símbolos para la media y
cajas para los intervalos de
confianza de la mediana. 150

100

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________50


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Un valor ausente puede 2. DATOS AUSENTES:


tener distintos
significados. Es posible que Introducción:
el campo no fuera aplicable,
que el evento no se Los datos ausentes son algo generalizado en el análisis multivariado. Por esta
produjera o que los datos no
estuvieran razón, el desafío consiste en enfrentarse a los resultados producidos por los datos
disponibles. También puede ausentes en los procesos de estimación y que afectan a la generalidad de los
deberse a que la persona resultados. La ocupación primaria del investigador es determinar las razones que
que escribió los datos no
subyacen en el dato ausente, debiendo entender el proceso principal de esta
conocía el valor correcto, o
no se preocupó de rellenar ausencia de datos para seleccionar el curso de acción apropiado.
un campo.
Un proceso de datos ausentes es cualquier evento sistemático externo al
encuestador (errores en la captura de los datos o problemas de su recolección) o
Sin embargo, hay muchos
acción por parte del encuestado (tales como rehusar a contestar) que da lugar a la
escenarios de análisis de
datos en los que los valores
ausencia de datos.
ausentes proporcionan
El impacto de los datos ausentes es perjudicial, no sólo por sus potenciales sesgos
información importante. El
significado de los valores
“escondidos”, sino también por su efecto en el tamaño de la muestra disponible en
ausentes depende en gran el análisis. En muchos análisis multivariantes, la ausencia de datos elimina tantas
parte del contexto. Por observaciones, que lo que en principio era una muestra adecuada, se reduce a una
ejemplo, un valor de fecha inadecuada. En estas circunstancias, el investigador debe buscar observaciones
ausente en una lista de adicionales o encontrar una solución para la ausencia de datos en la muestra
facturas tiene un significado original.
sustancialmente diferente de
la ausencia de una fecha en
la columna que indica la
fecha de contratación de un Razones causantes de datos ausentes:
empleado.
La ausencia de datos puede ocurrir por muchas razones y en muchas situaciones.
Uno se debe a factores de procedimiento tales como errores en la entrada de
datos que crean códigos inválidos, restricciones de representatividad o fallos al
completar el cuestionario. En estas situaciones, el investigador tiene poco o nulo
control sobre los procesos de ausencia de datos. Otro tipo de procesos de pérdida
de datos tiene lugar cuando la respuesta es inaplicable, como las preguntas en
relación a los años de matrimonios para adultos que nunca han estado casados.

Otros tipos de procesos de datos ausentes tiene que ver con el encuestado, que
no desea contestar tal pregunta. El investigador debe preveer estos problemas e
intentar minimizarlos en el diseño de la investigación y en los niveles de
recolección de los datos.

Tratamiento de datos ausentes:

Las aproximaciones o soluciones que tratan los datos ausentes pueden clasificarse
en tres categorías basadas en la aleatoriedad de los procesos de datos ausentes,

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________51


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

en función del método empleados para eliminarlos:

a. Utilizar sólo aquellas observaciones con datos completos.

La aproximación más sencilla y directa para tratar con datos ausentes es incluir
sólo aquellas observaciones con datos completos. Este método está incluido en
casi todo el software estadístico y es el método por defecto en muchos programas.
No obstante, este método sólo es recomendable cuando los valores ausentes se
presentan en forma aleatoria y no forman un patrón, ya que podrían sesgarse los
resultados. Incluso aunque fueran aleatorios los datos ausentes, podía la muestra
resultante quedar reducida a una muestra inadecuada por su tamaño para los
propósitos del análisis.

b. Supresión de caso(s) y/o variable(s).

Otra solución simple para los datos ausentes es suprimir el caso(s) y/o variable(s)
que peor se comporta(n) respecto a los datos ausentes. El investigador determina
la extensión de los datos ausentes sobre cada caso y variable, y entonces suprime
los casos y variables que excedan el nivel especificado. Cuando se presenta un
patrón de datos ausentes puede ser una solución viable este método. Si una
variable, que no sea la variable dependiente tiene valores ausentes y es una
candidata de eliminación, el investigador debe asegurarse de que existan variables
alternativas, que se espera que estén altamente correlacionadas, para representar
a la variable original.

c. Métodos de imputación.

Una tercera forma para tratar con datos ausentes, es usar alguno de los muchos
métodos de imputación. La imputación es el proceso de estimación de valores
ausentes basado en valores de otras variables y/o casos de la muestra. La
finalidad es emplear relaciones conocidas que puedan identificarse en los valores
válidos de la muestra que ayuden a estimar valores ausentes. El investigador debe
considerar el uso de la imputación en cada instancia, dados sus potenciales
impactos sobre el análisis.

En los métodos de imputación suelen utilizarse básicamente variables métricas, ya


que se pueden hacer estimaciones de los datos ausentes. Mientras que en las
variables no métricas requieren una estimación de un valor específico en lugar de
una estimación en una escala continua, como por ejemplo la estimación del
género del encuestado, cuando este dato este ausente.

La sustitución de datos ausentes consiste en sustituir datos ausentes por valores


estimados sobre la base de otra información existente en la muestra. Esto se
puede llevar a cabo de distintas maneras:

- Sustitución de caso: en este método, las observaciones con datos


ausentes se sustituyen con otras observaciones no muestrales y es el que más se

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________52


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

utiliza cuando existen datos ausentes en un caso particular.

- Sustitución por la media: es tal vez el método más empleado y consiste en


sustituir los valores ausentes por una variable cuyo valor medio se calcula sobre
todas las respuestas válidas. La lógica de esta aproximación, es que la media es el
mejor valor de sustitución aunque tiene tres desventajas: la primera es que
invalida las estimaciones de la varianza derivada de las fórmulas estándar de la
varianza para conocer la verdadera varianza de los datos. La segunda, la
distribución real de los valores se encuentra distorsionada por la sustitución de los
datos ausentes por la media. La tercera es que el método modifica la correlación
observada porque todos los datos ausentes tendrán un valor único constante. Por
otro lado tiene la ventaja de ser fácil de realizar y proporcionar una información
completa para todos los casos.

- Sustitución por valor constante: el investigador utiliza este método para


sustituir los valores ausentes por un valor constante derivado de fuentes externas
o de una investigación previa por considerar que el valor de sustitución de una
fuente externa es más valido que el valor generado internamente por la media.

- Imputación por regresión: el análisis de regresión se usa en este método


para predecir valores ausentes de una variable basándose en su relación con las
otras variables del conjunto de datos. Este método tiene el atractivo de usar las
relaciones preexistentes en la muestra como base de predicción, sin embargo,
puede que refuerce las relaciones ya existentes en la muestra y hacer que el
análisis sea menos generalizable. Otra desventaja es que se subestima la varianza
de la distribución, además de suponer a priori que la variable con datos ausentes
tiene correlaciones sustanciales con otras variables. Si estas correlaciones no son
buenas para una estimación significativa es mejor utilizar otros métodos, como la
sustitución por la media.

Si una muestra contiene 3. CASOS O VALORES ATÍPICOS:


más de un supuesto valor
atípico, entonces la prueba Los casos atípicos son observaciones que presentan una combinación de
de Grubbs y la relación Q de
características que pueden ser identificadas que hace que diferencien claramente
Dixon pudieran no ser
efectivas. Las otras pruebas de las otras observaciones. Pueden ser benéficos o problemáticos y deben ser
de Dixon se diseñaron para analizados dentro del contexto del análisis y, su evaluación está en función de la
superar el efecto de información que pueden proporcionar. Cuando son benéficos pueden ser
ocultación que pueden
ocasionar múltiples valores indicativos de ciertas características de un segmento de la población que se
atípicos potenciales. llegaría a descubrir en el curso normal del análisis. Si son problemáticos no son
representativos de la población y están en contra de los objetivos del análisis y
No debe utilizar las pruebas pueden distorsionar seriamente las pruebas estadísticas. Se sugiere realizar un
de valor atípico de Minitab análisis meticuloso de influencia para averiguar el tipo de influencia que ejercen.
más de una vez en la misma
muestra. Si elimina un valor
atípico de su muestra y Los casos atípicos se pueden clasificar en cuatro categorías: la primera los que

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________53


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

luego vuelve probar, surgen de un error de procedimiento, tales como la captura de datos o un error en
arriesga eliminar valores que la codificación que puede, en algunos casos, evitarse con un adecuado filtro de
no son en realidad atípicos.
datos. La segunda es la observación que ocurre como consecuencia de un
acontecimiento extraordinario y existe una aplicación por la unidad de la
observación y el investigador debe decidir si es representativo de la muestra y
debe ser retenido en el análisis o si hay que suprimirlo. La tercera categoría
comprende las observaciones extraordinarias para las que el investigador no tiene
explicación y, a menos que el investigador crea que representan un segmento
válido de la población, deben ser eliminados. La cuarta y última contiene las
observaciones que se sitúan fuera del rango ordinario de valores de cada variable,
pero que son únicos en su combinación de valores entre las variables. En este
caso el atípico no es un miembro válido de la población.

Valor atípico - una Detección de casos atípicos:


observación inusualmente
grande o pequeña. Los Pueden identificarse los casos atípicos desde un enfoque univariado, divariado o
valores ubicados más allá de multivariado, y el investigador debe utilizar cualquiera de ellos buscando una
los bigotes o brazos son consistencia entre los métodos de identificación de casos atípicos.
valores atípicos.
- Detección univariante: examina la distribución de las observaciones,
Por opción predeterminada, seleccionando como casos atípicos aquellos casos que caigan fuera de los rangos
el bigote o brazo superior en
de la distribución, estableciendo un umbral para la designación como caso atípico.
Minitab se extiende hasta el
valor de datos más alto Un enfoque típico convierte en primer lugar los valores de los datos en valores
dentro del límite superior. estándar que tienen media cero con varianza uno. En muestras pequeñas (de 80 o
incluso menos), las pautas sugeridas identifican como atípicos aquellos casos con
Límite superior = Q3 + 1.5 valores estándar de 2.5 o superiores, y para muestras más grandes las pautas
(Q3 - Q1)
sugieren que el valor del umbral estandarizado se sitúe entre 3 y 4.

Por opción predeterminada, A menudo es más fácil identificar gráficamente los valores atípicos, identificando
el bigote o brazo inferior en
dichos valores en gráficas de cajas, al etiquetar las observaciones que son por
Minitab se extiende hasta el
valor más bajo dentro del menos 1.5 veces el rango intercuartílico (RIQ) (Q3-Q1) desde el borde de la caja.
límite inferior.

Límite inferior = Q1- 1.5 (Q3


- Q1)

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________54


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Gráfica de caja de VALOR

300

250

VALOR
200

150

100

- Detección bivariante: Pueden evaluarse conjuntamente pares de variables


mediante un gráfico de dispersión. Casos que caigan fuera del rango del resto de
las observaciones pueden identificarse como puntos atípicos en el gráfico de
dispersión. Para ayudar a determinar el rango esperado de las observaciones, el
investigador necesita una forma de medición objetiva de la posición
multidimensional de cada observación relativa a un punto común. La medida 𝐷" de
Mahalanobis puede usarse para este fin. Es una medida de la distancia de cada
observación en un espacio multidimensional respecto al centro de las
observaciones. Dada la naturaleza de las pruebas estadísticas, se sugiere se use
un nivel muy conservador, quizás 0.01, como un umbral para la designación como
caso atípico.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________55


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

La Distancia de Mahalanobis
es la distancia entre un
punto de datos y el
centroide de un espacio
multivariado (media
general). Utilice la distancia
de Mahalanobis en Análisis
de componentes principales
para identificar valores
atípicos. Es un método
multivariado más poderoso
para detectar valores
atípicos que el
procedimiento de examinar
una variable a la vez,
porque toma en cuenta las
diferentes escalas entre
variables y las correlaciones
entre éstas.

Es importante verificar la presencia de valores atípicos ya que éstos pueden


influir significativamente en sus resultados. La gráfica de valores atípicos muestra
las distancias de Mahalanobis para cada una de las observaciones en su hoja de
trabajo de Minitab. Los puntos que se encuentran por encima de la línea de
referencia del eje Y son valores atípicos.
La distancia de Cook, o D,
es una medida general del El análisis de influencia es otra variante. Utilice medidas de diagnóstico, tales como
impacto combinado de cada distancia de Cook o DFITS para determinar si el valor atípico es una observación
observación sobre los influyente. Para determinar el efecto del valor atípico sobre sus resultados, realice
valores ajustados. Dado que el análisis con y sin la observación para ver cómo cambia el modelo. Note que una
D se calcula utilizando observación pudiera ser un valor atípico en un modelo lineal, pero se explica mejor
valores con apalancamiento mediante un modelo no lineal.
y residuos estandarizados,
considera la posibilidad de - Detección multivariada: además de la evaluación univariada y divariada, es
que una observación sea conveniente realizar una evaluación multivariada de cada observación para
poco común con respecto identificar casos atípicos a lo largo de un conjunto de variables. Dado que la
tanto a los valores x como a
mayoría de los análisis multivariados tienen más de dos variables, el investigador
los valores y.
necesita una forma de medición objetiva de la posición multidimensional de cada
Geométricamente, la la
distancia de Cook es una observación relativa a un punto común. La medida 𝐷" de Mahalanobis puede
medida de la distancia entre usarse para este fin. Es una medida de la distancia de cada observación en un
los valores ajustados espacio multidimensional respecto al centro de las observaciones. Dada la
calculados con y sin la naturaleza de las pruebas estadísticas, se sugiere se use un nivel muy
observación iésima. Los conservador, quizás 0.01, como un umbral para la designación como caso atípico.
valores grandes, los cuales
son indicativos de
La distancia de Mahalanobis es la distancia entre un punto de datos y el centroide
observaciones poco
de un espacio multivariado (media general). Utilice la distancia de Mahalanobis en
comunes, pueden producirse

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________56


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

porque la observación posee Análisis de componentes principales para identificar valores atípicos. Es un método
1) un residuo grande y un multivariado más poderoso para detectar valores atípicos que el procedimiento de
apalancamiento moderado, examinar una variable a la vez, porque toma en cuenta las diferentes escalas entre
2) un apalancamiento
variables y las correlaciones entre éstas.
grande y un residuo
moderado o 3) un residuo y
un apalancamiento grandes.
Algunos estadísticos
recomiendan comparar D
con la distribución F (p, n-
p). Si D es mayor que el
valor F en el percentil 50,
entonces D es considerado
extremo y se debe
examinar. Otros estadísticos
recomiendan comparar las
estadísticas D entre sí,
identificando valores que
sean extremadamente
grandes en relación con los
demás valores. Una sencilla
manera de comparar los
valores D consiste en
graficarlos utilizando
graficas de series de tiempo,
donde el eje x representa
las observaciones, no un
índice ni un período de
tiempo.

Es importante verificar la presencia de valores atípicos ya que éstos pueden


influir significativamente en sus resultados. La gráfica de valores atípicos muestra
las distancias de Mahalanobis para cada una de las observaciones en su hoja de
trabajo de Minitab. Los puntos que se encuentran por encima de la línea de
referencia del eje Y son valores atípicos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________57


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.1 EJEMPLO ILUSTRATIVO. Datos atípicos. Diagrama de Caja y


Brazos Simple.

EJEMPLO Una agencia de Bienes Raíces desea examinar el VALOR general de las casas
ILUSTRATIVO que forman su cartera de ventas. Las casas se encuentran ubicadas en diferentes
orientaciones de la ciudad. Se levanta en principio una encuesta que más
1.3.1.1 adelante se llamará “BIENES1” a 30 de ellas que incluyen 21 preguntas entre
DATOS ATÍPICOS. ellas el VALOR de las mismas. Cree una gráfica de caja y brazos para examinar
DIAGRAMA DE CAJA la distribución de los valores de las misma y revisar la posibilidad de
encontrar valores atípicos que pudieran influir negativamente en el estudio que
Y BRAZOS SIMPLE se pretende realizar más adelante.

Los datos se muestran a continuación:

215.0 210.0 174.5 177.5 297.5 180.0


181.0 205.0 260.0 173.0 290.0 160.0
189.0 154.0 175.0 174.9 219.9 176.5
176.0 215.0 286.5 185.0 189.9 189.9
267.0 280.0 169.5 164.9 159.9 185.0

Para ordenar los datos en forma ascendente usamos un diagrama de


tallo y hojas sin recortar los datos o valores atípicos generado por
Utilice una gráfica de puntos Minitab:
para evaluar la forma y la
tendencia central de sus
Tallo y hoja de VALOR N = 30
datos. Igual que un
histograma, una gráfica de Unidad de hoja = 1.0
puntos se divide en secciones.
Sin embargo, una gráfica de
puntos puede ser más útil que 2 15 49
un histograma cuando se 5 16 049
tiene una cantidad pequeña 12 17 3445667
de datos porque: (7) 18 0155999
11 19
· Por opción 11 20 5
predeterminada, una gráfica 10 21 0559
de puntos tiene muchas más
6 22
secciones que un histograma.
6 23
6 24
· Cada punto representa
6 25
una observación (o un número
pequeño de observaciones). 6 26 07
4 27
4 28 06

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________58


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Las gráficas de puntos 2 29 07


también son útiles para
comparar grupos de datos. Para ordenar los datos en forma ascendente usamos un diagrama de
tallo y hojas recortando los datos o valores atípicos generado por
Utilice una gráfica de tallo y Minitab:
hoja para mostrar los valores
de datos reales en un formato
Tallo y hoja de VALOR N = 30
de secciones. Aunque es
similar a una gráfica de Unidad de hoja = 1.0
puntos, una gráfica de tallo y
hoja:
1 15 4
· Se proyecta hacia un lado. 2 15 9
4 16 04
· Utiliza las cifras iniciales de 5 16 9
los valores de muestra para 8 17 344
determinar las secciones (por 12 17 5667
ejemplo, una sección puede 14 18 01
tener valores entre 0 y 9, otra (5) 18 55999
sección pudiera tener valores 11 19
entre 10 y 19, y así 11 19
sucesivamente).
11 20
11 20 5
· Muestra las cifras de los 10 21 0
valores individuales en lugar
9 21 559
de puntos.
6 22
6 22
6 23
6 23
6 24
6 24
6 25
6 25
6 26 0
5 26 7

HI 280, 286, 290, 297

Otra forma de ordenarlos es colocarlos en forma ascendente:

154.0 173.0 176.5 185.0 210.0 267.0


159.9 174.5 177.5 189.0 215.0 280.0
160.0 174.9 180.0 189.9 215.0 286.5
164.9 175.0 181.0 189.9 219.9 290.0
169.5 176.0 185.0 205.0 260.0 297.5

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________59


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Resumen de 5 Números: Resultados aproximados a las décimas.

1. Valor Mínimo: 154.0

2. Cuartil 1 Q1=Dato 7 + 0.75 (Dato 8-Dato 7)= 174.5 + 0.75 (174.9-


174.5)=174.8

#$%&
P(Q1)= 1 = 7.75
'

Por opción predeterminada, *+,- &/0*+,-&1 &21.$%&21.$


en Minitab, la Valla Externa 3. Mediana 𝑋)= "
= "
=185.5
Inferior se extiende hasta el
valor más bajo dentro del 4%& #$%&
límite inferior. P(𝑋))= " = " =15.5

Límite inferior = Q1- 3.0 (Q3 -


Q1) 4. Cuartil 3 Q3=Dato 23+ 0.25(Dato 24- Dato 23)=215.0+0.25(219.9-
215.0)=216.2
Por opción predeterminada,
en Minitab, la Valla Interna P(Q3)= 3
#$%&
= 23.25
Inferior se extiende hasta el '
valor más bajo dentro del
límite inferior.
5. Valor Máximo= 297.5
Límite inferior = Q1- 1.5 (Q3 -
Q1)
Esquema de vallas: Resultados aproximados a las décimas
Por opción predeterminada,
en Minitab, la parte inferior de VEI (Valla Externa Inferior)= Q1-3(RIQ)=174.8-3(216.2-174.8)= 174.8-
la caja es el primer cuartil 3(41.4)=50.6
(Q1) - 25% de los valores de
datos son menores que o
iguales a este valor. VII (Valla Interna Inferior)= Q1-1.5(RIQ)=174.8-1.5(216.2-174.8)= 174.8-
1.5(41.4)=112.7
Por opción predeterminada,en
Minitab, la parte superior de la
caja es el tercer cuartil (Q3) -
75% de los valores de datos VIS (Valla Interna Superior)= Q1+1.5(RIQ)=216.2+1.5(216.2-174.8)=
son menores que o iguales a 216.2+1.5(41.4)=278.3
este valor.

Por opción predeterminada, VES (Valla Externa Superior)= Q1-3(RIQ)=216.2+3(216.2-174.8)=


en Minitab, La Valla Interna 216.2+3(41.4)=340.4
Superior se extiende hasta el
valor de datos más alto dentro
del límite superior.

Límite superior = Q3 + 1.5


(Q3 - Q1)

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________60


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Diagrama de Caja y Brazos


Por opción predeterminada,
en Minitab, La Valla Externa
Superior se extiende hasta el Gráfica de caja de VALOR
valor de datos más alto dentro 300
del límite superior.
275
Límite superior = Q3 + 3.0
(Q3 - Q1)
250

VALOR
225

200

175

150

Interpretación: En el diagrama anterior se puede observar que existen 4


valores atípicos: 280, 286.5, 290.0 y 297.5 entre las VIS y la VES (a los que
les denominamos comúnmente valores aberrantes) que deben ser estudiados con
detalle para ver el tratamiento que se le van a dar en estudios subsecuentes ya
que es posible que provoquen un sesgo rompiendo algunos supuestos entre ellos
el de Normalidad ( la posición de la mediana, a la izquierda de la caja, sugiere
un sesgo hacia la derecha producto tal vez de los valores o casos atípicos).

1.3.1.1 ACTIVIDAD DE APRENDIZAJE

ACTIVIDAD DE Una agencia de Bienes Raíces desea examinar el VALOR de las casas ubicadas
APRENDIZAJE en la zona NORTE que forman su cartera de ventas. Se levanta en principio una
encuesta que más adelante se llamará “BIENES1” a 30 de ellas ubicadas en la
1.3.1.1 zona NORTE que incluyen 21 preguntas entre ellas el VALOR de las mismas.
DATOS ATÍPICOS. Cree una gráfica de caja y brazos para examinar la distribución de los
DIAGRAMA DE valores de las misma y revisar la posibilidad de encontrar valores atípicos
que pudieran influir negativamente en el estudio que se pretende realizar más
CAJA Y BRAZOS adelante ordenando los datos en forma ascendente ya sea en forma manual o
SIMPLE. mediante un diagrama de tallo y hojas, presente el resumen de cinco números,
construya el esquema de vallas correspondiente y el diagrama de caja y brazos
con su debida interpretación.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________61


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Los datos se muestran a continuación:

215.0 267.0 247.0 235.0 170.0 155.0


195.0 199.9 218.0 190.0 215.0 179.0
160.0 169.0 299.9 180.0 229.5 195.0
189.0 179.0 172.0 213.0 180.0 179.9
249.0 218.0 230.0 175.0 225.0 225.0

1.3.1.1 EJERCICIO DE AUTOEVALUACIÓN

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material estudiado anterioriormente. La respuesta a este ejercicio de
Autoevaluación se encuentra en el cuaderno de trabajo anexo de respuestas. Le
recomendamos enfáticamente resolverlo y posteriormente revisar su respuesta como
retroalimentación de su aprendizaje

AUTOEVALUACIÓN
1.3.1.1 Una agencia de Bienes Raíces desea examinar el VALOR de las casas ubicadas
en la zona SUR que forman su cartera de ventas. Se levanta en principio una
DATOS ATÍPICOS. encuesta que más adelante se llamará “BIENES1” a 30 de ellas ubicadas en la
DIAGRAMA DE zona SUR que incluyen 21 preguntas entre ellas el VALOR de las mismas. Cree
CAJA Y BRAZOS una gráfica de caja y brazos para examinar la distribución de los valores de
las misma y revisar la posibilidad de encontrar valores atípicos que pudieran
SIMPLE. influir negativamente en el estudio que se pretende realizar más adelante
ordenando los datos en forma ascendente ya sea en forma manual o mediante
un diagrama de tallo y hojas, presente el resumen de cinco números, construya
el esquema de vallas correspondiente y el diagrama de caja y brazos con su
debida interpretación.

Los datos se muestran a continuación:

181.0 181.0 179.9 200.0 230.0 174.9


220.0 185.0 210.0 115.0 183.0 100.0
190.0 269.9 159.9 199.9 215.0 174.9
160.0 189.9 165.0 189.9 159.0 189.9
176.0 299.9 185.0 189.9 180.0 210.0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________62


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.1 EJERCICIOS DE REFUERZO

EJERCICIOS DE 1.3.1.1.1 Una agencia de Bienes Raíces desea examinar el IMPUESTO de las
REFUERZO casas ubicadas en la zona SUR que forman su cartera de ventas. Se levanta en
1.3.1.1 principio una encuesta que más adelante se llamará “BIENES1” a 30 de ellas
ubicadas en la zona SUR que incluyen 21 preguntas entre ellas el IMPUESTO
DATOS ATÍPICOS. de las mismas. Cree una gráfica de caja y brazos para examinar la distribución
DIAGRAMA DE de los valores de las misma y revisar la posibilidad de encontrar valores
CAJA Y BRAZOS atípicos que pudieran influir negativamente en el estudio que se pretende
realizar más adelante ordenando los datos en forma ascendente ya sea en forma
SIMPLE. manual o mediante un diagrama de tallo y hojas, presente el resumen de cinco
números, construya el esquema de vallas correspondiente y el diagrama de caja
y brazos con su debida interpretación.

Los datos se muestran a continuación:

3959 3959 2911 3871 3638 2500


3142 3700 3930 2400 2708 1775
2600 4500 2378 2540 2989 3000
2250 2860 1800 4200 1814 2386
2857 4343 2700 3600 2800 3500

1.3.1.1.2 Una agencia de Bienes Raíces desea examinar la ANTIGUEDAD de


NOTA: las casas ubicadas en la zona NORTE que forman su cartera de ventas. Se
levanta en principio una encuesta que más adelante se llamará “BIENES1” a
El uso de un software 30 de ellas ubicadas en la zona NORTE que incluyen 21 preguntas entre ellas el
estadístico como Excel o ANTIGUEDAD de las mismas. Cree una gráfica de caja y brazos para examinar
Minitab, entre otros, reduce
la distribución de los valores de las misma y revisar la posibilidad de
de gran manera el tiempo de
cálculo y la probabilidad de encontrar valores atípicos que pudieran influir negativamente en el estudio
cometer errores en los que se pretende realizar más adelante ordenando los datos en forma
cálculos aritméticos, sin ascendente ya sea en forma manual o mediante un diagrama de tallo y hojas,
embargo se deben
presente el resumen de cinco números, construya el esquema de vallas
comprender primero los
pasos del proceso. Por lo correspondiente y el diagrama de caja y brazos con su debida interpretación.
mismo es muy importante
que primero resuelva el
ejercicio en forma manual
Los datos se muestran a continuación:
y posteriormente utilice
un software para
comparar sus resultados. 30 33 30 34 41 35
Es importante mencionar que
pueden existir diferencias
35 38 30 44 35 37
en las respuestas debido a la 35 37 15 40 28 34
cantidad de dígitos que se 24 35 35 35 14 25
utilizan en los cálculos
manuales. Se sugiere 22 31 31 38 30 33
utilizar aproximaciones
de 5 dígitos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________63


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.1.3 Una agencia de Bienes Raíces desea examinar la ANTIGUEDAD de


las casas ubicadas en la zona SUR que forman su cartera de ventas. Se levanta
en principio una encuesta que más adelante se llamará “BIENES1” a 30 de
ellas ubicadas en la zona SUR que incluyen 21 preguntas entre ellas el
ANTIGUEDAD de las mismas. Cree una gráfica de caja y brazos para examinar
la distribución de los valores de las misma y revisar la posibilidad de
encontrar valores atípicos que pudieran influir negativamente en el estudio
que se pretende realizar más adelante ordenando los datos en forma
ascendente ya sea en forma manual o mediante un diagrama de tallo y hojas,
presente el resumen de cinco números, construya el esquema de vallas
correspondiente y el diagrama de caja y brazos con su debida interpretación.

Los datos se muestran a continuación:

32 28 35 30 61 34
60 27 30 16 39 21
27 28 39 28 31 34
35 35 30 31 55 38
30 14 28 31 32 24

1.3.1.2.D.A. EJEMPLO ILUSTRATIVO EN MINITAB 17. Datos Atípicos

EJEMPLO Se reciben datos sobre una encuesta realizada a 233 casas para realizar
diferentes estudios sobre ella. Nota que el valor más pequeño o más grande de
ILUSTRATIVO los datos de la variable VALOR parecen inusualmente pequeño o grande. Antes
1.3.1.2. de analizar los datos con mayor profundidad y aplicar alguna técnica multivariada,
INTEGRAL EN se desea utilizar la Prueba de valores atípicos de Minitab para determinar si el
valor más pequeño o el más grande se puede considerar como valor atípico.
MINITAB 17. DATOS
ATÍPICOS 1 Abra la base de datos que creó “BIENES1”. Elija Estadísticas >
Estadísticas básicas > Prueba de valor atípico.

3 En Variable, ingrese VALOR

4 Haga clic en Opciones.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________64


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

5 En ¿Qué desea determinar?, elija El valor más pequeño o más grande


de los datos es un valor atípico.

6 Haga clic en Aceptar en cada cuadro de diálogo.


Utilice esta opción de valores
atípicos para identificar un Salida de la ventana Sesión
valor atípico individual en
una muestra. Las hipótesis
son las siguientes:
Prueba de valores atípicos: VALOR

· H0 (la hipótesis nula): Método


Todos los valores de la
muestra corresponden a la Hipótesis nula Todos los valores de los datos provienen de
la misma población normal
misma población
Hipótesis alterna El valor más pequeño o más grande de los
normalmente distribuida.
datos es un valor atípico
Nivel de significancia α = 0.05
· H1 (la hipótesis
alternativa): Uno de los
valores de la muestra no Prueba de Grubbs
corresponde a la misma
población normalmente Variable N Media Desv.Est. Mín. Máx. G P
distribuida. VALOR 233 190.85 34.55 100.00 310.00 3.45 0.112

* NOTA * No hay valor atípico en el nivel de significancia de 5%


Las opciones de las
relaciones de Dixon le
ayudan a detectar un valor Gráfica de valores atípicos de VALOR
atípico en presencia de otros
supuestos valores atípicos. Salida de la ventana Gráfica
Para una explicación más
detallada, véase Elección de
la prueba adecuada de Gráfica de valores atípicos de VALOR
valores atípicos.
Prueba de Grubbs
Mín. Máx. G P
100.00 310.00 3.45 0.112
No debe utilizar las pruebas
de valor atípico de Minitab
más de una vez en la misma
muestra. Si elimina un valor
atípico de su muestra y
luego vuelve probar, arriesga
eliminar valores que no son
en realidad atípicos.

100 150 200 250 300


VALOR

Interpretación de los resultados

Los resultados correspondientes a los datos de VALOR muestran el valor más


pequeño es de 100 y el más grande de 310. La estadística de G de 3.45 indica
que el valor de datos más pequeño ó más grande de 100 ó 310, es 3.45

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________65


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

desviaciones estándar menos más que la media. El valor p indica que, si todos los
valores pertenecen en realidad a la misma población normalmente distribuida,
entonces la probabilidad de obtener un valor mínimo así de pequeño o un valor
máximo así de grande es 0.112. Este valor p es mayor que el nivel de significancia
que se eligió, de modo que no se puede rechazar la hipótesis nula y concluir que
el valor más pequeño ó el más grande no es un valor atípico.

1.3.1.2 ACTIVIDAD DE APRENDIZAJE EN MINITAB 17. Datos Atipicos.

ACTIVIDAD DE Se reciben datos sobre una encuesta realizada a 233 casas para realizar
APRENDIZAJE EN diferentes estudios sobre ella. Nota que el valor más pequeño o más grande de
los datos de la variable TAMAÑO DEL LOTE parecen inusualmente pequeño o
MINITAB 17 grande. Antes de analizar los datos con mayor profundidad y aplicar alguna
1.3.1.2 técnica multivariada, se desea utilizar la Prueba de valores atípicos de Minitab
DATOS ATÍPICOS para determinar si el valor más pequeño o el más grande se puede considerar
como valor atípico. Utilice el paquete Minitab para resolver esta
Actividad de Aprendizaje.

1.3.1.2 EJERCICIO DE AUTOEVALUACIÓN. Datos Atipicos.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Se reciben datos sobre una encuesta realizada a 233 casas para realizar
1.3.1.2 diferentes estudios sobre ella. Nota que el valor más pequeño o más grande de
los datos de la variable ANTIGÜEDAD DE LAS CASAS parecen inusualmente

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________66


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

DATOS ATÍPICOS pequeño o grande. Antes de analizar los datos con mayor profundidad y aplicar
alguna técnica multivariada, se desea utilizar la Prueba de valores atípicos de
Minitab para determinar si el valor más pequeño o el más grande se puede
considerar como valor atípico. Utilice el paquete Minitab para resolver esta
Autoevaluación.

1.3.1.2 EJERCICIOS DE REFUERZO. Datos Atípicos

EJERCICIOS DE 1.3.1.2.1. Se reciben datos sobre una encuesta realizada a 233 casas para
REFUERZO realizar diferentes estudios sobre ella. Nota que el valor más pequeño o más
1.3.1.2 grande de los datos de la variable NÚMERO DE RECÁMARAS parecen
inusualmente pequeño o grande. Antes de analizar los datos con mayor
DATOS ATÍPICOS profundidad y aplicar alguna técnica multivariada, se desea utilizar la Prueba de
valores atípicos de Minitab para determinar si el valor más pequeño o el más
grande se puede considerar como valor atípico. Utilice el paquete Minitab
para resolver este Ejercicio de Refuerzo.

1.3.1.2.2. Se reciben datos sobre una encuesta realizada a 233 casas para
realizar diferentes estudios sobre ella. Nota que el valor más pequeño o más
grande de los datos de la variable NÚMERO DE BAÑOS parecen inusualmente
pequeño o grande. Antes de analizar los datos con mayor profundidad y aplicar
alguna técnica multivariada, se desea utilizar la Prueba de valores atípicos de
Minitab para determinar si el valor más pequeño o el más grande se puede
considerar como valor atípico. Utilice el paquete Minitab para resolver este
Ejercicio de Refuerzo.

1.3.1.2.3. Se reciben datos sobre una encuesta realizada a 233 casas para
realizar diferentes estudios sobre ella. Nota que el valor más pequeño o más
grande de los datos de la variable IMPUESTOS ANUALES parecen
inusualmente pequeño o grande. Antes de analizar los datos con mayor
profundidad y aplicar alguna técnica multivariada, se desea utilizar la Prueba de
valores atípicos de Minitab para determinar si el valor más pequeño o el más
grande se puede considerar como valor atípico. Utilice el paquete Minitab
para resolver este Ejercicio de Refuerzo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________67


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.3.D.A. EJEMPLO ILUSTRATIVO EN MINITAB 17.Datos Atipicos. Un


nivel de Factor

EJEMPLO Se reciben datos sobre una encuesta realizada a las casas ubicadas en la zona
ESTE de la base de datos “BIENES 1” para realizar diferentes estudios sobre
ILUSTRATIVO ella. Nota que el valor más pequeño o más grande de los datos de la variable
INTEGRAL EN VALOR en esta zona ESTE parecen inusualmente pequeño o grande. Antes de
MINITAB 17. DATOS analizar los datos con mayor profundidad y aplicar alguna técnica multivariada, se
desea utilizar la Prueba de valores atípicos de Minitab para determinar si el
ATÍPICOS PARA UN NIVEL
valor más pequeño o el más grande se puede considerar como valor atípico. Este
DE UN FACTOR. ejemplo se debe resolver en dos pasos:
SUBCONJUNTO DE
HOJA DE TRABAJO. 1. Crear un subconjunto de hoja de trabajo
2. Realizar la Prueba de valores atípicos de Minitab

Crear un subconjunto de hoja de trabajo.

Nota importante:

Al crear un subconjunto de hoja de trabajo se divide, o desapila, la hoja de


trabajo activa en hojas de trabajo nuevas basándose en una o más "Por"
variables. Crear subconjunto de hoja de trabajo siempre copian los datos en hojas
de trabajo nuevas. Como la base de datos “BIENES 1” contiene todas las casas
ubicadas en la zona NORTE, SUR y ESTE debemos crear un subconjunto de
Utilice esta opción de crear hoja de trabajo que solo incluya las casas ubicadas en el ESTE Esto nos permite
un subconjunto de hoja de analizar los diferentes niveles de un factor por separado en caso de que la prueba
trabajo para copiar las filas
de ANOVA haya sido significativa y exista la posibilidad de que las medias de la
especificadas de la hoja de
trabajo activa en una nueva variable VALOR no sea la misma en los tres niveles del Factor UBICACIÓN
hoja de trabajo. Usted puede
especificar el subconjunto 1 Abra la base de datos que creó “BIENES1”
basándose en números de
fila, puntos destacados en
una gráfica, o una condición,
2 Elija Datos > Crear subconjunto de hoja de trabajo.
como hombres no casados
menores de 50 años. 3 En Incluir o excluir, elija Especificar las filas que se incluirán.

Dividir hoja de trabajo


4 En Especificar las filas que se incluirán, elija Filas que coincidan. Haga
divide, o desapila, la hoja de
trabajo activa en dos o más clic en Condición.
hojas de trabajo nuevas
basándose en una o más 5 En Condición, ingrese UBICACIÓN=3. Haga clic en Aceptar en cada
"Por" variables. Crear
subconjunto de hoja de
cuadro de diálogo.
trabajo y Dividir hoja de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________68


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

trabajo siempre copian los


datos en hojas de trabajo
nuevas. Usted puede utilizar
Copiar columnas para
reemplazar datos en la hoja
de trabajo actual con un
subconjunto.

Nota importante: Minitab es sensible al nombre que se le asignó a la variable


por lo cual es conveniente no escribir el nombre de la variable sino seleccionarla
de la parte izquierda de la ventana y solo añadir =3.

Minitab Crea un subconjunto de hoja nueva que incluye las casas ubicadas en la
zona ESTE

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________69


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Utilice esta opción de


prueba de valores atípicos Realizar la Prueba de valores atípicos de Minitab
para identificar un valor
atípico individual en una
1 En la nueva hoja de trabajo que Minitab generó de la base de datos
muestra. Las hipótesis son
“BIENES1” que incluye solo las casas ubicadas en la zona ESTE Elija
las siguientes:
Estadísticas > Estadísticas básicas > Prueba de valor atípico.
· H0 (la hipótesis nula):
Todos los valores de la 3 En Variable, ingrese Valor
muestra corresponden a la
misma población 4 Haga clic en Opciones.
normalmente distribuida.
5 En ¿Qué desea determinar?, elija El valor más pequeño o más grande
· H1 (la hipótesis de los datos es un valor atípico.
alternativa): Uno de los
valores de la muestra no
corresponde a la misma 6 Haga clic en Aceptar en cada cuadro de diálogo.
población normalmente
distribuida.

Las opciones de las


relaciones de Dixon le
ayudan a detectar un valor
atípico en presencia de otros
supuestos valores atípicos.
Para una explicación más
detallada, véase Elección de
la prueba adecuada de
valores atípicos.

No debe utilizar las pruebas


de valor atípico de Minitab
más de una vez en la misma
muestra. Si elimina un valor
atípico de su muestra y
luego vuelve probar, arriesga

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________70


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

eliminar valores que no son Salida de la ventana Sesión


en realidad atípicos.

Prueba de valores atípicos: VALOR

Método

Hipótesis nula Todos los valores de los datos provienen de


la misma población normal
Hipótesis alterna El valor más pequeño o más grande de los
datos es un valor atípico
Nivel de significancia α = 0.05

Prueba de Grubbs

Variable N Media Desv.Est. Mín. Máx. G P


VALOR 99 172.34 16.92 140.00 239.90 3.99 0.003

Valor atípico

Valor
Variable Fila atípico
VALOR 65 239.9

Gráfica de valores atípicos de VALOR

Salida de la ventana Gráfica

Gráfica de valores atípicos de VALOR


Prueba de Grubbs
Mín. Máx. G P
140.00 239.90 3.99 0.003

150 175 200 225 250


VALOR

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________71


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Interpretación de los resultados

Los resultados correspondientes a los datos de VALOR muestran el valor más


pequeño es de 140 y el más grande de 239. La estadística de G de 3.49 indica
que el valor de datos más pequeño ó más grande de 100 ó 305, es 3.99
desviaciones estándar menos más que la media. El valor p indica que, si todos los
valores pertenecen en realidad a la misma población normalmente distribuida,
entonces la probabilidad de obtener un valor mínimo así de pequeño o un valor
máximo así de grande es 0.003. Este valor p es menor que el nivel de significancia
que se eligió, de modo que se puede rechazar la hipótesis nula y concluir que el
valor más grande es un valor atípico. En este caso corresponde al valor 305 que
se observa en rojo en la gráfica y que pertenece al caso o fila 65 del nuevo
subconjunto de hoja de trabajo.

Es importante aclarar que hay que ubicar dicho caso en la base de datos
“BIENES1” original por si es el caso en que haya que eliminirlo para
depurar dicha base de datos.

ACTIVIDAD DE APRENDIZAJE EN MINITAB 17. Datos Atipicos.


1.3.1.3
Un nivel de Factor

ACTIVIDAD DE Se reciben datos sobre una encuesta realizada a las casas ubicadas en la zona
APRENDIZAJE SUR de la base de datos “BIENES 1” para realizar diferentes estudios sobre
ella. Nota que el valor más pequeño o más grande de los datos de la variable
1.3.1.3 VALOR en esta zona SUR parecen inusualmente pequeño o grande. Antes de
DATOS ATÍPICOS PARA analizar los datos con mayor profundidad y aplicar alguna técnica multivariada,
UN NIVEL DE UN se desea utilizar la Prueba de valores atípicos de Minitab para determinar si
FACTOR. el valor más pequeño o el más grande se puede considerar como valor atípico.
SUBCONJUNTO DE
HOJA DE TRABAJO a) Crear un subconjunto de hoja de trabajo.
b) Realizar la Prueba de valores atípicos de Minitab

Utilice el paquete Minitab para resolver esta Actividad de Aprendizaje.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________72


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.3 EJERCICIO DE AUTOEVALUACIÓN EN MINITAB 17. Datos


Atipicos. Un nivel de Factor

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Se reciben datos sobre una encuesta realizada a las casas ubicadas en la zona
1.3.1.3 NORTE de la base de datos “BIENES 1” para realizar diferentes estudios sobre
ella. Nota que el valor más pequeño o más grande de los datos de la variable
DATOS ATÍPICOS PARA VALOR en esta zona NORTE parecen inusualmente pequeño o grande. Antes
UN NIVEL DE UN de analizar los datos con mayor profundidad y aplicar alguna técnica
FACTOR. multivariada, se desea utilizar la Prueba de valores atípicos de Minitab para
SUBCONJUNTO DE determinar si el valor más pequeño o el más grande se puede considerar como
HOJA DE TRABAJO valor atípico.

a) Crear un subconjunto de hoja de trabajo.


b) Realizar la Prueba de valores atípicos de Minitab

Utilice el paquete Minitab para resolver esta Autoevaluación.

1.3.1.3 EJERCICIOS DE REFUERZO EN MINITAB 17. Datos Atipicos. Un


nivel de Factor

EJERCICIOS DE 1.3.1.3.1 Se reciben datos sobre una encuesta realizada a las casas con estilo
REFUERZO MODERNO de la base de datos “BIENES 1” para realizar diferentes estudios
sobre ella. Nota que el valor más pequeño o más grande de los datos de la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________73


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.3 variable VALOR en las casas con estilo MODERNO parecen inusualmente
DATOS ATÍPICOS PARA pequeño o grande. Antes de analizar los datos con mayor profundidad y aplicar
UN NIVEL DE UN alguna técnica multivariada, se desea utilizar la Prueba de valores atípicos
de Minitab para determinar si el valor más pequeño o el más grande se puede
FACTOR. considerar como valor atípico.
SUBCONJUNTO DE
HOJA DE TRABAJO a) Crear un subconjunto de hoja de trabajo.
b) Realizar la Prueba de valores atípicos de Minitab

Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.

1.3.1.3.2 Se reciben datos sobre una encuesta realizada a las casas con estilo
HACIENDA de la base de datos “BIENES 1” para realizar diferentes estudios
sobre ella. Nota que el valor más pequeño o más grande de los datos de la
variable VALOR en las casas con estilo HACIENDA parecen inusualmente
pequeño o grande. Antes de analizar los datos con mayor profundidad y aplicar
alguna técnica multivariada, se desea utilizar la Prueba de valores atípicos
de Minitab para determinar si el valor más pequeño o el más grande se puede
considerar como valor atípico.
NOTA:
a) Crear un subconjunto de hoja de trabajo.
El uso de un software
estadístico como Excel o b) Realizar la Prueba de valores atípicos de Minitab
Minitab, entre otros, reduce
de gran manera el tiempo de Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.
cálculo y la probabilidad de
cometer errores en los
cálculos aritméticos, sin 1.3.1.3.3 Se reciben datos sobre una encuesta realizada a las casas con estilo
embargo se deben
comprender primero los
GRANJA de la base de datos “BIENES 1” para realizar diferentes estudios
pasos del proceso. Por lo sobre ella. Nota que el valor más pequeño o más grande de los datos de la
mismo es muy importante variable VALOR en las casas con estilo GRANJA parecen inusualmente
que primero resuelva el pequeño o grande. Antes de analizar los datos con mayor profundidad y aplicar
ejercicio en forma manual
y posteriormente utilice alguna técnica multivariada, se desea utilizar la Prueba de valores atípicos
un software para de Minitab para determinar si el valor más pequeño o el más grande se puede
comparar sus resultados. considerar como valor atípico.
Es importante mencionar que
pueden existir diferencias
en las respuestas debido a la a) Crear un subconjunto de hoja de trabajo.
cantidad de dígitos que se b) Realizar la Prueba de valores atípicos de Minitab
utilizan en los cálculos
manuales. Se sugiere
utilizar aproximaciones Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.
de 5 dígitos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________74


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.4.D.A. EJEMPLO ILUSTRATIVO EN MINITAB 17. Datos Atípicos.


Diagrama de Caja y Brazos Simple.

EJEMPLO Una agencia de Bienes Raíces desea examinar el VALOR general de las casas
ILUSTRATIVO que forman su cartera de ventas. Las casas se encuentran ubicadas en diferentes
orientaciones de la ciudad. De la base de datos “BIENES1” se eligió una muestra
INTEGRAL EN
aleatorioa de 30 de ellas que incluyen 21 preguntas entre ellas el VALOR de las
MINITAB 17. DATOS mismas. Cree una gráfica de caja y brazos para examinar la distribución de los
ATÍPICOS. valores de la misma y revisar la posibilidad de encontrar valores atípicos que
DIAGRAMA DE pudieran influir negativamente en el estudio que se pretende realizar más
CAJA Y BRAZOS adelante.

SIMPLE. Los datos se muestran a continuación:

215.0 210.0 174.5 177.5 297.5 180.0


181.0 205.0 260.0 173.0 290.0 160.0
189.0 154.0 175.0 174.9 219.9 176.5
176.0 215.0 286.5 185.0 189.9 189.9
267.0 280.0 169.5 164.9 159.9 185.0

Por opción predeterminada, Utilice el paquete Minitab para resolver esta Autoevaluación.
en Minitab, la Valla Externa
Inferior se extiende hasta el Para introducir los datos agrega una hoja de trabajo vacía al proyecto actual:
valor más bajo dentro del
límite inferior.
1 Elija Archivo > Nuevo.
Límite inferior = Q1- 3.0 (Q3
- Q1) 2 Seleccione Hoja de trabajo de Minitab y haga clic en Aceptar.

Por opción predeterminada, 3 En C1 coloca el nombre de la variable VALOR.


en Minitab, la Valla Interna
Inferior se extiende hasta el 4 Teclea los datos de la tabla en forma vertical.
valor más bajo dentro del
límite inferior.

Límite inferior = Q1- 1.5 (Q3


- Q1)

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________75


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Por opción predeterminada,


en Minitab, la parte inferior
de la caja es el primer cuartil
(Q1) - 25% de los valores de
datos son menores que o
iguales a este valor.

Por opción
predeterminada,en Minitab,
la parte superior de la caja
es el tercer cuartil (Q3) -
75% de los valores de datos
son menores que o iguales a
este valor.

Por opción predeterminada,


en Minitab, La Valla Interna 5 Elija Gráfica > Gráfica de caja.
Superior se extiende hasta el
valor de datos más alto
dentro del límite superior. 6 En Una Y, elija Simple. Haga clic en Aceptar.

Límite superior = Q3 + 1.5 7 En Variables de graficas, ingrese VALOR.


(Q3 - Q1)

Por opción predeterminada,


en Minitab, La Valla Externa
Superior se extiende hasta el
valor de datos más alto
dentro del límite superior.

Límite superior = Q3 + 3.0


(Q3 - Q1)

8 Haga clic en Aceptar.

Salida de la ventana Gráfica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________76


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Gráfica de caja de VALOR


300

275

250

VALOR
225

200

175

150

Interpretación: En el diagrama anterior se puede observar que existen 4 valores


atípicos que pueden ser identificados colocando el puntero del mouse en cada uno
de ellos proporcionandonos la siguiente información:

Fila 10 Valor 280.0

Fila 14 Valor 286.5

Fila 22 Valor 290.0

Fila 21 Valor 297.5

Estos valores ó datos ó casos atípicos deben ser estudiados con detalle para ver el
tratamiento que se le van a dar en estudios subsecuentes ya que es posible que
provoquen un sesgo rompiendo algunos supuestos entre ellos el de Normalidad (la
posición de la mediana, a la izquierda de la caja sugiere un sesgo hacia la derecha
producto tal vez de los valores o casos atípicos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________77


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.4 ACTIVIDAD DE APRENDIZAJE. Datos Atípicos. Diagrama de


Caja y Brazos Simple.

ACTIVIDAD DE Una agencia de Bienes Raíces desea examinar el VALOR de las casas ubicadas
APRENDIZAJE en la zona NORTE que forman su cartera de ventas. De la base de datos
“BIENES1” se eligieron aleatoriamente a 30 de ellas ubicadas en la zona
1.3.1.4 NORTE que incluyen 21 preguntas entre ellas el VALOR de las mismas. Cree
DATOS ATÍPICOS. una gráfica de caja y brazos para examinar la distribución de los valores de
DIAGRAMA DE las misma y revisar la posibilidad de encontrar valores atípicos que pudieran
CAJA Y BRAZOS influir negativamente en el estudio que se pretende realizar más adelante.
SIMPLE
Los datos se muestran a continuación:

215.0 267.0 247.0 235.0 170.0 155.0


195.0 199.9 218.0 190.0 215.0 179.0
160.0 169.0 299.9 180.0 229.5 195.0
189.0 179.0 172.0 213.0 180.0 179.9
249.0 218.0 230.0 175.0 225.0 225.0

Utilice el paquete Minitab para resolver esta Actividad de Aprendizaje.

1.3.1.4 EJERCICIO DE AUTOEVALUACIÓN. Datos Atipicos. Diagrama


de Caja y Brazos Simple.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Una agencia de Bienes Raíces desea examinar el VALOR de las casas ubicadas
1.3.1.4 en la zona SUR que forman su cartera de ventas. Se levanta en principio una
encuesta que más adelante se llamará “BIENES1” a 30 de ellas ubicadas en la
DATOS ATÍPICOS. zona SUR que incluyen 21 preguntas entre ellas el VALOR de las mismas. Cree
DIAGRAMA DE CAJA una gráfica de caja y brazos para examinar la distribución de los valores de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________78


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Y BRAZOS SIMPLE las misma y revisar la posibilidad de encontrar valores atípicos que pudieran
influir negativamente en el estudio que se pretende realizar más adelante.

Los datos se muestran a continuación:

181.0 181.0 179.9 200.0 230.0 174.9


220.0 185.0 210.0 115.0 183.0 100.0
190.0 269.9 159.9 199.9 215.0 174.9
160.0 189.9 165.0 189.9 159.0 189.9
176.0 299.9 185.0 189.9 180.0 210.0

Utilice el pauete Minitab para resolver esta Autoevaluación.

1.3.1.4 EJERCICIOS DE REFUERZO. Datos Atípicos. Diagrama de Caja y


Brazos Simple.

EJERCICIOS DE 1.3.1.4.1 Una agencia de Bienes Raíces desea examinar el IMPUESTO de las
REFUERZO casas ubicadas en la zona SUR que forman su cartera de ventas. De la base de
1.3.1.4 datos “BIENES1” se seleccionan aleatoriamente a 30 de ellas ubicadas en la
zona SUR que incluyen 21 preguntas entre ellas el IMPUESTO de las mismas.
DATOS ATÍPICOS. Cree una gráfica de caja y brazos para examinar la distribución de los
DIAGRAMA DE valores de las misma y revisar la posibilidad de encontrar valores atípicos
CAJA Y BRAZOS que pudieran influir negativamente en el estudio que se pretende realizar más
SIMPLE. adelante.

Los datos se muestran a continuación:

3959 3959 2911 3871 3638 2500


3142 3700 3930 2400 2708 1775
2600 4500 2378 2540 2989 3000
2250 2860 1800 4200 1814 2386
2857 4343 2700 3600 2800 3500

Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo

1.3.1.4.2 Una agencia de Bienes Raíces desea examinar la ANTIGUEDAD de


NOTA: las casas ubicadas en la zona NORTE que forman su cartera de ventas. De la
base de datos “BIENES1” se seleccionan aleatoriamente a 30 de ellas ubicadas
El uso de un software
estadístico como Excel o en la zona NORTE que incluyen 21 preguntas entre ellas la ANTIGUEDAD de
Minitab, entre otros, reduce las mismas. Cree una gráfica de caja y brazos para examinar la distribución de
de gran manera el tiempo de los valores de las misma y revisar la posibilidad de encontrar valores atípicos
cálculo y la probabilidad de que pudieran influir negativamente en el estudio que se pretende realizar más
cometer errores en los
cálculos aritméticos, sin adelante.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________79


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

embargo se deben
comprender primero los
pasos del proceso. Por lo
mismo es muy importante
que primero resuelva el Los datos se muestran a continuación:
ejercicio en forma manual
y posteriormente utilice
un software para
30 33 30 34 41 35
comparar sus resultados. 35 38 30 44 35 37
Es importante mencionar que
pueden existir diferencias
35 37 15 40 28 34
en las respuestas debido a la 24 35 35 35 14 25
cantidad de dígitos que se 22 31 31 38 30 33
utilizan en los cálculos
manuales. Se sugiere
utilizar aproximaciones Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo
de 5 dígitos.

1.3.1.4.3 Una agencia de Bienes Raíces desea examinar la ANTIGUEDAD de


las casas ubicadas en la zona SUR que forman su cartera de ventas. De la base
de datos “BIENES1” se seleccionan aleatoriamente a 30 de ellas ubicadas en la
zona SUR que incluyen 21 preguntas entre ellas la ANTIGUEDAD de las
mismas. Cree una gráfica de caja y brazos para examinar la distribución de
los valores de las misma y revisar la posibilidad de encontrar valores atípicos
que pudieran influir negativamente en el estudio que se pretende realizar más
adelante.

Los datos se muestran a continuación:

32 28 35 30 61 34
60 27 30 16 39 21
27 28 39 28 31 34
35 35 30 31 55 38
30 14 28 31 32 24

Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________80


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.1.5.D.A. EJEMPLO ILUSTRATIVO EN MINITAB 17. Datos Atípicos.


Diagrama de Caja y Brazos Múltiple.

EJEMPLO Se reciben datos sobre una encuesta “BIENES1” realizada a 233 casas para
realizar diferentes estudios sobre ella. Antes de analizar los datos con mayor
ILUSTRATIVO profundidad y aplicar alguna técnica multivariada, se desea identificar la posible
1.3.1.5. existencia de valores atípicos que pudieran influenciar negativamente el estudio.
INTEGRAL EN Para su identificación se desea utilizar diagramas de caja múltiples que incluyan
las variables VALOR, ANTIGÜEDAD E IMPUESTOS en los 3 niveles de la
MINITAB 17. DATOS UBICACIÓN DE LAS CASAS.
ATÍPICOS.
DIAGRAMA DE Nota importante: Como las variables VALOR, ANTIGÜEDAD E
IMPUESTOS están medidas en diferentes escalas primero se deben
CAJA Y BRAZOS estandarizar las variables de la siguiente manera:
MÚLTIPLE
1 Abra la base de datos que creó “BIENES1”. Elija Calc > Estandarizar.

2 En Columnas de entrada, ingrese las columnas que desea estandarizar. En


este caso ingrese VALOR, ANTIGUEDAD E IMPUESTOS.

3 En Almacenar resultados en, ingrese las columnas en las que desea


almacenar los datos estandarizados. En este caso escriba C22-C24, haga clic en
Aceptar

Por opción predeterminada,


en Minitab, la Valla Externa
Inferior se extiende hasta el
valor más bajo dentro del
límite inferior.

Límite inferior = Q1- 3.0 (Q3


- Q1)

Por opción predeterminada,


en Minitab, la Valla Interna
Inferior se extiende hasta el
valor más bajo dentro del
límite inferior.

Límite inferior = Q1- 1.5 (Q3


- Q1)

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________81


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

4 Los datos estandarizados aparecerán en las columas 22,23 y 24 de la base


original “BIENES1”. Colocar el nombre de las variable estantarazadas como
Por opción predeterminada, Valor 1, Antig1 e Impuesto 1 para identificarlas.
en Minitab, la parte inferior
de la caja es el primer cuartil 1 Elija Gráfica > Gráfica de caja.
(Q1) - 25% de los valores de
datos son menores que o 2 En Múltiples Y, elija Con grupos. Haga clic en Aceptar.
iguales a este valor.
3 En Variables de gráficas, ingrese Valor1, Antig1 e Impuesto1

Por opción 4 En Variables categóricas para agrupación (1 a 3, la más externa


predeterminada,en Minitab, primero), ingrese Ubicación
la parte superior de la caja
es el tercer cuartil (Q3) -
75% de los valores de datos
son menores que o iguales a
este valor.

Por opción predeterminada,


en Minitab, La Valla Interna
Superior se extiende hasta el
valor de datos más alto
dentro del límite superior.

Límite superior = Q3 + 1.5


(Q3 - Q1)

Por opción predeterminada,


en Minitab, La Valla Externa
Superior se extiende hasta el 5 En Nivel de escala para variables de gráficas, elija Las variables de
valor de datos más alto gráficas se muestran más hacia dentro en la escala. Haga clic en Aceptar.
dentro del límite superior.

Límite superior = Q3 + 3.0


(Q3 - Q1)

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________82


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Gráfica de caja de Valor1, Antig1, Impuesto1

Datos
2

-2

-4
r1 1 1 r1 1 1 r1 1 1
lo t ig es
to lo t ig es
to lo t ig es
to
Va An pu Va An pu Va An p u
Im Im Im
UBICACIO 1 2 3

Interpretación de los resultados

La gráfica de caja muestra:

· En general en todos los niveles de UBICACIÓN de las casas las tres variables
muestran valores atípicos que hay que estudiar con excepción de Valor1 e
Impuestos1 en la parte inferior de la zona NORTE, Impuestos1 en ambas
partes de la zona SUR y Valor1 e Impuestos1 en la parte inferior de la zona
ESTE.

· Para las casas ubicadas en la zona SUR, en la variable Antig1 se detectan la


mayor cantidad de valores atípicos con valores sumamente extremos.

Se recomienda estudiar minuciosamente cada uno de los valores atípicos


para ver que tipo de tratamiento se les puede dar para disminuir el riesgo
potencial de influencia en el estudio multivariado que se pudiera realizar más
adelante.

Asimismo se recomienda realizar análisis estadísticos, tales como MANOVA


balanceado, para examinar más a fondo la relación entre los factores.

Para obtener información precisa de Q1, mediana, Q3, rango intercuartil, bigotes
o brazos y N, coloque el cursor sobre cualquier parte de la gráfica de caja. Para
ver el valor del eje Y y el número de fila de un valor atípico, coloque el cursor
sobre el valor atípico.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________83


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Etiquetado de los niveles de la variable o “Factor” UBICACIÓN:

Etiquetado de los niveles de la variable o “Factor” UBICACIÓN Y


Etiquetado del subtitulo CASAS DE “BIENES1”:

1 Haga doble clic en el número 1 en el renglón de UBICACIÓN para que


Minitab despliegue la ventana Editar Escala.

2 Seleccionar la pestaña Etiquetas

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________84


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

3 Desactivar la casilla UBICACIÓN

4 Borrar los números 1 2 3 y escribir NORTE SUR ESTE.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________85


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

5 En Etiqueta de eje , si es el caso, desactivar la casilla de UBICACIO y


escribir UBICACIÓN.

6 Haga clic en Aceptar.


7 Aparece la gráfica debidamente etiquetada.

Gráfica de caja de Valor1, Antig1, Impuesto1


6

4
Datos

-2

-4
r1 1 1 r1 1 1 r1 1 1
lo t ig to lo t ig to lo t ig to
Va An es Va An es Va An es
pu pu pu
Im Im Im
UBICACION E
RT
R TE
SU ES
NO

8 Coloque el mouse en el título de la grafica y presione el botón derecho del


mouse. Seleccione la opción Agregar y la opción Subtitulo. Se escribe
CASAS DE “BIENES1” en la ventana Agregar subtítulo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________86


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

9 Haga clic en Aceptar.


10 Aparece la gráfica debidamente etiquetada.

Gráfica de caja de Valor1, Antig1, Impuesto1


CASAS DE "BIENES1"

4
Datos

-2

-4
r1 1 1 r1 1 1 r1 1 1
lo t ig to lo t ig to lo t ig to
Va An ues Va An u es Va An ues
p p p
Im Im Im
UBICACIÌ N E
RT
R TE
SU ES
NO

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________87


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ACTIVIDAD DE APRENDIZAJE. Datos Atípicos. Diagrama de


1.3.1.5
Caja y Brazos Múltiple

ACTIVIDAD DE Se reciben datos sobre una encuesta “BIENES1” realizada a 233 casas para
APRENDIZAJE realizar diferentes estudios sobre ella. Antes de analizar los datos con mayor
profundidad y aplicar alguna técnica multivariada, se desea identificar la posible
1.3.1.5 existencia de valores atípicos que pudieran influenciar negativamente el estudio.
DATOS ATÍPICOS . Para su identificación se desea utilizar diagramas de caja múltiples que incluyan
DIAGRAMA DE las variables VALOR, ANTIGÜEDAD E IMPUESTOS de las casas con estilo
CAJA Y BRAZOS MODERNO en los 3 niveles de la UBICACIÓN DE LAS CASAS.
MÚLTIPLE
Utilice el paquete Minitab para resolver esta Actividad de Aprendizaje.

Nota importante: Primero hay que crear un subconjunto de hoja de


trabajo con el estilo MODERNO y después, como las variables VALOR,
ANTIGÜEDAD E IMPUESTOS están medidas en diferentes escalas se deben
estandarizar las variables.

1.3.1.5 EJERCICIO DE AUTOEVALUACIÓN. Datos Atipicos. Diagrama


de Caja y Brazos Múltiple.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Se reciben datos sobre una encuesta “BIENES1” realizada a 233 casas para
1.3.1.5 realizar diferentes estudios sobre ella. Antes de analizar los datos con mayor
profundidad y aplicar alguna técnica multivariada, se desea identificar la posible
DATOS ATÍPICOS. existencia de valores atípicos que pudieran influenciar negativamente el estudio.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________88


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

DIAGRAMA DE CAJA Para su identificación se desea utilizar diagramas de caja múltiples que incluyan
las variables VALOR, ANTIGÜEDAD E IMPUESTOS de las casas CON AIRE
Y BRAZOS MÚLTIPLE ACONDICIONADO en los 3 niveles de la UBICACIÓN DE LAS CASAS.

Utilice el paquete Minitab para resolver esta Autoevaluación.

Nota importante: Primero hay que crear un subconjunto de hoja de


trabajo con las caas que tienen AIRE ACONDICIONADO y después, como
las variables VALOR, ANTIGÜEDAD E IMPUESTOS están medidas en

1.3.1.5 EJERCICIOS DE REFUERZO. Datos Atípicos. Diagrama de Caja y


Brazos Múltiple.

EJERCICIOS DE 1.3.1.5.1 Se reciben datos sobre una encuesta “BIENES1” realizada a 233
REFUERZO casas para realizar diferentes estudios sobre ella. Antes de analizar los datos con
1.3.1.5 mayor profundidad y aplicar alguna técnica multivariada, se desea identificar la
posible existencia de valores atípicos que pudieran influenciar negativamente el
DATOS ATÍPICOS. estudio. Para su identificación se desea utilizar diagramas de caja múltiples que
DIAGRAMA DE incluyan las variables VALOR, ANTIGÜEDAD E IMPUESTOS de las casas SIN
CAJA Y BRAZOS SÓTANO en los 3 niveles de la UBICACIÓN DE LAS CASAS.
MÚLTIPLE.
Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.Nota
importante: Primero hay que crear un subconjunto de hoja de trabajo con
las caas que no tienen SOTANO y después, como las variables VALOR,
ANTIGÜEDAD E IMPUESTOS están medidas en diferentes escalas se deben
estandarizar las variables.

1.3.1.5.2 Se reciben datos sobre una encuesta “BIENES1” realizada a 233


casas para realizar diferentes estudios sobre ella. Antes de analizar los datos con
mayor profundidad y aplicar alguna técnica multivariada, se desea identificar la
posible existencia de valores atípicos que pudieran influenciar negativamente el
estudio. Para su identificación se desea utilizar diagramas de caja múltiples que
incluyan las variables VALOR, ANTIGÜEDAD E IMPUESTOS de las casas SIN
NOTA: CHIMENEA en los 3 niveles de la UBICACIÓN DE LAS CASAS.

El uso de un software Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.Nota
estadístico como Excel o
importante: Primero hay que crear un subconjunto de hoja de trabajo con
Minitab, entre otros, reduce
de gran manera el tiempo de las casas que no tienen CHIMENEA y después, como las variables VALOR,
cálculo y la probabilidad de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________89


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

cometer errores en los ANTIGÜEDAD E IMPUESTOS están medidas en diferentes escalas se deben
cálculos aritméticos, sin
embargo se deben
estandarizar las variables.
comprender primero los
pasos del proceso. Por lo 1.3.1.5.3 Se reciben datos sobre una encuesta “BIENES1” realizada a 233
mismo es muy importante
que primero resuelva el casas para realizar diferentes estudios sobre ella. Antes de analizar los datos con
ejercicio en forma manual mayor profundidad y aplicar alguna técnica multivariada, se desea identificar la
y posteriormente utilice posible existencia de valores atípicos que pudieran influenciar negativamente el
un software para
estudio. Para su identificación se desea utilizar diagramas de caja múltiples que
comparar sus resultados.
Es importante mencionar que incluyan las variables VALOR, ANTIGÜEDAD E IMPUESTOS de las casas SIN
pueden existir diferencias TINA DE HIDROMASAJE en los 3 niveles de la UBICACIÓN DE LAS CASAS.
en las respuestas debido a la
cantidad de dígitos que se
utilizan en los cálculos Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo.Nota
manuales. Se sugiere importante: Primero hay que crear un subconjunto de hoja de trabajo con
utilizar aproximaciones las casas que no tienen TINA DE HIDROMASAJE y después, como las
de 5 dígitos. variables VALOR, ANTIGÜEDAD E IMPUESTOS están medidas en diferentes
escalas se deben estandarizar las variables.

ANÁLISIS PREVIO DE LOS DATOS MULTIVARIADOS.


VERIFICACIÓN DE LOS SUPUESTOS DEL ANÁLISIS
1.3.2
MULTIVARIADO. NORMALIDAD.
HOMOCEDASTICIDAD.LINEALIDAD.

CONCEPTOS BÁSICOS VERIFICACION DE LOS SUPUESTOS DEL ANÁLISIS MULTIVARIADO.


VERIFICACION DE LOS La última etapa del examen de los datos consiste en la comprobación de los
SUPUESTOS DEL ANÁLISIS supuestos subyacentes básicos del análisis multivariado. Esta necesidad de
MULTIVARIADO comprobar los supuestos estadísticos aumenta en las aplicaciones
multivariadas como consecuencia de la complejidad de las relaciones, por la
gran cantidad de variables que hace que distorsiones y los sesgos potenciales
sean más potentes cuando se incumplen los supuestos, por lo tanto, el
investigador debe estar atento a cualquier incumplimiento de los supuestos y
a las implicaciones que puedan tener para el proceso de estimación o
interpretación de resultados.

El análisis multivariante requiere que los supuestos subyacentes a las técnicas


multivariadas sean contrastados dos veces, primero las variables aisladas,
similar a las pruebas de los supuestos univariados y posteriormente para el
valor teórico del modelo multivariante, que actúa colectivamente sobre las

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________90


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

variables a analizar y por lo tanto, debe cumplir los mismos supuestos que las
variables individuales.
La prueba de normalidad es una
prueba de hipótesis para 1. NORMALIDAD:
determinar si la población de la
cual extrajo su muestra es no En el análisis multivariado, el supuesto fundamental es la normalidad de los
normal. Muchos procedimientos datos, en referencia al perfil de la distribución de los datos para una única
estadísticos dependen de la
normalidad de la población, de variable métrica y su correspondencia con una distribución normal. Si la
modo que recurrir a una prueba variación con respecto a la normal es amplia, todas las pruebas estadísticas
de normalidad para determinar si resultantes no son válidas, dado que se requiere normalidad para el uso de
se rechaza este supuesto pudiera
los estadísticos t y F. La normalidad multivariante, es decir la combinación de
ser un paso importante en su
análisis. La hipótesis nula para dos o más variables, implica que las variables individuales sean normales en
una prueba de normalidad un sentido univariado y que sus combinaciones también sean normales. La
establece que la población es normalidad multivariante es más difícil de probar aunque existen varias
normal. La hipótesis alternativa
establece que la población es no pruebas para situaciones en las que la técnica multivariada se ve
normal. Para determinar si los particularmente afectada por una violación de los supuestos.
datos de su muestra provienen de
una población no normal, usted Análisis gráfico de la normalidad:
puede elegir en general entre tres
pruebas: La prueba más simple para diagnosticar la normalidad es una comprobación
visual del histograma que compare los valores de los datos observados con
La prueba de Anderson-Darling
es una prueba que compara la
una distribución aproximada de la distribución normal. Aunque este método
función de distribución acumulada es simple, también es problemático para muestras pequeñas, donde la
empírica de los datos de su construcción de un histograma puede distorsionar la representación visual de
muestra con la distribución tal forma que el análisis sea inútil. Una forma de mayor confianza es el
esperada si los datos son
normales. Si esta diferencia gráfico de distribución normal que compara la distribución acumulada de
observada es suficientemente los valores reales de los datos con la distribución acumulada de una
grande, la prueba rechazará la distribución normal. La distribución normal sigue una línea recta en diagonal.
hipótesis nula de normalidad en la
Si una distribución es normal, la línea que representa a la distribución real de
población.
los datos sigue de cerca de la diagonal.

Gráfica de probabilidad de IMPUESTO


Normal
99.9
Media 3035
Desv .Est. 763.5
99 N 233
AD 2.295
95 Valor P <0.005
90
80
Porcentaje

70
60
50
40
30
20
10
5

0.1
0 1000 2000 3000 4000 5000 6000 7000
IMPUESTO

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________91


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Pruebas estadísticas de normalidad:

La prueba de normalidad de Pueden utilizarse pruebas estadísticas para evaluar la normalidad. Una de
Ryan-Joiber es una prueba que ellas es simple y es una regla basada en el valor de la asimetría. El valor
evalúa la normalidad calculando la
correlación entre sus datos y las
estadístico (z) se calcula como:
puntuaciones normales de sus
datos. Si el coeficiente de 𝑠𝑖𝑚𝑒𝑡𝑟í𝑎
𝑍6789,:í+ =
correlación se encuentra cerca de
1, es probable que la población
D6
𝑛
sea normal. La estadística de
Ryan-Joiner evalúa la solidez de Donde n es el tamaño de la muestra.
esta correlación; si se encuentra
por debajo del valor crítico
Un valor “z” que también puede ser calculado para el valor de la curtósis es:
apropiado, usted rechazará la
hipótesis nula de normalidad en la
población. Esta prueba es similar
𝑐𝑢𝑟𝑡ó𝑠𝑖𝑠
𝑍GH:,ó676 =
a la prueba de normalidad de
D24
Shapiro-Wilk. 𝑛

La prueba de normalidad de Si el valor calculado de “z” excede un valor crítico, entonces la distribución
Kolmogorov-Smirnov es una real de los datos no es normal. Un valor calculado que exceda ± 2.58, indica
prueba que compara la función de
distribución acumulada empírica
que podemos rechazar el supuesto sobre la normalidad de la distribución con
de los datos de su muestra con la un nivel de significancia de 0.01. Otro valor crítico habitualmente utilizado es
distribución esperada si los datos ± 1.96, que corresponde a un nivel de significancia de 0.05.
son normales. Si esta diferencia
observada es suficientemente Hay pruebas estadísticas que se encuentran en los programas
grande, la prueba rechazará la
hipótesis nula de normalidad en la
computacionales. Los dos más comunes son las pruebas de Shapiro-Wilks y
población. una modificación de la prueba de Kolmogorov-Smornov. Cada uno determina
el nivel de significancia para las diferencias respecto a una distribución
Si el valor p de esta prueba es normal. Estas pruebas son poco útiles para muestras pequeñas (menores de
menor que su nivel a elegido,
30) y muy sensibles para grandes muestras (mayores a 1000 observaciones),
usted puede rechazar su hipótesis
nula y concluir que la población es por lo que el investigador debe siempre utilizar tanto los gráficos como
no normal. cualquier comprobación estadística para evaluar el grado de desviación de la
normalidad.

Estadístico de Anderson-Darling
La prueba de Anderson-Darling
es una prueba que compara la Mide si los datos siguen una distribución particular. Mientras mejor se ajusta
función de distribución acumulada la distribución a los datos, menor será este estadístico. Utilice el estadístico
empírica de los datos de su
muestra con la distribución de Anderson-Darling para comparar el ajuste de varias distribuciones, para
esperada si los datos son ver cuál es el mejor, o para probar si una muestra de datos proviene de una
normales. Si esta diferencia población con una distribución específica. Por ejemplo, puede utilizar el
observada es suficientemente
estadístico Anderson-Darling para elegir entre la distribución de Weibull y la
grande, la prueba rechazará la
hipótesis nula de normalidad en la normal, para un análisis de datos de confiabilidad o para probar si los datos
población. cumplen con el supuesto de normalidad de una prueba t.

Las hipótesis para la prueba de Anderson-Darling son:

H$ : Los datos siguen una distribución específica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________92


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

H& : Los datos no siguen una distribucion específica

Si el valor p (al estar disponible) para la prueba de Anderson-Darling, es


inferior al nivel de significancia seleccionado (generalmente 0.05 ó 0.01),
concluya que los datos no siguen la distribución específica.

En muchas ocasiones en que se indica no normalidad es en realidad un


resultado de otras violaciones de los supuestos, por lo tanto remediando los
otros incumplimientos, eliminamos el problema de la normalidad, y por esto
debemos realizar pruebas de normalidad después o a la par con los análisis y
Existen dos pruebas de
homocedasticidad: la prueba de soluciones de otras violaciones.
Bonett y la prueba de Levene.
Para cada prueba, la hipótesis 2. HOMOCEDASTICIDAD:
nula plantea que las dos varianzas
son iguales (H0: s21 / s22 = 1). La Es un supuesto que se refiere a las relaciones de dependencia entre las
hipótesis alternativa puede ser de
variables, es decir, que las variables dependientes tengan iguales niveles de
cola izquierda (H1: s21 / s22 < 1),
de cola derecha (H1: s21 / s22 > varianza a lo largo del rango del predictor de las variables. El efecto de la
1), o de dos colas (H1: s21 / s22 ≠ heterocedasticidad está relacionado con el tamaño de la muestra,
1). De forma opcional, las especialmente cuando examinamos la dispersión de la varianza entre grupos.
relaciones de prueba diferentes
de 1 (igualdad) se pueden
Por ejemplo, en ANOVA o MANOVA, el tamaño de la heterocedasticidad de las
especificar. pruebas estadísticas depende de los tamaños de la muestra asociada con los
grupos de menor o mayor varianza. En el análisis de regresión múltiple,
En estadística, la prueba de ocurrirán efectos similares en distribuciones altamente simétricas donde
Bartlett se utiliza para probar existan un número desproporcionado de encuestados en ciertos rangos de la
si k muestras provienen de
poblaciones con la misma variable independiente.
varianza. A las varianzas iguales a
través de las muestras se Pruebas estadísticas de homocedasticidad:
llama homocedasticidad u
homogeneidad de varianzas. Las pruebas estadísticas de igual dispersión de la varianza, se refieren a la
Algunas pruebas estadísticas, por varianza en grupos formados por variables métricas. La prueba más común
ejemplo, el análisis de la
varianza ANOVA, suponen que las es el test de Levene que puede usarse para evaluar si las varianzas de una
varianzas son iguales en todos los única variable métrica son iguales a lo largo de cualquier cantidad de grupos
grupos o muestras. La prueba de y cuando los datos provengan de distribuciones continuas, pero no
Bartlett se puede utilizar para
necesariamente distribuciones normales. Este método considera las
verificar esa suposición.
distancias de las observaciones con respecto a la mediana de la muestra, en
La prueba de Bartlett es sensible
lugar de la media de la muestra, esto hace que la prueba sea más sólida para
a las desviaciones de la
normalidad. Es decir, si las las muestras más pequeñas. Cuando los datos provengan de distribuciones
muestras provienen de normales, la prueba de Barlett es un poco más sólida que la de Levene.
distribuciones no normales, Una prueba F reemplaza a la prueba de Barlett cuando solo se tiene dos
entonces la prueba de Bartlett
puede ser simplemente para
niveles.
probar la no normalidad.
La Prueba de Levene y la de Soluciones para la heterocedasticidad:
Bonett son alternativas a la
prueba de Bartlett que son menos Los problemas de heterocedasticidad pueden solucionarse por medio de
sensibles a las desviaciones de la transformaciones de datos, similares a las usadas para conseguir normalidad
normalidad.1
y como se mencionó antes, en muchas ocasiones la heterocedasticidad es
reflejo de la no normalidad de una de las variables y la correlación de la no

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________93


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

normalidad resuelve igualmente la dispersión de la varianza.

3. LINEALIDAD:

Es un supuesto implícito en las técnicas multivariadas basadas en medidas de


correlación, como la regresión múltiple, logística, factorial, etc., debido a que
las correlaciones representan solo la asociación lineal entre variables, los
efectos no lineales no estarán representados en el valor de la correlación. Por
eso es adecuado examinar las relaciones para identificar cualquier
desplazamiento de la linealidad que pueda influir en la correlación.

Identificación de relaciones no lineales:

Una forma común de evaluar la linealidad es examinar los gráficos de


dispersión de las variables e identificar cualquier patrón no lineal en los datos.
Alternativamente se puede usar el análisis de residuos de la regresión
múltiple, ya que éstos reflejan la parte no explicada de la variable
dependiente y por lo tanto, cualquier parte no lineal de la relación quedará
reflejada en los residuos.

Soluciones para la no normalidad:

La aproximación más directa es transformar una o ambas variables para


conseguir la normalidad. Una alternativa a la transformación de los datos es
crear una nueva variable que represente la parte no lineal de la relación.

En estadística, la transformación TRANSFORMACIONES DE LOS DATOS:


de datos se efectúa para
asegurarse que estos tienen Transformaciones de los datos para conseguir la normalidad y la
una distribución normal (lo que
homocedasticidad:
puede ser un remedio para
analizar datos que tienen otros
tipos de distribución, falta de Para las distribuciones no normales, las dos formas más comunes son las
normalidad, linealidad, distribuciones “planas” y las distribuciones asimétricas. Para la distribución
y homocedasticidad). Cuando se plana, las transformaciones más comunes son la inversa (es decir, 1/Y o 1/X).
usan cierto tipo de pruebas
estadísticas la transformación de
Las distribuciones asimétricas, pueden ser transformadas empleando la raíz
datos puede ser necesaria ya que cuadrada, logaritmos o incluso la inversa de la variable. Las distribuciones
este tipo de análisis asumen que asimétricas negativas se transforman de forma más efectiva usando la raíz
los datos deben ser lineales, cuadrada, mientras que por lo regular, el logaritmo funciona mejor para la
normales y
tienen homocedasticidad en su asimetría positiva. Cuando se examinan los residuos de la regresión múltiple
varianza. Si el tamaño de la buscando la heterocedasticidad, se observa que un indicio de varianzas
muestra es demasiado pequeño o desiguales es una distribución con perfil de cono. Si el cono se abre a la
los datos están sesgados hacia
derecha, la mejor transformación es la inversa; si se abre a la izquierda,
una distribución no normal se
puede intentar hacer una de las elegimos la raíz cuadrada.
siguientes
transformaciones: logarítmica, raíz Transformaciones para conseguir la linealidad:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________94


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

cuadrada o inversa. Hay numerosos procedimientos para conseguir la linealidad entre dos
variables, sin embargo, las más simples incluyen la aplicación de la raíz
cuadrada, el logaritmo y la inversa. Se prueban cada una de las
transformaciones hasta conseguir la linealidad o bien, crear una nueva
variable, denominada polinómica, que represente la parte no lineal de la
relación.

1.3.2.1.P.N. EJEMPLO ILUSTRATIVO EN MINITAB 17. Prueba de


Normalidad. Anderson Darling

EJEMPLO Estadísticas > Estadísticas básicas > Prueba de normalidad


ILUSTRATIVO
Genera una gráfica de probabilidad normal y realiza una prueba de hipótesis para
1.3.2.1.
examinar si las observaciones siguen o no una distribución normal . Para la
INTEGRAL EN prueba de normalidad , las hipótesis son,
MINITAB 17.
PRUEBA DE H0: los datos siguen una distribución normal vs. H1: los datos no siguen una
NORMALIDAD distribución normal

La escala vertical de la gráfica se asemeja a la escala vertical del papel de


probabilidad normal. El eje horizontal es una escala lineal. La línea forma un
estimado de la función de distribución acumulada para la población de la cual se
extrajeron los datos. Con la gráfica se muestran estimaciones numéricas de los
parámetros de la población , m y s, el valor de la prueba de normalidad y el valor
p asociado.

Elementos del cuadro de diálogo

Variable : Ingrese la columna que se utilizará para el eje x. Minitab calcula la


probabilidad de ocurrencia de cada observación en la columna (presuponiendo
una distribución normal) y utiliza el logaritmo de las probabilidades calculadas
como valores y.

Líneas percentiles: Minitab marca cada uno de los porcentajes en la columna


con una línea de referencia horizontal en la gráfica y marca cada línea con el valor
porcentual. Minitab dibuja una línea de referencia vertical, en la que la línea de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________95


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

referencia horizontal intersecta el ajuste de la línea a los datos, y marca esta línea
con el valor de datos estimado.

Ninguno: Elija esta opción para no mostrar ninguna línea de percentil.

En los valores de Y: Elija esta opción para ingresar valores de escala Y para
colocar las líneas de percentiles. Ingrese valores entre 0 y 100 cuando los
porcentajes se utilicen como el tipo de escala Y, o 0 a 1 cuando la probabilidad es
el tipo de escala Y.

En los valores de datos: Elija esta opción para ingresar valores de datos para
colocar líneas de percentiles.

Pruebas de normalidad: Para obtener explicaciones acerca de las pruebas de


normalidad, véase el capítulo correspondiente.

Anderson-Darling: Elija esta opción para realizar una prueba de Anderson-


Darling de normalidad, que es una prueba basada en la ECDF (función de
distribución acumulada empírica).

Ryan-Joiner: Elija esta opción para realizar una prueba de Ryan-Joiner , que es
similar a la prueba de Shapiro-Wilk . La prueba de Ryan-Joiner es una prueba
basada en correlaciones.

Kolmogorov-Smirnov: Elija esta opción para realizar una prueba de


Kolmogorov-Smirnov de normalidad, que es una prueba basada en la ECDF.

Título: Para reemplazar el título predeterminado por su propio título


personalizado, escriba el texto que desee en este cuadro.
La prueba de Anderson-
Darling es una prueba que PRUEBA DE NORMALIDAD. Prueba de Anderson Darling.
compara la función de
distribución acumulada
Se midió el VALOR de las casas en la base de datos “BIENES1” que se
empírica de los datos de su
muestra con la distribución construyó anteriormente.
esperada si los datos son
normales. Si esta diferencia Se desea determinar si estos datos siguen una distribución normal, de modo que
observada es utiliza una Prueba de normalidad.
suficientemente grande, la
prueba rechazará la hipótesis
nula de normalidad en la 1 Abra la base de datos que creó “BIENES1”
población.
2 Elija Estadísticas > Estadísticas básicas > Prueba de normalidad.

3 En Variable, ingrese Valor. Haga clic en Aceptar.

Salida de la ventana Gráfica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________96


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Genera una gráfica de probabilidad normal y realiza una prueba de hipótesis


para examinar si las observaciones siguen o no una distribución normal . Para
la prueba de normalidad , las hipótesis son,

H0: los datos siguen una distribución normal vs. H1: los datos no siguen una
distribución normal

La escala vertical de la gráfica se asemeja a la escala vertical del papel de


probabilidad normal. El eje horizontal es una escala lineal. La línea forma un
estimado de la función de distribución acumulada para la población de la cual se
extrajeron los datos. Con la gráfica se muestran estimaciones numéricas de
los parámetros de la población , Media y Desviación Estándar, el tamaño de la
muestra ó población, el valor de la prueba de normalidad ( Estadístico de
Anderson Darling) y el valor p asociado.

Interpretación de los resultados

La salida gráfica es una gráfica de probabilidades normales versus los datos. Los
datos se alejan de la línea ajustada de una manera más evidente en los extremos,
o colas de la distribución. El valor p de la prueba de Anderson-Darling indica que,
en niveles p menores a 0.005, hay evidencia de que los datos no siguen una
distribución normal.

Los problemas de no normalidad puede solucionarse por medio de


transformaciones de datos y como se mencionó antes, en muchas ocasiones la
heterocedasticidad es reflejo de la no normalidad de una o varias de las variables
por lo que también se debe verificar el supuesto de homocedasticidad y la
correlación de la no normalidad resuelve igualmente la dispersión de la varianza.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________97


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Para las distribuciones no normales, las dos formas más comunes son las
distribuciones “planas” y las distribuciones asimétricas. Para la distribución plana,
las transformaciones más comunes son la inversa (es decir, 1/Y o 1/X). Las
distribuciones asimétricas, pueden ser transformadas empleando la raíz cuadrada,
logaritmos o incluso la inversa de la variable. Las distribuciones asimétricas
negativas se transforman de forma más efectiva usando la raíz cuadrada, mientras
que por lo regular, el logaritmo funciona mejor para la asimetría positiva.

Asimismo se debe verificar la presencia de valores o casos atípicos que pudieran


influir en la Normalidad de la distribución.

Nota: Etiquete la gráfica dando doble clic en VALOR para que aparezca la
ventana Editar etiqueta de eje y en la parte inferior donde dice Texto escriba
VALOR DE LAS CASAS DE “BIENES1”. Haga clic en Aceptar.

Haga clic en Aceptar.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________98


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ACTIVIDAD DE APRENDIZAJE. Prueba de Normalidad. Prueba


1.3.2.1
de Anderson Darling.

ACTIVIDAD DE Se midió el VALOR de las casas en la zona ESTE en la base de datos


APRENDIZAJE “BIENES1” que se construyó anteriormente.
1.3.2.1
Se desea determinar si estos datos siguen una distribución normal, de modo que
PRUEBA DE utiliza una Prueba de normalidad de Anderson Darling, creando primero un
NORMALIDAD. subconjunto de hoja de trabajo para las casas ubicadas en el ESTE e interprete
PRUEBA DE los resultados y etiquetando correctamente todas las gráficas.
ANDERSON
DARLING Utilice el paquete Minitab para resolver esta Actividad de Aprendizaje.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________99


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.2.1 EJERCICIO DE AUTOEVALUACIÓN. Prueba de Normalidad.


Prueba de Anderson Darling.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Se midió el VALOR de las casas en la zona SUR en la base de datos


1.3.2.1 “BIENES1” que se construyó anteriormente.
PRUEBA DE
Se desea determinar si estos datos siguen una distribución normal, de modo que
NORMALIDAD. utiliza una Prueba de normalidad de Anderson Darling, creando primero un
PRUEBA DE subconjunto de hoja de trabajo para las casas ubicadas en el SUR e interprete
ANDERSON los resultados etiquetando correctamente todas las gráficas.
DARLING
Utilice el paquete Minitab para resolver esta Autoevaluación.

1.3.2.1 EJERCICIOS DE REFUERZO. Prueba de Normalidad. Prueba de


Anderson Darling.
.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________100


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

EJERCICIOS DE 1.3.2.1.1 Se midió el VALOR de las casas en la zona NORTE en la base de


REFUERZO datos “BIENES1” que se construyó con anterioridad.
1.3.2.1
Utilizando el paquete Minitab se desea determinar si estos datos siguen una
PRUEBA DE
distribución normal, de modo que utiliza una Prueba de normalidad de Anderson
NORMALIDAD. Darling, creando primero un subconjunto de hoja de trabajo para las casas en la
PRUEBA DE zona NORTE e interprete los resultados y etiquetando correctamente todas las
ANDERSON gráficas.
DARLING.

1.3.2.1.2 Se midió el VALOR de las casas con estilo MODERNO en la base


de datos “BIENES1” que se construyó con anterioridad.

Utilizando el paquete Minitab se desea determinar si estos datos siguen una


distribución normal, de modo que utiliza una Prueba de normalidad de Anderson
Darling, creando primero un subconjunto de hoja de trabajo para las casas con
estilo MODERNO e interprete los resultados y etiquetando correctamente todas
las gráficas.

NOTA:
El uso de un software
1.3.2.1.3 Se midió el VALOR de las casas con estilo GRANJA en la base de
estadístico como Excel o datos “BIENES1” que se construyó con anterioridad.
Minitab, entre otros, reduce
de gran manera el tiempo de
cálculo y la probabilidad de
Utilizando el paquete Minitab se desea determinar si estos datos siguen una
cometer errores en los distribución normal, de modo que utiliza una Prueba de normalidad de Anderson
cálculos aritméticos, sin Darling, creando primero un subconjunto de hoja de trabajo para las casas con
embargo se deben estilo GRANJA e interprete los resultados y etiquetando correctamente todas
comprender primero los
pasos del proceso. Por lo
las gráficas.
mismo es muy importante
que primero resuelva el
ejercicio en forma manual
y posteriormente utilice
un software para
comparar sus resultados.
Es importante mencionar que
pueden existir diferencias
en las respuestas debido a la
cantidad de dígitos que se
utilizan en los cálculos
manuales. Se sugiere
utilizar aproximaciones
de 5 dígitos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________101


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.2.2 EJEMPLO ILUSTRATIVO EN MINITAB 17. Prueba de


P.H. Homocedasticidad. Prueba de Levene. Transformaciones.
Etiquetado de Gráficos

EJEMPLO Revisión general del análisis de la varianza:


ILUSTRATIVO
INTEGRAL EN El análisis de la varianza (ANOVA) es similar a la regresión en el sentido de que se
utiliza para investigar y modelar la relación entre una variable de respuesta y una
MINITAB 17. o más variables predictoras. Sin embargo, el análisis de la varianza se diferencia
1.3.2.2. IGUALDAD DE de la regresión, en dos aspectos: las variables predictoras son cualitativas
VARIANZAS. (categóricas), y no se parte de ninguna suposición acerca de la naturaleza de la
relación (es decir, el modelo no incluye coeficientes para las variables). En efecto,
(HOMOCEDASTICI el análisis de la varianza amplia la prueba t de dos muestras para probar la
DAD). PRUEBA DE igualdad de las medias de dos poblaciones de modo que la convierta en una
hipótesis nula en la que se comparan más de dos medias y determinar si, o bien
LEVENE. todas son iguales o no todas son iguales. Sin embargo, varios de los
procedimientos de ANOVA de Minitab, permiten modelos en los que se incluyen
TRANSFORMA- tanto variables cualitativas, como cuantitativas.
CIONES.
ETIQUETADO DE Entre las capacidades para ANOVA que puede realizar Minitab figuran
GRÁFICOS procedimientos para ajustar modelos ANOVA a datos recolectados en diseños de
diversa naturaleza, para ajustar modelos MANOVA a diseños con respuestas
múltiples, para ajustar modelos ANOM (análisis de medias), y gráficas para probar
la igualdad de las varianzas, para gráficas de intervalos de confianza y gráficas de
efectos principales e interacciones.

Se utilizará el paquete Minitab para resolver este Ejemplo Ilustrativo de


Igualdad de Varianzar, realizar las Transformaciones de Raíz Cuadrada,
Inversa y Logaritmo decimal y etiquetar debidamente todos los gráficos
de presentación.

Prueba de igualdad de varianzas

Estadísticas > ANOVA > Prueba de igualdad de varianzas.

Utilice la prueba de varianzas para realizar pruebas de hipótesis para detectar


la igualdad u homogeneidad de la varianza utilizando las pruebas de Bartlett y
de Levene. Una Prueba F reemplaza a la prueba de Bartlett cuando usted sólo
tiene dos niveles.

Muchos procedimientos estadísticos, incluyendo los análisis de varianza, parten


del supuesto de que aunque es posible que haya diferentes muestras

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________102


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

provenientes de poblaciones con medias diferentes, éstas tienen la misma


varianza. El efecto que ejerce la desigualdad de las varianzas en las inferencias
depende en parte de si su modelo incluye factores fijos o aleatorios,
disparidades en el tamaño de las muestras, y la elección del procedimiento de
comparación múltiple. La prueba F de ANOVA es ligeramente afectada por la
desigualdad de las varianzas si el modelo contiene sólo factores fijos y tiene
tamaños de muestras iguales o casi iguales. Sin embargo, las pruebas F que
incluyen efectos aleatorios pudieran ser sustancialmente afectadas. Utilice el
procedimiento de prueba de varianza para probar la validez de la suposición de
igualdad en las varianzas.

Elementos del cuadro de diálogo

Respuesta: Ingrese la columna que contiene la variable de respuesta.

Factores: Ingrese las columnas que contienen los factores en el modelo.

Nivel de confianza: Ingrese un valor de 0 a 100 como nivel de confianza


deseado para los intervalos de confianza que se muestran en la gráfica. El nivel
predeterminado es 95. Minitab utiliza el método de Bonferroni para calcular los
intervalos de confianza simultáneos.

Título: Escriba en este cuadro el texto deseado para sustituir el título


predeterminado por su propio título personalizado.

Comparación entre las pruebas de Bartlett y las pruebas de Levene

Minitab calcula y muestra una estadística de prueba y un valor p tanto para la


prueba de Bartlett, como para la prueba de Levene donde, respectivamente, la
hipótesis nula corresponde o bien a varianzas iguales, o a varianzas que en no
todos los casos son iguales. Si sólo hay dos niveles, se realiza una prueba F en
lugar de la prueba de Bartlett.

· Utilice la prueba de Bartlett cuando los datos provengan de distribuciones


normales, la prueba de Bartlett no es sólida cuando los datos se apartan de la
normalidad.

· Utilice la prueba de Levene cuando los datos provengan de distribuciones


continuas, pero no necesariamente distribuciones normales. Este método
considera las distancias de las observaciones con respecto a la mediana de la
muestra en lugar de la media de la muestra, esto hace que la prueba sea más
Existen dos pruebas de sólida para las muestras más pequeñas.
homocedasticidad: la prueba
de Bonett y la prueba de
PRUEBA DE LEVENE
Levene. Para cada prueba,
la hipótesis nula plantea que
las dos varianzas son iguales Ejemplo de realización de prueba de igualdad de varianzas suponiendo
(H0: s21 / s22 = 1). La que los datos provengan de distribuciones continuas, pero no necesariamente
hipótesis alternativa puede normales (Prueba de Levene) con el paquete Mininat 17:
ser de cola izquierda (H1: s21
/ s22 < 1), de cola derecha

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________103


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

(H1: s21 / s22 > 1), o de dos Usted pretende diseñar un experimento para evaluar el valor de 233 casas de
colas (H1: s21 / s22 ≠ 1). De diferentes estilos. Usted mide el VALOR de las casas de la base de datos
forma opcional, las
relaciones de prueba “BIENES 1” que se construyó con anterioridad en cada una de las casas con
diferentes de 1 (igualdad) se ESTILO diferente. Como usted desea probar la igualdad de las medias y evaluar
pueden especificar. las diferencias de las medias, utiliza el procedimiento ANOVA de un factor (datos
apilados) con comparaciones múltiples. Por lo general, usted escogería un método
de comparación múltiple apropiado para sus datos. Sin embargo, aquí se
seleccionan dos métodos para demostrar las capacidades de Minitab
para probar primeramente que se cumpla el supuesto de igualdad de
varianzas (Homocedasticidad).

Antes de realizar el análisis de varianza, usted verifica la suposición de que la


varianza es igual utilizando la Prueba de igualdad de varianzas suponiendo que los
datos provienen de distribuciones continuas, pero no necesariamente
normales (Prueba de Levene):

1 Abra la base de datos que creó “BIENES1”

2 Elija Estadísticas > ANOVA > Prueba de varianzas iguales.

3 En Respuesta, ingrese VALOR

4 En Factores, ingrese ESTILO. Haga clic en Aceptar.

Salida de la ventana Sesión

Prueba de varianzas iguales: VALOR vs. ESTILO

Método

Hipótesis nula Todas las varianzas son iguales


Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0.05

Intervalos de confianza de Bonferroni de 95% para desviaciones


estándar

ESTILO N Desv.Est. IC
1 97 21.7286 (17.7196, 27.371)
2 15 43.7908 (17.5418, 131.983)
3 23 43.1440 (29.0550, 72.145)
4 60 23.4876 (15.1276, 38.104)
5 38 36.4499 (28.1542, 50.621)

Nivel de confianza individual = 99%

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________104


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Pruebas

Estadística
Método de prueba Valor p
Comparaciones múltiples — 0.004
Levene 5.48 0.000

Salida de la ventana Gráfica

Prueba de varianzas iguales: VALOR vs. ESTILO


Múltiples intervalos de comparación para la desviación estándar, ķ = 0.05

Comparaciones múltiples
1 Valor p 0.004
Prueba de Levene
Valor p 0.000
2
ESTILO

10 20 30 40 50 60 70 80 90 100

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.

Interpretación de los resultados

La Prueba de igualdad de varianzas genera una gráfica que muestra


Intervalos de confianza de Bonferroni de 95% para la desviación estándar
de la respuesta en cada nivel. Los resultados de las pruebas Levene se muestran
tanto en la ventana Sesión, como en la gráfica. (Interprete la prueba de
Bartlett cuando los datos provengan de distribuciones normales; utilice
la prueba de Levene cuando los datos provengan de distribuciones
continuas, pero no necesariamente normales). Note que el nivel de
confianza de 95% se aplica a la familia de intervalos y la asimetría de los
intervalos se debe al sesgo de la distribución chi-cuadrada.

Para el ejemplo para evaluar el VALOR de las casas con base en el ESTILO de
las mismas, los valores de p de 0.000 es menor que la opción razonable de alfa,

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________105


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

así que se puede rechazar la hipótesis nula de que las varianzas no son iguales
ó de que al menos una es diferente. Es decir, estos datos no proveen evidencia
suficiente para afirmar que las poblaciones tienen varianzas iguales.

Los problemas de heterocedasticidad pueden solucionarse por medio de


transformaciones de datos, similares a las usadas para conseguir normalidad y
como se mencionó antes, en muchas ocasiones la heterocedasticidad es reflejo de
la no normalidad de una de las variables y la correlación de la no normalidad
resuelve igualmente la dispersión de la varianza.

Para las distribuciones no normales, las dos formas más comunes son las
distribuciones “planas” y las distribuciones asimétricas. Para la distribución plana,
las transformaciones más comunes son la inversa (es decir, 1/Y o 1/X). Las
distribuciones asimétricas, pueden ser transformadas empleando la raíz
cuadrada, logaritmos o incluso la inversa de la variable. Las distribuciones
asimétricas negativas se transforman de forma más efectiva usando la raíz
cuadrada, mientras que por lo regular, el logaritmo funciona mejor para la
asimetría positiva

EJEMPLO DE TRANSFORMACIONES EN MINITAB 17 Y PRUEBA DE LEVENE


En estadística,
la transformación de
datos se efectúa para
Transformaciónes Raiz Cuadrada, 1/X y Log de la variable VALOR con
asegurarse que estos tienen Minitab:
una distribución normal (lo
que puede ser un remedio 1 Abra la base de datos que creó “BIENES1”
para analizar datos que
tienen otros tipos de
distribución, falta de 2 Elija Calc > Calculadora.
normalidad, linealidad,
y homocedasticidad). 3 En Almacenar resultado en variable, ingrese C22
Cuando se usan cierto tipo
de pruebas estadísticas la
transformación de datos 4 En Expresión, busque en Funciones: Raíz Cuadrada y selecciónela.
puede ser necesaria ya que Haga clic en el botón Seleccionar o simplemente doble clic.
este tipo de análisis asumen
que los datos deben ser
lineales, normales y
tienen homocedasticidad en
su varianza. Si el tamaño de
la muestra es demasiado
pequeño o los datos están
sesgados hacia una
distribución no normal se
puede intentar hacer una de
las siguientes
transformaciones: logarítmic
a, raíz cuadrada o inversa.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________106


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

5 En Expresión aparece SQRT(número). Seleccione la variable VALOR


del lado izquierdo y haga clic en el botón Seleccionar o doble clic.

6 Haga clic en Aceptar.

7 En C22 teclee el nombre RAÍZ

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________107


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

8 Elija Calc > Calculadora.

9 En Almacenar resultado en variable, ingrese C23

10 En Expresión, para obtener la Inversa, Teclee 1/ y seleccione la


variable VALOR del lado izquierdo o doble clic.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________108


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

11 Haga clic en Aceptar. En C23 escriba el nombre 1/X

12 Elija Calc > Calculadora.

13 En Almacenar resultado en variable, ingrese C24

14 En Expresión, busque en Funciones: Logaritmo base 10 y


selecciónela. Haga clic en el botón Seleccionar o simplemente doble clic.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________109


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

15 En Expresión aparece LOGTEN(número). Seleccione la variable


VALOR del lado izquierdo y haga clic en el botón Seleccionar o doble clic.

16 Haga clic en Aceptar. En C24 escriba el nombre Log

Repita la prueba de Levene para las TRES transformaciones para ver si

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________110


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

se corrigió el problema de homocedasticidad y si fué así cual


transformación resulto mejor.

A. CON LA RAÍZ CUADRADA DE VALOR

1 Elija Estadísticas > ANOVA > Prueba de varianzas iguales.

2 En Respuesta, ingrese RAÍZ

3 En Factores, ingrese ESTILO. Haga clic en Aceptar.

Salida de la ventana Sesión

Prueba de varianzas iguales: RAIZ vs. ESTILO

Método

Hipótesis nula Todas las varianzas son iguales


Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0.05

Intervalos de confianza de Bonferroni de 95% para desviaciones


estándar

ESTILO N Desv.Est. IC
1 97 0.0283202 (0.0237186, 0.034737)
2 15 0.0472208 (0.0204493, 0.131647)
3 23 0.0467954 (0.0333582, 0.073924)
4 60 0.0323497 (0.0202691, 0.053947)
5 38 0.0388919 (0.0309284, 0.052462)

Nivel de confianza individual = 99%

Pruebas

Estadística
Método de prueba Valor p
Comparaciones múltiples — 0.008
Levene 3.08 0.017

Prueba de varianzas iguales: RAIZ vs. ESTILO

Salida de la ventana Gráfica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________111


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Prueba de varianzas iguales: RAIZ CUADRADA DE VALOR vs. ESTILO


Múltiples intervalos de comparación para la desviación estándar, ķ = 0.05

Comparaciones múltiples
MODERNO
Valor p 0.008
Prueba de Levene
Valor p 0.017
HACIENDA

ESTILO COLONIAL

GRANJA

DESNIVELES

0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.


Elaboró: Arq. y M. en Admón. Javier Bech Vertti

Interpretación de los resultados

Para el ejemplo para evaluar la transformación de la RAIZ CUADRADA del


VALOR de las casas con base en el ESTILO de las mismas, los valores de p de
0.017 es menor que la opción razonable de alfa, así que se puede rechazar la
hipótesis nula de que las varianzas no son iguales ó de que al menos una es
diferente. Es decir, estos datos no proveen evidencia suficiente para afirmar que
las poblaciones tienen varianzas iguales.

B. CON LA LA INVERSA DE VALOR (1/X)

1 Elija Estadísticas > ANOVA > Prueba de varianzas iguales.

2 En Respuesta, ingrese 1/X

3 En Factores, ingrese ESTILO. Haga clic en Aceptar.

Salida de la ventana Sesión

Prueba de varianzas iguales: 1/X vs. ESTILO

Método

Hipótesis nula Todas las varianzas son iguales


Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0.05

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________112


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Intervalos de confianza de Bonferroni de 95% para desviaciones


estándar

ESTILO N Desv.Est. IC
1 97 0.0080457 (0.0068001, 0.0097793)
2 15 0.0124099 (0.0055708, 0.0333766)
3 23 0.0123215 (0.0089739, 0.0190515)
4 60 0.0095517 (0.0057398, 0.0166080)
5 38 0.0101533 (0.0081479, 0.0135723)

Nivel de confianza individual = 99%

Pruebas

Estadística
Método de prueba Valor p
Comparaciones múltiples — 0.014
Levene 2.14 0.077

Prueba de varianzas iguales: 1/X vs. ESTILO

Salida de la ventana Gráfica

Prueba de varianzas iguales: 1/ X INVERSA DE VALOR vs. ESTILO


Múltiples intervalos de comparación para la desviación estándar, ķ = 0.05

Comparaciones múltiples
MODERNO
Valor p 0.014
Prueba de Levene
Valor p 0.077
HACIENDA
ESTILO

COLONIAL

GRANJA

DESNIVELES

0.005 0.010 0.015 0.020 0.025

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.


Elaboró: Arq. y M. en Admón. Javier Bech Vertti

Interpretación de los resultados

Para el ejemplo para evaluar la transformación de la INVERSA del VALOR de las

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________113


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

casas con base en el ESTILO de las mismas, los valores de p de 0.077 es mayor
que la opción razonable de alfa, así que NO se puede rechazar la hipótesis nula
de que las varianzas son iguales. Es decir, estos datos proveen evidencia
suficiente para afirmar que las poblaciones tienen varianzas iguales.

C. CON EL LOGARITMO BASE 10 DE VALOR

1 Elija Estadísticas > ANOVA > Prueba de varianzas iguales.

2 En Respuesta, ingrese Log

3 En Factores, ingrese ESTILO. Haga clic en Aceptar.

Salida de la ventana Sesión

Prueba de varianzas iguales: Log vs. ESTILO

Método

Hipótesis nula Todas las varianzas son iguales


Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0.05

Intervalos de confianza de Bonferroni de 95% para desviaciones


estándar

ESTILO N Desv.Est. IC
1 97 0.0128313 (0.0107809, 0.0156884)
2 15 0.0208416 (0.0091331, 0.0574205)
3 23 0.0206678 (0.0148427, 0.0324086)
4 60 0.0148313 (0.0091792, 0.0250387)
5 38 0.0171300 (0.0136672, 0.0230313)

Nivel de confianza individual = 99%

Pruebas

Estadística
Método de prueba Valor p
Comparaciones múltiples — 0.010
Levene 2.75 0.029

Prueba de varianzas iguales: Log vs. ESTILO

Salida de la ventana Gráfica

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________114


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Prueba de varianzas iguales: LOGARITM O DE VALOR vs. ESTILO


Múltiples intervalos de comparación para la desviación estándar, ķ = 0.05

Comparaciones múltiples
MODERNO
Valor p 0.010
Prueba de Levene
Valor p 0.029
HACIENDA

ESTILO COLONIAL

GRANJA

DESNIVELES

0.010 0.015 0.020 0.025 0.030 0.035 0.040 0.045

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.


Elaboró: Arq. y M. en Arq. Javier Bech Vertti

Interpretación de los resultados

Para el ejemplo para evaluar la transformación deL LOGARITMO DECIMAL del


VALOR de las casas con base en el ESTILO de las mismas, los valores de p de
0.029 es menor que la opción razonable de alfa, así que se puede rechazar la
hipótesis nula de que las varianzas no son iguales ó de que al menos una es
diferente. Es decir, estos datos no proveen evidencia suficiente para afirmar que
las poblaciones tienen varianzas iguales.

Nota Importante: Como puede observarse con la INVERSA de VALOR se


logra corregir la falta de Homocedasticidad. No es del alcance de este
trabajo tomar la decisión de si se debe o no trabajar con los datos
transformados o sin transformar para usar alguna técnica multivariada
sino solamente mostrar la forma de hacer dichas transformaciones.

EJEMPLO DE ETIQUETADO DE LOS NIVELES DE LA VARIABLE O


“FACTOR” ESTILO:

1 Haga doble clic en el número 1 del eje vertical de la gráfica que dice
ESTILO para que Minitab despliegue la ventana Editar Escala.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________115


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

2 Seleccionar la pestaña Etiquetas

3 Activar la casilla Especificado

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________116


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

4 Borrar los números 1 2 3 4 5 y escribir MODERNO HACIENDA


COLONIAL GRANJA DESNIVELES

5 Haga clic en Aceptar.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________117


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

6 Aparece la gráfica debidamente etiquetada.

Prueba de varianzas iguales: VALOR vs. ESTILO


Múltiples intervalos de comparación para la desviación estándar, ķ = 0.05

Comparaciones múltiples
MODERNO Valor p 0.004
Prueba de Levene
Valor p 0.000
HACIENDA
ESTILO

COLONIAL

GRANJA

DESNIVELES

10 20 30 40 50 60 70 80 90 100

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.

Con lo anterior queda terminado el ejemplo ilustrativo de Igualdad de


varianzas (Prueba de homocedasticidad). Prueba de Levene en el paquete
MINITAB17. Para salir del sistema selecciona con el puntero del mouse en el
menú Archivo de la barra la opción Salir y da un clic con el botón izquierdo del
mouse. El sistema te mandará al escritorio de Windows en la pantalla. Aplica el
procedimiento para salir de Windows

ACTIVIDAD DE APRENDIZAJE EN MINITAB 17. Prueba de


1.3.2.2 Homocedasticidad. Prueba de Levene. Transformaciones.
Etiquetado de Gráficos.

ACTIVIDAD DE Usted pretende diseñar un experimento para evaluar el valor de 233 casas de
APRENDIZAJE EN diferentes estilos. Usted mide el VALOR de las casas de la base de datos
“BIENES 1” que se construyó con anterioridad en cada una de las casas con

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________118


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

MINITAB 17 UBICACIÓN diferente. Como usted desea probar la igualdad de las medias y
1.3.2.2 evaluar las diferencias de las medias, utiliza el procedimiento ANOVA de un
factor (datos apilados) con comparaciones múltiples. Por lo general, usted
PRUEBA DE escogería un método de comparación múltiple apropiado para sus datos. Sin
HOMOCEDASTICI embargo, aquí se seleccionan dos métodos para demostrar las
DAD. PRUEBA DE capacidades de Minitab para probar primeramente que se cumpla el
LEVENE. supuesto de igualdad de varianzas (Homocedasticidad).
TRANSFORMA-
Antes de realizar el análisis de varianza, usted verifica la suposición de que la
CIONES. varianza es igual utilizando la Prueba de igualdad de varianzas suponiendo que
ETIQUETADO DE los datos provienen de distribuciones continuas, pero no necesariamente
normales (Prueba de Levene):
GRÁFICOS.
Utilice el paquete Minitab para resolver esta Actividad de Aprendizaje
de Igualdad de Varianzas e interprete su resultado, realice las
Transformaciones de Raíz Cuadrada, Inversa y Logaritmo decimal
repitiendo las pruebas Levene para cada transformación e interprete
los resultados y etiquete debidamente todos los gráficos de
presentación.

1.3.2.2 EJERCICIO DE AUTOEVALUACIÓN. Prueba de


Homocedasticidad. Prueba de Levene. Transformaciones.
Etiquetado de Gráficos.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Se pretende diseñar un experimento para evaluar el valor de 233 casas de


1.3.2.2 diferentes estilos. Se mide el VALOR de las casas de la base de datos “BIENES
1” que se construyó con anterioridad con base en si tienen o no CHIMENEA.
PRUEBA DE Como se desea probar la igualdad de las medias y evaluar las diferencias de las
HOMOCEDASTICI medias, se utiliza el procedimiento ANOVA de un factor (datos apilados) con
DAD. PRUEBA DE comparaciones múltiples. Por lo general, se escogería un método de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________119


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

LEVENE. comparación múltiple apropiado para sus datos.


TRANSFORMA-
CIONES. Antes de realizar el análisis de varianza, se verifica la suposición de que la
varianza es igual utilizando la Prueba de igualdad de varianzas suponiendo que
ETIQUETADO DE los datos provienen de distribuciones continuas, pero no necesariamente
GRÁFICOS. normales (Prueba de Levene):

Utilice el paquete Minitab para resolver este Ejercicio de


Autoevaluación de Igualdad de Varianzas e interprete su resultado,
realice las Transformaciones de Raíz Cuadrada, Inversa y Logaritmo
decimal repitiendo las pruebas Levene para cada transformación e
interprete los resultados y etiquete debidamente todos los gráficos de
presentación.

1.3.2.2 EJERCICIOS DE REFUERZO. Prueba de Homocedasticidad.


Prueba de Levene. Transformaciones. Etiquetado de
Gráficos.

EJERCICIOS DE 1.3.2.2.1 Se pretende diseñar un experimento para evaluar el IMPUESTO


REFUERZO que pagan 233 casas en diferentes zonas de la ciudad. Se mide el IMPUESTO
1.3.2.2 de las casas de la base de datos “BIENES 1” que se construyó con anterioridad
en cada una de las casas con ESTILO diferente. Como se desea probar la
PRUEBA DE igualdad de las medias y evaluar las diferencias de las medias, se utiliza el
HOMOCEDASTICI procedimiento ANOVA de un factor (datos apilados) con comparaciones
DAD. PRUEBA DE múltiples. Por lo general, se escogería un método de comparación múltiple
LEVENE. apropiado para los datos.
TRANSFORMA-
CIONES. Antes de realizar el análisis de varianza, verifica la suposición de que la
varianza es igual en todos los niveles del Factor ESTILO utilizando la Prueba de
ETIQUETADO DE igualdad de varianzas suponiendo que los datos provienen de distribuciones
GRÁFICOS. continuas, pero no necesariamente normales (Prueba de Levene)
utilizando el paquete de cómputo Minitab:

Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo de


Igualdad de Varianzas e interprete su resultado, realice las
Transformaciones de Raíz Cuadrada, Inversa y Logaritmo decimal
repitiendo las pruebas Levene para cada transformación e interprete
los resultados y etiquete debidamente todos los gráficos de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________120


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

presentación.

1.3.2.2.2 Se pretende diseñar un experimento para evaluar el IMPUESTO


que pagan 233 casas en diferentes zonas de la ciudad. Se mide el IMPUESTO
de las casas de la base de datos “BIENES 1” que se construyó con anterioridad
con respecto a su UBICACIÓN diferente. Como se desea probar la igualdad de
las medias y evaluar las diferencias de las medias, se utiliza el procedimiento
ANOVA de un factor (datos apilados) con comparaciones múltiples. Por lo
general, se escogería un método de comparación múltiple apropiado para los
datos.

Antes de realizar el análisis de varianza, verifica la suposición de que la


NOTA: varianza es igual en todos los niveles del Factor UBICACIÓN utilizando la
Prueba de igualdad de varianzas suponiendo que los datos provienen de
El uso de un software distribuciones continuas, pero no necesariamente normales (Prueba de
estadístico como Excel o
Minitab, entre otros, reduce
Levene) utilizando el paquete de cómputo Minitab:
de gran manera el tiempo de
cálculo y la probabilidad de Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo de
cometer errores en los
Igualdad de Varianzas e interprete su resultado, realice las
cálculos aritméticos, sin
embargo se deben Transformaciones de Raíz Cuadrada, Inversa y Logaritmo decimal
comprender primero los repitiendo las pruebas Levene para cada transformación e interprete
pasos del proceso. Por lo los resultados y etiquete debidamente todos los gráficos de
mismo es muy importante
que primero resuelva el
presentación.
ejercicio en forma manual
y posteriormente utilice
un software para
1.3.2.2.3 Se pretende diseñar un experimento para evaluar el IMPUESTO
comparar sus resultados. que pagan 233 casas en diferentes zonas de la ciudad. Se mide el IMPUESTO
Es importante mencionar que de las casas de la base de datos “BIENES 1” que se construyó con anterioridad
pueden existir diferencias con respecto a si tienen o no CHIMENEA. Como se desea probar la igualdad de
en las respuestas debido a la
las medias y evaluar las diferencias de las medias, se utiliza el procedimiento
cantidad de dígitos que se
utilizan en los cálculos ANOVA de un factor (datos apilados) con comparaciones múltiples. Por lo
manuales. Se sugiere general, se escogería un método de comparación múltiple apropiado para los
utilizar aproximaciones datos.
de 5 dígitos.

Antes de realizar el análisis de varianza, verifica la suposición de que la


varianza es igual en todos los niveles del Factor CHIMENEA utilizando la
Prueba de igualdad de varianzas suponiendo que los datos provienen de
distribuciones continuas, pero no necesariamente normales (Prueba de
Levene) utilizando el paquete de cómputo Minitab:

Utilice el paquete Minitab para resolver este Ejercicio de Refuerzo de


Igualdad de Varianzas e interprete su resultado, realice las
Transformaciones de Raíz Cuadrada, Inversa y Logaritmo decimal
repitiendo las pruebas Levene para cada transformación e interprete
los resultados y etiquete debidamente todos los gráficos de
presentación.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________121


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.3.2.3.P.H. EJEMPLO ILUSTRATIVO EN MINITAB 17. Prueba de


Homocedasticidad. Prueba de Barlett

EJEMPLO Revisión general del análisis de la varianza:


ILUSTRATIVO
1.3.2.3.
El análisis de la varianza (ANOVA) es similar a la regresión en el sentido de que se
INTEGRAL EN utiliza para investigar y modelar la relación entre una variable de respuesta y una
MINITAB 17. o más variables predictoras. Sin embargo, el análisis de la varianza se diferencia
IGUALDAD DE de la regresión, en dos aspectos: las variables predictoras son cualitativas
(categóricas), y no se parte de ninguna suposición acerca de la naturaleza de la
VARIANZAS relación (es decir, el modelo no incluye coeficientes para las variables). En efecto,
(HOMOCEDASTICI el análisis de la varianza amplia la prueba t de dos muestras para probar la
igualdad de las medias de dos poblaciones de modo que la convierta en una
DAD). PRUEBA DE
hipótesis nula en la que se comparan más de dos medias y determinar si, o bien
BARLETT todas son iguales o no todas son iguales. Sin embargo, varios de los
procedimientos de ANOVA de Minitab, permiten modelos en los que se incluyen
tanto variables cualitativas, como cuantitativas.

Entre las capacidades para ANOVA que puede realizar Minitab figuran
procedimientos para ajustar modelos ANOVA a datos recolectados en diseños de
diversa naturaleza, para ajustar modelos MANOVA a diseños con respuestas
múltiples, para ajustar modelos ANOM (análisis de medias), y gráficas para probar
la igualdad de las varianzas, para gráficas de intervalos de confianza y gráficas de
efectos principales e interacciones.

Prueba de igualdad de varianzas

Estadísticas > ANOVA > Prueba de igualdad de varianzas.

Utilice la prueba de varianzas para realizar pruebas de hipótesis para detectar


la igualdad u homogeneidad de la varianza utilizando las pruebas de Bartlett y
de Levene. Una Prueba F reemplaza a la prueba de Bartlett cuando usted sólo
tiene dos niveles.

Muchos procedimientos estadísticos, incluyendo los análisis de varianza, parten


del supuesto de que aunque es posible que haya diferentes muestras
provenientes de poblaciones con medias diferentes, éstas tienen la misma
varianza. El efecto que ejerce la desigualdad de las varianzas en las inferencias
depende en parte de si su modelo incluye factores fijos o aleatorios,
disparidades en el tamaño de las muestras, y la elección del procedimiento de
comparación múltiple. La prueba F de ANOVA es ligeramente afectada por la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________122


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

desigualdad de las varianzas si el modelo contiene sólo factores fijos y tiene


tamaños de muestras iguales o casi iguales. Sin embargo, las pruebas F que
incluyen efectos aleatorios pudieran ser sustancialmente afectadas. Utilice el
procedimiento de prueba de varianza para probar la validez de la suposición de
igualdad en las varianzas.

Elementos del cuadro de diálogo

Respuesta: Ingrese la columna que contiene la variable de respuesta.

Factores: Ingrese las columnas que contienen los factores en el modelo.

Nivel de confianza: Ingrese un valor de 0 a 100 como nivel de confianza


deseado para los intervalos de confianza que se muestran en la gráfica. El nivel
predeterminado es 95. Minitab utiliza el método de Bonferroni para calcular los
intervalos de confianza simultáneos.

Título: Escriba en este cuadro el texto deseado para sustituir el título


predeterminado por su propio título personalizado.

Comparación entre las pruebas de Bartlett y las pruebas de Levene

Minitab calcula y muestra una estadística de prueba y un valor p tanto para la


prueba de Bartlett, como para la prueba de Levene donde, respectivamente, la
hipótesis nula corresponde o bien a varianzas iguales, o a varianzas que en no
todos los casos son iguales. Si sólo hay dos niveles, se realiza una prueba F en
lugar de la prueba de Bartlett.

· Utilice la prueba de Bartlett cuando los datos provengan de distribuciones


normales, la prueba de Bartlett no es sólida cuando los datos se apartan de la
normalidad.

· Utilice la prueba de Levene cuando los datos provengan de distribuciones


continuas, pero no necesariamente distribuciones normales. Este método
considera las distancias de las observaciones con respecto a la mediana de la
muestra en lugar de la media de la muestra, esto hace que la prueba sea más
sólida para las muestras más pequeñas.

En estadística, la prueba de EJEMPLO DE UNA PRUEBA DE BARLETT CON MINITAB 17


Bartlett se utiliza para
probar si k muestras Usted diseña un experimento para evaluar el valor de 233 casas de diferentes
provienen de poblaciones estilos. Usted mide el VALOR de las casas de la base de datos “BIENES1” que
con la misma varianza. A las
varianzas iguales a través de
se construyó en el ejemplo anterior en cada una de las casas con ESTILO
las muestras se diferente. Como usted desea probar la igualdad de las medias y evaluar las
llama homocedasticidad u diferencias de las medias, utiliza el procedimiento ANOVA de un factor (datos
homogeneidad de varianzas. apilados) con comparaciones múltiples. Por lo general, usted escogería un método
Algunas pruebas estadísticas,
por ejemplo, el análisis de la de comparación múltiple apropiado para sus datos.
varianza ANOVA, suponen

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________123


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

que las varianzas son iguales Realice la prueba de igualdad de varianzas suponiendo que los datos
en todos los grupos o provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
muestras. La prueba de de cómputo Minitab:
Bartlett se puede utilizar
para verificar esa suposición.
Antes de realizar el análisis de varianza, usted verifica la suposición de que la
La prueba de Bartlett es
varianza es igual utilizando la Prueba de igualdad de varianzas.
sensible a las desviaciones
de la normalidad. Es decir, si
las muestras provienen de 1 Abra la base de datos que creó “BIENES1”
distribuciones no normales,
entonces la prueba de
Bartlett puede ser 2 Elija Estadísticas > ANOVA > Prueba de varianzas iguales.
simplemente para probar la
no normalidad. La Prueba de 3 En Respuesta, ingrese VALOR
Levene y la de Bonett son
alternativas a la prueba de
Bartlett que son menos 4 En Factores, ingrese ESTILO
sensibles a las desviaciones
de la normalidad.1 5 En el botón Opciones active la casilla que dice: Utilice la prueba
basándose en la distribución normal. Haga clic en Aceptar y nuevamente
Aceptar

Salida de la ventana Sesión

Prueba de varianzas iguales: VALOR vs. ESTILO

Método

Hipótesis nula Todas las varianzas son iguales


Hipótesis alterna Por lo menos una varianza es diferente
Nivel de significancia α = 0.05

Se utiliza el método de Bartlett. Este método es exacto sólo para


datos
normales.

Intervalos de confianza de Bonferroni de 95% para desviaciones


estándar

ESTILO N Desv.Est. IC
1 97 21.7286 (18.2938, 26.5988)
2 15 43.7908 (29.2780, 81.1710)
3 23 43.1440 (30.9337, 68.8346)
4 60 23.4876 (18.9420, 30.5957)
5 38 36.4499 (27.9595, 51.4287)

Nivel de confianza individual = 99%

Pruebas

Estadística
Método de prueba Valor p
Bartlett 37.48 0.000

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________124


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Prueba de varianzas iguales: VALOR vs. ESTILO

Salida de la ventana Gráfica

Prueba de varianzas iguales: VALOR vs. ESTILO


Prueba de Bartlett
1 Valor p 0.000

2
ESTILO

10 20 30 40 50 60 70 80
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Interpretación de los resultados

La Prueba de igualdad de varianzas genera una gráfica que muestra


Intervalos de confianza de Bonferroni de 95% para la desviación estándar
de la respuesta en cada nivel. Los resultados de la prueba de Barlett se muestran
tanto en la ventana Sesión, como en la gráfica. (Interprete la prueba de
Bartlett cuando los datos provengan de distribuciones normales; utilice
la prueba de Levene cuando los datos provengan de distribuciones
continuas, pero no necesariamente normales). Note que el nivel de
confianza de 95% se aplica a la familia de intervalos y la asimetría de los
intervalos se debe al sesgo de la distribución chi-cuadrada.

Para el ejemplo para evaluar el VALOR de las casas con base en el ESTILO de
las mismas, los valores de p de 0.000 es menor que la opción razonable de alfa,
así que se puede rechazar la hipótesis nula de que las varianzas no son iguales
ó de que al menos una es diferente. Es decir, estos datos no proveen evidencia
suficiente para afirmar que las poblaciones tienen varianzas iguales.

Los problemas de heterocedasticidad pueden solucionarse por medio de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________125


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

transformaciones de datos, similares a las usadas para conseguir normalidad y


como se mencionó antes, en muchas ocasiones la heterocedasticidad es reflejo de
la no normalidad de una de las variables y la correlación de la no normalidad
resuelve igualmente la dispersión de la varianza.

Para las distribuciones no normales, las dos formas más comunes son las
distribuciones “planas” y las distribuciones asimétricas. Para la distribución plana,
las transformaciones más comunes son la inversa (es decir, 1/Y o 1/X). Las
distribuciones asimétricas, pueden ser transformadas empleando la raíz cuadrada,
logaritmos o incluso la inversa de la variable. Las distribuciones asimétricas
negativas se transforman de forma más efectiva usando la raíz cuadrada, mientras
que por lo regular, el logaritmo funciona mejor para la asimetría positiva.

Asimismo se debe verificar la presencia de valores o casos atípicos que pudieran


influir en la Normalidad de la distribución y en la falta de homocedasticidad.

Etiquetado de los niveles de la variable o “Factor” ESTILO:

1 Haga doble clic en el número 1 del eje vertical de la gráfica que dice
ESTILO para que Minitab despliegue la ventana Editar Escala.

2 Seleccionar la pestaña Etiquetas

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________126


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

3 Activar la casilla Especificado

4 Borrar los números 1 2 3 4 5 y escribir MODERNO HACIENDA


COLONIAL GRANJA DESNIVELES

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________127


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

5 Haga clic en Aceptar.


6 Aparece la gráfica debidamente etiquetada.

Prueba de varianzas iguales: VALOR vs. ESTILO


Prueba de Bartlett
MODERNO Valor p 0.000

HACIENDA
ESTILO

COLONIAL

GRANJA

DESNIVELES

10 20 30 40 50 60 70 80
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________128


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Con lo anterior queda terminado el ejemplo ilustrativo de Igualdad de


varianzas (Prueba de homocedasticidad) Prueba de Barlett en el paquete
MINITAB17. Para salir del sistema selecciona con el puntero del mouse en el
menú Archivo de la barra la opción Salir y da un clic con el botón izquierdo del
mouse. El sistema te mandará al escritorio de Windows en la pantalla. Aplica el
procedimiento para salir de Windows

ACTIVIDAD DE APRENDIZAJE. Prueba de Homocedasticidad.


1.3.2.3
Prueba de Barlett

ACTIVIDAD DE Usted diseña un experimento para evaluar el valor de 233 casas de diferentes
APRENDIZAJE estilos. Usted mide el VALOR de las casas de la base de datos “BIENES1” que
se construyó en el ejemplo anterior en cada una de las casas con base en la
1.3.2.3 UBICACIÓN de las casas. Como usted desea probar la igualdad de las medias
PRUEBA DE y evaluar las diferencias de las medias, utiliza el procedimiento ANOVA de un
HOMOCEDASTICI factor (datos apilados) con comparaciones múltiples. Por lo general, usted
DAD. PRUEBA DE escogería un método de comparación múltiple apropiado para sus datos.
BARLETT
Realice la prueba de igualdad de varianzas suponiendo que los datos
provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
de cómputo Minitab.

1.3.2.3 EJERCICIO DE AUTOEVALUACIÓN. Prueba de


Homocedasticidad. Prueba de Barlett.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________129


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

AUTOEVALUACIÓN Usted diseña un experimento para evaluar el valor de 233 casas de diferentes
1.3.2.3 estilos. Usted mide el VALOR de las casas de la base de datos “BIENES1” que
se construyó en el ejemplo anterior en cada una de las casas con respecto al
PRUEBA DE tipo de ALBERCA ubicada en la propiedad. Como usted desea probar la
HOMOCEDASTICI igualdad de las medias y evaluar las diferencias de las medias, utiliza el
DAD. PRUEBA DE procedimiento ANOVA de un factor (datos apilados) con comparaciones
BARLETT múltiples. Por lo general, usted escogería un método de comparación múltiple
apropiado para sus datos.

Realice la prueba de igualdad de varianzas suponiendo que los datos


provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
de cómputo Minitab:

1.3.2.3 EJERCICIOS DE REFUERZO. Prueba de Homocedasticidad.


Prueba de Barlett.

EJERCICIOS DE 1.3.2.3.1 Usted diseña un experimento para evaluar el valor de 233 casas de
REFUERZO diferentes estilos. Usted mide el IMPUESTO de las casas de la base de datos
1.3.2.3 “BIENES1” que se construyó en el ejemplo anterior en cada una de las casas
con ESTILO diferente. Como usted desea probar la igualdad de las medias y
PRUEBA DE evaluar las diferencias de las medias, utiliza el procedimiento ANOVA de un
HOMOCEDASTICI factor (datos apilados) con comparaciones múltiples. Por lo general, usted
DAD. PRUEBA DE escogería un método de comparación múltiple apropiado para sus datos.
BARLETT
Realice la prueba de igualdad de varianzas suponiendo que los datos
provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
de cómputo Minitab:

1.3.2.3.2 Usted diseña un experimento para evaluar el valor de 233 casas de


diferentes estilos. Usted mide el IMPUESTO de las casas de la base de datos
“BIENES1” que se construyó en el ejemplo anterior en cada una de las casas
con base en el IMPUESTO que pagan las casas. Como usted desea probar la
igualdad de las medias y evaluar las diferencias de las medias, utiliza el
procedimiento ANOVA de un factor (datos apilados) con comparaciones
múltiples. Por lo general, usted escogería un método de comparación múltiple

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________130


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

apropiado para sus datos.


NOTA:
Realice la prueba de igualdad de varianzas suponiendo que los datos
El uso de un software provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
estadístico como Excel o
Minitab, entre otros, reduce
de cómputo Minitab:
de gran manera el tiempo de
cálculo y la probabilidad de
cometer errores en los
1.3.2.3.3 Usted diseña un experimento para evaluar el valor de 233 casas de
cálculos aritméticos, sin diferentes estilos. Usted mide el IMPUESTO de las casas de la base de datos
embargo se deben “BIENES1” que se construyó en el ejemplo anterior en cada una de las casas
comprender primero los con respecto al tipo de ALBERCA ubicada en la propiedad. Como usted desea
pasos del proceso. Por lo
mismo es muy importante
probar la igualdad de las medias y evaluar las diferencias de las medias, utiliza
que primero resuelva el el procedimiento ANOVA de un factor (datos apilados) con comparaciones
ejercicio en forma manual múltiples. Por lo general, usted escogería un método de comparación múltiple
y posteriormente utilice apropiado para sus datos.
un software para
comparar sus resultados.
Es importante mencionar que Realice la prueba de igualdad de varianzas suponiendo que los datos
pueden existir diferencias provienen de distribuciones normales (Prueba de Barlett) utilizando el paquete
en las respuestas debido a la
de cómputo Minitab:
cantidad de dígitos que se
utilizan en los cálculos
manuales. Se sugiere
utilizar aproximaciones
de 5 dígitos.

OBJETIVO 1.4. El alumno entenderá y aplicará un sistema de


ecuaciones lineales representado como un producto de una matriz
formada por los coeficientes de las incógnitas por un VECTOR
COLUMNA, formado por las incognitas y este producto siendo igual a
un VECTOR COLUMA formado por los términos independientes

ANTECEDENTES CONCEPTOS DE:

Ecuación lineal, sistema de ecuaciones lineales,Matriz aumentada,


representación matricial, operaciones elementales, ecuación algebraica, tamaño
de una matriz, tipo de matrices, igualdad de matrices, operaciones con matrices,
matriz de cofactores, matriz inversa, determinantes

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________131


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

SISTEMAS MATRICIALES DE RESOLUCION DE SISTEMAS DE


1.4.1
ECUACIONES LINEALES

CONCEPTOS BÁSICOS SISTEMAS MATRICIALES DE RESOLUCIÓN DE SISTEMAS DE


SISTEMAS MATRICIALES DE ECUACIONES LINEALES
RESOLUCIÓN DE SISTEMAS
Un sistema de ecuaciones lineales se puede representar como el producto
DE ECUACIONES
de una matriz formada por los coeficientes de las incógnitas por un
LINEALES VECTOR COLUMNA, formado por las incógnitas, y este producto siendo
igual a un vector columna formado por los términos independientes.

EJEMPLO: El sistema:

a1x + b1y + c1z = d1

a2x + b2y + c3z = d2

a3x + b3y + c3z = d3

puede ser representado como:

En matemáticas y álgebra lineal, a1 b1 c1 x d1


un sistema de ecuaciones lineales,
también conocido como sistema a2 b2 c2 x y = d2
lineal de ecuaciones o
simplemente sistema lineal, es un
conjunto de ecuaciones a3 b3 c3 z d3
lineales (es decir, un sistema de
ecuaciones en donde
cada ecuación es de primer
grado), definidas sobre
un cuerpo o un anillo conmutativo.
Un ejemplo de sistema lineal de
ecuaciones sería el siguiente: A x X = K

RESOLUCION DE UN SISTEMA LINEAL DE ECUACIONES MEDIANTE


2x+3y-4z=-4 LA MATRIZ INVERSA
x-y+3z=8
Para un sistema de ecuaciones lineales heterogéneas es válida la expresión:
2x+5y-z=9
A x X = K (**)

El problema consiste en encontrar Donde:


los valores desconocidos de las
variables x1, x2 y x3 que satisfacen A= Matriz de coeficientes
las tres ecuaciones.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________132


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

El problema de los sistemas X= Incógnitas


lineales de ecuaciones es uno de
los más antiguos de la matemática K= Términos independientes
y tiene una infinidad de
aplicaciones, como
Si ambos miembros de (**) los multiplicamos por A-1, matriz inversa de A,
en procesamiento digital de
señales, análisis estructural, obtenemos:
estimación, predicción y más
generalmente en programación A-1 x ( A x X)= A-1 x K o sea (A-1 x A) x X = A-1 x K y como, por definición,
lineal así como en A-1 x A = Au=1, se tiene:
la aproximación de problemas no
lineales de análisis numérico.
1(X)= A-1K, que es X= A-1 x K

Esquemáticamente el procedimiento es:

Paso 1. Paso 2. OBTENER LA MATRIZ


EXPRESAR EL DE COEFICIENTES Y
SISTEMA COMO COMPROBAR QUE |A| ES
A x X=K DIFERENTE DE CERO

Paso 3.OBTENER
Paso 4. OBTENER LA MATRIZ
LA
DE COFACTORES DE LA
TRANSPUESTA
TRANSPUESTA: A´
DE A=A´

Paso 5. OBTENER LA MATRIZ INVERSA


Paso 6. APLICAR
APLICANDO:
LA EXPRESIÓN:
A-1=(1/ |A|)(MATRIZ DE COFACTORES
X= (A-1)(K)
DE LA TRANSPUESTA)

Paso 7.
SOLUCIÓN

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________133


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.4.1.1 EJEMPLO ILUSTRATIVO. Resolución de un Sistema Lineal de


Ecuaciones mediante el Método de matriz Inversa.

EJEMPLO Resolver el siguiente sistema, empleando el método de la


ILUSTRATIVO MATRIZ INVERSA:
1.4.1.1
RESOLUCIÓN DE UN 2x + 3y – 4z = -4
x - y + 3z = 8
SISTEMA LINEAL DE
2x + 5y - z = 9
ECUACIONES MEDIANTE
EL MÉTODO DE MATRIZ Paso 1. Expresar el sistema como A x X = K
INVERSA
2 3 −4 𝑥 −4
`1 −1 3 e x k𝑦o = ` 8 e
fg
2 ggghg
5 g ggi
−1 fhi 𝑧 fhi 9
j p s

Paso 2. Buscar el valor del determinante |𝑨|=

2 3 −4
|𝐴| = w1 −1 3 w=+2 x−1 3 x-3x1 3 x + (−4) x1 −1x =
5 −1 2 −1 2 5
2 5 −1

Por el método de los menores correspondientes de una matriz:

= 2(-1)1+1(1-15) +3(-1)1+2(-1-6)-4(-1)1+3(5+2)=-28+21-28=35≠0 (tiene inversa)


Nota: Cuidar los signos de los cofactores + - +. Cofactor=expresión: (-1)i+j |Mai𝐣|

Aplicando la regla de Sarrus:

2 3 −4
1 −1 3
|𝐴| = ~~2 5 −1~~ = (2*-1*-1)+ (1*5*-4)+ (2*3*3)- (2*-1*-4)- (2*5*-3)- (1*3*-
2 3 −4
1 −1 3
1)=-35≠0

Paso 3. Obtener la matriz transpuesta de la matriz A, que es:

2 1 2
AT=A’= ` 3 −1 5 e
−4 3 −1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________134


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Paso 4. Formar la matriz de cofactores de A’, es decir formar α A’



−1 5 3 5 3 −1
⎡+ x 3 −1x −x
−4 −1
x +x
−4 3 ⎤
x
⎢ 1 2 2 2 2 1 ⎥⎥
αA’=⎢ − x x +x x −x x
⎢ 3 −1 −4 −1 −4 3 ⎥
⎢ + x 1 2x 2 2 2 1 ⎥
⎣ −x x +x x
−1 5 3 5 3 −1 ⎦

+(1 − 15) −(−3 − 20) +(9 − 4) −14 −17 5


= …−(−1 − 6) +(−2 + 8) −(6 + 4) ‡ = ` 7 6 10 e
+((5 + 2) −(10 − 6) +(−2 − 3) 7 −4 −5

𝟏
Paso 5. Calcular la inversa de la matriz A’= |𝑨| α A’

14/35 17/35 −5/35


1 −14 −17 5
` 7 6 −10e = `−7/35 −6/35 10/35 e
−35
7 −4 −5 −7/35 4/35 5/35

Paso 6. Llevar este valor a la expresión X=A-1 x K y tenemos:

𝑥 14/35 17/35 −5/35 −4


k𝑦o = `−7/35 −6/35 10/35 e 𝑥 ` 8 e =
𝑧 −7/35 4/35 5/35 9

−4
⎡ ‹14 17 − 5 Œ ∗ ` 8 e⎤
⎢ 35 35 35 ⎥
⎢ 9 ⎥
−4 ⎥ −56/35 +136/35 −45/35
⎢ 7 6 10
‹−
⎢ 35 − Œ ∗ ` 8 e⎥ = ` 28/35 −48/35 +90/35e
35 35 28/35 +32/35 +45/35
⎢ 9 ⎥
⎢ 7 4 5 −4 ⎥
⎢ ‹− Œ ∗ ` 8 e⎥
⎣ 35 35 35
9 ⎦

35/35 1 𝑥
= ` 70/35 e = `2e = k𝑦o
105/35 3 𝑧

Paso 7. La solución es x=1, y=2, z=3

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________135


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ACTIVIDAD DE APRENDIZAJE. Resolución de un Sistema Lineal


1.4.1.1
de Ecuaciones mediante el Método de matriz Inversa.

ACTIVIDAD DE Resolver el siguiente sistema, empleando el método de la MATRIZ INVERSA y


APRENDIZAJE aplicando la regla de Sarrus para obtener el determinante de A o sea |𝑨|
1.4.1.1
x + y + z = 11
RESOLUCIÓN DE UN 2x – y +z = 5
SISTEMA LINEAL DE 3x + 2y +z= 24
ECUACIONES MEDIANTE
EL MÉTODO DE MATRIZ
INVERSA

1.4.1.1 EJERCICIO DE AUTOEVALUACIÓN. Resolución de un Sistema


Lineal de Ecuaciones mediante el Método de matriz
Inversa.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN Resolver el siguiente sistema, empleando el método de la MATRIZ INVERSA y


1.4.1.1 aplicando la regla de Sarrus para obtener el determinante de A o sea |𝑨|
RESOLUCIÓN DE UN
4x + 2y + 3z = 4
SISTEMA LINEAL DE
-3x – y – 2z = -6

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________136


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ECUACIONES MEDIANTE -2x – y – z = -5


EL MÉTODO DE MATRIZ
INVERSA

1.4.1.1 EJERCICIOS DE REFUERZO. Resolución de un Sistema Lineal de


Ecuaciones mediante el Método de matriz Inversa.

EJERCICIOS DE 1.4.1.1.1 Resolver el siguiente sistema, empleando el método de la MATRIZ


REFUERZO INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
1.4.1.1 sea |𝑨|
3x – 5y + 7z =28
RESOLUCIÓN DE UN 2x + 6y – 9z =-23
SISTEMA LINEAL DE 4x – 2y – 5z = 9
ECUACIONES MEDIANTE
EL MÉTODO DE MATRIZ 1.4.1.1.2 Resolver el siguiente sistema, empleando el método de la MATRIZ
INVERSA INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
sea |𝑨|
2x + 3y + z = 4
x + 2y + 2z = 6
5x + y + 4x = 21

1.4.1.1.3 Resolver el siguiente sistema, empleando el método de la MATRIZ


INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
sea |𝑨|
2x + 5y – 3z = 17
6x – 2y -5z = -3
3x + 7y + 4z = -18

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________137


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.4.1.2 EJEMPLO ILUSTRATIVO EN EXCEL. Resolución de un


Sistema Lineal de Ecuaciones mediante el Método de
matriz Inversa.

EJEMPLO ILUSTRA- Resolver el siguiente sistema, empleando el método de la MATRIZ


TIVO INVERSA con Excel:
INTEGRAL EN EXCEL
2x + 3y – 4z = -4
1.4.1.2 x - y + 3z = 8
RESOLUCIÓN 2x + 5y - z = 9
SISTEMA LINEAL
ECUACIONES. Cómo resolver un sistema de ecuaciones con Excel
MÉTODO MATRIZ
Uno de los cálculos que constituyen un verdadero reto para los estudiantes es la
INVERSA
resolución de sistemas de ecuaciones.

Existen muchos tipos de sistemas de ecuaciones, pero hoy se va a resolver


con Excel uno de los más sencillos: los sistemas de ecuaciones lineales:

2x + 3y – 4z = -4
x - y + 3z = 8
2x + 5y - z = 9

Para un sistema de ecuaciones lineales heterogéneas es válida la expresión:

A x X = K (**)

Donde:

A= Matriz de coeficientes
X= Incógnitas
K= Términos independientes
Si ambos miembros de (**) los multiplicamos por A-1, matriz inversa de A,
obtenemos:
A-1 x ( A x X)= A-1 x K o sea (A-1 x A) x X = A-1 x K y como, por definición, A-1 x
A = Au=1, se tiene:
1(X)= A-1K, que es X= A-1 x K

Para resolver un sistema de ecuaciones, debemos encontrar el valor de las


variables que contiene:

X=1

Y=2

Z=3

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________138


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

La única condición que debe darse para resolver este tipo de sistemas con
Excel es que debe haber el mismo número de variables que de ecuaciones. El
ejemplo anterior utiliza dos variables y dos ecuaciones. Tener tres ecuaciones
significaría que deben existir también tres variables.

Los pasos que debes seguir para resolver sistemas de ecuaciones con Excel es
el siguiente:

1. Introduce la ecuación de forma que los valores como figura en la imagen de


debajo, es decir, los valores deben situarse en celdas independientes para luego
poder tomarlas de referencia para los cálculos. Si las ecuaciones originales están
en el formato 3x -8 = -2y, deben cambiarse para despejar el valor
independiente (3x + 2y = 8).
2. Introduce los coeficientes del sistema en una matriz de n x n celdas, donde n
representa el número de ecuaciones.
3. Introduce los valores independientes en otro rango al lado.

4. Utiliza la función matricial MINVERSA () para calcular la matriz inversa de los


coeficientes introducidos. (Recuerda que para introducir la función debes pulsar
Ctrl + Mayús + Intro).

Como la matriz de coeficientes es de 3 x 3 se necesitas 9 celdas para mostrar


los resultados de la matris Inversa para lo cual selecciona con el mouse 9 celdas
debajo de la matriz de coeficientes dejando un renglón libre. Teclea el signo =
para que se activen las funciones de ecuaciones en el margen izquierdo superior
y busca la función matricial MINVERSA () seleccionando la opción Más
funciones en la parte inferior

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________139


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________140


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

En Seleccionar una función busca MINVERSA y da un clic.

Da un clic en Aceptar para que aparezca el cuadro de dialogo Argumentos de


función

Selecciona las celdas de la matriz de coeficientes, en este caso A5:C7

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________141


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Ojo, no pulses Aceptar. La matriz inversa se determinará al pulsar


simultáneamente las teclas Ctrl + Mayús (La flecha hacia arriba) +
Intro (Enter).

Como la matriz de los términos constantes es un vector de 1 x 3 se necesitas 3


celdas para mostrar los resultados de las Incógnitas X, Y y Z para lo cual
selecciona con el mouse 3 celdas debajo de la matriz inversa dejando un
renglón libre. Teclea el signo = para que se activen las funciones de ecuaciones
en el margen izquierdo superior y busca la función matricial MMULT ()
seleccionando la opción Más funciones en la parte inferior

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________142


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________143


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Da un clic en Aceptar para que aparezca el cuadro de dialogo Argumentos de


función

En el campo que dice Matriz 1 selecciona las celdas de la matriz de inversa, en


este caso A9:C11 y en el campo que dice Matriz 2 selecciona las celdas de los
términos constantes, en este caso D5:D7

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________144


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

Ojo, no pulses Aceptar. Los resultados de las incógnitas X, Y, Z se


determinarán al pulsar simultáneamente las teclas Ctrl + Mayús (La flecha
hacia arriba) + Intro (Enter), en este caso 1,2,3. Por lo tanto las
incognitas quedan X=1, Y=2 y Z=3.

Con lo anterior queda terminado el ejemplo ilustrativo de resolución de un


sistema lineal de ecuaciones mediante el método de matriz inversa en
el paquete EXCEL. Aplica el procedimiento para salir de Windows

1.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________145


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

ACTIVIDAD DE APRENDIZAJE EN EXCEL. Resolución de un


1.4.1.2 Sistema Lineal de Ecuaciones mediante el Método de matriz
Inversa.

ACTIVIDAD DE Resolver el siguiente sistema, empleando el método de la MATRIZ


APRENDIZAJE EN INVERSA con Excel:
EXCEL x + y + z = 11
1.4.1.2 2x – y +z = 5
RESOLUCIÓN DE UN 3x + 2y +z= 24
SISTEMA LINEAL DE
ECUACIONES MEDIANTE
EL MÉTODO DE MATRIZ
INVERSA

1.4.1.2 EJERCICIO DE AUTOEVALUACIÓN en Excel. Resolución de un


Sistema Lineal de Ecuaciones mediante el Método de matriz
Inversa.

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra en el cuaderno de trabajo anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________146


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

AUTOEVALUACIÓN Resolver en Excel el siguiente sistema, empleando el método de la MATRIZ


EN EXCEL INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
sea |𝑨|
1.4.1.2
RESOLUCIÓN DE UN x + 2y -3z = 5
SISTEMA LINEAL DE 3x – 22y + 6z =4
ECUACIONES MEDIANTE 7x – 6y – 3z = 15
EL MÉTODO DE MATRIZ
INVERSA

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________147


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

1.4.1.2 EJERCICIOS DE REFUERZO. Resolución de un Sistema Lineal de


Ecuaciones mediante el Método de matriz Inversa.

EJERCICIOS DE 1.4.1.2.1 Resolver el siguiente sistema, empleando el método de la MATRIZ


REFUERZO EN INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
EXCEL sea |𝑨|
1.4.1.2 x + y + 2z =31
RESOLUCIÓN DE UN x + z + 2y = 32
SISTEMA LINEAL DE y + z + 2x = 33
ECUACIONES MEDIANTE
EL MÉTODO DE MATRIZ 1.4.1.2.2 Resolver el siguiente sistema, empleando el método de la MATRIZ
INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
INVERSA EN EXCEL
sea |𝑨|

9x – 2y + 12z =20
6x + 4y - 3z = 3
3x + 2y – 3z = -1

1.4.1.2.3 Resolver el siguiente sistema, empleando el método de la MATRIZ


INVERSA y aplicando la regla de Sarrus para obtener el determinante de A o
sea |𝑨|

2x – y + 3z = 14
2y – z + 3x = 24
2z – x + 3y = 10

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________148


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

AUTOEVALUACIÓN CON REACTIVOS DE


FALSO Ó VERDADERO

______________________________________________________

EN CADA UNO DE LOS REACTIVOS, CONTESTE CON UNA F SI CONSIDERA QUE LA AFIRMACIÓN ES
FALSA Y CON UNA V SI CONSIDERA QUE LA AFIRMACIÓN ES VERDADERA.

1. La supresión de caso(s) y/o variable(s) se usa como tratamiento en caso de datos


ausentes.
( )

2. La prueba de Barlett se utiliza para probar la homocedasticidad de varianzas de una


variable.
( )

3. Si los datos provienen de distribuciones continuas, pero no necesariamente normales, la


mejor prueba para checar la homocedasticidad es la prueba de Levene.
( )

4. En muestras grandes (mayores de 80) las pautas sugieren que el umbral de


estandarizado para identificar los casos atípicos se sitúe entre 1.28 y 1.96.
( )

5. El método de transformación de los datos se usa para tratar los datos ausentes.

( )

6. Para la distribución de variables no normales asimétricas positivas, la transformación mas


común para conseguir normalidad y homocedasticidad es el logaritmo decimal.
( )

7. La prueba de Anderson Darling se utiliza para probar la homocedasticidad de varianzas


de una variable.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________149


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

( )

8. Para evitar un efecto adverso en caso de datos ausentes se usa el método de


impugnación.
( )

9. Para conseguir la linealidad entre dos variables, la transformación que se aplica es el


logaritmo natural.
( )

10. La prueba de Barlett se utiliza para probar la normalidad de una distribución de datos.

( )

11. Si se sustituyen los valores ausentes en una base de datos por un único valor derivado
de fuentes externas, la imputación fue por sustitución de caso.
( )

12. Para distribución de variables no normales planas, la trasformación mas común para
conseguir normalidad y homocedasticidad es la raíz cuadrada.
( )

13. Para conseguir la linealidad entre dos variables, la transformación que se aplica es la
inversa.
( )

14. Si se sustituyen valores ausentes en una base de datos por un único valor derivado de
fuentes externas, la imputación fue por la media.
( )

15. En muestras pequeñas (de 80 incluso menos), las pautas sugeridas identifican como
atípicos aquellos casos con valores estándar entre 1.96 y 2.58.
( )

16. La prueba de Shapiro-Wilks se utiliza para probarla normalidad de una distribución de


datos.
( )

17. Si los datos provienen de distribuciones continuas, pero no necesariamente normales, la


mejor prueba para checar la homocedasticidad es la prueba de Barlett.
( )

18. Si se sustituyen los valores ausentes en una base de datos por un único valor derivado
de fuentes externas, la imputación fue por sustitución por valor constante.
( )

19. En muestras grandes (mayores de 80) para identificar los casos atípicos, las pautas
sugieren que el umbral estandarizado se sitúe entre 3 y 4.
( )

20. Para distribución de variables no normales planas, la transformación mas usual para

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________150


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

conseguir normalidad y homocedasticidades la inversa. ( )

21. En muestras pequeñas (de 80 incluso menos), las pautas sugeridas identifican como
atípicos aquellos casos con valores estándar de 2.58 ó superiores.
( )

22. Si los datos provienen de distribuciones continuas, con distribuciones normales, la mejor
prueba para checarla homocedasticidad es la prueba de Shapiro-Wilks.
( )

23. Para distribución de variables no normales asimétricas negativas, la transformación mas


común para conseguir normalidad y homocedasticidades el logaritmo natural.
( )

24. Para la distribución de variables no normales asimétricas positivas, la transformación mas


usual para conseguir normalidad y homocedasticidad es la inversa.
( )

25. Si los datos provienen de distribuciones continuas, con distribuciones normales, la mejor
prueba para checar la homocedasticidad es la prueba de Barlett.
( )

26. Para distribución de variables no normales asimétricas negativas, la transformación mas


ususal para conseguir normalidad y homocedasticidades la raíz cuadrada.
( )

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________151


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

AUTOEVALUACIÓN CON REACTIVOS DE OPCIÓN


MÚLTIPLE
______________________________________________________

EN CADA UNO DE LOS REACTIVOS SIGUIENTES, SELECCIONE LA OPCIÓN QUE CONSIDERE


CORRECTA.

1.- Los siguientes tratamientos corresponden a datos ausentes excepto:

a) Utilizar sólo aquellas observaciones con datos completos.

b) Supresión de caso(s) y/o variable(s).

c) Método de impugnación

d) Método de transformación de los datos.

2.- Cuando en una base de datos se tiene datos ausentes, la imputación es el proceso de estimación de
variables y/o casos de la muestra. Si se sustituyen los valores ausentes por una variable cuyo valor medio se
calcula sobre todas las respuestas, la imputación fue por:

a) Sustitución de caso.

b) Sustitución por la media.

c) Sustitución por valor constante

d) Imputación por regresión.

3.- Si se sustituyen los valores ausentes en una base de datos por un único valor derivado de fuentes
externas, la imputación fue por:

a) Sustitución de caso.

b) Sustitución por la media.

c) Sustitución por valor constante

d) Imputación por regresión.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________152


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

4.- Si se predicen valores ausentes de una variable basándose en su relación con las otras variables del
conjunto de datos, la imputación fue:

a) Sustitución de caso.

b) Sustitución por la media.

c) Sustitución por valor constante

d) Imputación por regresión.

5.- Pueden identificarse los casos atípicos desde un enfoque univariado seleccionando como casos atípicos
aquellos casos que caigan fuera de los rangos de la distribución. En muestras pequeñas (de 80 incluso
menos) las pautas sugeridas identifican como atípicos aquellos casos con valores estándar de:

a) 1.96

b) 2.58 ó superiores

c) entre 1.96 y 2,58

d) entre 3 y 4

6.- Pueden identificarse los casos atípicos desde un enfoque univariado seleccionando como casos atípicos
aquellos casos que caigan fuera de los rangos de la distribución. En muestras grandes (mayores de 80) las
pautas sugieren que el umbral de estandarizado se sitúe entre:

a) entre 1.28 y 1.96

b) entre 2.58 y 3

c) entre 1.96 y 2,58

d) entre 3 y 4

7.- Las siguientes pruebas sirven para probar la normalidad de una distribución de datos excepto:

a) Shapiro-Wilks

b) Kolmogorov-Smirnov

c) Anderson Darling

d) Barlett

8.- Las siguientes pruebas sirven para probar la homocedasticidad de varianzas de una variable para
diferentes grupos excepto:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________153


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

a) Barlett

b) Prueba F

c) Levene

d) Anderson Darling

9.- Si los datos provienen de distribuciones continuas, pero no necesariamente distribuciones normales, la
mejor prueba para checar la homocedasticidad es:

a) Levene

b) Barlett

c) Shapiro-Wilks

d) Anderson Darling

10.- Si los datos provienen de distribuciones continuas, con distribuciones normales, la mejor prueba para
checar la homocedasticidad es:

a) Levene

b) Barlett

c) Shapiro-Wilks

d) Anderson Darling

11.- Para las distribuciones de variables no normales planas, la transformación más común para conseguir
normalidad y homocedasticidad es:

a) La inversa

b) La raíz cuadrada

c) El logaritmo decimal

d) El logaritmo natural

12.- Para las distribuciones de variables no normales asimétricas negativas, la transformación más común
para conseguir normalidad y homocedasticidad es:

a) La inversa

b) La raíz cuadrada

c) El logaritmo decimal

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________154


_Cuaderno de trabajo: Análisis Multivariado.C1. INTRODUCIÓN AL ANÁLISIS MULTIVARIANTE

d) El logaritmo natural

13.- Para las distribuciones de variables no normales asimétricas positivas, la transformación más común para
conseguir normalidad y homocedasticidad es:

a) La inversa

b) La raíz cuadrada

c) El logaritmo decimal

d) El logaritmo natural

14.- Las siguientes transformaciones se aplican para conseguir la linealidad entre dos variables excepto:

a) La inversa

b) La raíz cuadrada

c) El logaritmo decimal

d) El logaritmo natural

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________155


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

CAPÍTULO 2. MÉTODOS DE REDUCCIÓN

OBJETIVO 2.1 El alumno aplicará la técnica de componentes


principales (Factor Análisis ó Análisis Factorial ó de Factores)
para identificar un conjunto de dimensiones o características
latentes dentro de un conjunto grande de variables (factores)

ANTECEDENTES CONCEPTOS DE:

Factor. Carga de Factor. Eigenvalor. Porcentaje de Variación Explicada.


Comunalidad. Variación Total. Variación Común. Variación Específica. Variación
Aleatoria.

FACTOR, CARGA DE FACTOR, PORCENTAJE DE


2.1.1
VARIACIÓN EXPLICADA, COMUNALIDAD.

CONCEPTOS BÁSICOS El análisis por factores (FA: factor analysis) es una técnica que se emplea
ANALISIS DE frecuentemente para crear nuevas variables que resumen toda la información de
la que podría disponerse en las variables originales. Por ejemplo, considere una
FACTORES vez más la realización de exámenes de lectura, ortografía y ciencias a estudiantes
del tercer año de primaria, en los que cada uno de los estudiantes puede obtener
calificaciones altas, regulares o bajas en las cuatro áreas. Se esto ocurre en
realidad, entonces se podría decir que estos resultados se están explicando por
alguna característica o factor subyacente que es común a las cuatro pruebas. En
este ejemplo, podría resultar razonable suponer que unan característica
subyacente de ese tipo es la “inteligencia global”.

El análisis por factores también se usa para estudiar las relaciones que podrían

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________156


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

existir entre las variables medidas en un conjunto de datos. Semejante al PCA, el


FA es una técnica dirigida por las variables. Un objeto básico del FA es
determinar si las variables respuesta exhiben patrones de relaciones entre sí,
tales que esas variables se pueden dividir en subconjuntos de modo que las
variables en un subconjunto estén fuertemente relacionadas una con cada una
de las otras y que las variables en subconjuntos diferentes que tengan bajas
Análisis de la estructura de
correlaciones entre sí. Por lo tanto, el FA se usa con frecuencia para estudiar la
datos
estructura de correlación de las variables en un conjunto de datos. Una
semejanza entre el FA y el PCA es que aquél también se puede usar para crear
Existen dos procedimientos
para analizar la estructura de
nuevas variables que no estén correlacionadas entre sí. Esas variables se llaman
covarianza de los datos: clasificación de factores.

· Componentes principales Una ventaja que parece tener el FA sobre el PCA, cuando se están creando
ayuda a comprender la nuevas variables es que, generalmente, las nuevas variables creadas por el FA
estructura de covarianza en son mucho más fáciles de interpretar que las creadas por el PCA. Si un
las variables originales y/o a investigador desea crear un conjunto más pequeño de nuevas variables que se
crear un número menor de pueden interpretar y que resuman la mayoría de la información existente en las
variables utilizando esta variables medidas, entonces el FA debe considerarse seriamente.
estructura.
Se considere una técnica estructural cuyo objetivo básico es el de resumir
· Análisis factorial, como los información donde sus variables son cuantitativas ò métricas y la mayoría de ellas
componentes principales, deben estar medidas en escala de intervalo ò de razón.
resume la estructura de
covarianza de datos en un
Esta técnica analiza las relaciones entre un gran número de variables y trata de
número más pequeño de
dimensiones. El énfasis en el explicarlas por medio de un concepto (atributos, características o dimensiones)
análisis factorial es la que las agrupe. Es decir, condensa la información de las variables originales
identificación de los "factores" mediante características comunes a dichas variables y que las representan
subyacentes que podrían lógicamente. Los factores obtenidos pueden utilizarse como variables en análisis
explicar las dimensiones posteriores, facilitando el manejo de la información ya condensada.
asociadas con una gran
variabilidad en los datos. El análisis de factores no es una técnica exacta, sino a base de prueba y error y
teniendo guías (criterios) que nos llevan hacia donde esta la respuesta.

OBJETIVOS ESPECÌFICOS DEL ANALISIS DE FACTORES


Utilice un análisis factorial , al
igual que el análisis de 1. Identificar un conjunto de dimensiones o características que se
componentes principales, a fin encuentran latentes (las cuales no se detectan fácilmente) dentro de
de resumir la estructura de un conjunto grande de variables. Cuando se está interesado en este
covarianzas de los datos en objetivo se le llama análisis de factores R.
algunas dimensiones de los 2. Encontrar características que describan a núcleos poblacionales
datos. Sin embargo, el énfasis
(personas). Si se persigue este objetivo se llama análisis de factores
en el análisis factorial es la
identificación de los "factores"
Q. Es decir, a partir de variables se encontrarán conceptos que
subyacentes que pudieran describan a personas; la diferencia con el análisis de factores anterior
explicar las dimensiones o R es que éste describe al mercado, no a las variables.
asociadas con una variabilidad 3. Utilizar a las nuevas variables generadas por la técnica para realizar
grande de los datos. estudios ò análisis posteriores como podrían ser entre otros la
regresión, el discriminante, etc.
4. Crear datos para las nuevas variables encontradas, a partir de la
información original.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________157


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

TERMINOS IMPORTANTES EN EL ANÀLISIS DE FACTORES

Factor

Desde el punto de vista matemático un factor es una combinación lineal de


variables originales de la investigación y está representado por la siguiente
ecuación:

Fij = Ai1X1j + Ai2X2j + Ai3X3j +…+ AikXkj

Donde:

i: número de factor
j: número de individuo o encuesta
k: número de variable

En esta ecuación las A representan la importancia que tiene cada variable, con
respecto a la característica obtenida.

Asimismo es importante tener presente que las variables usadas en la técnica


deben estar estandarizadas de tal manera que en términos de unidades puedan
ser comparables, es decir su media es cero y su varianza igual a uno.

Carga de factor

Este término es el que se la da a la relación que llegan a tener cada una de las
variables con cada uno de los factores. Es una medida de correlación entre una
variable y un factor.

Eigenvalor

Se usa este término para denominar a la variación que cada uno de los factores
logra explicar del conjunto de variables.

Para calcular el Eigenvalor, cada carga se eleva al cuadrado y se suma para cada
factor.

Porcentaje de variación explicada

Representa la relación entre la variación explicada por el factor, con respecto a la


variación máxima, la cual es igual al numero de variables, ya que cada una de
ellas tiene una variación de uno por estar estandarizadas; por lo tanto, la mayor
variación que se puede llegar a explicar sería la suma de las variaciones de cada
variable.

A mayor porcentaje de varianza explicada quiere decir que el factor está


explicando mejor a la variable.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________158


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Comunalidad

Se usa este término para nombrar a la variación explicada por la solución de


factores para cada variable y por estar estandarizadas, el valor máximo posible
de la comunalidad es de 1. Mientras más se aproxime el valor de la comunalidad
a 1 quiere decir que se explico mejor la variable.

El valor de la comunalidad total se obtiene elevando al cuadrado cada carga y


sumándolo por cada variable.

PASOS PARA LLEVAR A CABO UN ANÁLISIS DE FACTORES

1. Identificar el problema
El objetivo del análisis factorial 2. Generar la matriz de correlación
es hallar un número pequeño 3. Seleccionar el modelo de factores que mejor convenga; puede ser de
de factores, o de variables no componentes principales o factor común.
observables, que explique la 4. Seleccionar un criterio para determinar qué características deberán
mayor parte de la variabilidad presentarse en los factores, ortogonal u oblicuo.
de datos y aun así tenga 5. Obtener una matriz de factores no rotada
sentido contextual. Es 6. Obtener una matriz de factores rotada.
deseable que se decida 7. Obtener los puntajes de los factores encontrados (opcional).
cuántos factores desea utilizar
y hallar las cargas que tengan
más sentido para sus datos.
Identificar el problema

Se debe establecer claramente cuál es el problema que se tratará en la


investigación y la información que se pretende resumir agrupando las variables
en factores, para lo cual se debe considerar lo siguiente:

- La técnica no acepta variables medidas en escala nominal, es decir


deben ser métricas, aunque permite el uso de variables dummy en
menor número que las de intervalo ò razón.
- La técnica de factores no debe usarse para los casos en los que el
número de entrevistas sea menor a 50 aunque se sugiere que sean
más de 100 entrevistas. En general se considera que el tamaño de la
muestra debe ser cuatro o cinco veces el número de variables que
se pretenda agrupar con la técnica.

Generar la matriz de correlación

Proporciona las medidas de relación de las variables de interés, comparándolas


por parejas y sirve en el análisis de factores cuando las variables se identifican
con más de un factor o característica y se tiene que decidir con que factor se
relaciona la variable.

Seleccionar el modelo de factores

En el análisis de factores se busca agrupar variables, buscando aspectos


comunes entre ellas. La dispersión o variación de los datos indica posibles
similitudes entre las variables; esta técnica usa la variación o varianza para medir
la dispersión de la información, tomando como base el siguiente modelo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________159


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Variación total= Variación comùn+Variación especifica + variación Aleatoria

Donde:

-Variación total: indica la variación o dispersión de cada variable.


-Variación común: representa la variación que hace parecidas a las variables, lo
que las une.
-Variación especifica: lo que hace diferentes a las variables.
-Variación aleatoria: es el error, presente en todo modelo y como no se puede
cuantificar, no se toma en cuenta.

En general la mayoría de los paquetes estadísticos computacionales usan dos


tipos de modelos para identificar qué tanto se relacionan las variables con el
factor:
1. Componentes principales. En este modelo se asume que la variación
específica es tan pequeña que pudiéramos considerarla como cero y
por lo tanto la variación total se considera igual a la variación común.
Los paquetes computacionales si no se les especifica algún otro
manejan este modelo.
2. Factor común. Asume que la variación específica es importante y que
por lo tanto se deberá eliminar del modelo de variación y con el resto
intentar agrupar las variables.
3.
Seleccionar el criterio para encontrar factores
Número de factores
Los factores pueden tener o no relación entre si. La decisión de obtener factores
La selección del número de independientes o dependientes se hará seleccionando alguno de los criterios
factores se basa con
siguientes:
frecuencia en la proporción de
1. Ortogonal . Va a extraer características que sean independientes, es
varianza explicada por los
factores, el conocimiento del decir, que tienen una relación igual a cero.
tema y la sensatez de la 2. Oblicuo. Extrae factores con cierto grado de relación entre ellos.
solución. Inicialmente, se trata
de utilizar el método de Obtener la matriz de factores no rotada
extracción de los
componentes principales Esta matriz nos proporciona información en relación a que tanto se identifica
especificando el número de cada variable con cada factor; estas medidas se llaman cargas de factores. Como
componentes igual al número
en esta matriz casi todas las cargas resultan significativas por eso no se agrupan
de variables. Se examina la
a las variables en este paso, solamente se determina el número de factores en
proporción de la variabilidad
explicada por diferentes los que quedarán agrupadas las variables de manera tentativa.
factores y se reduce su
selección a cuántos factores Para determinar el número de factores como solución inicial, la mayor parte de
se utilizarán. Una gráfica de los paquetes computacionales utilizan el criterio denominado de la raíz latente.
sedimentación puede ser útil Mediante este criterio, se considera que un factor debe ser retenido en la
aquí para evaluar visualmente solución si su Eigenvalue es mayor a 1. Si lo que queda por explicar es una
la importancia de los factores. cantidad menor a 1, no tendrá caso agregar un factor mas a la solución.
Una vez que se haya reducido
esta selección, se examina los
Asimismo se usa normalmente el criterio del porcentaje de variación explicada
ajustes de los diferentes
análisis factorial. Los valores acumulada que establece que se deben considerar n factores como solución
de comunalidad y la inicial, si el porcentaje de variación explicada acumulada se encuentra en un
proporción de la variabilidad rango de 60% a 95%. Es decir, con este criterio se está dispuesto a perder

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________160


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

de cada variable explicada por cuando mucho 40% y cuando menos 5% de información.
los factores que pueden ser
de especial utilidad para Cabe señalar que cada factor que se agrega a la solución en la matriz no rotada
comparar los ajustes. Se
explica en una cantidad menor al conjunto de variables, puesto que cada uno
puede decidir agregar un
factor si contribuye al ajuste
que se agrega tiene menor variación por explicar.
de ciertas variables. Se puede
tratar también con el método Es en este paso donde se señala en forma inicial o tentativa el número de
de extracción de máxima factores en que quedaràn agrupadas las variables pero no se agrupan ni
verosimilitud. concluyen las características que se obtienen.

Rotación Obtener la matriz de factores rotada

Una vez que se haya Esta matriz permite definir no solo el número de factores sino la agrupación de
seleccionado el número de las variables en dichos factores, procurando obtener así una solución final lógica.
factores, probablemente usted
se querrá probar con Mediante este proceso se ajustan los ejes coordenados o ejes factor en la
diferentes rotaciones. Johnson dirección en que giran las manecillas del reloj con el fin de obtener una solución
y Wichern sugieren la rotación mas sencilla y con mayor significado teórico, es decir, hacer que una de las
varimax. Un resultado similar
cargas de la variable sea lo mas alta posible para que se identifique
de diferentes métodos puede
dar crédito a la solución que perfectamente con un solo factor, mientras que sus demás cargas sean bajas de
se escogió. En este punto se manera que su relación con otros factores se pierda.
pudiera interpretar los
factores utilizando su En el proceso de rotar los factores se redistribuyen las cargas cambiando el valor
conocimiento de los datos. de los Eigenvalue para cada factor sin que la variación explicada total y las
comunalidades cambien, a menos que se eliminen o agreguen factores por lo que
al rotar no se explica más o se pierde información solo se redistribuyen las
cargas.

Al rotar los factores se trata de que las variables queden en un solo eje y que se
agrupen las variables bajo una sola característica, lo que daría la mejor solución.
Como este proceso es complejo para llevarlo a cabo manualmente se han creado
paquetes computacionales que realizan rápidamente la rotación de factores, sin
embargo hay que especificarles el criterio que deberá usar para realizar la
rotación de factores y que en general es el criterio Varimax, mediante el cual se
trata de identificar a un grupo de variables con un solo factor, es decir, simplifica
por columna, buscando la máxima simplificación al generar tantos unos y ceros
como sea posible en la matriz.

Una vez generada la matriz rotada, será necesario identificar en ella las cargas
significativas que indiquen con qué factor se han identificado cada una de las
variables, lo cual depende del tamaño de la muestra y el nivel de significancia
manejado en la investigación, por lo que es necesario conocer el tamaño de la
muestra ya que a medida que la muestra es mas grande existe mayor
credibilidad o confianza en la información y se puede por lo tanto fijar limites
cada vez menores en la carga del factor para considerarla significativa.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________161


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Criterios para identificar cargas significativas

1.Cuando n está entre 50 y 100:

a) Carga altamente significativa es la de ± 0.5 para arriba ( prioridad 1).


b) Carga sólo significativa es entre ± 0.4 a ± 0.5 (prioridad 2).
c) Carga sòlo significativa es entre ± 0.3 a ± 0.4 ( prioridad 3).
d) Si es menor a 0.3 se considera que no existen cargas significativas
(prioridad 4).

2.Cuando n está entre 100 y 200:

a) Para un alfa igual a 5%, una carga significativa es aquella de ±


0.19 en adelante, habiendo aplicado primero las prioridades a,b,c y d
del apartado anterior. Con una carga menor de 0.19 ya no se
considera significativa.
b) Para un alfa igual a 1 % una carga es significativa de ± 0.26 en
adelante habiendo aplicado las prioridades del apartado anterior.

3. Cuando n está entre 200 y 300:

a) Para un alfa igual a 5%, una carga significativa es aquella de ±


0.14 en adelante, habiendo aplicado primero las prioridades a,b,c y d
del apartado anterior.
b) Para un alfa igual a 1 % una carga es significativa de ± 0.18 en
adelante habiendo aplicado las prioridades del apartado anterior.

4. Cuando n es mayor o igual a 300:

a) Para un alfa igual a 5%, una carga significativa es aquella de ±


0.11 en adelante, habiendo aplicado primero las prioridades a,b,c y d
del apartado anterior.
b) Para un alfa igual a 1 % una carga es significativa de ± 0.15 en
adelante habiendo aplicado las prioridades del apartado anterior.

Cabe mencionar que a estos criterios se les puede dar continuidad, es decir, si no
se cumple el criterio de la prioridad uno, se pasarà al criterio de la prioridad dos,
y así sucesivamente, considerando el tamaño de la muestra y el nivel de
significancia especificado en la investigación.

Por otro lado, si existe alguna variable que no tenga carga significativa, es decir,
que no se haya identificado con ningún factor, puede deberse a que esa variable
tenga una variación específica muy alta y es muy particular por lo que en ese
caso existen dos posibles acciones:

- Se deja la solución tal cual, sin agrupar a esa variable y así se realiza
el análisis.
- Se elimina la variable del banco de datos y se vuelve a correr de
nuevo la solución.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________162


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Por último hay que considerar que la solución inicial no necesariamente es la


mejor. Hay que analizar si las variables que quedan bajo cada factor se pueden
agrupar lógicamente bajo una característica común ya que si no, no sería la
mejor solución y se tendrían que probar otras soluciones con mas ò menos
factores hasta que las variables queden agrupadas de manera lógica.

2.1.1.1 EJEMPLO ILUSTRATIVO

EJEMPLO El Director de mercadotecnia de una compañía de Bienes Raíces desea conocer


ILUSTRATIVO cuales dimensiones o indicadores básicos influyen al momento de pronosticar el
valor de una casa o vivienda unifamiliar al momento en que un potencial cliente
2.1.1.1 desea ya sea comprar o vender su casa con el objeto de brindar un servicio
FACTOR ANÁLISIS confiable y rápido. Para llevar a cabo la investigación dividió la Ciudad en tres
grandes zonas: NORTE, SUR Y ESTE. En cada zona se aplicó una encuesta a 20
propietarios de casas unifamiliares. El cuestionario estaba conformado por 20
variables que se consideraba podían formar parte de dichos indicadores X1=
Tamaño del lote y X2= Número de recámaras, , X3= Número de baños, X4=
Número de habitaciones y X5= Antigüedad de la casa, X6= Impuestos anuales,
X7= Tipo de estacionamiento interior, X8= Estilo arquitectónico, X9= Tipo de
combustible para la calefacción, X10= Tipo de sistema para la calefaccción, X11=
Tipo de alberca, X12= Cocina con antecomedor y X13= Aire acondicionado, X14=
Chimenea, X15= Drenaje municipal X16= Sótano, X17= Cocina integral, X18= Tina
de hidromasaje.
Los resultados en la zona NORTE fueron los siguientes:

Casa X1 X2 X3 X4 X5 X6 X7 X8 X9
No.
1 6.00 3 1.0 6 45 1600 0 1 2
2 7.00 3 1.5 10 28 3500 1 5 1
3 7.00 4 2.0 6 35 3600 0 4 2
4 7.00 3 2.0 7 35 4100 1 3 1
5 6.00 3 2.0 9 32 4400 2 5 2
6 7.75 4 2.5 8 22 3000 1 4 2
7 6.00 2 1.0 6 38 2400 1 1 2
8 10.32 3 2.5 6 26 5400 2 5 2
9 7.20 4 2.0 7 30 3600 1 1 2
10 9.41 3 1.5 8 24 2900 1 4 1
11 6.00 3 1.0 7 31 2900 1 5 1
12 7.50 4 2.0 8 35 3100 1 1 2
13 10.50 4 2.5 9 29 5000 2 5 2
14 6.00 3 2.5 6 30 4058 2 5 2
15 6.00 3 1.0 7 35 2752 1 4 2
16 7.20 4 1.0 7 30 2900 1 1 2
17 7.20 3 1.0 8 40 1900 0 4 2
18 6.00 5 2.5 6 32 4000 1 5 2
19 10.00 3 2.0 7 38 3512 2 1 2
20 10.80 4 1.0 8 36 3100 0 1 2

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________163


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Casa X10 X11 X12 X13 X14 X15 X16 X17 X18
No.
1 2 1 1 0 0 1 1 1 1
2 1 1 1 0 0 1 1 1 1
3 2 1 1 0 0 1 1 1 1
4 2 1 1 0 0 1 0 0 0
5 2 1 1 1 1 1 1 1 1
6 2 1 1 0 0 1 1 1 1
7 2 1 1 0 0 1 1 1 1
8 2 1 1 0 0 1 1 0 0
9 2 1 1 0 0 1 1 0 0
10 1 1 1 0 0 0 1 1 1
11 1 1 1 0 0 1 1 1 0
12 1 1 1 0 0 1 1 0 0
13 2 1 1 0 1 1 1 0 0
14 2 1 1 0 0 1 1 1 1
15 2 1 1 0 0 1 0 1 1
16 2 1 0 0 0 1 1 0 0
17 3 1 1 0 0 1 0 0 0
18 2 3 1 0 0 1 1 1 1
19 3 2 1 0 1 1 1 1 1
20 2 1 1 0 1 1 0 1 1

a) ¿Cuántas dimensiones o indicadores esperaría tener como solución inicial


en esta investigación?. Explique su respuesta tomando en cuenta los
criterios para analizar el número de factores en la solución inicial.
b) Teniendo como supuesto que la solución inicial es correcta, ¿Qué
variables se identifican más con cada factor?. Explique su respuesta
tomando en cuenta los criterios para identificar cargas significativas y sus
prioridades.
c) Según la información de la matriz rotada, ¿con cuál de los factores se
identificó mejor el conjunto de 18 variables?. Justifique.
d) ¿Cuál de las variables ha sido mejor explicada en esta investigación por la
solución de factores?. Justifique.

Respuesta al inciso a.

Se supone que ya se realizaron todos los pasos necesarios hasta antes de


generar la matriz de correlación, la cual es la siguiente:
Número de factores X1 X2 X3 X4 X5 X6 X7 X8 X9
X1 1.000
La selección del número de X2 0.164 1.000
factores se basa con X3 0.220 0.401 1.000
frecuencia en la proporción de X4 0.267 0.040 -0.025 1.000
varianza explicada por los X5 -0.260 -0.242 -0.497 -0.308 1.000
X6 0.371 0.230 0.777 0.091 -0.514 1.000
factores, el conocimiento del
X7 0.194 -0.158 0.593 0.111 -0.462 0.713 1.000
tema y la sensatez de la
X8 -0.107 0.000 0.403 0.215 -0.505 0.481 0.335 1.000
solución. Inicialmente, se trata X9 0.058 0.302 0.187 -0.306 0.281 0.022 0.037 -0.289 1.000
de utilizar el método de
extracción de los X10 X11 X12 X13 X14 X15 X16 X17 X18
componentes principales X10 1.000
especificando el número de X11 0.253 1.000
componentes igual al número X12 -0.043 0.072 1.000
de variables. Se examina la X13 0.043 -0.772 0.053 1.000
proporción de la variabilidad X14 0.325 0.105 0.115 0.459 1.000
explicada por diferentes X15 0.383 0.072 -0.053 0.053 0.115 1.000

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________164


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

factores y se reduce su X16 -0.325 0.157 -0.115 0.115 -0.062 -0.115 1.000
selección a cuántos factores X17 -0.136 0.231 0.313 0.168 0.105 -0.168 0.157 1.000
se utilizarán. Una gráfica de X18 0.038 0.257 0.281 0.187 0.153 -0.187 0.102 0.899 1.000
sedimentación puede ser útil
aquí para evaluar visualmente A partir de la matriz de correlación, se puede identificar que las variables con
la importancia de los factores. mayor relación son la 8 con la 18 es decir X8= Estilo arquitectónico y X18= Tina
Una vez que se haya reducido de hidromasaje, con una correlación de 0.899, mientras las que tienen menor
esta selección, se examina los
relación son la 2 con la 8 o sea X2= Número de recámaras con X8= Estilo
ajustes de los diferentes
arquitectónico, con una correlación de 0.000. Sin embargo, a partir de la matriz
análisis factorial. Los valores
de comunalidad y la de correlación, es muy difícil encontrar a las variables afines que se puedan
proporción de la variabilidad agrupar en factores y resumir así la información. Se necesita verificar entonces la
de cada variable explicada por matriz de factores no rotada que proporcione mayor información por lo que se
los factores que pueden ser corrió un análisis de factores y se obtuvo la siguiente matriz:
de especial utilidad para
comparar los ajustes. Se Cargas de factores no rotados :
puede decidir agregar un
factor si contribuye al ajuste Variable Factor Factor Factor Factor Factor Factor Factor Factor Factor
de ciertas variables. Se puede 1 2 3 4 5 6 7 8 9
tratar también con el método X1 0.385 -0.210 0.258 -0.405 -0.645 -0.102 0.304 -0.053 -0.065
de extracción de máxima X2 0.275 -0.368 0.154 0.392 -0.463 0.140 - -0.089 -0.033
verosimilitud. 0.582
X3 0.821 -0.247 -0.091 0.303 0.008 -0.194 0.023 -0.175 -0.063
X4 0.314 0.301 0.127 -0.639 -0.132 0.157 - -0.084 0.055
0.436
X5 -0.727 -0.398 -0.240 -0.176 0.125 -0.122 0.029 -0.079 0.326
X6 0.891 -0.199 0.056 -0.007 0.122 -0.162 0.042 0.028 0.037
X7 0.779 -0.087 -0.087 -0.072 0.297 0.112 0.374 0.154 0.136
X8 0.569 0.360 -0.174 0.082 0.259 -0.368 - 0.233 -0.224
0.282
X9 -0.050 -0.794 -0.217 0.081 0.029 0.216 0.037 -0.215 -0.368
X10 -0.160 -0.772 -0.216 -0.166 0.040 -0.185 0.156 0.304 -0.215
X11 0.175 -0.331 -0.422 0.462 -0.312 -0.086 - 0.360 0.416
0.152
X12 0.138 0.173 -0.453 -0.140 -0.027 -0.676 0.033 -0.444 0.119
X13 0.304 0.004 -0.407 -0.438 0.437 0.358 - 0.073 0.002
0.238
X14 0.341 -0.383 -0.317 -0.685 -0.245 0.167 - -0.002 0.169
0.013
X15 -0.095 -0.629 -0.043 0.043 0.466 -0.069 - -0.226 0.090
0.297
X16 0.430 0.137 -0.135 0.440 0.062 0.538 0.267 -0.294 0.164
X17 -0.139 0.383 -0.846 0.079 -0.159 0.092 - 0.002 -0.063
0.001
X18 -0.108 0.212 -0.868 0.041 -0.248 0.112 0.034 -0.007 -0.217
Eigenvalue 3.7604 2.7844 2.4448 1.9917 1.4936 1.2985 1.111 0.7414 0.6717
% Var 0.209 0.155 0.136 0.111 0.083 0.072 0.062 0.041 0.037

Variable Factor Factor Factor Factor Factor Factor Factor Factor Factor
10 11 12 13 14 15 16 17 18
X1 0.090 0.047 0.130 -0.015 -0.003 0.122 -0.083 0.021 0.003
X2 -0.075 0.103 0.005 0.012 -0.034 -0.100 0.016 0.040 0.007
X3 -0.123 -0.052 -0.167 -0.161 0.054 -0.087 -0.090 -0.026 -0.008
X4 0.067 -0.348 -0.093 -0.004 0.092 0.033 0.019 0.006 -0.012
X5 -0.108 0.050 0.118 -0.020 0.214 -0.067 -0.037 0.024 -0.006
X6 0.072 0.288 -0.011 -0.057 0.106 0.081 0.097 0.007 -0.014
X7 0.114 -0.090 -0.147 0.195 -0.002 -0.092 -0.017 0.037 0.006
X8 0.055 -0.071 0.324 0.055 0.073 -0.034 -0.026 -0.003 0.007
X9 -0.106 -0.067 0.048 0.247 0.050 0.042 0.008 -0.015 -0.010

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________165


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

X10 -0.060 -0.229 0.023 -0.200 -0.074 -0.025 0.048 0.021 -0.002
X11 -0.55 -0.119 -0.016 0.083 -0.015 0.117 -0.009 -0.019 -0.002
X12 -0.181 -0.073 -0.006 0.068 -0.100 0.022 0.041 0.011 0.005
X13 -0.356 0.150 -0.004 -0.047 -0.077 0.097 -0.049 0.012 0.003
X14 0.085 0.099 0.104 0.005 -0.047 -0.138 0.031 -0.041 0.008
X15 0.458 -0.005 -0.013 -0.049 -0.056 0.075 -0.033 0.001 0.008
X16 -0.022 -0.181 0.240 -0.121 0.003 0.021 0.032 0.005 0.003
X17 0.227 0.083 0.041 -0.002 -0.098 -0.049 -0.029 0.016 -0.027
X18 0.106 0.026 -0.16 -0.059 0.151 0.046 0.019 0.003 0.022
Eigenvalue 0.5236 0.3840 0.2932 0.2063 0.1371 0.1101 0.0382 0.0080 0.0020
% Var 0.0290 0.021 0.016 0.011 0.008 0.006 0.002 0.000 0.000

Esta matriz no rotada muestra las cargas de factor que, como ya se mencionó,
indican la relación de cada variable con cada factor .
Aquí la mejor solución en cuanto al número de factores sería un factor que
agrupara a las diez y ocho variables. Todas tendrían algo en común entre sí,
mientras que la peor solución serían diez y ocho factores, lo cual representaría
que las variables no tuvieron nada en común y no se podría resumir nada la
información.
Tanto por el criterio de la raíz latente como por el porcentaje de variación
explicada acumulada, se tiene como solución inicial siete factores, ya que el
Eigenvalue de los siete primeros es mayor a 1 y el porcentaje de variación
explicada acumulada está entre 60 % y 95%, es de 82.70%
En este problema de diez y ocho variables la varianza ó variación máxima que se
podría obtener, se tiene que F1 explica 3.7604, el F2 explica 2.7844, el F3 explica
2.4448, el F4 explica 1.9917, el F5 explica 1.4936, el F6 explica 1.2985 y el F7
explica 1.1111 de acuerdo con su Eigenvalue. El total de la variación es de
13.862 (total de los Eigenvalue de los 7 factores y se pierde 4.138 ( 18 – 13.862)
de información.

Respuesta al inciso b.
Rotación
Una vez se ha determinado el número de factores para la solución inicial se trata
Una vez que se haya
de agrupar a las variables en esos siete factores, lo cual se determina analizando
seleccionado el número de
la matriz de factores rotada, que es la siguiente:
factores, probablemente usted
se querrá probar con
diferentes rotaciones. Johnson Cargas de factores rotados y comunalidades
y Wichern sugieren la rotación
varimax. Un resultado similar
de diferentes métodos puede Variable Factor Factor Factor Factor Factor Factor Factor Comunalidad
dar crédito a la solución que 1 2 3 4 5 6 7
se escogió. En este punto se X1 0.117 0.020 0.174 0.057 - -0.087 -0.053 0.943
pudiera interpretar los 0.931
X2 0.078 -0.036 0.129 0.026 -0.063 - 0.144 0.962
factores utilizando su
0.955
conocimiento de los datos. X3 0.853 -0.072 0.019 -0.077 -0.062 -0.338 -0.130 0.874
X4 -0.034 0.385 0.134 0.783 -0.219 -0.066 -0.113 0.846
X5 - - -0.095 -0.077 0.107 0.197 -0.130 0.807
0.583 0.620
X6 0.865 -0.026 0.204 0.160 -0.146 -0.140 -0.145 0.879
X7 0.865 -0.055 0.010 0.159 -0.108 0.246 0.132 0.867
X8 0.532 0.354 -0.065 0.180 0.305 -0.089 -0.477 0.772
X9 0.072 - -0.046 -0.005 -0.038 -0.215 0.259 0.735
0.783
X10 -0.024 - 0.023 -0.53 -0.179 0.016 -0.136 0.756
0.837

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________166


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

X11 0.214 -0.267 -0.394 -0.232 -0.001 - -0.066 0.659


0.573
X12 0.169 0.014 -0.332 -0.045 -0.058 0.121 - 0.733
0.758
X13 0.262 -0.152 -0.214 0.765 0.248 0.188 0.080 0.825
X14 0.167 -0.381 -0.175 0.641 - -0.013 -0.042 0.920
0.551
X15 0.035 - 0.268 0.124 0.408 -0.141 -0.071 0.719
0.662
X16 0.526 0.190 -0.285 -0.115 0.110 -0.039 0.599 0.779
X17 -0.103 0.114 - 0.060 0.127 0.041 -0.096 0.922
0.932
X18 -0.079 -0.029 - 0.069 -0.000 -0.019 -0.067 0.886
0.933
Eigenvalue 3.3582 2.7105 2.3551 1.8038 1.6571 1.6134 1.3862 14.8844
% Var 0.187 0.151 0.131 0.100 0.092 0.090 0.077 0.827

Ni el Eigenvalue ni la comunalidad total, ni el porcentaje de variación explicada


total cambian al rotar los factores, es decir, no cambian de la matriz no rotada a
la rotada, solo se distribuyeron las cargas de factor y ahora sí algunas
cargas tienen valores más grandes que en la no rotada como para poder
determinar la forma como se agrupan las variables en cada factor.
Lo que si cambia es la importancia en que cada factor explica a las variables
(Eigenvalue de cada factor) y en la matriz rotada es posible que cada factor
hacia la derecha explique menos a las variables.
Para determinar en cual factor se agrupara cada variable debe analizarse la
matriz rotada, buscando las cargas significativas. Al identificar las cargas
significativas, no importa el signo que tengan, sino la magnitud de la relación, el
signo negativo solo expresa una relación inversa. En principio se buscan cargas
mayores a 0.50 utilizando la Prioridad 1, en caso de que una variable no tuviera
una carga mayor a 0.5 se aplicarían las prioridades 2, 3 o 4, según sea el caso,
de los criterios de cargas significativas en toda la matriz rotada. En este ejemplo
se tiene:

X1= Tamaño del lote se identifica con el F5 con una carga de 0.931
X2= Número de recámaras se identifica con el F6 con una carga de 0.955
X3= Número de baños se identifica con el F1 con una carga de 0.853
X4= Número de habitaciones se identifica con el F4 con una carga de 0.783
X5= Antigüedad de la casa se identifica con el F1 y el F2 con unas cargas de
0.583 y 0.620
X6= Impuestos anuales se identifica con el F1 con una carga de 0.865
X7= Tipo de estacionamiento interior se identifica con el F1 con una carga de
0.865
X8= Estilo arquitectónico se identifica con el F1 con una carga de 0.532
X9= Tipo de combustible para la calefacción se identifica con el F2 con una carga
de 0.783
X10= Tipo de sistema para la calefacción se identifica con el F2 con una carga de
0.837
X11= Tipo de alberca se identifica con el F6 con una carga de 0.573
X12= Cocina con antecomedor se identifica con el F7 con una carga de 0.758
X13= Aire acondicionado se identifica con el F4 con una carga de 0.765
X14= Chimenea se identifica con el F4 y el F5 con unas cargas de 0.641 y
0.551
X15= Drenaje municipal se identifica con el F2 con una carga de 0.662

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________167


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

X16= Sótano se identifica con el F1 y el F7 con unas cargas de 0.526 y 0.599


X17= Cocina integral se identifica con el F3 con una carga de 0.932
X18= Tina de hidromasaje se identifica con el F3 con una carga de 0.933

En caso de que alguna variable tuviera carga significativa con dos o más
factores, se debe analizar en la matriz de correlación con cuales variables tiene
mayor relación. En este caso X5= Antigüedad de la casa se identifica con el F1
y el F2 con unas cargas de 0.583 y 0.620, X14= Chimenea se identifica con el
F4 y el F5 con unas cargas de 0.641 y 0.551 y X16= Sótano se identifica con
el F1 y el F7 con unas cargas de 0.526 y 0.599; entonces se debe checar la
correlación con todas las combinaciones que se pueden hacer con la variable X5=
Antigüedad, X14= Chimenea y X16= Sótano y las que forman con el F1 y F2, con
el F4 y F5 y F1 y F7 respectivamente:

Para el caso X5= Antigüedad de la casa se identifica con el F1 y el F2 con unas


cargas de 0.583 y 0.620 tenemos:
X5= Antigüedad VS X3= Número de baños tienen una correlación de
0.497
X5= Antigüedad VS X6= Impuestos anuales tienen una correlación de
0.514
X5= Antigüedad VS X7= Tipo de estacionamiento interior tienen una
correlación de 0.462
X5= Antigüedad VS X8= Estilo arquitectónico tienen una correlación de
0.505
X5= Antigüedad VS X9= Tipo de combustible tienen una correlación de
0.281
X5= Antigüedad VS X10= Tipo de sistema para la calef. tienen una
correlación de 0.429
X5= Antigüedad VS X15= Drenaje municipal tienen una correlación de
0.361
X5= Antigüedad VS X16= Sótano tienen una correlación de 0.364
Como la máxima correlación que se obtuvo es con X6= Impuestos anuales,
entonces la variable X5= Antigüedad debe ir en el Factor 1.
Para el caso X14= Chimenea se identifica con el F4 y el F5 con unas cargas de
0.641 y 0.551 tenemos:
X14= Chimenea VS X1= Tamaño del lote tienen una correlación de 0.539
X14= Chimenea VS X4= Número de habitaciones tienen una correlación de
0.415
X14= Chimenea VS X13= Aire acondicionado tienen una correlación de
0.459
Como la máxima correlación que se obtuvo es con X1= Tamaño del lote, entonces
la variable X14= Chimenea debe ir en el Factor 5.
Para el caso de X16= Sótano se identifica con el F1 y el F7 con unas cargas de
0.526 y 0.599 tenemos:
X16= Sótano VS X3= Número de baños tienen una correlación de 0.395
X16= Sótano VS X4= Número de habitaciones tienen una correlación de
0.087
X16= Sótano VS X5= Antigüedad tienen una correlación de 0.364
X16= Sótano VS X6= Impuestos anuales tienen una correlación de 0.230
X16= Sótano VS X7= Tipo de estacionamiento interior tienen una
correlación de 0.411

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________168


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

X16= Sótano VS X8= Estilo arquitectónico tienen una correlación de 0.072


X16= Sótano VS X12= Cocina con antecomedor tienen una correlación de
0.115
Como la máxima correlación que se obtuvo es con X7= Tipo de estacionamiento
interior, X16= Sótano debe ir en el Factor 1.
La solución final óptima sería:
F1: X3= Número de baños, X5= Antigüedad, X6= Impuestos anuales, X7= Tipo de
estacionamiento interior, X8= Estilo arquitectónico y X16= Sótano
F2: X9= Tipo de combustible, X10= Tipo de sistema para la calefacción y X15=
Drenaje municipal
F3: X17= Cocina integral y X18= Tina de hidromasaje
F4: X4= Número de habitaciones y X13= Aire acondicionado
F5: X1= Tamaño del lote y X14= Chimenea
F6: X2= Número de recámaras y X11= Tipo de alberca
F7: X12= Cocina con antecomedor

Respuesta al inciso c.
Los valores de comunalidad y
la proporción de la variabilidad El porcentaje de varianza, que es el porcentaje de variación explicada con
de cada variable explicada por respecto a la máxima variación que se podría tener, se obtiene, por ejemplo para
los factores que pueden ser F1 dividiendo 3.7604/18, lo que es igual a 0.209 o 20.9 %. El Factor que ha
de especial utilidad para explicado más al conjunto de variables es el 1, y después el 2 y así
comparar los ajustes. Se sucesivamente lo cual es lógico pues cada factor adicional explica menor
puede decidir agregar un cantidad, ya que cada vez queda menos por explicar, en este caso, por ejemplo,
factor si contribuye al ajuste
queda por explicar 4.138 de variación; si se agregan los 11 factores que faltan,
de ciertas variables. Se puede
tratar también con el método ya cada uno explicaría muy poco y no convendría. El porcentaje de variación
de extracción de máxima explicada acumulada total es de 0.827 o de 82.70 % de un máximo por explicar
verosimilitud. de 100%.

Respuesta al inciso d.

Se puede observar que la variable mejor explicada por el conjunto de factores es


la variable X2=Número de Recámaras, ya que es la que tiene la mayor
comunalidad de 0.962

2.1.1.1 ACTIVIDAD DE APRENDIZAJE

ACTIVIDAD DE
APRENDIZAJE El Director de mercadotecnia de una compañía de Bienes Raíces desea conocer
2.1.1.1 cuales dimensiones o indicadores básicos influyen al momento de pronosticar el
FACTOR ANÁLISIS valor de una casa o vivienda unifamiliar al momento en que un potencial cliente
desea ya sea comprar o vender su casa con el objeto de brindar un servicio
confiable y rápido. Para llevar a cabo la investigación dividió la Ciudad en tres
grandes zonas: NORTE, SUR Y ESTE. En cada zona se aplicó una encuesta a 20

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________169


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

propietarios de casas unifamiliares. El cuestionario estaba conformado por 20


variables que se consideraba podían formar parte de dichos indicadores X1=
Tamaño del lote y X2= Número de recámaras, , X3= Número de baños, X4=
Número de habitaciones y X5= Antigüedad de la casa, X6= Impuestos anuales,
X7= Tipo de estacionamiento interior, X8= Estilo arquitectónico, X9= Tipo de
combustible para la calefacción, X10= Tipo de sistema para la calefaccción, X11=
Tipo de alberca, X12= Cocina con antecomedor y X13= Aire acondicionado, X14=
Chimenea, X15= Drenaje municipal X16= Sótano, X17= Cocina integral, X18= Tina
de hidromasaje.
Los resultados en la zona SUR fueron los siguientes:
Casa No. X1 X2 X3 X4 X5 X6 X7 X8
1 31.5 5 2.0 6 31 4200 0 5
2 6.8 4 2.5 8 10 4980 1 3
3 6.0 4 1.5 10 30 2857 1 1
4 9.0 3 1.5 6 25 2400 1 4
5 7.0 3 1.5 7 28 3959 1 3
6 6.5 2 1.0 5 35 2250 1 1
7 9.1 3 1.5 5 30 4134 1 5
8 9.8 4 1.5 7 60 3142 2 3
9 6.0 3 1.0 8 30 2500 1 4
10 6.0 4 1.0 7 34 2500 1 1
11 10.0 4 2.0 7 34 3000 1 1
12 10.0 3 1.5 6 30 3930 1 5
13 7.0 4 2.0 7 35 3100 1 1
14 12.1 3 2.0 7 46 3640 0 2
15 8.5 3 1.0 7 35 2725 1 4
16 7.0 5 1.5 6 28 4100 1 5
17 6.0 3 1.0 6 39 2378 0 1
18 11.0 3 2.0 7 33 2767 0 4
19 10.0 4 2.0 6 28 4500 2 4
20 9.9 3 1.5 8 30 3871 1 5

Casa No. X10 X11 X12 X13 X14 X15 X16 X17
1 2 1 1 0 0 1 1 1
2 2 1 1 0 0 0 1 1
3 1 1 1 0 1 1 0 1
4 2 1 1 0 1 0 1 1
5 2 1 1 0 0 1 1 0
6 2 1 0 0 0 1 1 0
7 2 1 1 0 1 1 1 0
8 2 1 1 0 0 0 1 0
9 2 1 1 0 0 1 1 1
10 2 1 1 0 0 1 1 1
11 2 1 1 0 0 1 1 1
12 2 1 1 1 0 1 1 1
13 2 1 0 0 1 1 1 0
14 2 1 1 1 1 1 1 1
15 2 2 1 0 0 1 1 0
16 1 1 1 0 1 1 1 0
17 1 2 1 0 0 0 1 0
18 1 2 1 1 1 1 1 0
19 2 1 1 1 0 1 1 1
20 2 1 1 0 0 1 1 1

a) ¿Cuántas dimensiones o indicadores esperaría tener como solución


inicial en esta investigación?. Explique su respuesta tomando en cuenta
los criterios para analizar el número de factores en la solución inicial.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________170


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

b) Teniendo como supuesto que la solución inicial es correcta, ¿Qué


variables se identifican más con cada factor?. Explique su respuesta
tomando en cuenta los criterios para identificar cargas significativas y
sus prioridades.
c) Según la información de la matriz rotada, ¿con cuál de los factores se
identificó mejor el conjunto de 18 variables?. Justifique.
d) ¿Cuál de las variables ha sido mejor explicada en esta investigación por
la solución de factores?. Justifique.

2.1.1.1 EJERCICIO DE AUTOEVALUACIÓN

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra al final del cuaderno de trabajo en el anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN El Director de mercadotecnia de una compañía de Bienes Raíces desea conocer


2.1.1.1 cuales dimensiones o indicadores básicos influyen al momento de pronosticar el
valor de una casa o vivienda unifamiliar al momento en que un potencial cliente
FACTOR ANÁLISIS desea ya sea comprar o vender su casa con el objeto de brindar un servicio
confiable y rápido. Para llevar a cabo la investigación dividió la Ciudad en tres
grandes zonas: NORTE, SUR Y ESTE. En cada zona se aplicó una encuesta a 20
propietarios de casas unifamiliares. El cuestionario estaba conformado por 20
variables que se consideraba podían formar parte de dichos indicadores X1=
Tamaño del lote y X2= Número de recámaras, , X3= Número de baños, X4=
Número de habitaciones y X5= Antigüedad de la casa, X6= Impuestos anuales,
X7= Tipo de estacionamiento interior, X8= Estilo arquitectónico, , X9= Tipo de
sistema para la calefaccción, X10= Tipo de alberca, X11= Cocina con
antecomedor, X12= Chimenea, X13= Cocina integral, X14= Tina de hidromasaje.
Los resultados en la zona ESTE fueron los siguientes:
Casa No. X1 X2 X3 X4 X5 X6 X7
1 6.9 4 2.0 8 38 3750 1
2 6.0 3 2.0 6 35 3240 0
3 7.0 3 1.0 6 39 2700 1
4 6.0 4 1.0 7 38 2800 1
5 6.0 3 2.0 7 38 2995 1
6 9.0 4 1.0 6 32 2500 1
7 11.2 4 1.0 9 32 2800 1
8 6.0 5 2.0 10 35 2500 0
9 5.6 3 1.0 6 37 2027 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________171


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

10 6.0 3 1.5 8 37 2500 1


11 6.0 4 1.0 6 39 2200 1
12 6.0 4 2.0 7 37 3156 0
13 8.7 4 1.0 6 36 2741 1
14 6.0 4 1.0 6 39 2100 0
15 6.5 3 2.0 7 36 2400 0
16 6.5 3 1.0 6 35 2280 0
17 6.0 3 2.0 8 38 2700 1
18 6.0 3 1.5 7 35 2300 1
19 6.0 3 1.0 7 36 1889 0
20 6.0 4 1.0 6 35 2900 0

Casa No. X8 X9 X10 X11 X12 X13 X14


1 3 2 1 1 0 0 0
2 1 2 1 1 1 1 1
3 1 1 1 1 0 0 0
4 1 2 1 1 0 1 1
5 4 2 1 1 1 1 1
6 4 2 1 1 1 0 0
7 1 2 1 1 0 0 0
8 1 2 1 1 0 0 0
9 1 2 1 1 1 1 1
10 2 2 1 1 1 1 1
11 1 2 1 1 0 1 1
12 1 2 1 1 1 1 1
13 1 2 1 1 1 0 0
14 1 2 1 1 0 0 0
15 1 2 2 1 0 1 1
16 1 2 1 0 0 0 1
17 1 2 1 1 0 1 1
18 4 2 1 1 1 1 1
19 1 2 1 1 0 1 1
20 4 2 1 1 1 1 1

a) ¿Cuántas dimensiones o indicadores esperaría tener como solución


inicial en esta investigación?. Explique su respuesta tomando en cuenta
los criterios para analizar el número de factores en la solución inicial.
b) Teniendo como supuesto que la solución inicial es correcta, ¿Qué
variables se identifican más con cada factor?. Explique su respuesta
tomando en cuenta los criterios para identificar cargas significativas y
sus prioridades.
c) Según la información de la matriz rotada, ¿con cuál de los factores se
identificó mejor el conjunto de 14 variables?. Justifique.
d) ¿Cuál de las variables ha sido mejor explicada en esta investigación por
la solución de factores?. Justifique.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________172


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

2.1.1.1.F.A. EJEMPLO ILUSTRATIVO EN MINITAB 17

EJEMPLO
ILUSTRATIVO
INTEGRAL EN
El Director de mercadotecnia de una compañía de Bienes Raíces desea conocer
MINITAB 17. cuales dimensiones o indicadores básicos influyen al momento de pronosticar el
2.1.1.1. FACTOR valor de una casa o vivienda unifamiliar al momento en que un potencial cliente
ANÁLISIS. desea ya sea comprar o vender su casa con el objeto de brindar un servicio
confiable y rápido. Para llevar a cabo la investigación dividió la Ciudad en tres
grandes zonas: NORTE, SUR Y ESTE. En cada zona se aplicó una encuesta a 20
propietarios de casas unifamiliares. El cuestionario estaba conformado por 20
variables que se consideraba podían formar parte de dichos indicadores X1=
Tamaño del lote y X2= Número de recámaras, , X3= Número de baños, X4=
Número de habitaciones y X5= Antigüedad de la casa, X6= Impuestos anuales,
X7= Tipo de estacionamiento interior, X8= Estilo arquitectónico, X9= Tipo de
combustible para la calefacción, X10= Tipo de sistema para la calefaccción, X11=
Tipo de alberca, X12= Cocina con antecomedor y X13= Aire acondicionado, X14=
Chimenea, X15= Drenaje municipal X16= Sótano, X17= Cocina integral, X18= Tina
de hidromasaje.

Los resultados en la zona NORTE fueron los siguientes:

Casa X1 X2 X3 X4 X5 X6 X7 X8 X9
No.
1 6.00 3 1.0 6 45 1600 0 1 2
2 7.00 3 1.5 10 28 3500 1 5 1
3 7.00 4 2.0 6 35 3600 0 4 2
4 7.00 3 2.0 7 35 4100 1 3 1
5 6.00 3 2.0 9 32 4400 2 5 2
6 7.75 4 2.5 8 22 3000 1 4 2
7 6.00 2 1.0 6 38 2400 1 1 2
8 10.32 3 2.5 6 26 5400 2 5 2
9 7.20 4 2.0 7 30 3600 1 1 2
10 9.41 3 1.5 8 24 2900 1 4 1
11 6.00 3 1.0 7 31 2900 1 5 1
12 7.50 4 2.0 8 35 3100 1 1 2
13 10.50 4 2.5 9 29 5000 2 5 2
14 6.00 3 2.5 6 30 4058 2 5 2
15 6.00 3 1.0 7 35 2752 1 4 2
16 7.20 4 1.0 7 30 2900 1 1 2
17 7.20 3 1.0 8 40 1900 0 4 2
18 6.00 5 2.5 6 32 4000 1 5 2
19 10.00 3 2.0 7 38 3512 2 1 2
20 10.80 4 1.0 8 36 3100 0 1 2

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________173


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Casa X10 X11 X12 X13 X14 X15 X16 X17 X18
No.
1 2 1 1 0 0 1 1 1 1
2 1 1 1 0 0 1 1 1 1
3 2 1 1 0 0 1 1 1 1
4 2 1 1 0 0 1 0 0 0
5 2 1 1 1 1 1 1 1 1
6 2 1 1 0 0 1 1 1 1
7 2 1 1 0 0 1 1 1 1
8 2 1 1 0 0 1 1 0 0
9 2 1 1 0 0 1 1 0 0
10 1 1 1 0 0 0 1 1 1
11 1 1 1 0 0 1 1 1 0
12 1 1 1 0 0 1 1 0 0
13 2 1 1 0 1 1 1 0 0
14 2 1 1 0 0 1 1 1 1
15 2 1 1 0 0 1 0 1 1
16 2 1 0 0 0 1 1 0 0
17 3 1 1 0 0 1 0 0 0
18 2 3 1 0 0 1 1 1 1
19 3 2 1 0 1 1 1 1 1
20 2 1 1 0 1 1 0 1 1

a) ¿Cuántas dimensiones o indicadores esperaría tener como solución inicial


en esta investigación?. Explique su respuesta tomando en cuenta los
criterios para analizar el número de factores en la solución inicial.
b) Teniendo como supuesto que la solución inicial es correcta, ¿Qué
variables se identifican más con cada factor?. Explique su respuesta
tomando en cuenta los criterios para identificar cargas significativas y sus
prioridades.
c) Según la información de la matriz rotada, ¿con cuál de los factores se
identificó mejor el conjunto de 18 variables?. Justifique.
d) ¿Cuál de las variables ha sido mejor explicada en esta investigación por la
solución de factores?. Justifique.

Respuesta al inciso a)
Cuando el número de observaciones es extenso y/o existen muchas
variables, los cálculos manuales son tediosos. Existen muchos paquetes de
software que pueden mostrar los resultados entre ellos Minitab.

Comenzamos introduciendo los datos en la hoja de Trabajo 1 de Minitab, tal y


como se muestra a continuación:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________174


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Hay tres maneras en las que usted puede llevar un análisis factorial en Minitab. La
manera habitual, descrita a continuación, es ingresar columnas que contengan sus
variables de medición.

Para generar la matriz no rotada para visualizar la solución inicial elija


Estadísticas > Análisis multivariado > Análisis factorial.

Aparece el siguiente cuadro de Diálogo:

En Variables, ingrese las columnas que contienen los datos de medición


seleccionando las 18 variables y oprimir el botón Seleccionar

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________175


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Aparece el siguiente cuadro de Diálogo:

En Número de factores que se extraerán coloque 18 que corresponde al


número de variables

En Método de extracción debe estar seleccionada por default la opción


Componentes principales y en Tipo de rotación debe estar seleccionada por
default la opción Ninguno y luego haga clic en Aceptar.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________176


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Salida de la ventana Sesión

Análisis factorial: X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
X13, X14, X15, X16, X17, X18
Cargas de factores no rotados :

Variabl Factor Factor Factor Factor Factor Factor Factor Factor Factor
e 1 2 3 4 5 6 7 8 9
X1 0.385 -0.210 0.258 -0.405 -0.645 -0.102 0.304 -0.053 -0.065
X2 0.275 -0.368 0.154 0.392 -0.463 0.140 -0.582 -0.089 -0.033
X3 0.821 -0.247 -0.091 0.303 0.008 -0.194 0.023 -0.175 -0.063
X4 0.314 0.301 0.127 -0.639 -0.132 0.157 -0.436 -0.084 0.055
X5 -0.727 -0.398 -0.240 -0.176 0.125 -0.122 0.029 -0.079 0.326
X6 0.891 -0.199 0.056 -0.007 0.122 -0.162 0.042 0.028 0.037
X7 0.779 -0.087 -0.087 -0.072 0.297 0.112 0.374 0.154 0.136
X8 0.569 0.360 -0.174 0.082 0.259 -0.368 -0.282 0.233 -0.224
X9 -0.050 -0.794 -0.217 0.081 0.029 0.216 0.037 -0.215 -0.368
X10 -0.160 -0.772 -0.216 -0.166 0.040 -0.185 0.156 0.304 -0.215
X11 0.175 -0.331 -0.422 0.462 -0.312 -0.086 -0.152 0.360 0.416
X12 0.138 0.173 -0.453 -0.140 -0.027 -0.676 0.033 -0.444 0.119
X13 0.304 0.004 -0.407 -0.438 0.437 0.358 -0.238 0.073 0.002
X14 0.341 -0.383 -0.317 -0.685 -0.245 0.167 -0.013 -0.002 0.169
X15 -0.095 -0.629 -0.043 0.043 0.466 -0.069 -0.297 -0.226 0.090
X16 0.430 0.137 -0.135 0.440 0.062 0.538 0.267 -0.294 0.164
X17 -0.139 0.383 -0.846 0.079 -0.159 0.092 -0.001 0.002 -0.063
X18 -0.108 0.212 -0.868 0.041 -0.248 0.112 0.034 -0.007 -0.217
Eigenva 3.7604 2.7844 2.4448 1.9917 1.4936 1.2985 1.111 0.7414 0.6717
lue
% Var 0.209 0.155 0.136 0.111 0.083 0.072 0.062 0.041 0.037

Variabl Factor Factor Factor Factor Factor Factor Factor Factor Factor
e 10 11 12 13 14 15 16 17 18
X1 0.090 0.047 0.130 -0.015 -0.003 0.122 -0.083 0.021 0.003
X2 -0.075 0.103 0.005 0.012 -0.034 -0.100 0.016 0.040 0.007
X3 -0.123 -0.052 -0.167 -0.161 0.054 -0.087 -0.090 -0.026 -0.008
X4 0.067 -0.348 -0.093 -0.004 0.092 0.033 0.019 0.006 -0.012
X5 -0.108 0.050 0.118 -0.020 0.214 -0.067 -0.037 0.024 -0.006
X6 0.072 0.288 -0.011 -0.057 0.106 0.081 0.097 0.007 -0.014
X7 0.114 -0.090 -0.147 0.195 -0.002 -0.092 -0.017 0.037 0.006
X8 0.055 -0.071 0.324 0.055 0.073 -0.034 -0.026 -0.003 0.007
X9 -0.106 -0.067 0.048 0.247 0.050 0.042 0.008 -0.015 -0.010
X10 -0.060 -0.229 0.023 -0.200 -0.074 -0.025 0.048 0.021 -0.002
X11 -0.55 -0.119 -0.016 0.083 -0.015 0.117 -0.009 -0.019 -0.002
X12 -0.181 -0.073 -0.006 0.068 -0.100 0.022 0.041 0.011 0.005
Número de factores X13 -0.356 0.150 -0.004 -0.047 -0.077 0.097 -0.049 0.012 0.003
X14 0.085 0.099 0.104 0.005 -0.047 -0.138 0.031 -0.041 0.008
La selección del número de X15 0.458 -0.005 -0.013 -0.049 -0.056 0.075 -0.033 0.001 0.008
factores se basa con X16 -0.022 -0.181 0.240 -0.121 0.003 0.021 0.032 0.005 0.003
frecuencia en la proporción
X17 0.227 0.083 0.041 -0.002 -0.098 -0.049 -0.029 0.016 -0.027
de varianza explicada por los

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________177


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

factores, el conocimiento del X18 0.106 0.026 -0.16 -0.059 0.151 0.046 0.019 0.003 0.022
tema y la sensatez de la Eigenva 0.5236 0.3840 0.2932 0.2063 0.1371 0.1101 0.0382 0.0080 0.0020
solución. Inicialmente, se lue
trata de utilizar el método de % Var 0.0290 0.021 0.016 0.011 0.008 0.006 0.002 0.000 0.000
extracción de los
componentes principales
especificando el número de Esta matriz no rotada muestra las cargas de factor que, como ya se mencionó,
componentes igual al indican la relación de cada variable con cada factor .
número de variables. Se Aquí la mejor solución en cuanto al número de factores sería un factor que
examina la proporción de la agrupara a las diez y ocho variables. Todas tendrían algo en común entre sí,
variabilidad explicada por mientras que la peor solución serian diez y ocho factores, lo cual representaría
diferentes factores y se que las variables no tuvieron nada en común y no se podría resumir nada la
reduce su selección a información.
cuántos factores se
utilizarán. Una gráfica de
Tanto por el criterio de la raíz latente como por el porcentaje de variación
sedimentación puede ser útil
aquí para evaluar explicada acumulada, se tiene como solución inicial siete factores, ya que
visualmente la importancia el Eigenvalue de los siete primeros es mayor a 1 y el porcentaje de variación
de los factores. Una vez que explicada acumulada está entre 60 % y 95%, es de 82.70%
se haya reducido esta En este problema de diez y ocho variables la varianza ó variación máxima que se
selección, se examina los podría obtener, se tiene que F1 explica 3.7604, el F2 explica 2.7844, el F3 explica
ajustes de los diferentes 2.4448, el F4 explica 1.9917, el F5 explica 1.4936, el F6 explica 1.2985 y el F7
análisis factorial. Los valores explica 1.1111 de acuerdo con su Eigenvalue. El total de la variación es de 13.862
de comunalidad y la (total de los Eigenvalue de los 7 factores y se pierde 4.138 ( 18 – 13.862) de
proporción de la variabilidad
información.
de cada variable explicada
por los factores que pueden
ser de especial utilidad para Respuesta al inciso b)
comparar los ajustes. Se
puede decidir agregar un Para generar la matriz de correlación elija Estadísticas > Estadísticas
factor si contribuye al ajuste básicas > correlación
de ciertas variables. Se
puede tratar también con el
método de extracción de Aparece el siguiente cuadro de Diálogo:
máxima verosimilitud.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________178


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Aparece el siguiente cuadro de Diálogo:

Desactive las casilla Presentar los valores de p (quitar la palomita) y haga clic
en Aceptar.

Salida de la ventana Sesión

Matriz de correlación:

Correlación: X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, X13, X14, X15, X16, X17, X18

X1 X2 X3 X4 X5 X6 X7 X8 X9
X1 1.000
X2 0.164 1.000
X3 0.220 0.401 1.000
X4 0.267 0.040 -0.025 1.000
X5 -0.260 -0.242 -0.497 -0.308 1.000
X6 0.371 0.230 0.777 0.091 -0.514 1.000
X7 0.194 -0.158 0.593 0.111 -0.462 0.713 1.000
X8 -0.107 0.000 0.403 0.215 -0.505 0.481 0.335 1.000
X9 0.058 0.302 0.187 -0.306 0.281 0.022 0.037 -0.289 1.000

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________179


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

X10 X11 X12 X13 X14 X15 X16 X17 X18


X10 1.000
X11 0.253 1.000
X12 -0.043 0.072 1.000
X13 0.043 -0.772 0.053 1.000
X14 0.325 0.105 0.115 0.459 1.000
X15 0.383 0.072 -0.053 0.053 0.115 1.000
X16 -0.325 0.157 -0.115 0.115 -0.062 -0.115 1.000
X17 -0.136 0.231 0.313 0.168 0.105 -0.168 0.157 1.000
X18 0.038 0.257 0.281 0.187 0.153 -0.187 0.102 0.899 1.000

Para generar la matriz rotada elija Estadísticas > Análisis Multivariado >
Análisis factorial

Aparece el siguiente cuadro de Diálogo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________180


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Número de factores que se extraerán colocar el número 7 y en Tipo de


rotación seleccionar la opción Varimax y luego dar click en Aceptar

Salida de la ventana Sesión

Rotación Cargas de factores rotados y comunalidades

Variable Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Factor 6 Factor 7 Comuna


Una vez que se haya
lidad
seleccionado el número de X1 0.117 0.020 0.174 0.057 -0.931 -0.087 -0.053 0.943
factores, probablemente X2 0.078 -0.036 0.129 0.026 -0.063 -0.955 0.144 0.962
usted se querrá probar con X3 0.853 -0.072 0.019 -0.077 -0.062 -0.338 -0.130 0.874
diferentes rotaciones. X4 -0.034 0.385 0.134 0.783 -0.219 -0.066 -0.113 0.846
Johnson y Wichern sugieren X5 -0.583 -0.620 -0.095 -0.077 0.107 0.197 -0.130 0.807
la rotación varimax. Un X6 0.865 -0.026 0.204 0.160 -0.146 -0.140 -0.145 0.879
resultado similar de X7 0.865 -0.055 0.010 0.159 -0.108 0.246 0.132 0.867
diferentes métodos puede X8 0.532 0.354 -0.065 0.180 0.305 -0.089 -0.477 0.772
dar crédito a la solución que X9 0.072 -0.783 -0.046 -0.005 -0.038 -0.215 0.259 0.735
se escogió. En este punto se X10 -0.024 -0.837 0.023 -0.53 -0.179 0.016 -0.136 0.756
pudiera interpretar los X11 0.214 -0.267 -0.394 -0.232 -0.001 -0.573 -0.066 0.659
factores utilizando su X12 0.169 0.014 -0.332 -0.045 -0.058 0.121 -0.758 0.733
X13 0.262 -0.152 -0.214 0.765 0.248 0.188 0.080 0.825
conocimiento de los datos.
X14 0.167 -0.381 -0.175 0.641 -0.551 -0.013 -0.042 0.920
X15 0.035 -0.662 0.268 0.124 0.408 -0.141 -0.071 0.719
X16 0.526 0.190 -0.285 -0.115 0.110 -0.039 0.599 0.779
X17 -0.103 0.114 -0.932 0.060 0.127 0.041 -0.096 0.922
X18 -0.079 -0.029 -0.933 0.069 -0.000 -0.019 -0.067 0.886
Eigenval 3.3582 2.7105 2.3551 1.8038 1.6571 1.6134 1.3862 14.8844
ue
% Var 0.187 0.151 0.131 0.100 0.092 0.090 0.077 0.827

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________181


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Ni el Eigenvalue ni la comunalidad total, ni el porcentaje de variación explicada


total cambian al rotar los factores, es decir, no cambian de la matriz no rotada a la
rotada, solo se distribuyeron las cargas de factor y ahora sí algunas cargas
tienen valores más grandes que en la no rotada como para poder determinar la
forma como se agrupan las variables en cada factor.

Lo que si cambia es la importancia en que cada factor explica a las variables


(Eigenvalue de cada factor) y en la matriz rotada es posible que cada factor hacia
la derecha explique menos a las variables.

Para determinar en cual factor se agrupará cada variable debe analizarse la matriz
rotada, buscando las cargas significativas. Al identificar las cargas significativas,
no importa el signo que tengan, sino la magnitud de la relación, el signo negativo
solo expresa una relación inversa. En principio se buscan cargas mayores a 0.50
utilizando la Prioridad 1, en caso de que una variable no tuviera una carga mayor
a 0.5 se aplicarían las prioridades 2, 3 o 4, según sea el caso, de los criterios de
cargas significativas en toda la matriz rotada. En este ejemplo se tiene:

X1= Tamaño del lote se identifica con el F5 con una carga de 0.931
X2= Número de recámaras se identifica con el F6 con una carga de 0.955
X3= Número de baños se identifica con el F1 con una carga de 0.853
X4= Número de habitaciones se identifica con el F4 con una carga de 0.783
X5= Antigüedad de la casa se identifica con el F1 y el F2 con unas cargas de
0.583 y 0.620
X6= Impuestos anuales se identifica con el F1 con una carga de 0.865
X7= Tipo de estacionamiento interior se identifica con el F1 con una carga de
0.865
X8= Estilo arquitectónico se identifica con el F1 con una carga de 0.532
X9= Tipo de combustible para la calefacción se identifica con el F2 con una carga
de 0.783
X10= Tipo de sistema para la calefacción se identifica con el F2 con una carga de
0.837
X11= Tipo de alberca se identifica con el F6 con una carga de 0.573
X12= Cocina con antecomedor se identifica con el F7 con una carga de 0.758
X13= Aire acondicionado se identifica con el F4 con una carga de 0.765
X14= Chimenea se identifica con el F4 y el F5 con unas cargas de 0.641 y 0.551
X15= Drenaje municipal se identifica con el F2 con una carga de 0.662
X16= Sótano se identifica con el F1 y el F7 con unas cargas de 0.526 y 0.599
X17= Cocina integral se identifica con el F3 con una carga de 0.932
X18= Tina de hidromasaje se identifica con el F3 con una carga de 0.933

En caso de que alguna variable tuviera carga significativa con dos o más
factores, se debe analizar en la matriz de correlación con cuales variables tiene
mayor relación. En este caso X5= Antigüedad de la casa se identifica con el F1
y el F2 con unas cargas de 0.583 y 0.620, X14= Chimenea se identifica con el
F4 y el F5 con unas cargas de 0.641 y 0.551 y X16= Sótano se identifica con
el F1 y el F7 con unas cargas de 0.526 y 0.599; entonces se debe checar la
correlación con todas las combinaciones que se pueden hacer con la variable X5=
Antigüedad, X14= Chimenea y X16= Sótano y las que forman con el F1 y F2, con
el F4 y F5 y F1 y F7 respectivamente:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________182


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Para el caso X5= Antigüedad de la casa se identifica con el F1 y el F2 con unas


cargas de 0.583 y 0.620 tenemos:
X5= Antigüedad VS X3= Número de baños tienen una correlación de 0.497
X5= Antigüedad VS X6= Impuestos anuales tienen una correlación de
0.514
X5= Antigüedad VS X7= Tipo de estacionamiento interior tienen una
correlación de 0.462
X5= Antigüedad VS X8= Estilo arquitectónico tienen una correlación de
0.505
X5= Antigüedad VS X9= Tipo de combustible tienen una correlación de
0.281
X5= Antigüedad VS X10= Tipo de sistema para la calef. tienen una
correlación de 0.429
X5= Antigüedad VS X15= Drenaje municipal tienen una correlación de
0.361
X5= Antigüedad VS X16= Sótano tienen una correlación de 0.364
Como la máxima correlación que se obtuvo es con X6= Impuestos anuales,
entonces la variable X5= Antigüedad debe ir en el Factor 1.
Para el caso X14= Chimenea se identifica con el F4 y el F5 con unas cargas de
0.641 y 0.551 tenemos:
X14= Chimenea VS X1= Tamaño del lote tienen una correlación de 0.539
X14= Chimenea VS X4= Número de habitaciones tienen una correlación de
0.415
X14= Chimenea VS X13= Aire acondicionado tienen una correlación de
0.459
Como la máxima correlación que se obtuvo es con X1= Tamaño del lote, entonces
la variable X14= Chimenea debe ir en el Factor 5.
Para el caso de X16= Sótano se identifica con el F1 y el F7 con unas cargas de
0.526 y 0.599 tenemos:
X16= Sótano VS X3= Número de baños tienen una correlación de 0.395
X16= Sótano VS X4= Número de habitaciones tienen una correlación de
0.087
X16= Sótano VS X5= Antigüedad tienen una correlación de 0.364
X16= Sótano VS X6= Impuestos anuales tienen una correlación de 0.230
X16= Sótano VS X7= Tipo de estacionamiento interior tienen una
correlación de 0.411
X16= Sótano VS X8= Estilo arquitectónico tienen una correlación de 0.072
X16= Sótano VS X12= Cocina con antecomedor tienen una correlación de
0.115
Como la máxima correlación que se obtuvo es con X7= Tipo de estacionamiento
interior, X16= Sótano debe ir en el Factor 1.
La solución final óptima sería:
F1: X3= Número de baños, X5= Antigüedad, X6= Impuestos anuales, X7= Tipo de
estacionamiento interior, X8= Estilo arquitectónico y X16= Sótano
F2: X9= Tipo de combustible, X10= Tipo de sistema para la calefacción y X15=
Drenaje municipal
F3: X17= Cocina integral y X18= Tina de hidromasaje
F4: X4= Número de habitaciones y X13= Aire acondicionado
F5: X1= Tamaño del lote y X14= Chimenea
F6: X2= Número de recámaras y X11= Tipo de alberca

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________183


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

F7: X12= Cocina con antecomedor

Respuesta al inciso c)

Para contestar el inciso c) utilizaremos la salida de la ventana Sesión del


inciso b):

Análisis factorial: X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
X13, X14, X15, X16, X17, X18

Cargas de factores rotados y comunalidades


Rotación Varimax

Variable Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Factor 6 Factor 7 Comuna


lidad
X1 0.117 0.020 0.174 0.057 -0.931 -0.087 -0.053 0.943
X2 0.078 -0.036 0.129 0.026 -0.063 -0.955 0.144 0.962
X3 0.853 -0.072 0.019 -0.077 -0.062 -0.338 -0.130 0.874
X4 -0.034 0.385 0.134 0.783 -0.219 -0.066 -0.113 0.846
X5 -0.583 -0.620 -0.095 -0.077 0.107 0.197 -0.130 0.807
X6 0.865 -0.026 0.204 0.160 -0.146 -0.140 -0.145 0.879
X7 0.865 -0.055 0.010 0.159 -0.108 0.246 0.132 0.867
X8 0.532 0.354 -0.065 0.180 0.305 -0.089 -0.477 0.772
X9 0.072 -0.783 -0.046 -0.005 -0.038 -0.215 0.259 0.735
X10 -0.024 -0.837 0.023 -0.53 -0.179 0.016 -0.136 0.756
X11 0.214 -0.267 -0.394 -0.232 -0.001 -0.573 -0.066 0.659
X12 0.169 0.014 -0.332 -0.045 -0.058 0.121 -0.758 0.733
X13 0.262 -0.152 -0.214 0.765 0.248 0.188 0.080 0.825
X14 0.167 -0.381 -0.175 0.641 -0.551 -0.013 -0.042 0.920
X15 0.035 -0.662 0.268 0.124 0.408 -0.141 -0.071 0.719
X16 0.526 0.190 -0.285 -0.115 0.110 -0.039 0.599 0.779
X17 -0.103 0.114 -0.932 0.060 0.127 0.041 -0.096 0.922
X18 -0.079 -0.029 -0.933 0.069 -0.000 -0.019 -0.067 0.886
Eigenval 3.3582 2.7105 2.3551 1.8038 1.6571 1.6134 1.3862 14.8844
ue
% Var 0.187 0.151 0.131 0.100 0.092 0.090 0.077 0.827

El porcentaje de varianza, que es el porcentaje de variación explicada con


respecto a la máxima variación que se podría tener, se obtiene, por ejemplo para
F1 dividiendo 3.7604/18, lo que es igual a 0.209 o 20.9 %. El Factor que ha
explicado más al conjunto de variables es el 1, y después el 2 y así
sucesivamente lo cual es lógico pues cada factor adicional explica menor cantidad,
ya que cada vez queda menos por explicar, en este caso, por ejemplo, queda por
explicar 4.138 de variación; si se agregan los 11 factores que faltan, ya cada uno
explicaría muy poco y no convendría. El porcentaje de variación explicada
acumulada total es de 0.827 o de 82.70 % de un máximo por explicar de 100%.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________184


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Respuesta al inciso d)

Para contestar el inciso d) utilizamos la salida de la ventana Sesión del


inciso b):

Análisis factorial: X1, X2, X3, X4, X5, X6, X7, X8, X9, X10, X11, X12,
X13, X14, X15, X16, X17, X18
Cargas de factores rotados y comunalidades
Rotación Varimax
Variable Factor 1 Factor 2 Factor 3 Factor 4 Factor 5 Factor 6 Factor 7 Comuna
lidad
X1 0.117 0.020 0.174 0.057 -0.931 -0.087 -0.053 0.943
X2 0.078 -0.036 0.129 0.026 -0.063 -0.955 0.144 0.962
X3 0.853 -0.072 0.019 -0.077 -0.062 -0.338 -0.130 0.874
X4 -0.034 0.385 0.134 0.783 -0.219 -0.066 -0.113 0.846
X5 -0.583 -0.620 -0.095 -0.077 0.107 0.197 -0.130 0.807
X6 0.865 -0.026 0.204 0.160 -0.146 -0.140 -0.145 0.879
X7 0.865 -0.055 0.010 0.159 -0.108 0.246 0.132 0.867
X8 0.532 0.354 -0.065 0.180 0.305 -0.089 -0.477 0.772
X9 0.072 -0.783 -0.046 -0.005 -0.038 -0.215 0.259 0.735
X10 -0.024 -0.837 0.023 -0.53 -0.179 0.016 -0.136 0.756
X11 0.214 -0.267 -0.394 -0.232 -0.001 -0.573 -0.066 0.659
X12 0.169 0.014 -0.332 -0.045 -0.058 0.121 -0.758 0.733
X13 0.262 -0.152 -0.214 0.765 0.248 0.188 0.080 0.825
X14 0.167 -0.381 -0.175 0.641 -0.551 -0.013 -0.042 0.920
X15 0.035 -0.662 0.268 0.124 0.408 -0.141 -0.071 0.719
X16 0.526 0.190 -0.285 -0.115 0.110 -0.039 0.599 0.779
X17 -0.103 0.114 -0.932 0.060 0.127 0.041 -0.096 0.922
X18 -0.079 -0.029 -0.933 0.069 -0.000 -0.019 -0.067 0.886
Eigenval 3.3582 2.7105 2.3551 1.8038 1.6571 1.6134 1.3862 14.8844
ue
% Var 0.187 0.151 0.131 0.100 0.092 0.090 0.077 0.827

Se puede observar que la variable mejor explicada por el conjunto de factores es


la variable X2=Número de Recámaras, ya que es la que tiene la mayor
comunalidad de 0.962

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________185


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

2.1.1.1 EJERCICIOS DE REFUERZO

EJERCICIOS DE
REFUERZO 2.1.1.1.1 Se tiene la siguiente matriz de factores no rotada:
2.1.1.1
FACTOR ANÁLISIS Variable Factor 1 Factor 2 Factor 3 Factor 4
A 0.67 0.49 -0.41 -0.35
B 0.55 0.58 0.45 -0.39
C 0.45 0.39 0.31 0.33
D 0.53 0.41 0.36 0.25
E 0.70 0.35 -0.29 0.28
F 0.65 0.48 0.45 0.32

a) Obtenga las Comunalidades, el Eigenvalue y el Porcentaje de


Variación Explicada:
b) A partir de estos resultados, ¿Se puede saber cómo agrupar a las
variables?. Explique.
c) ¿Cuál es la variable que más se identifica con las características?.
Explique el porqué de su respuesta.

2.1.1.1.2 Se tiene la siguiente matriz de factores no rotada.

F1 F2
X1 0.8386 -0.2196
X2 -0.7387 -0.5203
X3 0.5242 0.6748
X4 0.5849 0.3674

a) Obtenga la variación explicada de cada factor y las comunalidades.


b) Se roto la matriz y generó la siguiente información:

F1 F2
X1 0.8050 0.3215
X2 0.9033 -0.0202
X3 -0.0208 0.8541
X4 -0.2523 0.6430

Obtenga Eigenvalue y comunalidades.


c) ¿ Se ganó o perdió información con respecto a la matriz no rotada?
d) Agrupe o identifique a cada variable con el factor que le
corresponda y concluya cómo quedaron agrupadas las variables.
e) ¿Cuál es la variable que más se identifica con las características?.
Explique el porqué de su respuesta.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________186


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

2.1.1.1.3 Una firma de investigación de mercados esta en el proceso de


intentar relacionar pruebas de puntaje de actividad-interés a medidas de
“éxito” de solicitantes de empleo como vendedores al detalle en un gran
almacén de departamentos de cierta ciudad. Los puntajes de actividad-
interés son: X1=vivir en grupo; X2afición por deportes al aire libre; X3afición
por la música y X4=deseo de viajar.

Valores altos en Xi indican mayor interés o éxito respectivamente.

a) Utilice un programa de computo estadístico para correr un análisis


de factores ( Utilice el modelo de componentes principales y el
criterio de rotación de factores Varimax)
b) Determine el número de factores óptimo y justifique su decisión.
c) Agrupe o identifique a cada variable con el factor que le
corresponda y concluya cómo quedaron agrupadas las variables.
d) ¿Cuál es la variable que más se identifica con las características?.
Explique el porqué de su respuesta.

Persona X1 X2 X3 X4
1 21 26 7 8
2 22 16 11 7
3 16 28 11 7
4 17 30 9 13
5 12 26 12 7
6 25 10 18 14
7 18 21 14 16
8 15 17 5 11
9 14 23 13 8
10 18 20 10 5
11 14 29 14 11
12 15 23 16 7
13 25 21 14 12
14 15 20 3 10

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________187


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

OBJETIVO 2.2 El alumno interpretará los resultados de las


técnicas de conglomerados (Cluster Análisis ó Análisis de
Conglomerados)

ANTECEDENTES CONCEPTOS DE:

Medida de distancia, Medida de Similitud, Coeficiente de similitud, Agrupamiento


Jerárquico., Dendograma.

ANÁLISIS DE CONGLOMERADOS, MEDIDAS DE


2.2.1 DISTANCIA Y SIMILITUD, METODO JERÁRQUICO
AGLOMERATIVO

CONCEPTOS BÁSICOS Suponga que un arqueólogo descubre un gran escondite de fragmentos de


ANÁLISIS DE alfarería y toma pequeñas muestras respectivas de cada fragmento, y cada
muestra se puede analizar y se pueden averiguar las cantidades relativas de
CONGLOMERADOS diferentes elementos químicos, como zinc, magnesio, hierro, etc. El arqueólogo
quiere separar los fragmentos en montones distintos, de modo que los que
queden en cada uno de esos montones provengan de la misma pieza de
alfarería. Resulta claro que esto puede ser una tarea difícil porque el arqueólogo
no sabe cuantos montones de fragmentos resultarán, cuántos fragmentos
quedarán en cada montón o si hay algunos fragmentos que en realidad
pertenezcan al mismo montón. El análisis por agrupación es un método
multivariado que puede ayudar a resolver este problema.

El análisis por agrupación (CA: cluster analysis) es semejante al discriminante en


el sentido de que se usa para clasificar individuos o unidades experimentales en
subgrupos definidos de una manera única. Este análisis se puede emplear
cuando el investigador cuenta con muestras aleatorias previamente obtenidas de
cada uno de los subgrupos definidos de manera única. El análisis por agrupación
trata de los problemas de clasificación cuando no se sabe de antemano de
cuáles subgrupos se originan las observaciones.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________188


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El análisis de conglomerados es una técnica estructural que tiene por objeto


resumir información, es decir, todas las variables son consideradas como
independientes y en su mayoría deben estar medidas en una escala de intervalo
o de razón. Este método se utiliza básicamente para la segmentación mercados
en donde lo que se busca es formar grupos de objetos o personas lo mas
homogéneos posible, al comparar los elementos que conforman un grupo, y lo
mas heterogéneo, al comparar un elemento de un grupo con otro.

Esta técnica a veces se confunde con el análisis de factores pero la diferencia


radica en que en factores se trata de agrupar variables para resumir información
y en la técnica de conglomerados o agrupamiento se trata de reunir personas
con base en las respuestas similares que se identifiquen.

El agrupamiento se puede realizar mediante el análisis de las similitudes o


diferencias (distancias relativas) detectadas al comparar dos objetos o personas,
es decir, se puede determinar lo parecido de las personas con base en las
mayores similitudes, o en caso contrario, según las diferencias menores entre
respuestas.

Para realizar un análisis de conglomerados o de agrupamiento se deben tomar


en cuenta los siguientes requisitos:

1. Detectar si los objetos, personas o variables que se pretende


agrupar lo pueden hacer en forma natural.
2. Las variables que son utilizadas en esta técnica, por regla
general, son actitudes, opiniones, características
demográficas o correlaciones entre variables y todas deben
estar previamente estandarizadas.
3. Lo parecido de los elementos puede calcularse con una
medida de distancia o bien con una de similitud.

Análisis de agrupamiento a través de la medida de distancia

Bajo este criterio se tendría como atención central agrupar aquellas personas u
objetos con menores distancias entre si (lo mas parecido). Para cuantificar la
distancia entre las personas u objetos se utiliza la siguiente formula de la
medida de distancia:

1/ 2
é r 2ù
dij =
êå (X ik - X jk ) ú
ë k =1 û

Donde:
dij : es la distancia de los perfiles de los objetos i y j .
Xik : representa la característica k medida en el objeto i .
Xjk : representa la característica k medida en el objeto j.
r : es el número de características utilizadas para evaluar lo
parecido.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________189


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Para realizar el análisis de agrupamiento los datos de las variables deben estar
estandarizadas, si son métricas, es decir, eliminar sus unidades de manera que
se encuentren todas en términos de z. Para lograrlo es necesario aplicar la
siguiente formula:

x-µ
Z=
s

Análisis de agrupamiento a través de la medida de similitud


Utilice el análisis de
conglomerados de
observaciones para clasificar
las observaciones en grupos La otra medida mediante la cual se puede evaluar lo parecido de las personas u
cuando los grupos se objetos para después agruparlos es la medida de similitud, la cual se utiliza
desconocen inicialmente. generalmente cuando se manejan características o variables cualitativas,
indicando con un 1 la presencia del atributo y con 0 la ausencia del atributo...En
esta técnica se manejan las características cualitativas por medio de variables
dummy De acuerdo a la presencia o ausencia de atributos en las personas u
objetos se establece la similitud existente.

Existen ocho coeficientes que permiten medir la similitud entre un objeto y otro
que permiten evaluar el hecho de que se presente o no cierto atributo en ambas
personas u objetos o solamente en uno de ellos de la siguiente manera:

Objeto i Total
Objeto j 1 0
1 a b
0 c d
Total p

Donde:

a: numero de características presentes tanto en el objeto i como en j .


b: numero de características ausentes en el objeto i y presentes en el objeto j.
c: numero de características ausentes en el objeto j y presentes en el objeto i.
d: numero de ausencias de características en ambos objetos.
p: total de características a ser evaluadas ( a+b+c+d).

La tabla anterior y las letras se pueden tomar como nomenclatura que se


utilizara en los coeficientes de similitud que a continuación se tratarà para
después aplicar el algoritmo de agrupamiento.

Coeficientes de similitud:

1. Del total de características, se evalúa cuantas están presentes y


cuantas ausentes en ambas personas u objetos, es decir se trata de
evaluar la proporción de atributos similares en ambos:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________190


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

a+d
p
2. Se da importancia a la presencia y ausencia de las características en
ambas personas u objetos, duplicándolas:

2(a + d )
2(a + b) + b + c
3. Se da importancia a las diferencias de la característica en las
personas u objetos, duplicándola:

a+d
a + d + 2(b + c)
4. Se calcula la proporción de las presencias en ambos, con respecto a
todas las características:

a
p
5. Se determina la presencia de la característica en ambos, con
respecto a a,b y c , ya que la ausencia en d no se puede evaluar:

a
a+b+c
6. Se evalúa solo la presencia al doble, sin poder evaluar la ausencia
en ambos:

2a
2a + b + c
7. Se determina solo las diferencias en ellos al doble, sin poder evaluar
la ausencia en ambos:

a
a + 2(b + c)
8. Se evalúa cuantas características se encuentran presentes en ambas
personas u objetos con respecto a las diferencias en ellos; es decir,
se mide la relación de iguales a diferentes:

a
b+c

Nota: Los tres primeros coeficientes proporcionan resultados similares ya se


basan en la presencia y ausencia de los atributos en ambas personas u objetos,
mientras que los coeficientes 5, 6 y 7 dan entre si resultados similares por estar
enfocándose a los atributos presentes en un objeto y diferentes entre ellos sin

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________191


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

evaluar la ausencia. El ultimo coeficiente es totalmente diferente a los dos


grupos anteriores ya que mide la solo la relación de iguales a diferentes, dando
como resultado una diagonal diferente a unos tendiendo a infinito porque al
comparar a un objeto consigo mismo , b y c son igual a 0.

Este procedimiento utiliza un METODO DE AGRUPAMIENTO JERARQUICO


método jerárquico
aglomerativo que comienza Una vez calculado lo parecido de las personas u objetos con base en medidas de
con todas las observaciones similitud y distancia se debe buscar el procedimiento a través del cual pueden
separadas, cada una de ellas agruparse. El algoritmo que se habrá de seguir para formar grupos de personas
formando su propio
u objetos similares entre si se le conoce como método de agrupamiento
conglomerado. En el primer
paso, las dos observaciones
jerárquico.
más cercanas entre sí se
unen. En el siguiente paso, Este método se puede dividir en agrupamiento jerárquico aglomerativo y en
una tercera observación se agrupamiento jerárquico divisional, de acuerdo con las bases de similitud de que
une a las dos primeras u se cuente y en si en la secuencia de los pasos que se llevan a cabo. Lo que se
otras dos observaciones se espera es contar como solución mínima a todos los objetos o personas en un
unen para formar un grupo y como solución máxima aun grupo (conglomerado) para cada elemento.
conglomerado diferente. Este
proceso continuará hasta
En el método jerárquico aglomerativo se comienza suponiendo que cada uno
que todos los conglomerados
se unan en un solo de los elementos que se pretende agrupar constituye un grupo o conglomerado
conglomerado; sin embargo, por lo tanto existen tantos grupos como personas u objetos a ser agrupados.
este conglomerado individual Con base en lo parecido de ellos, los elementos se van fusionando hasta
no es útil para propósitos de terminar uniendo a todas las personas u objetos en un solo grupo o
clasificación. Por lo tanto, se conglomerado y de ahí el nombre de aglomerativo, es decir de muchas partes se
debe decidir cuántos grupos forma un todo, donde se van uniendo los elementos mas parecidos entre si.
son lógicos para los datos y
clasificarlos adecuadamente.
En el método jerárquico divisional se trabaja al revés; supone que existe un
La agrupación final de solo grupo o conglomerado conteniendo a todas las personas u objetos y con
conglomerados (también base en diferencias los va dividiendo hasta terminar formando tantos grupos
denominada partición final)
como objetos manejados en la técnica y de ahí su nombre de divisional, es decir
es la agrupación de
conglomerados que, si los de un todo de divide en partes.
resultados son favorables,
identificará grupos cuyas Los resultados del agrupamiento mediante esta técnica u otra se representan en
observaciones o variables forma grafica mediante un diagrama llamado dendograma.
compartan características
comunes. La decisión acerca
de la agrupación final
también se denomina METODO JERARQUICO AGLOMERATIVO
dendrograma . El
dendrograma completo
(diagrama de árbol) es una En este método, el procedimiento consiste en ir agrupando los elementos
representación gráfica de la parecidos por parejas y evaluar lo parecido que llega a ser una pareja o grupo
conformación en amalgama con los restantes elementos que no se han fusionado. Para hacer esto se utilizan
de observaciones o variables los llamados criterios de eslabonamiento.
en un solo conglomerado.
Cortar el dendrograma es
similar a trazar una línea a lo
largo del dendrograma para
especificar la agrupación

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________192


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

final.
Tipos de criterios de eslabonamiento
Se recomienda probar con
varios métodos de
eslabonamiento y comparar Un eslabonamiento consiste en volver a establecer el grado de parecido de un
los resultados. Dependiendo nuevo grupo con el resto de los elementos que no habìan sido agrupados y
de las características de los
existen básicamente tres formas o criterios para medir ese grado de parecido.
datos, algunos métodos
pueden proveer "mejores"
resultados que otros.
Nota: Por cuestiones de la terminología que se va a utilizar suponga que se
· Con el eslabonamiento utilizan los elementos u,v y w de los cuales ya se unieron (uv) y se pretende
simple, o del "vecino más evaluar su parecido con w.
cercano", la distancia entre
dos conglomerados es la
distancia mínima entre una 1. Eslabonamiento simple:
observación en un
conglomerado y una Este criterio asume que al momento de fusionarse dos personas u
observación en el otro
objetos, prevalecen las características de aquel elemento cuya distancia
conglomerado. El
eslabonamiento simple es
sea la mínima o, bien cuya similitud sea la máxima (mas parecido):
una opción apropiada
cuando los conglomerados MIN { duw,dvw} MAX {Suw,Svw}
están claramente separados.
Cuando las observaciones Este criterio supone que los elementos son tan parecidos como antes de
están cerca entre sí, el fusionarse.
eslabonamiento simple
tiende a identificar
conglomerados largos
2. Eslabonamiento completo:
similares a cadenas que
pueden tener una separación
relativamente grande entre
observaciones en cualquier Este criterio considera que cuando dos elementos se unen, el grado de
extremo de la cadena. · parecido de ese grupo a un tercer elemento va a estar dado por la
máxima distancia o la mínima de las similitudes (menos parecido):
· Con el eslabonamiento
completo, o "del vecino más MAX { duw,dvw} MIN {Suw,Svw}
lejano", la distancia entre
dos conglomerados es la Este criterio supone que el nuevo grupo comparado con otro elemento
distancia máxima entre una no agrupado es tan diferente como los elementos antes de agruparse.
observación en un
conglomerado y una
observación en el otro
conglomerado. Este método
3. Eslabonamiento promedio:
garantiza que todas las
observaciones en un Este criterio asume que al unirse dos elementos y formar un grupo, las
conglomerado se encuentren características de ellos con respecto a un tercero estarán dadas por el promedio
dentro de una distancia de las que originalmente poseían, lo cual puede representarse de la siguiente
máxima y tiende a producir manera:
conglomerados con
diámetros similares. Los d(uv)w=(duw+dvw)/2 S(uv)w=(Suw+Svw)/2
resultados pueden ser
sensibles a valores atípicos.

· Con el eslabonamiento
promedio, la distancia entre

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________193


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

dos conglomerados es la
distancia media entre una Pasos para llevar a cabo un agrupamiento jerárquico aglomerativo:
observación en un
conglomerado y una
1- Se necesita contar con la información en forma de matriz de
observación en el otro
conglomerado. En vista de
distancia o similitud.
que los métodos de
eslabonamiento simple o 2- Se comienza con n grupos, cada uno de ellos formado por un
completos agrupan elemento. Con base en la información manejada en la matriz de
conglomerados sobre la base distancia o similitud se seleccionara a la pareja de elementos más
de distancias entre pares parecida para formar un grupo.
individuales, el
eslabonamiento promedio
utiliza una medida de
3- Una vez ya fusionados los elementos y formado el grupo o
ubicación más central.
conglomerado, se aplica alguno de los criterios de eslabonamiento
para evaluar lo parecido que es este grupo con respecto a los demás
elementos sin unirse.

4- Se repiten los pasos 2 y 3 un total de n-1 veces hasta terminar


fusionando a todas las personas u objetos en un solo grupo.
¿Cómo se sabe dónde cortar
el dendrograma? Primero
convendría que se ejecute un
análisis del conglomerado sin
especificar la partición final. Dendrograma:
Se examinen los resultados
de los niveles de similitud y
de distancia y en el Es la representación grafica de los grupos o conglomerados formados donde en
dendrograma. El nivel de el eje horizontal se establecen los elementos que se están agrupando, de
similitud en cualquier paso
preferencia en el orden en que se fueron agrupando y en el eje vertical se
es el porcentaje de la
distancia mínima en el paso, manejan las medidas de distancia (o similitud) a las que se fueron uniendo los
en relación con la distancia grupos. Si se trata de medidas de distancia el punto inicial es cero y si se trata
máxima entre observaciones de medidas de similitud el punto inicial es uno y hacia arriba irían disminuyendo
dentro de los datos. El los valores ya que serian menos parecidos los elementos que se van agrupando
patrón de cómo los valores conforme se avanza en el proceso de agrupamiento.
de similitud o de distancia
cambian de paso a paso El dendrograma esta formado por rectángulos que unen a los elementos
puede ayudar a elegir la agrupados con sus esquinas inferiores y su altura indica el grado de distancia a
agrupación final. El paso
la cual se unieron dichos elementos.
donde los valores cambian
de manera abrupta podría
identificar un buen punto Es importante señalar que en el dendograma no deben cruzarse las líneas que
para cortar el dendrograma, indican los agrupamientos.
si esto tiene sentido para sus
datos. Mientras a mayor altura se realiza la unión de elementos para formar un grupo,
es mayor la diferencia entre ellos (en similitud, es menor la similitud a mayor
Después de elegir dónde se altura).
desea realizar la partición, se
vuelve a ejecutar el Mediante este dendrograma se puede determinar tentativamente en cuantos
procedimiento del grupos o conglomerados se unieron los elementos.
conglomerado, utilizando, o
bien el Número de
Como criterio general si se decide dejar todos los elementos en un solo grupo no
conglomerados o Nivel de
similitud para obtener un tiene caso, porque resume demasiado las características de los elementos. Si se
número establecido de decide dejar como solución a dos grupos, el agrupamiento se realizó a una

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________194


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

conjuntos o un Nivel de distancia muy alta, lo que indicaría es que en realidad los elementos que quedan
similitud para cortar el en cada grupo no son muy similares.
dendrograma.Se examinan
los conglomerados
resultantes en la partición
final para observar si la
agrupación parece lógica. La
observación de
dendrogramas para
determinar diferentes
agrupaciones finales puede
ayudar a decidir cuáles de
ellas tienen más sentido para
los datos.

2.2.1.1 EJEMPLO ILUSTRATIVO

EJEMPLO
ILUSTRATIVO
Con el fin de incrementar el confort de las diferentes piezas para vestir, los
2.2.1.1 industriales de la confección desean desarrollar un sistema de patronaje y tallas
ANÁLISIS DE flexibles, pero con medidas reales del cuerpo de los hombres mexicanos,
CONGLOMERADOS. experimentado de mejor manera con la elongación de músculos y la elasticidad
MATRIZ DE de alguna fibras . El estudio antropométrico contempló 3 indicadores útiles para
DISTANCIA. diseñar y fabricar piezas de vestir, la estatura, el peso y la cintura de cinco
personas del género FEMENINO cuyos resultados se presentan a continuación:

Persona Altura (mts.) Peso (Kg.) Cintura (cms)

1 1.52 57.12 84.10

2 1.67 76.85 86.20

3 1.54 67.62 85.22

4 1.56 49.35 83.60

5 1.63 87.22 87.52

Promedio: 1.58 67.63 85.33

Desviación
estándar 0.06 15.11 1.59

a) Obtenga la pareja de personas más parecidas y la menos parecida.


b) Se le pide realice un agrupamiento jerárquico aglomerativo con los tres

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________195


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

eslabonamientos simple, completo y promedio y represente cada


procedimiento en un dendograma. Establezca la solución óptima.
c) Proponga un nombre tentativo a cada uno de los conglomerados
conforme a la solución establecida.

Resolución del inciso a)

Estandarización de variables

Antes que nada hay que se deben estandarizar las variables, es decir, eliminar el
efecto de las unidades y hacerlas comparables, de manera que todas estén en
términos de “Z” mediante la siguiente expresión:

𝑥 − 𝑥̅
𝑍=
𝑠
1.52 − 1.58 57.12 − 67.63 84.10 − 85.33
𝑍&& = = −1.00 𝑍&" = = −.70 𝑍&# = = −.77
. 06 15.11 1.59

1.67 − 1.58 76.85 − 67.63 86.20 − 85.33


𝑍"& = = 1.50 𝑍"" = = .61 𝑍"# = = .55
. 06 15.11 1.59

1.54 − 1.58 67.62 − 67.63 85.22 − 85.33


𝑍#& = = −0.67 𝑍#" = = 0.00 𝑍## = = −.07
. 06 15.11 1.59

1.56 − 1.58 49.35 − 67.63 83.60 − 85.33


𝑍'& = = −0.33 𝑍'" = = −1.21 𝑍'# = = −1.09
. 06 15.11 1.59

1.63 − 1.58 87.22 − 67.63 87.52 − 85.33


𝑍1& = = .83 𝑍1" = = 1.30 𝑍1# = = 1.38
. 06 15.11 1.59

Los datos estandarizados de las 5 personas, al considerar 3 variables, se


presenta de la siguiente manera:

Persona Altura Peso Cintura


estandarizad estandarizad estandarizad
a o a
1 - 1.00 0.70 -0 .77
2 1.50 0.61 0.55
3 - 0.67 0.00 - 0.07
4 - 0.33 - 1.21 - 1.09
5 0.83 1.30 1.38
Promedio: 0.00 0.00 0.00
Desviación 1.00 1.00 1.00
estándar

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________196


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Cálculo de las distancias:

:
0.5
𝑑7• = `‘(𝑥7’ − 𝑥•’ )" e
s“&

0.5
𝑑&," = [(−1.00 − 1.50)" + (−.70 − .61)" + (−.77 − .55)" ] = 3.12

0.5
𝑑&,# = [(−1.00 − (−0.67))" + (−.70 − 0.00)" + (−.77 − (−.07))" ] = 1.04

0.5
𝑑&,' = [(−1.00 − (−0.33))" + (−.70 − (−1.21))" + (−.77 − (−1.09))" ] = .90

0.5
𝑑&,1 = [(−1.00 − .83)" + (−.70 − 1.30)" + (−.77 − 1.38)" ] = 3.46

0.5
𝑑",# = [(1.50 − (−0.67))" + (.61 − 0.00)" + (.55 − (−07))" ] = 2.34

0.5
𝑑",' = [(1.50 − (−0.33))" + (.61 − (−1.21))" + (.55 − (−1.09))" ] = 3.06

0.5
𝑑",1 = [(1.50 − .83)" + (.61 − 1.30)" + (.55 − 1.38)" ] = 1.27

0.5
𝑑#,' = [(−0.67 − (−0.33))" + (0.00 − (−1.21))" + (−.07 − (−1.09))" ] = 1.62

0.5
𝑑#,1 = [(−0.67 − .83)" + (0.00 − 1.30)" + (−.07 − 1.38)" ] = 2.46

0.5
𝑑',1 = [(−0.33 − .83)" + (−1.21 − 1.30)" + (−1.09 − 1.38)" ] = 3.71

Con la información anterior se construye una matriz cuadrada en este caso de 5


x 5 ya que tenemos 5 personas a la que le nombraremos matriz de distancia
la cual representa que tan parecidas son las personas con respecto a la
distancia entre ellas.

1 2 3 4 5

1 0 3.12 1.04 0.90 3.46

2 3.12 0 2.34 3.06 1.27

3 1.04 2.34 0 1.62 2.46

4 0.90 3.06 1.62 0 3.71

5 3.46 1.27 2.46 3.71 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________197


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Como esta matriz es una matriz espejo, es decir la matriz superior es igual a la
matriz inferior y la diagonal contiene ceros ya que la distancia que hay al
comparar una persona consigo misma es nula, sólo será necesario utilizar la
información de la matriz inferior como se muestra a continuación:

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0
Métodos de
eslabonamiento 4 0.90 3.06 1.62 0

El método de 5 3.46 1.27 2.46 3.71 0


eslabonamiento que se elija
determinará cómo se define
la distancia entre dos
conglomerados. En cada
etapa de la amalgamación,
los dos conglomerados más Al observar la matriz de distancia se puede entonces contestar lo planteado en
cercanos se unen. Al el inciso a) con respecto a las personas más parecidas y las menos parecidas, en
comienzo, cuando cada este caso la pareja de personas más parecidas es aquella cuya distancia entre sí
observación constituye un es la menor que está formada por las personas 1 y 4, con una medida de
conglomerado, la distancia
distancia de 0.90 y la menos parecida será aquella cuya distancia entre sí es la
entre los conglomerados es
simplemente la distancia
mayor que está formada por las personas 4 y 5, con una medida de distancia de
entre las observaciones. 3.71.
Posteriormente, después de
que se unifican las
observaciones, es necesaria
una regla de eslabonamiento
para calcular las distancias
entre conglomerados,
1 2 3 4 5
cuando hay múltiples
observaciones en un
conglomerado. 1 0

Se recomienda probar con 2 3.12 0


varios métodos de
eslabonamiento y comparar 3 1.04 2.34 0
los resultados. Dependiendo
de las características de los
datos, algunos métodos 4 0.90 3.06 1.62 0
pueden proveer "mejores"
resultados que otros. 5 3.46 1.27 2.46 3.71 0

· Con el eslabonamiento
simple, o del "vecino más
cercano", la distancia entre
dos conglomerados es la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________198


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

distancia mínima entre una Resolución al inciso b)


observación en un
conglomerado y una
observación en el otro Vinculación o eslabonamiento:
conglomerado. El
eslabonamiento simple es 1. Eslabonamiento Simple:
una opción apropiada
cuando los conglomerados
están claramente separados. Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
Cuando las observaciones siguientes pasos:
están cerca entre sí, el
eslabonamiento simple Paso 1. Agrupar. Reducir la matriz con la distancia menor, es decir elegir los
tiende a identificar elementos más parecidos para formar el primer conglomerado.
conglomerados largos
similares a cadenas que
pueden tener una separación
relativamente grande entre
Paso 2. Eslabonar. Llenar la matriz con la distancia menor, o sea contrastar las
observaciones en cualquier distancias de los elementos agrupados con el resto de los elementos.
extremo de la cadena.

Paso 1. Agrupar

Como en este ejemplo se utilizan distancias, los elementos más parecidos se


elegirán con la distancia menor, que en este caso es 0.90

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 0.90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

Una vez seleccionada la distancia de los elementos que se van a agrupar, se


determina quiénes son las personas; al seguir por renglón y columna vemos que
son las personas 1 y 4, como se muestra en la siguiente matriz inferior:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________199


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 0.90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

El nuevo conglomerado (1,4) se pone en primer lugar dentro de la nueva matriz,


cuyas dimensiones ahora son reducidas de 5 x 5 a 4 x 4, como se muestra a
continuación:

(1,4) 2 3 5

(1,4) 0

2 0

3 0

5 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
distancia menor, es decir se compara al nuevo conglomerado (1,4) con el resto
de las personas; al comparar (1,4) con la persona 2 se debe verificar en la
matriz anterior las distancias entre la persona 2 con la 1 que es 3.11 y la de la
persona 2 con la 4 que es 3.06, eligiendo entonces la distancia menor de las dos
personas que en este caso es 3.06. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 3.12
La distancia 2 la menor es 3.06
con 4 es de 3.06
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________200


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.06 0

3 0

5 0

Repetimos el mismo criterio para eslabonar la persona 3 con la pareja de


personas (1,4); al comparar (1,4) con la persona 3 se debe verificar en la matriz
anterior las distancias entre las persona 3 con 1 que es 1.04 y la de la personas
3 con 4 que es 1.62, eligiendo entonces la distancia menor de las dos personas
que en este caso es 1.04. Lo anterior se puede resumir con el siguiente
diagrama de flujo:

con 1 es de 1.04
La distancia 3 la menor es 1.04
con 4 es de 1.62
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.06 0

3 1.04 0

5 0

Utilizamos finalmente el mismo criterio para eslabonar la persona 5 con la pareja


de personas (1,4); al comparar (1,4) con la persona 5 se debe verificar en la
matriz anterior las distancias entre las persona 5 con 1 que es 3.46 y la de la
personas 5 con 4 que es 3.70, eligiendo entonces la distancia menor de las dos
personas que en este caso es 3.46. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________201


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

con 1 es de 3.46
La distancia 5 la menor es 3.46
con 4 es de 3.70
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.06 0

3 1.04 0

5 3.46 0

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original.

(1,4) 2 3 5

(1,4) 0

2 3.06 0

3 1.04 2.34 0

5 3.46 1.27 2.46 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, que en este caso sería la persona 3 que se
eslabonaría al conglomerado formado por las personas (1,4) con la distancia
menor de 1.04 como se muestra a continuación:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________202


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

(1,4) 2 3 5

(1,4) 0

2 3.06 0

3 1.04 2.34 0

5 3.46 1.27 2.46 0

La nueva matriz se reduce de 4 x 4 a una de 3 x 3 de la siguiente manera:


(1,4,3) 2 5

(1,4,3) 0

2 0

5 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
distancia menor, es decir se compara al conglomerado (1,4,3) con el resto de
las personas; al comparar (1,4) con la persona 2 se debe verificar en la matriz
anterior las distancias entre la persona 2 con las 1 y 4 que es 3.06 y la de la
persona 2 con la 3 que es 2.34, eligiendo entonces la distancia menor de las
dos combinaciones o tres personas que en este caso es 2.34. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 1,4 es de 3.06


La distancia 2 la menor es 2.34
con 3 es de 2.34
La

El valor eslabonado se coloca en la matriz reducida


(1,4,3) 2 5

(1,4,3) 0

2 2.34 0

5 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________203


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Repetimos el mismo criterio para eslabonar la persona 5 con el conglomerado


(1,4,3); al comparar (1,4,3) con la persona 5 se debe verificar en la matriz
anterior las distancias entre las persona 5 con las personas 1 y 4 que es 1.4 y
la de la personas 5 con la 3 que es 2.46, eligiendo entonces la distancia menor
de las dos combinaciones o tres personas que en este caso es 2.46. Lo anterior
se puede resumir con el siguiente diagrama de flujo:

con 1,4 es de 3.46


La distancia 5 la menor es 2.46
con 3 es de 2.46
La

El valor eslabonado se coloca en la matriz reducida

(1,4,3) 2 5

(1,4,3) 0

2 2.34 0

5 2.46 0

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original.

(1,4,3) 2 5

(1,4,3) 0

2 2.34 0

5 2.46 1.27 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, que en este caso serían las personas 2 y 5 para
formar un nuevo conglomerado con la distancia menor de 1.27 como se muestra
a continuación:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________204


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

(1,4,3) 2 5

(1,4,3) 0

2 2.34 0

5 2.46 1.27 0

La nueva matriz se reduce de 3 x 3 a una de 2 x 2 de la siguiente manera:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
distancia menor, es decir se compara al conglomerado (1,4,3) con el resto de
las personas; al comparar (1,4,3) con la persona 2 se debe verificar en la matriz
anterior las distancias entre la persona 2 con las personas (1,3,4) que es 2.34 y
la de la persona 5 con las (1,3,4) que es 2.46, eligiendo entonces la distancia
menor de las dos combinaciones o tres personas que en este caso es 2.34. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 2 es de 2.34
La distancia 1,4,3 la menor es 2.34
con 5 es de 2.46
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________205


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 2.34 0

En este punto se detiene el procedimiento llegando a unir las cinco personas en


un solo grupo con una distancia de 2.34.

Tabla de eslabonamiento

La información de las etapas realizadas se puede resumir en la siguiente tabla:

Etap Número de Nivel de Personas Nuevo


a conglomera distancia incorporadas conglomera
dos do
1 4 0.90 1 4 1
2 3 1.04 1 3 1
3 2 1.27 2 5 2
4 1 2.34 1 2 1

En la tabla anterior se presenta en la primera columna el número de etapas que


se realizaron, la cual se puede calcular como el número de elementos menos
uno, es decir como tenemos cinco personas menos uno nos dan cuatro etapas.
La segunda columna no muestra la reducción de la matriz principal que era de 5
x 5 y que en la primera etapa quedó reducida a una matriz de 4 x 4 y así
sucesivamente. La tercera columna nos muestra el valor de la distancia a la que
se eslabonaron las dos primeras personas presentadas en la columna 4 que en
este caso fueron la 1 y la 4 y en la quinta columna nos señala la formación del
primer conglomerado. En la etapa 2 se incorporó la persona 3 al primer
conglomerado formado por las personas 1 y 4 como se muestra en la columna 4
a una distancia de 1.04. En la etapa 3 se forma un nuevo conglomerado como
se aprecia en la columna 5 formado por las personas 2 y 5 a una distancia de
1.27 y finalmente en la etapa 4 se eslabonaron ambos conglomerados a una
distancia final de 2.34. Minitab presenta la misma información en una tabla
semejante haciendo hincapié que debido a que sólo se tomaron dos decimales
para desarrollar el problema los resultados de Minitab pueden variar
sensiblemente.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________206


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Variables estandarizadas, Distancia euclediana, Enlace simple


Pasos de amalgamación

Número de Nivel de Nivel de Conglomerados Nuevo


Paso conglomerados semejanzal distancia incorporados conglomerado
1 4 76.3492 0.87219 1 4 1
2 3 71.8157 1.03937 1 3 1
3 2 66.1312 1.24900 2 5 2
4 1 39.6809 2.22443 1 2 1

Dendograma
El dendrograma completo
(diagrama de árbol) es una El dendograma es un gráfico formado por rectángulos que unen a los elementos
representación gráfica de la agrupados en el eje horizontal y su altura en el eje vertical indica el valor de
conformación en amalgama distancia a la cual se unieron dichos elementos.
de observaciones o variables
en un solo conglomerado. Es importante señalar que en el dendograma no deben cruzarse las líneas que
Cortar el dendrograma es indican los eslabonamientos para lo cual es conveniente construirlo conforme a
similar a trazar una línea a lo
los elementos que forman cada conglomerado en nuestro caso el conglomerado
largo del dendrograma para
especificar la agrupación 1 está formado por las personas (1,4,3) y el conglomerado 2 por las personas
final. (2,5).

Cabe mencionar que mientras a mayor distancia se realiza el eslabonamiento de


los elementos para formar un conglomerado, es mayor la diferencia entre ellos.

Ejemplo ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Simple

2.22
Distancia de eslabonamiento

1.48

0.74

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti
¿Cómo se sabe dónde cortar
el dendrograma? Primero
convendría que se ejecute
un análisis del conglomerado
sin especificar la partición Numero de conglomerados a dejar como solución
final. Se examinen los
resultados de los niveles de ¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una
similitud y de distancia y en agrupación útil depende por completo de su situación particular, debe
el dendrograma. El nivel de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________207


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

similitud en cualquier paso especificar los criterios para colocar la partición final. Puede definir la colocación
es el porcentaje de la basándose en el número de grupos que desee obtener o por el nivel de distancia
distancia mínima en el paso, que requiere dentro de los conglomerados. Examine los niveles de distancia en
en relación con la distancia
los resultados de la tabla de eslabonamiento resumen y en el dendograma. La
máxima entre observaciones
dentro de los datos. El
distancia de eslabonamiento en cualquier etapa es el valor de la distancia
patrón de cómo los valores mínima en la etapa, en relación con la distancia máxima entre observaciones
de similitud o de distancia dentro de los datos. El patrón de cómo los valores de distancia cambian de paso
cambian de paso a paso a paso puede ayudar a elegir la agrupación final. El paso donde los valores
puede ayudar a elegir la cambian de manera abrupta podría identificar un buen punto para cortar el
agrupación final. El paso dendograma, si esto tiene sentido para sus datos. En este caso entre la etapa 3
donde los valores cambian y 4 los valores de distancia cambian abruptamente de 1.27 a 2.34 cuando se
de manera abrupta podría unen ambos grupos, por lo tanto, la solución más factible parece ser la de 2
identificar un buen punto
conglomerados (1,4,3) y (2,5).
para cortar el dendrograma,
si esto tiene sentido para sus
datos

· Con el eslabonamiento 2. Eslabonamiento Completo:


completo, o "del vecino más
lejano", la distancia entre Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
dos conglomerados es la
siguientes pasos:
distancia máxima entre una
observación en un
conglomerado y una Paso 1. Agrupar. Reducir la matriz con la distancia menor, es decir elegir los
observación en el otro elementos más parecidos para formar el primer conglomerado.
conglomerado. Este método
garantiza que todas las Paso 2. Eslabonar. Llenar la matriz con la distancia mayor, o sea contrastar las
observaciones en un distancias de los elementos agrupados con el resto de los elementos.
conglomerado se encuentren
dentro de una distancia
máxima y tiende a producir
Paso 1. Agrupar
conglomerados con
diámetros similares. Los
resultados pueden ser Como en este ejemplo se utilizan distancias, las personas más parecidas se
sensibles a valores atípicos. elegirán con la distancia menor, que en este caso es 0.90

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 .90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________208


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Una vez seleccionada la distancia de los elementos que se van a agrupar, se


determina quiénes son las personas; al seguir por renglón y columna vemos
que son las personas 1 y 4, como se muestra en la siguiente matriz inferior:

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 0.90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

El nuevo conglomerado (1,4) se pone en primer lugar dentro de la nueva matriz,


cuyas dimensiones ahora son reducidas de 5 x 5 a 4 x 4, como se muestra a
continuación:

(1,4) 2 3 5

(1,4) 0

2 0

3 0

5 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
distancia mayor, es decir se compara al nuevo conglomerado (1,4) con el resto
de las personas; al comparar (1,4) con la persona 2 se debe verificar en la
matriz anterior las distancias entre la persona 2 con la 1 que es 3.12 y la de la
persona 2 con la 4 que es 3.06, eligiendo entonces la distancia mayor de las dos
personas que en este caso es 3.12. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 3.12
La distancia 2 la mayor es 3.12
con 4 es de 3.06
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________209


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.12 0

3 0

5 0

Repetimos el mismo criterio para eslabonar a la persona 3 con la pareja de


personas (1,4); al comparar (1,4) con la persona 3 se debe verificar en la matriz
anterior las distancias entre las personas 3 con 1 que es 1.04 y la de la personas
3 con 4 que es 1.62, eligiendo entonces la distancia mayor de las dos personas
que en este caso es 1.62. Lo anterior se puede resumir con el siguiente
diagrama de flujo:

con 1 es de 1.04
La distancia 3 la mayor es 1.62
con 4 es de 1.62
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.12 0

3 1.62 0

5 0

Utilizamos finalmente el mismo criterio para eslabonar la persona 5 con la


pareja de personas (1,4); al comparar (1,4) con la persona 5 se debe verificar
en la matriz anterior las distancias entre las persona 5 con 1 que es 3.46 y la de
la personas 5 con 4 que es 3.71, eligiendo entonces la distancia mayor de las
dos personas que en este caso es 3.71. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 3.46
La distancia 5 la menor es 3.71
con 4 es de 3.71
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________210


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.12 0

3 1.62 0

5 3.71 0

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original.

(1,4) 2 3 5

(1,4) 0

2 3.12 0

3 1.62 2.34 0

5 3.71 1.27 2.46 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado. En este caso se forma un nuevo conglomerado con
las personas 2 y 5 con una distancia de 1.27 como se muestra a continuación:

(1,4) 2 3 5

(1,4) 0

2 3.12 0

3 1.62 2.34 0

5 3.71 1.27 2.46 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________211


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

La nueva matriz se reduce de 4 x 4 a una de 3 x 3 de la siguiente manera:

(1,4) (2,5) 3

(1,4) 0

(2,5) 0

3 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
distancia mayor, es decir se compara al conglomerado (1,4) con el resto de las
personas; al comparar (1,4) con la persona 2 se debe verificar en la matriz
anterior las distancias entre el conglomerado (1,4) con la persona 2 que es 3.12
y al conglomerado (1,4) con la de la persona 5 que es 3.71, eligiendo entonces
la distancia mayor de las dos combinaciones o tres personas que en este caso
es 3.71. Lo anterior se puede resumir con el siguiente diagrama de flujo:

con 2 es de 3.11
La distancia 1,4 la mayor es 3.71
con 5 es de 3.71
La

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.71 0

3 0

Repetimos el mismo criterio para eslabonar la persona 3 con el conglomerado


(1,4); al comparar (1,4) con la persona 3 se debe verificar en la matriz anterior
las distancias entre la persona 3 con la persona 1 que es 0.90 y la de la
persona 3 con la 4 que es 1.62, eligiendo entonces la distancia mayor de las dos
combinaciones o tres personas que en este caso es 1.62. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 1 es de 0.90
La distancia 3 la mayor es 1.62
con 4 es de 1.62
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________212


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.71 0

3 1.62 0

Repetimos el mismo criterio para eslabonar la persona 3 con el conglomerado


(2,5); al comparar (2,5) con la persona 3 se debe verificar en la matriz anterior
las distancias entre la persona 3 con la persona 2 que es 2.34 y la de la
personas 3 con la 5 que es 2.46, eligiendo entonces la distancia mayor de las
dos combinaciones o tres personas que en este caso es 2.46. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 2 es de 2.34
La distancia 3 la mayor es 2.46
con 5 es de 2.46
La

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.71 0

3 1.62 2.46 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona a un
conglomerado ya formado, que en este caso sería la persona 3 que se
eslabonaría al conglomerado formado por las personas (1,4) con la distancia
menor de 1.62 como se muestra a continuación:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________213


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.71 0

3 1.62 2.46 0

La nueva matriz se reduce de 3 x 3 a una de 2 x 2 de la siguiente manera:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
distancia mayor, es decir se compara al conglomerado (1,4,3) con el
conglomerado (2,5); al comparar (1,4,3) con el conglomerado (2,5) las personas
2 y 5 se debe verificar en la matriz anterior las distancias entre las personas 2
y 5 con las personas (1,4) que es 3.71 y las personas 2 y 5 con la persona 3
que es 2.46, eligiendo entonces la distancia mayor de las dos combinaciones o
cinco personas que en este caso es 3.71. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1,4 es de 3.71


La distancia 2,5 la mayor es 3.71
con 3 es de 2.46
La

El valor eslabonado se coloca en la matriz reducida:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 3.71 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________214


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En este punto se detiene el procedimiento llegando a unir a las cinco personas


en un solo grupo con una distancia de 3.71.

Tabla de eslabonamiento

La información de las etapas realizadas se puede resumir en la siguiente tabla:

Etapa Número de Nivel de Personas Nuevo


conglomerad distancia incorporadas conglomerad
os o
1 4 0.90 1 4 1
2 3 1.27 2 5 2
3 2 1.62 1 3 1
4 1 3.71 1 2 1

En la tabla anterior se presenta en la primera columna el número de etapas


que se realizaron, la cual se puede calcular como el número de elementos
menos uno, es decir como tenemos cinco personas menos uno nos dan cuatro
etapas. La segunda columna nos muestra la reducción de la matriz principal
que era de 5 x 5 y que en la primera etapa quedó reducida a una matriz de 4 x
4 y así sucesivamente. La tercera columna nos muestra el valor de la distancia
a la que se eslabonaron las dos primeras personas presentadas en la columna
4 que en este caso fueron la 1 y la 4 a una distancia de 0.90 y en la quinta
columna nos señala la formación del primer conglomerado. En la etapa 2 se
formó un segundo conglomerado eslabonando a las personas 2 y 5 a una
distancia de 1.27 como se muestra en quinta columna. En la etapa 3 se
eslabonó a la persona 3 al primer conglomerado formado por las personas 1 y 4
a una distancia de 1.62 y finalmente en la etapa 4 se eslabonaron ambos
conglomerados a una distancia final de 3.71. Minitab presenta la misma
información en una tabla semejante haciendo hincapié que debido a que sólo se
tomaron dos decimales para desarrollar el problema a mano, los resultados de
Minitab pueden variar sensiblemente.

Variables estandarizadas, Distancia euclediana, Enlace completo


Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 56.2472 1.61350 1 3 1 3
4 1 0.0000 3.68777 1 2 1 5
Dendograma

El dendograma es un gráfico formado por rectángulos que unen a los elementos


agrupados en el eje horizontal y su altura en el eje vertical indica el valor de
distancia a la cual se unieron dichos elementos.

Es importante señalar que en el dendograma no deben cruzarse las líneas que


indican los eslabonamientos para lo cual es conveniente construirlo conforme a

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________215


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

los elementos que forman cada conglomerado en nuestro caso el conglomerado


1 está formado por las personas (1,4,3) y el conglomerado 2 por las personas
(2,5).

Cabe mencionar que mientras a mayor distancia se realiza el eslabonamiento de


El dendrograma completo los elementos para formar un conglomerado, es mayor la diferencia entre ellos.
(diagrama de árbol) es una
representación gráfica de la
conformación en amalgama
de observaciones o variables
Ejemplo ilustrativo 1. Dendograma de datos antropométricos
en un solo conglomerado.
Eslabonamiento Completo
Cortar el dendrograma es
similar a trazar una línea a lo
largo del dendrograma para 3.69
Distancia de eslabonamiento

especificar la agrupación
final.

2.46

1.23

¿Cómo se sabe dónde cortar


el dendrograma? Primero
convendría que se ejecute 0.00
1 4 3 2 5
un análisis del conglomerado
Personas del género FEMENINO
sin especificar la partición
final. Se examinen los Elaboró: M. en Admón. Javier Bech Vertti
resultados de los niveles de
similitud y de distancia y en
el dendrograma. El nivel de
similitud en cualquier paso Numero de conglomerados a dejar como solución
es el porcentaje de la
distancia mínima en el paso, ¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una
en relación con la distancia agrupación útil depende por completo de su situación particular, debe
máxima entre observaciones
especificar los criterios para colocar la partición final. Puede definir la colocación
dentro de los datos. El
patrón de cómo los valores basándose en el número de grupos que desee obtener o por el nivel de distancia
de similitud o de distancia que requiere dentro de los conglomerados. Examine los niveles de distancia en
cambian de paso a paso los resultados de la tabla de eslabonamiento resumen y en el dendograma. La
puede ayudar a elegir la distancia de eslabonamiento en cualquier etapa es el valor de la distancia
agrupación final. El paso mínima en la etapa, en relación con la distancia máxima entre observaciones
donde los valores cambian dentro de los datos. El patrón de cómo los valores de distancia cambian de paso
de manera abrupta podría a paso puede ayudar a elegir la agrupación final. El paso donde los valores
identificar un buen punto cambian de manera abrupta podría identificar un buen punto para cortar el
para cortar el dendrograma,
dendograma, si esto tiene sentido para sus datos. En este caso entre la etapa 3
si esto tiene sentido para sus
datos.
y 4 los valores de distancia cambian abruptamente de 1.62 a 3.71 cuando se
unen ambos grupos, por lo tanto, la solución más factible parece ser la de 2
conglomerados (1,4,3) y (2,5).

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________216


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

· Con el eslabonamiento 3. Eslabonamiento Promedio:


promedio, la distancia entre
dos conglomerados es la
distancia media entre una Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
observación en un siguientes pasos:
conglomerado y una
observación en el otro Paso 1. Agrupar. Reducir la matriz con la distancia menor, es decir elegir los
conglomerado. En vista de elementos más parecidos para formar el primer conglomerado.
que los métodos de
eslabonamiento simple o Paso 2. Eslabonar. Llenar la matriz con la distancia promedio, o sea contrastar
completos agrupan
las distancias de los elementos agrupados con el resto de los elementos.
conglomerados sobre la base
de distancias entre pares
individuales, el Paso 1. Agrupar
eslabonamiento promedio
utiliza una medida de Como en este ejemplo se utilizan distancias, los elementos más parecidos se
ubicación más central. elegirán con la distancia menor, que en este caso es 0.90

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 0.90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

Una vez seleccionada la distancia de los elementos que se van a agrupar, se


determina quiénes son las personas; al seguir por renglón y columna vemos que
son las personas 1 y 4, como se muestra en la siguiente matriz inferior:

1 2 3 4 5

1 0

2 3.12 0

3 1.04 2.34 0

4 0.90 3.06 1.62 0

5 3.46 1.27 2.46 3.71 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________217


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El nuevo cluster (1,4) se pone en primer lugar dentro de la nueva matriz, cuyas
dimensiones ahora son reducidas de 5 x 5 a 4 x 4, como se muestra a
continuación:

(1,4) 2 3 5

(1,4) 0

2 0

3 0

5 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento promedio, al


momento de eslabonar se debe tener cuidado de elegir la distancia promedio,
es decir se compara al nuevo conglomerado (1,4) con el resto de las personas;
al comparar (1,4) con la persona 2 se debe verificar en la matriz anterior las
distancias entre la persona 2 con la 1 que es 3.12 y la de la persona 2 con la 4
que es 3.06, eligiendo entonces la distancia promedio de las dos personas que
en este caso es 3.09. Lo anterior se puede resumir con el siguiente diagrama de
flujo:

con 1 es de 3.12
La distancia 2 el promedio es 3.09
con 4 es de 3.06
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.09 0

3 0

5 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________218


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Repetimos el mismo criterio para eslabonar la persona 3 con la pareja de


personas (1,4); al comparar (1,4) con la persona 3 se debe verificar en la matriz
anterior las distancias entre las persona 3 con 1 que es 1.04 y la de la personas
3 con 4 que es 1.62, eligiendo entonces la distancia promedio de las dos
personas que en este caso es 1.33. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 1.04
La distancia 3 el promedio es 1.33
con 4 es de 1.62
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.09 0

3 1.33 0

5 0

Utilizamos finalmente el mismo criterio para eslabonar la persona 5 con la


pareja de personas (1,4); al comparar (1,4) con la persona 5 se debe verificar
en la matriz anterior las distancias entre las persona 5 con 1 que es 3.46 y la de
la personas 5 con 4 que es 3.71, eligiendo entonces la distancia promedio de las
dos personas que en este caso es 3.58. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 3.46
La distancia 5 el promedio es 3.58
con 4 es de 3.71
La

El valor eslabonado se coloca en la matriz reducida

(1,4) 2 3 5

(1,4) 0

2 3.09 0

3 1.33 0

5 3.58 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________219


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original.

(1,4) 2 3 5

(1,4) 0

2 3.09 0

3 1.33 2.34 0

5 3.58 1.27 2.46 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado. En este caso se forma un nuevo conglomerado con
las personas 2 y 5 a una distancia menor de 1.27 como se muestra a
continuación:

(1,4) 2 3 5

(1,4) 0

2 3.09 0

3 1.33 2.34 0

5 3.58 1.27 2.46 0

La nueva matriz se reduce de 4 x 4 a una de 3 x 3 de la siguiente manera:

(1,4) (2,5) 3

(1,4) 0

(2,5) 0

3 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________220


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento promedio, al


momento de eslabonar se debe tener cuidado de elegir la distancia promedio,
es decir se compara al conglomerado(1,4) con las personas del conglomerado
(2,5); al comparar (1,4) con la persona 2 se debe verificar en la matriz anterior
las distancias entre las persona (1,4) y la persona 2 que es 3.09 y la de las
personas (1,4) con la persona 5 que es 3.58, eligiendo entonces la distancia
promedio de las dos combinaciones o cuatro personas que en este caso es
3.34. Lo anterior se puede resumir con el siguiente diagrama de flujo:

con 2 es de 3.09
La distancia 1,4 El promedio es 3.34
con 5 es de 3.58
La

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.34 0

3 0

Repetimos el mismo criterio para eslabonar a la persona 3 con el conglomerado


(1,4); al comparar (1,4) con la persona 3 se debe verificar en la matriz anterior
las distancias entre las persona 3 con las personas 1 y 4 que es 1.04 y la de la
personas 3 con la 4 que es 1.62, eligiendo entonces la distancia promedio de las
dos combinaciones o tres personas que en este caso es 1.33. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 1 es de 1.04
La distancia 3 El promedio es 1.33
con 4 es de 1.62
La

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.34 0

3 1.33 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________221


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Repetimos el mismo criterio para eslabonar a la persona 3 con el conglomerado


(2,5); al comparar (2,5) con la persona 3 se debe verificar en la matriz anterior
las distancias entre las persona 3 con la persona 2 que es 2.34 y la de la
personas 3 con la 5 que es 2.45, eligiendo entonces la distancia promedio de las
dos combinaciones o tres personas que en este caso es 2.40. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 2 es de 2.34
La distancia 3 El promedio es 2.40
con 5 es de 2.46
La

El valor eslabonado se coloca en la matriz reducida

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.34 0

3 1.33 2.40 0

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, que en este caso sería la persona 3 para eslabonarse
al conglomerado formado por las personas (1,4) con la distancia menor de 1.33
como se muestra a continuación:

(1,4) (2,5) 3

(1,4) 0

(2,5) 3.34 0

3 1.33 2.40 0

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________222


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

La nueva matriz se reduce de 3 x 3 a una de 2 x 2 de la siguiente manera:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 0

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento promedio, al


momento de eslabonar se debe tener cuidado de elegir la distancia promedio,
es decir se compara al conglomerado (1,4,3) con el resto de las personas del
conglomerado (2,5); al comparar (2,5) con las personas (1,4,3) se debe
verificar por única vez en la primera matriz de distancias entre las
personas 1,4 y 3 con las personas 2,5, eligiendo entonces la distancia promedio
de las seis combinaciones o cinco personas que en este caso es 3.02. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 2 es de 3.12.
La distancia 1 19
con 5 es de 3.46

con 2 es de 3.06
La distancia 4 El promedio es 3.02
con 5 es de 3.71
La

con 2 es de 2.34
La distancia 3
con 5 es de 2.46

El valor eslabonado se coloca en la matriz reducida:

(1,4,3) (2,5)

(1,4,3) 0

(2,5) 3.02 0

En este punto se detiene el procedimiento llegando a unir las cinco personas en


un solo grupo con una distancia de 2.87.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________223


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Tabla de eslabonamiento

La información de las etapas realizadas se puede resumir en la siguiente tabla:

Etapa Número de Nivel de Personas Nuevo


conglomerad distancia incorporadas conglomerad
os o
1 4 0.90 1 4 1
2 3 1.27 2 5 2
3 2 1.33 1 3 1
4 1 3.02 1 2 1

En la tabla anterior se presenta en la primera columna el número de etapas


que se realizaron, la cual se puede calcular como el número de elementos
menos uno, es decir como tenemos cinco personas menos uno nos dan cuatro
etapas. La segunda columna nos muestra la reducción de la matriz principal
que era de 5 x 5 y que en la primera etapa quedó reducida a una matriz de 4 x
4 y así sucesivamente. La tercera columna nos muestra el valor de la distancia
a la que se eslabonaron las dos primeras personas presentadas en la cuarta
columna que en este caso fueron la 1 y la 4 a una distancia de 0.90 y en la
quinta columna nos señala el número de conglomerado formado. En la etapa
2 se formó un segundo conglomerado eslabonando a las personas 2 y 5 a una
distancia de 1.27 como se muestra en quinta columna. En la etapa 3 se
eslabonó a la persona 3 al primer conglomerado formado por las personas 1 y 4
a una distancia de 1.33 y finalmente en la etapa 4 se eslabonaron ambos
conglomerados a una distancia final de 3.02 Minitab presenta la misma
información en una tabla semejante haciendo hincapié que debido a que sólo se
tomaron dos decimales para desarrollar el problema a mano, los resultados de
Minitab pueden variar sensiblemente.

Variables estandarizadas, Distancia euclediana, Enlace de promedios


Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 64.0314 1.32644 1 3 1 3
4 1 19.8532 2.95563 1 2 1 5

Dendograma

El dendograma es un gráfico formado por rectángulos que unen a los elementos


agrupados en el eje horizontal y su altura en el eje vertical indica el valor de
distancia a la cual se unieron dichos elementos.

Es importante señalar que en el dendograma no deben cruzarse las líneas que


indican los eslabonamientos para lo cual es conveniente construirlo conforme a
los elementos que forman cada conglomerado en nuestro caso el conglomerado
1 está formado por las personas (1,4,3) y el conglomerado 2 por las personas

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________224


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

(2,5).

El dendrograma completo
(diagrama de árbol) es una
representación gráfica de la Ejemplo Ilustrativo 1. Dendograma de datos antropométricos
conformación en amalgama Eslabonamiento Promedio
de observaciones o variables
en un solo conglomerado.
2.96
Cortar el dendrograma es

Distancia de eslabonamiento
similar a trazar una línea a lo
largo del dendrograma para
especificar la agrupación
final. 1.97

0.99

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

¿Cómo se sabe dónde cortar


Numero de conglomerados a dejar como solución
el dendrograma? Primero
convendría que se ejecute
un análisis del conglomerado ¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una
sin especificar la partición agrupación útil depende por completo de su situación particular, debe
final. Se examinen los especificar los criterios para colocar la partición final. Puede definir la colocación
resultados de los niveles de basándose en el número de grupos que desee obtener o por el nivel de distancia
similitud y de distancia y en que requiere dentro de los conglomerados. Examine los niveles de distancia en
el dendrograma. El nivel de
los resultados de la tabla de eslabonamiento resumen y en el dendograma. La
similitud en cualquier paso
es el porcentaje de la
distancia de eslabonamiento en cualquier etapa es el valor de la distancia
distancia mínima en el paso, mínima en la etapa, en relación con la distancia máxima entre observaciones
en relación con la distancia dentro de los datos. El patrón de cómo los valores de distancia cambian de paso
máxima entre observaciones a paso puede ayudar a elegir la agrupación final. El paso donde los valores
dentro de los datos. El cambian de manera abrupta podría identificar un buen punto para cortar el
patrón de cómo los valores dendograma, si esto tiene sentido para sus datos. En este caso entre la etapa 3
de similitud o de distancia y 4 los valores de distancia cambian abruptamente de 1.33 a 3.02 cuando se
cambian de paso a paso unen ambos grupos, por lo tanto, la solución más factible parece ser la de 2
puede ayudar a elegir la
conglomerados (1,4,3) y (2,5).
agrupación final. El paso
donde los valores cambian
de manera abrupta podría Respuesta al inciso c)
identificar un buen punto
para cortar el dendrograma, Nombre de los conglomerados
si esto tiene sentido para sus
datos.
Una vez elegidos el número de conglomerados definitivo, para finalizar el
proceso es deseable colocar un nombre apropiado a los conglomerados. En este
caso el conglomerado 1 está formado por las personas 1,4 y 3 y el
conglomerado 2 está formado por las personas 2 y 5. Para conocer el tipo de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________225


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

personas que se encuentran en cada conglomerado se deben obtener la media


de los datos originales de quienes la conforman variable por variable como se
muestra a continuación:

Para el conglomerado 1:

• La media de la altura es de: (1.52+1.54+1.56)/3=1.54 Mts.


• La media del peso es de: (57.12+67.62+49.35)/3=58.03 Kg.
• La media de la cintura es de: (84.10+85.22+83.60)/3=84.30 Cms.

Para el conglomerado 2:

• La media de la altura es de: (1.67+1.63)/2=1.65 Mts.


• La media del peso es de: (76.85+87.22)/2=82.03 Kg.
• La media de la cintura es de: (86.20+87.52)/2=86.86 Cms.

Los resultados del conglomerado 1 nos indican que las mujeres de este grupo
son más bajitas, más delgadas y de menor cintura que las mujeres del
conglomerados 2, por lo que un posible nombre para el conglomerado 1 podría
ser “talla pequeña” y para el conglomerado 2 “talla grande”

2.2.1.1 ACTIVIDAD DE APRENDIZAJE

ACTIVIDAD DE
APRENDIZAJE Con el fin de incrementar el confort de las diferentes piezas para vestir, los
industriales de la confección desean desarrollar un sistema de patronaje y tallas
2.2.1.1
flexibles, pero con medidas reales del cuerpo de los hombres mexicanos,
ANÁLISIS DE experimentado de mejor manera con la elongación de músculos y la elasticidad
CONGLOMERADOS. de alguna fibras . El estudio antropométrico contempló 3 indicadores útiles para
MEDIDA DE diseñar y fabricar piezas de vestir, la estatura, el peso y la cintura de cinco
DISTANCIA. personas del género MASCULINO cuyos resultados se presentan a
continuación:

Persona Altura (mts.) Peso (Kg.) Cintura (cms)

1 1.73 63.56 89.10

2 1.85 83.99 92.20

3 1.70 74.91 90.22

4 1.63 54.48 88.60

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________226


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

5 1.93 95.34 93.50

Promedio: 1.77 74.46 90.72

Desviación
estándar 0.12 16.16 2.08

a) Obtenga la pareja de personas más parecidas y la menos parecida.


b) Se le pide realice un agrupamiento jerárquico aglomerativo con los tres
eslabonamientos simple, completo y promedio y represente cada
procedimiento en un dendograma. Establezca la solución óptima.
c) Proponga un nombre tentativo a cada uno de los conglomerados
conforme a la solución establecida.

2.2.1.1 EJERCICIO DE AUTOEVALUACIÓN

A continuación se presenta un ejercicio de autoevaluación el cual pone a prueba su


comprensión del material anterior. La respuesta a este ejercicio de autoevaluación se
encuentra al final del cuaderno de trabajo en el anexo de respuestas. Le recomendamos
enfáticamente resolverlo y posteriormente revisar su respuesta como retroalimentación de
su aprendizaje

AUTOEVALUACIÓN
2.2.1.1 Suponga que se desea segmentar a los clientes de un supermercado con base a la
ANÁLISIS DE actitud que tienen cuando salen de compras. De acuerdo a una investigación
CONGLOMERADO previa, se identificaron tres variables de actitud y se pidió a los cinco
entrevistados que expresaran su grado de acuerdo con tres afirmaciones en una
S. MATRIZ DE escala de siete puntos en la cual 1 significa en desacuerdo y 7 significa de
DISTANCIA acuerdo.

Las afirmaciones podrían ser las siguientes:

V1 Salir de compras es divertido


V2 Puedo ahorrar mucho dinero si comparo precios
V3 Prefiero salir de compras con mi familia

Si los resultados para cada una de las afirmaciones se considera que son
variables, se tienen tres, las cuales se representarán con V1, V2 y V3; por otra
parte, las respuestas de cada uno de los entrevistados constituyen los cinco
casos, que se representarán con C1, C2,…,C5. Los valores de las variables para

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________227


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

los cinco casos, se presentan a continuación:

ENTREVISTA VARIABLE
DO V1 V2 V3
C1 1 2 1
C2 5 7 5
C3 2 1 1
C4 7 7 5
C5 3 2 2
Promedio: 3.6 3.8 2.8
Desviación 2.41 2.95 2.049
estándar

a) Obtenga la pareja de personas entrevistadas más parecidas y la menos


parecida.
b) Se le pide realice un agrupamiento jerárquico aglomerativo con los tres
eslabonamientos simple, completo y promedio y represente cada
procedimiento en un dendograma. Establezca la solución óptima.
c) Proponga un nombre tentativo a cada uno de los conglomerados
conforme a la solución establecida.

C.A. EJEMPLO ILUSTRATIVO EN MINITAB 17

EJEMPLO
ILUSTRATIVO Con el fin de incrementar el confort de las diferentes piezas para vestir, los
industriales de la confección desean desarrollar un sistema de patronaje y tallas
INTEGRAL EN
flexibles, pero con medidas reales del cuerpo de los hombres mexicanos,
MINITAB 17. experimentado de mejor manera con la elongación de músculos y la elasticidad de
ANÁLISIS DE alguna fibras. El estudio antropométrico contempló 3 indicadores útiles para
CONGLOMERADOS. diseñar y fabricar piezas de vestir, la estatura, el peso y la cintura de cinco
MEDIDA DE personas del género FEMENINO cuyos resultados se presentan a continuación:
DISTANCIA
Persona Altura (mts.) Peso (Kg.) Cintura (cms)

1 1.52 57.12 84.10

2 1.67 76.85 86.20

3 1.54 67.62 85.22

4 1.56 49.35 83.60

5 1.63 87.22 87.52

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________228


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Promedio: 1.58 67.63 85.33

Desviación
estándar 0.06 15.11 1.59

Se le pide realice un agrupamiento jerárquico aglomerativo con los tres


eslabonamientos simple, completo y promedio y represente cada procedimiento
en un dendograma. Establezca la solución óptima.

Solución. Eslabonamiento Simple o Individual:


· Con el eslabonamiento
simple, o del "vecino más
Método La distancia entre dos Razones para utilizar este
cercano", la distancia entre
dos conglomerados es la
conglomerados es... método
distancia mínima entre una Simple La distancia mínima entre un Más apropiado para
observación en un o elemento en un conglomerado y observaciones que están
conglomerado y una Individ un elemento en el otro claramente separadas. Cuando
observación en el otro ual conglomerado. Se conoce también están cerca, el enlace simple o
conglomerado. El como el método del "vecino más individual tiende a identificar
eslabonamiento simple es cercano" conglomerados largos similares
una opción apropiada a cadenas que pueden tener
cuando los conglomerados
una separación relativamente
están claramente separados.
Cuando las observaciones grande entre elementos en
están cerca entre sí, el cualquier extremo de la cadena.
eslabonamiento simple
tiende a identificar Cuando el número de observaciones es extenso y/o existen muchas
conglomerados largos variables, los cálculos manuales son tediosos. Existen muchos paquetes de
similares a cadenas que software que pueden mostrar los resultados entre ellos Minitab.
pueden tener una separación
relativamente grande entre
Comenzamos introduciendo los datos en la hoja de Trabajo 1 de Minitab, tal y
observaciones en cualquier
como se muestra a continuación:
extremo de la cadena. ·

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________229


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Elija de la barra menú Estadísticas> Análisis Multivariado>Conglomerado


de observaciones.

La opción de conglomerados de observaciones se utiliza para clasificar los


elementos en grupos cuando éstos se desconocen inicialmente. En Minitab este
procedimiento utiliza el método jerárquico aglomerativo que comienza con
todos los elementos separados, cada uno de ellos formando su propio
conglomerado. En el primer paso, los dos elementos más cercanos se unen entre
sí. En el siguiente paso, un tercer elemento se une a los dos primeros u otros dos
elementos se unen para formar un conglomerado diferente. Este proceso continúa
hasta que todos los conglomerados se unan en un solo conglomerado; sin
embargo, este conglomerado individual no es útil para propósitos de clasificación,
por lo tanto, usted debe decidir cuántos grupos son lógicos para sus datos y
clasificarlos adecuadamente

Aparece el siguiente cuadro de Diálogo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________230


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Matriz de distancia o variables, ingrese las tres variables dando doble click
sobre cada una de ellas o seleccione las tres y oprima el botón Seleccionar.

En Método de vinculación, elija Individual en Medición de la distancia elija


Euclidiano.

Marque la opción Estandarizar variables.

Nota: Esta opción permite convertir todas las variables a una escala común al
sustraer las medias y dividir entre la desviación estándar antes del cálculo de la
matriz de distancia sobretodo si las variables están en unidades diferentes y usted
desea minimizar el efecto de las diferencias de escala.

Marque la opción Mostrar dendograma.

Haga clic en Personalizar. Aparece el siguiente cuadro de diálogo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________231


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Título, ingrese Dendograma de datos antropométricos.

En Etiquetar el eje de Y con elija Distancia.

Haga clic en Aceptar en cada cuadro de diálogo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________232


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Salida de la ventana Sesión

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...
Variables estandarizadas, Distancia euclediana, Enlace simple
Pasos de amalgamación

Número de Nivel de Nivel de Conglomerados Nuevo


Paso conglomerados semejanzal distancia incorporados conglomerado
1 4 76.3492 0.87219 1 4 1
2 3 71.8157 1.03937 1 3 1
3 2 66.1312 1.24900 2 5 2
4 1 39.6809 2.22443 1 2 1

Interpretación de los resultados

Minitab muestra los pasos de eslabonamiento en la ventana Sesión. En cada paso,


se unen dos conglomerados (personas). La tabla muestra los conglomerados que
se unieron, la distancia entre ellos, el nivel de similitud correspondiente, el
número de identificación del conglomerado nuevo (este número siempre
corresponde al número más pequeño de los dos conglomerados que se unieron),
el número de observaciones en el conglomerado nuevo y el número de
conglomerados. El eslabonamiento continúa hasta que sólo queda un
conglomerado.

Los pasos de eslabonamiento muestran que en principio, en el paso 1, las


personas más parecidas son la 1 y la 4 y forman el primer conglomerado a una
distancia de eslabonamiento de 0.87219, posteriormente en el paso 2 se incorpora
a este conglomerado la persona 3 a una distancia de eslabonamiento de 1.03937.
En el paso 3 se observa que se forma un segundo conglomerado con las personas
2 y 5 a una distancia de eslabonamiento de 1.24900 para finalmente unirse en el
paso 4 ambos conglomerados a una distancia de eslabonamiento de 2.22443

Esto indica que tal vez dos conglomerados son razonablemente suficientes para la
partición o solución final. Si esta agrupación tiene sentido intuitivo para los datos,
entonces es probable que sea una elección apropiada.

Dendrograma

La agrupación final de conglomerados (también denominada partición final) es la


agrupación de conglomerados que, si los resultados son favorables, identificará
grupos cuyas observaciones o variables compartan características comunes. La
decisión acerca de la agrupación final también se denomina Dendograma. El
dendograma completo (diagrama de árbol) es una representación gráfica de la
conformación en amalgama de los elementos en un solo conglomerado.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________233


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Ejemplo ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Simple

2.22

Distancia de eslabonamiento
1.48

0.74

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Por opción predeterminada, el dendograma presenta el nivel de similitud en el eje


vertical (de forma alterna, como en este caso, puede mostrar el nivel de
distancia) y las diferentes observaciones se enumeran con el eje horizontal. La
gráfica muestra la manera en la cual se formaron los conglomerados, bien sea
uniendo dos observaciones individuales o pareando una observación individual con
un conglomerado existente (como en este caso la persona 3). Puede determinar
en cuáles distancias de eslabonamiento se forman los conglomerados así como la
composición de los conglomerados de la solución final.

¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una


agrupación útil depende por completo de su situación particular, debe especificar
los criterios para colocar la partición final. Puede definir la colocación basándose
en el número de grupos que desee obtener o por el nivel de distancia que
requiere dentro de los conglomerados, aunque en la práctica puede ejecutar
primero un análisis de conglomerados sin especificar una partición final con
el objeto de decidir dónde colocarla. Examine los niveles de distancia en los
resultados de la ventana Sesión y en el dendograma. Puede ver las distancias de
eslabonamiento en el dendograma colocando el puntero de su ratón sobre una
línea horizontal. La distancia de eslabonamiento en cualquier paso es el valor de la
distancia mínima en el paso, en relación con la distancia máxima entre
observaciones dentro de los datos. El patrón de cómo los valores de distancia
cambian de paso a paso puede ayudar a elegir la agrupación final. El paso donde
los valores cambian de manera abrupta podría identificar un buen punto para
cortar el dendograma, si esto tiene sentido para sus datos.

Después de elegir dónde desea realizar su partición, vuelva a ejecutar el


procedimiento del conglomerado, utilizando, el Número de conglomerados para
obtener un número establecido de conjuntos de la siguiente manera:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________234


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En la parte inicial del análisis apareció el siguiente cuadro de Diálogo:

Ahora en Especifique la partición final por, elija Número de


conglomerados e ingrese 2.

Haga clic en Aceptar en el cuadro de diálogo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________235


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Salida de la ventana Sesión

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...
Variables estandarizadas, Distancia euclediana, Enlace simple
Pasos de amalgamación

Número de Nivel de Nivel de Conglomerados Nuevo


Paso conglomerados semejanzal distancia incorporados conglomerado
1 4 76.3492 0.87219 1 4 1
2 3 71.8157 1.03937 1 3 1
3 2 66.1312 1.24900 2 5 2
4 1 39.6809 2.22443 1 2 1

Partición final
Número de conglomerados: 2

Dentro de la Distancia
suma de promedio Distancia
Número de cuadrados del desde el máxima desde
observaciones conglomerado centroide centroide
Conglomerado1 3 1.48147 0.665049 0.856782
Conglomerado2 2 0.78000 0.624502 0.624502

Cuando usted especifica la partición o solución final, Minitab muestra entre otras
una tabla adicional que resume cada conglomerado según el número de
observaciones, en este caso el primer conglomerado está formado por tres
mujeres (1,4 y 3) y el segundo conglomerado por las mujeres (2 y 5)

Dendrograma

Ejemplo ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Simple

2.22
Distancia de eslabonamiento

1.48

0.74

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________236


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Examine los conglomerados resultantes en la partición o solución final para


observar si la agrupación parece lógica (Las personas que forman cada
conglomerado aparecen con un color distinto en cada conglomerado). La
observación de dendogramas para determinar diferentes agrupaciones finales
puede ayudarle a decidir cuáles de ellas tienen más sentido para sus datos.

· Con el eslabonamiento Solución. Eslabonamiento Completo:


completo, o "del vecino más
lejano", la distancia entre Métod La distancia entre dos Razones para utilizar este
dos conglomerados es la o conglomerados es... método
distancia máxima entre una Compl La distancia máxima entre un Asegura que todos los
observación en un
eto elemento en un conglomerado y elementos en un conglomerado
conglomerado y una
observación en el otro
un elemento en el otro se encuentren dentro de una
conglomerado. Este método conglomerado. Se conoce distancia máxima y tiende a
garantiza que todas las también como el método del producir conglomerados con
observaciones en un "vecino más lejano". diámetros similares. Los
conglomerado se encuentren resultados pueden ser sensibles
dentro de una distancia a valores atípicos.
máxima y tiende a producir
conglomerados con Comenzamos introduciendo los datos en la hoja de Trabajo 1 de Minitab, tal y
diámetros similares. Los
como se muestra a continuación:
resultados pueden ser
sensibles a valores atípicos.

Elija de la barra menú Estadísticas> Análisis Multivariado>Conglomerado


de observaciones.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________237


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Aparece el siguiente cuadro de Diálogo:

En Matriz de distancia o variables, ingrese las tres variables dando doble click
sobre cada una de ellas o seleccione las tres y oprima el botón Seleccionar.

En Método de vinculación, elija Completo en Medición de la distancia elija


Euclidiano.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________238


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Marque la opción Estandarizar variables.

Marque la opción Mostrar dendograma.

Haga clic en Personalizar. Aparece el siguiente cuadro de diálogo:

En Título, ingrese Dendograma de datos antropométricos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________239


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Etiquetar el eje de Y con elija Distancia.

Haga clic en Aceptar en cada cuadro de diálogo.

Salida de la ventana Sesión

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...
Variables estandarizadas, Distancia euclediana, Enlace completo
Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 56.2472 1.61350 1 3 1 3
4 1 0.0000 3.68777 1 2 1 5

Interpretación de los resultados

Minitab muestra los pasos de eslabonamiento en la ventana Sesión. En cada paso,


se unen dos conglomerados (personas). La tabla muestra los conglomerados que
se unieron, la distancia entre ellos, el nivel de similitud correspondiente, el
número de identificación del conglomerado nuevo (este número siempre
corresponde al número más pequeño de los dos conglomerados que se unieron),
el número de observaciones en el conglomerado nuevo y el número de
conglomerados. El eslabonamiento continúa hasta que sólo queda un
conglomerado.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________240


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Los pasos de eslabonamiento muestran que en principio, en el paso 1, las


personas más parecidas son la 1 y la 4 y forman el primer conglomerado a una
distancia de eslabonamiento de 0.87219, posteriormente en el paso 2 se forma un
segundo conglomerado con las personas 2 y 5 a una distancia de eslabonamiento
de 1.24900. En el paso 3 se incorpora al primer conglomerado la persona 3 a una
distancia de eslabonamiento de 1.61350 para finalmente unirse en el paso 4
ambos conglomerados a una distancia de eslabonamiento de 3.68777.

Esto indica que tal vez dos conglomerados son razonablemente suficientes para la
partición o solución final. Si esta agrupación tiene sentido intuitivo para los datos,
entonces es probable que sea una elección apropiada.

Dendrograma

Ilustra la información en la tabla de eslabonamiento en la forma de un diagrama


de árbol.

Ejemplo ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Completo

3.69
Distancia de eslabonamiento

2.46

1.23

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Por opción predeterminada, el dendograma presenta el nivel de similitud en el eje


vertical (de forma alterna, como en este caso, puede mostrar el nivel de distancia)
y las diferentes observaciones se enumeran con el eje horizontal. La gráfica
muestra la manera en la cual se formaron los conglomerados, bien sea uniendo
dos observaciones individuales o pareando una observación individual con un
conglomerado existente (como en este caso la persona 3). Puede determinar en
cuáles distancias de eslabonamiento se forman los conglomerados así como la
composición de los conglomerados de la solución final.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________241


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una


agrupación útil depende por completo de su situación particular, debe especificar
los criterios para colocar la partición final. Puede definir la colocación basándose
en el número de grupos que desee obtener o por el nivel de distancia que
requiere dentro de los conglomerados, aunque en la práctica puede ejecutar
primero un análisis de conglomerados sin especificar una partición final con
el objeto de decidir dónde colocarla. Examine los niveles de distancia en los
resultados de la ventana Sesión y en el dendograma. Puede ver las distancias de
eslabonamiento en el dendograma colocando el puntero de su ratón sobre una
línea horizontal. La distancia de eslabonamiento en cualquier paso es el valor de la
distancia mínima en el paso, en relación con la distancia máxima entre
observaciones dentro de los datos. El patrón de cómo los valores de distancia
cambian de paso a paso puede ayudar a elegir la agrupación final. El paso donde
los valores cambian de manera abrupta podría identificar un buen punto para
cortar el dendograma, si esto tiene sentido para sus datos.

Después de elegir dónde desea realizar su partición, vuelva a ejecutar el


procedimiento del conglomerado, utilizando, el Número de conglomerados para
obtener un número establecido de conjuntos de la siguiente manera:

En la parte inicial del análisis del eslabonamiento completo apareció el siguiente


cuadro de Diálogo:

Ahora en Especifique la partición final por, elija Número de


conglomerados e ingrese 2.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________242


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Haga clic en Aceptar en el cuadro de diálogo.

Salida de la ventana Sesión

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...
Variables estandarizadas, Distancia euclediana, Enlace completo
Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 56.2472 1.61350 1 3 1 3
4 1 0.0000 3.68777 1 2 1 5

Partición final
Número de grupos: 2

Dentro de Distancia
la suma de promedio Distancia
Número de cuadrados desde el máxima desde
observaciones del grupo centroide centroide
Grupo1 3 1.48147 0.665049 0.856782
Grupo2 2 0.78000 0.624502 0.624502

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________243


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Cuando usted especifica la partición o solución final, Minitab muestra entre otras
una tabla adicional que resume cada conglomerado según el número de
observaciones, en este caso el primer conglomerado está formado por tres
mujeres (1,4 y 3) y el segundo conglomerado por las mujeres (2 y 5)

Dendrograma

Ejemplo Ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento completo

3.69
Distancia de eslabonamiento

2.46

1.23

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Examine los conglomerados resultantes en la partición o solución final para


observar si la agrupación parece lógica (Las personas que forman cada
conglomerado aparecen con un color distinto en cada conglomerado). La
observación de dendogramas para determinar diferentes agrupaciones finales
puede ayudarle a decidir cuáles de ellas tienen más sentido para sus datos.

Solución. Eslabonamiento Promedio:


· Con el eslabonamiento
promedio, la distancia entre Método La distancia entre dos Razones para utilizar este
dos conglomerados es la conglomerados es... método
distancia media entre una
Prome La distancia media entre un En vista de que los métodos de
observación en un
conglomerado y una
dio elemento en un conglomerado y enlace simples o completos
observación en el otro un elemento en el otro agrupan conglomerados sobre
conglomerado. En vista de conglomerado la base de distancias entre
que los métodos de pares individuales, el enlace
eslabonamiento simple o promedio utiliza una medida de
completos agrupan ubicación más central.
conglomerados sobre la base
de distancias entre pares Comenzamos introduciendo los datos en la hoja de Trabajo 1 de Minitab, tal y
individuales, el
como se muestra a continuación:
eslabonamiento promedio

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________244


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

utiliza una medida de


ubicación más central.

Elija de la barra menú Estadísticas> Análisis Multivariado>Conglomerado


de observaciones.

Aparece el siguiente cuadro de Diálogo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________245


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Matriz de distancia o variables, ingrese las tres variables dando doble click
sobre cada una de ellas o seleccione las tres y oprima el botón Seleccionar.

En Método de vinculación, elija Promedio en Medición de la distancia elija


Euclidiano.

Marque la opción Estandarizar variables.

Marque la opción Mostrar dendograma.

Haga clic en Personalizar. Aparece el siguiente cuadro de diálogo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________246


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En Título, ingrese Dendograma de datos antropométricos.

En Etiquetar el eje de Y con elija Distancia.

Haga clic en Aceptar en cada cuadro de diálogo.

Salida de la ventana Sesión

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________247


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...

Variables estandarizadas, Distancia euclediana, Enlace de promedios


Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 64.0314 1.32644 1 3 1 3
4 1 19.8532 2.95563 1 2 1 5

Interpretación de los resultados

Minitab muestra los pasos de eslabonamiento en la ventana Sesión. En cada paso,


se unen dos conglomerados (personas). La tabla muestra los conglomerados que
se unieron, la distancia entre ellos, el nivel de similitud correspondiente, el
número de identificación del conglomerado nuevo (este número siempre
corresponde al número más pequeño de los dos conglomerados que se unieron),
el número de observaciones en el conglomerado nuevo y el número de
conglomerados. El eslabonamiento continúa hasta que sólo queda un
conglomerado.

Los pasos de eslabonamiento muestran que en principio, en el paso 1, las


personas más parecidas son la 1 y la 4 y forman el primer conglomerado a una
distancia de eslabonamiento de 0.87219, posteriormente en el paso 2 se forma un
segundo conglomerado con las personas 2 y 5 a una distancia de eslabonamiento
de 1.24900. En el paso 3 se incorpora al primer conglomerado la persona 3 a una
distancia de eslabonamiento de 1.32644 para finalmente unirse en el paso 4
ambos conglomerados a una distancia de eslabonamiento de 2.95563

Esto indica que tal vez dos conglomerados son razonablemente suficientes para la
partición o solución final. Si esta agrupación tiene sentido intuitivo para los datos,
entonces es probable que sea una elección apropiada.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________248


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Dendrograma

Ilustra la información en la tabla de eslabonamiento en la forma de un diagrama


de árbol.

Ejemplo Ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Promedio

2.96
Distancia de eslabonamiento

1.97

0.99

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Por opción predeterminada, el dendograma presenta el nivel de similitud en el eje


vertical (de forma alterna, como en este caso, puede mostrar el nivel de
distancia) y las diferentes observaciones se enumeran con el eje horizontal. La
gráfica muestra la manera en la cual se formaron los conglomerados, bien sea
uniendo dos observaciones individuales o pareando una observación individual con
un conglomerado existente (como en este caso la persona 3). Puede determinar
en cuáles distancias de eslabonamiento se forman los conglomerados así como la
composición de los conglomerados de la solución final.

¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una


agrupación útil depende por completo de su situación particular, debe especificar
los criterios para colocar la partición final. Puede definir la colocación basándose
en el número de grupos que desee obtener o por el nivel de distancia que
requiere dentro de los conglomerados, aunque en la práctica puede ejecutar
primero un análisis de conglomerados sin especificar una partición final con
el objeto de decidir dónde colocarla. Examine los niveles de distancia en los
resultados de la ventana Sesión y en el dendograma. Puede ver las distancias de
eslabonamiento en el dendograma colocando el puntero de su ratón sobre una
línea horizontal. La distancia de eslabonamiento en cualquier paso es el valor de la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________249


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

distancia mínima en el paso, en relación con la distancia máxima entre


observaciones dentro de los datos. El patrón de cómo los valores de distancia
cambian de paso a paso puede ayudar a elegir la agrupación final. El paso donde
los valores cambian de manera abrupta podría identificar un buen punto para
cortar el dendograma, si esto tiene sentido para sus datos.

Después de elegir dónde desea realizar su partición, vuelva a ejecutar el


procedimiento del conglomerado, utilizando, el Número de conglomerados para
obtener un número establecido de conjuntos de la siguiente manera:

En la parte inicial del análisis del eslabonamiento completo apareció el siguiente


cuadro de Diálogo:

Ahora en Especifique la partición final por, elija Número de


conglomerados e ingrese 2

Haga clic en Aceptar en el cuadro de diálogo.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________250


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Salida de la ventana Sesión

Análisis de observaciones de conglomerado: Altura (mts., Peso (Kg.),


...
Variables estandarizadas, Distancia euclediana, Enlace de promedios
Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 4 76.3492 0.87219 1 4 1 2
2 3 66.1312 1.24900 2 5 2 2
3 2 64.0314 1.32644 1 3 1 3
4 1 19.8532 2.95563 1 2 1 5

Partición final
Número de grupos: 2

Dentro de Distancia
la suma de promedio Distancia
Número de cuadrados desde el máxima desde
observaciones del grupo centroide centroide
Grupo1 3 1.48147 0.665049 0.856782
Grupo2 2 0.78000 0.624502 0.624502

Cuando usted especifica la partición o solución final, Minitab muestra entre otras
una tabla adicional que resume cada conglomerado según el número de
observaciones, en este caso el primer conglomerado está formado por tres
mujeres (1,4 y 3) y el segundo conglomerado por las mujeres (2 y 5)

Dendrograma

Ejemplo Ilustrativo 1. Dendograma de datos antropométricos


Eslabonamiento Promedio

2.96
Distancia de eslabonamiento

1.97

0.99

0.00
1 4 3 2 5
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________251


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Examine los conglomerados resultantes en la partición o solución final para


observar si la agrupación parece lógica (Las personas que forman cada
conglomerado aparecen con un color distinto en cada conglomerado). La
observación de dendogramas para determinar diferentes agrupaciones finales
puede ayudarle a decidir cuáles de ellas tienen más sentido para sus datos.

2.2.1.1 EJERCICIOS DE REFUERZO

EJERCICIOS DE
REFUERZO 2.1.1.1.1. Los alumnos de mercadotecnia tienen que hacer una investigación
2.2.1.1 acerca de si trae mejores resultados el trabajo entre dos personas juntas con un
parecido en algún aspecto (en este caso calificación) que otras diferentes en tal
ANÁLISIS DE aspecto.
CONGLOMERADOS.
MEDIDA DE Persona Calificación No. 1 Calificación No. 2
DISTANCIA 1 5.5 4.9
2 9.6 6.3
3 8.1 9.8
4 3.8 7.3
5 8.6 7.0

a) Obtenga la pareja de personas más parecidas y la menos


parecida
b) Se le pide realice un agrupamiento jerárquico aglomerativo con
los tres eslabonamientos, simple, completo y promedio y
represente cada procedimiento en un dendograma. Establezca la
solución óptima
NOTA: 2.2.1.1.2. Una compañía de investigación de mercados le solicitan realizar un
estudio sobre algunas marcas de cierto producto del mercado para lo cual se
El uso de un software analizan tres variables obtenidas de un análisis de factores. Las variables que se
estadístico como Excel o han identificado más con cada uno de los factores son las siguientes: Con el
Minitab, entre otros,
reduce de gran manera el
factor 1, la variable X1; con el factor 2, la variable X2 y con el factor 3, la variable
tiempo de cálculo y la X3.
probabilidad de cometer Suponga que dichos factores se utilizarán para realizar la segmentación de
errores en los cálculos mercado, para lo cual se proporcionan los puntajes de 5 entrevistas:
aritméticos, sin embargo se
deben comprender
primero los pasos del ENTREVISTA VARIABLE
proceso. Por lo mismo es X1 X2 X3
muy importante que
1 1.35 2.70 1.35
primero resuelva el
ejercicio en forma 2 6.75 9.45 6.75
manual y posteriormente 3 2.70 1.35 1.35
utilice un software para 4 9.45 9.45 6.75
comparar sus resultados.
Es importante mencionar 5 4.05 2.70 2.70

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________252


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

que pueden existir Promedio: 4.86 5.13 3.78


diferencias en las
respuestas debido a la
Desviación 3.25 3.98 2.77
cantidad de dígitos que se estándar
utilizan en los cálculos
manuales. Se sugiere a) Obtenga la pareja de personas entrevistadas más parecidas y la menos
utilizar aproximaciones
de 5 dígitos. parecida.
b) Se le pide realice un agrupamiento jerárquico aglomerativo con los tres
eslabonamientos simple, completo y promedio y represente cada
procedimiento en un dendograma. Establezca la solución óptima.
c) Proponga un nombre tentativo a cada uno de los conglomerados
conforme a la solución establecida.

2.2.1.2 EJEMPLO ILUSTRATIVO

EJEMPLO
ILUSTRATIVO Con el fin de incrementar el confort de las diferentes piezas para vestir, los
industriales de la confección desean desarrollar un sistema de patronaje y tallas
2.2.1.2 flexibles, pero con medidas reales del cuerpo de las mujeres mexicanas,
ANÁLISIS DE experimentado de mejor manera con la elongación de músculos y la elasticidad
CONGLOMERADOS. de alguna fibras . Para ser más precisos en ciertos resultados, el estudio
MATRIZ DE antropométrico sustituyó el indicador de cintura por el de busto contemplando
SIMILITUD. igualmente 3 indicadores útiles para diseñar y fabricar piezas de vestir, la
estatura, el peso y el busto de cinco personas del género FEMENINO cuyos
resultados se presentan a continuación:

Persona Altura (mts.) Peso (Kg.) Busto


1 1.52 57.12 Mediano
2 1.67 76.85 Grande
3 1.54 67.62 Mediano
4 1.56 49.35 Pequeño
5 1.63 87.22 Grande
6 1.65 82.54 Grande
7 1.68 53.12 Mediano

Criterio de similitud para recodificar los datos:

Altura: existe(1) si es ≥ a 1.60 mts.


no existe(0) si es < a 1.60 mts.

Peso: existe(1) si es ≥ a 60 Kgs.


No existe(0) si es < a 60 Kgs.

Busto: existe(1) si es Mediano


no existe (0) si es cualquier otro tamaño

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________253


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

a) Obtenga la pareja de personas más parecidas y la menos parecida.


b) Se le pide realice un agrupamiento jerárquico aglomerativo con los tres
eslabonamientos simple, completo y promedio y represente cada
procedimiento en un dendograma. Establezca la solución óptima.
c) Proponga un nombre tentativo a cada uno de los conglomerados
conforme a la solución establecida.

Resolución del inciso a)


El método de Los datos recodificados quedaron como sigue:
eslabonamiento que se elija
determinará cómo se define Persona Altura (mts.) Peso (Kg.) Busto
la similitud entre dos
1 0 0 1
conglomerados. En cada
etapa del eslabonamiento, 2 1 1 0
los dos conglomerados más 3 0 1 1
semejantes se unen. Al 4 0 0 0
comienzo, cuando cada 5 1 1 0
observación constituye un 6 1 1 0
conglomerado, la similitud
7 1 0 1
entre los conglomerados es
simplemente la similitud
entre las observaciones. Cálculo de las similitudes a encontrar:
Posteriormente, después de El coeficiente de similitud que se usará para resolver este ejemplo es el de
que se unifican las parejas simples. El coeficiente es:
observaciones, es necesaria 𝑎+𝑑
una regla de eslabonamiento 𝑆7• =
𝑝
para calcular las similitudes
entre conglomerados,
Se debe cuantificar la similitud entre las personas con base en este coeficiente,
cuando hay múltiples
donde a es la presencia del atributo en ambas personas, d es la ausencia del
observaciones en un
conglomerado. atributo en ambas personas y p es el total de características (o variables) que
serán evaluadas.
Se recomienda probar con
Se empieza a comparar por pareja de personas, en este caso la persona 1 y la
varios métodos de 2, como en ninguna de las características hay presencia del atributo en ambas
eslabonamiento y comparar (a) ni ausente en ambas (d), entonces tanto a como d tienen valor de 0 en el
los resultados. Dependiendo coeficiente, en cuanto a p tenemos que son tres características para evaluar (
de las características de los Altura, Peso y Busto); la similitud entre las personas 1 y 2 es de 0 como a
datos, algunos métodos continuación se presenta:
pueden proveer "mejores"
resultados que otros. 0+0
𝑆&." = =0
3

De igual forma se procede con las personas 1 y 3, donde hay un atributo


presente (a) en ambos en la característica de Busto y un atributo ausente (d) en
ambos en la característica de Altura; por lo tanto, la similitud entre las personas
1 y 3 es de 2/3 como a continuación se presenta:

1+1
𝑆&.# = = 2/3
3

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________254


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Y así sucesivamente, se obtienen las medidas de similitud para todas las parejas
que se pretende comparar obteniendo los siguientes resultados:

2+1 3
0+0 1+0 1+0 𝑆1./ = =
𝑆&." = =0 𝑆".# = = 1/3 𝑆#.1 = = 1/3 3 3
3 3 3 =1

1+1 0+1 1+0 1+0


𝑆&.# = = 2/3 𝑆".' = = 1/3 𝑆#./ = = 1/3 𝑆1.™ = = 1/3
3 3 3 3

2+1 1+0 1+0


0+2 𝑆".1 = = 3/3 𝑆#.™ = = 1/3 𝑆/.™ = = 1/3
𝑆&.' = = 2/3 3 3 3
3

2+1 0+1
0+0 𝑆"./ = = 3/3 𝑆'.1 = = 1/3
𝑆&.1 = =0 3 3
3

0+0 1+0 0+1


𝑆&./ = =0 𝑆".™ = = 1/3 𝑆'./ = = 1/3
3 3 3

1+1 0+1 0+1


𝑆&.™ = = 2/3 𝑆#.' = = 1/3 𝑆'.™ = = 1/3
3 3 3

Con la información anterior se construye una matriz cuadrada en este caso de 7


x 7 ya que tenemos 7 personas a la que le nombraremos matriz de similitud
la cual representa que tan similares son las personas con respecto a la similitud
entre ellas:
1 2 3 4 5 6 7
1 1 0 2/3 2/3 0 0 2/3
2 0 1 1/3 1/3 1 1 1/3
3 2/3 1/3 1 1/3 1/3 1/3 1/3
4 2/3 1/3 1/3 1 1/3 1/3 1/3
5 0 1 1/3 1/3 1 1 1/3
6 0 1 1/3 1/3 1 1 1/3
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Como esta matriz es una matriz espejo, es decir la matriz superior es igual a la
matriz inferior y la diagonal contiene 1´s ya que la similitud máxima que hay al
comparar una persona consigo es de uno, sólo será necesario utilizar la
información de la matriz inferior como se muestra a continuación:

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________255


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Al observar la matriz de similitud se puede entonces contestar lo planteado en el


inciso a) con respecto a las personas más parecidas y las menos parecidas, en
este caso la pareja de personas más parecidas es aquella cuya similitud entre sí
es la que se acerque más o sea igual a 1, en este caso tenemos tres parejas, la
primera formada por las personas 2 y 5, con una medida de similitud de 1; la
segunda formada por las personas 2 y 6, con una similitud también de 1 y la
tercera formada por las personas 5 y 6, con una similitud de 1.

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

La pareja de personas menos parecida será aquella cuya similitud entre sí es la


se acerque más o sea igual a 0. En este caso tenemos tres parejas, la primera
formada por las personas 1 y 2, con una medida de similitud de 0; la segunda
formada por las personas 1 y 5, con una similitud también de 0 y la tercera
formada por las personas 1 y 6, con una similitud de 0.

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Resolución al inciso b)

· Con el eslabonamiento Vinculación o eslabonamiento:


simple, o del "vecino más
cercano", la similitud entre 1. Eslabonamiento Simple:
dos conglomerados es la
similitud máxima entre una
observación en un
Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
conglomerado y una siguientes pasos:
observación en el otro Paso 1. Agrupar. Reducir la matriz con la similitud más grande, es decir cuya
conglomerado. El similitud entre sí se acerque más o sea igual a 1 , para formar el primer
eslabonamiento simple es conglomerado.
una opción apropiada

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________256


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

cuando los conglomerados


están claramente separados. Paso 2. Eslabonar. Llenar la matriz con la similitud más grande, o sea contrastar
Cuando las observaciones las similitudes de los elementos agrupados con el resto de los elementos.
están cerca entre sí, el
eslabonamiento simple
tiende a identificar
Paso 1. Agrupar
conglomerados largos
similares a cadenas que Como en este ejemplo se utilizan similitudes, los elementos más próximos se
pueden tener una separación elegirán con la similitud más grande. Como existen tres parejas de personas con
relativamente grande entre similitudes igual a 1 ( 2 con 5, 2 con 6 y 5 con 6) podemos elegir cualquiera de
observaciones en cualquier ellas para formar el primer conglomerado, en este caso tomaremos la pareja
extremo de la cadena. · formada por las personas 5 y 6.

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Una vez seleccionada la similitud de los elementos que se van a agrupar, se


determina quiénes son las personas; al seguir por renglón y columna vemos
que son las personas 5 y 6, como se muestra en la siguiente matriz inferior:

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

El nuevo conglomerado (5,6) se pone en primer lugar dentro de la nueva matriz,


cuyas dimensiones ahora son reducidas de 7 x 7 a 6 x 6, como se muestra a
continuación:

(5,6) 1 2 3 4 7
(5,6) 1
1 1
2 1
3 1
4 1
7 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________257


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Paso 2. Eslabonar
Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino
más cercano, al momento de eslabonar se debe tener cuidado de elegir la
similitud más grande, es decir se compara al nuevo conglomerado (5,6) con el
resto de las personas; al comparar (5,6) con la persona 1 se debe verificar en la
matriz anterior las similitudes entre la persona 1 con la 5 que es 0 y la de la
persona 1 con la 6 que es 0, eligiendo entonces la mayor similitud de las dos
personas que en este caso es 0. Lo anterior se puede resumir con el siguiente
diagrama de flujo:

con 5 es de 0
La similitud 1 la mayor es 0
con 6 es de 0
La

El valor eslabonado se coloca en la matriz reducida:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1
3 1
4 1
7 1

Siguiendo el mismo criterio se eslabona la persona 2 con la pareja de personas


(5,6), eligiendo entonces la mayor similitud de las dos personas que en este
caso es 1. Lo anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1
La similitud 2 la mayor es 1
con 6 es de 1
La

El valor eslabonado se coloca en la matriz reducida:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 1
3 1
4 1
7 1

Sigue eslabonar a la persona 3 con la pareja de personas (5,6), eligiendo


entonces la mayor similitud de las dos personas que en este caso es 1/3. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________258


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

con 5 es de 1/3
La similitud 3 la mayor es 1/3
con 6 es de 1/3
La

Sigue eslabonar a la persona 4 con la pareja de personas (5,6), eligiendo


entonces la mayor similitud de las dos personas que en este caso es 1/3. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1/3
La similitud 4 la mayor es 1/3
con 6 es de 1/3
La

Sigue eslabonar a la persona 7 con la pareja de personas (5,6), eligiendo


entonces la mayor similitud de las dos personas que en este caso es 1/3. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1/3
La similitud 7 la mayor es 1/3
con 6 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 1
3 1/3 1
4 1/3 1
7 1/3 1

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original:
(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 0 1
3 1/3 2/3 1/3 1
4 1/3 2/3 1/3 1/3 1
7 1/3 2/3 1/3 1/3 1/3 1

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, que en este caso sería la persona 2 que se
eslabonaría al conglomerado formado por las personas (5,6) con la similitud

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________259


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

mayor que en este caso es de 1 como se muestra a continuación:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 0 1
3 1/3 2/3 1/3 1
4 1/3 2/3 1/3 1/3 1
7 1/3 2/3 1/3 1/3 1/3 1

La nueva matriz se reduce de 6 x 6 a una de 5 x 5 de la siguiente manera:

(5,6,2) 1 3 4 7
(5,6,2) 1
1 1
3 1
4 1
7 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
similitud mayor, es decir se compara al conglomerado (5,6,2) con el resto de las
personas; al comparar (5,6) con la persona 1 se debe verificar en la matriz
anterior las similitudes entre la persona 1 con las 5 y 6 que es 0 y la de la
persona 1 con la 2 que es 0, eligiendo entonces la similitud mayor de las dos
combinaciones o tres personas que en este caso es 0. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 5,6 es de 0
La similitud 1 la mayor es 0
con 2 es de 0
La

El valor eslabonado se coloca en la matriz reducida

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3
4 1
7 1

Sigue eslabonar a la persona 3 con el conglomerado de personas (5,6,2),


eligiendo entonces la mayor similitud de las tres personas. Primero se compara a
la persona 3 con las personas 5 y 6 con una similitud de 1/3 y segundo a la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________260


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

persona 3 con la persona 2 con una similitud de 1/3 eligiendo la similitud mayor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 5,6 es de 1/3


La similitud 3 la mayor es 1/3
con 2 es de 1/3
La

Sigue eslabonar a la persona 4 con el conglomerado de personas (5,6,2),


eligiendo entonces la mayor similitud de las tres personas. Primero se compara a
la persona 4 con las personas 5 y 6 con una similitud de 1/3 y segundo a la
persona 4 con la persona 2 con una similitud de 1/3 eligiendo la similitud mayor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 5,6 es de 1/3


La similitud 4 la mayor es 1/3
con 2 es de 1/3
La

Sigue eslabonar a la persona 7 con el conglomerado de personas (2,5,6),


eligiendo entonces la mayor similitud de las tres personas. Primero se compara a
la persona 7 con las personas 5 y 6 con una similitud de 1/3 y segundo a la
persona 7 con la persona 2 con una similitud de 1/3 eligiendo la similitud mayor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 5,6 es de 1/3


La similitud 7 la mayor es 1/3
con 2 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 1
4 1/3 1
7 1/3 1

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original:
(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1
7 1/3 2/3 1/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________261


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado. En este caso se forma un nuevo conglomerado con
las personas 1 y 3 o con las personas 1 con 7. Como ambos grupos tienen la
misma similitud de 2/3 se podría seleccionar cualquiera de los 2. Suponga que
se eligió a la persona 1 y 7 como se muestra a continuación:

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1
7 1/3 2/3 1/3 1/3 1

La nueva matriz se reduce de 5 x 5 a una de 4 x 4 de la siguiente manera:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1
3 1
4 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
similitud mayor, es decir se compara al conglomerado (5,6,2) con el resto de las
personas; al comparar (5,6,2) con la persona 1 se debe verificar en la matriz
anterior las similitudes entre la persona 1 con las personas (5,6,2) que es 0 y la
persona 7 con las (5,6,2) que es 1/3, eligiendo entonces la similitud mayor de
las dos combinaciones o cinco personas que en este caso es 1/3. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 1 es de 0
La similitud 5,6,2 la mayor es 1/3
con 7 es de 1/3
La

El valor eslabonado se coloca en la matriz reducida

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1/3 1
3 1
4 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________262


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En la etapa anterior podemos observar que ya tenemos el eslabonamiento de la


persona 3 con el conglomerado (5,6,2) con una similitud de 1/3 y a la persona 4
con el conglomerado (5,6,2) con una similitud de 1/3, estos valores se pasan
directamente a la matriz reducida:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1/3 1
3 1/3 1
4 1/3 1

Sigue eslabonar a la persona 3 con el nuevo conglomerado de personas (1,7)


eligiendo entonces la mayor similitud de las tres personas. Primero se compara a
la persona 3 con las personas 1 con una similitud de 2/3 y segundo a la persona
3 con la persona 7 con una similitud de 1/3 eligiendo la similitud mayor de
ambas comparaciones que es 2/3. Lo anterior se puede resumir con el siguiente
diagrama de flujo:

con 1 es de 2/3
La similitud 3 la mayor es 2/3
con 7 es de 1/3
La

Sigue eslabonar a la persona 4 con el nuevo conglomerado de personas (1,7)


eligiendo entonces la mayor similitud de las tres personas. Primero se compara a
la persona 4 con las personas 1 con una similitud de 1/3 y segundo a la persona
4 con la persona 7 con una similitud de 1/3 eligiendo la similitud mayor de
ambas comparaciones que es 1/3. Lo anterior se puede resumir con el siguiente
diagrama de flujo:
con 1 es de 2/3
La similitud 4 la mayor es 2/3
con 7 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1/3 1
3 1/3 2/3 1
4 1/3 2/3 1

El valor faltante de la matriz se llena con el mismo dato de la matriz original:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1/3 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________263


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, como es el caso de la persona 3 o 4 que se
eslabonan al conglomerado formado por las personas (1,7) con la similitud más
grande de 2/3. Se puede elegir cualquiera de las dos personas, se elegirá a la
persona 4 como se muestra a continuación:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1/3 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1

La nueva matriz se reduce de 4 x 4 a una de 3 x 3 de la siguiente manera:

(5,6,2) (1,7,4) 3
(5,6,2) 1
(1,7,4) 1
3 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
similitud mayor, es decir se compara al conglomerado (5,6,2) con el resto de las
personas; al comparar (5,6,2) con la persona 1 y7 se debe verificar en la matriz
anterior las similitudes entre las personas 1 y ,7 con las personas (5,6,2) que es
1/3 y la persona 4 con las personas (5,6,2) que es 1/3, eligiendo entonces la
similitud mayor de las dos combinaciones o seis personas que en este caso es
1/3. Lo anterior se puede resumir con el siguiente diagrama de flujo:

con 1,7 es de 1/3


La similitud 5,6,2 la mayor es 1/3
con 4 es de 1/3
La

El valor eslabonado se coloca en la matriz reducida

(5,6,2) (1,7,4) 3
(5,6,2) 1
(1,7,4) 1/3 1
3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________264


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En la etapa anterior podemos observar que ya tenemos el eslabonamiento de la


persona 3 con el conglomerado (5,6,2) con una similitud de 1/3 este valor se
pasa directamente a la matriz reducida:

(5,6,2) (1,7,4) 3
(5,6,2) 1
(1,7,4) 1/3 1
3 1/3 1

Sigue eslabonar a la persona 3 con el conglomerado de personas (1,7,4)


eligiendo entonces la mayor similitud de las cuatro personas. Primero se
compara a la persona 3 con las personas 1 y 7 con una similitud de 2/3 y
segundo a la persona 3 con la persona 4 con una similitud de 1/3 eligiendo la
similitud mayor de ambas comparaciones que es 2/3. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 1,7 es de 2/3


La similitud 3 la mayor es 2/3
con 4 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6,2) (1,7,4) 3
(5,6,2) 1
(1,7,4) 1/3 1
3 1/3 2/3 1

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, como es el caso de la persona 3 que se puede
eslabonar a cualquiera de los dos conglomerados (5,6,2) o ( 1,7,3) con la
similitud más grande de 1/3. Se elige el conglomerado formado por las
personas(1,7,4) como se muestra a continuación:

(5,6,2) (1,7,4) 3
(5,6,2) 1
(1,7,4) 1/3 1
3 1/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________265


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

La nueva matriz se reduce de 3 x 3 a una de 2 x 2 de la siguiente manera:

(1,7,4,
(5,6,2)
3)
(5,6,2) 1
(1,7,4,
1
3)

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento simple o del vecino


más cercano, al momento de eslabonar se debe tener cuidado de elegir la
similitud mayor, es decir se compara al conglomerado (5,6,2) con el resto de las
personas que forman el otro conglomerado (1,7,4,3); al comparar (5,6,2) con
las personas (1,7,4,3) se debe verificar en la matriz anterior las similitudes
entre las personas 1,7,3 con las personas (5,6,2) que es 1/3 y la persona 3 con
las (5,6,2) que es 1/3, eligiendo entonces la similitud mayor de las dos
combinaciones o siete personas que en este caso es 1/3. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 1,7,3 es de 1/3


La similitud 5,6,2 la mayor es 1/3
con 4 es de 1/3
La

El valor resultante se acomoda en la matriz reducida:

(1,7,3,
(2,5,6)
4)
(2,5,6) 1
(1,7,3,
1/3 1
4)

Tabla de eslabonamiento

La información de las etapas realizadas se puede resumir en la siguiente tabla:


Etapa Número de Nivel de Personas Nuevo
conglomera similitud incorporadas conglomerado
dos
1 6 1 5 6 2
2 5 1 2 5 3
3 4 2/3 1 7 2
4 3 2/3 1 4 3
5 2 2/3 1 3 4
6 1 1/3 1 2 7

En la tabla anterior se presenta en la primera columna el número de etapas que


se realizaron, la cual se puede calcular como el número de elementos menos

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________266


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

uno, es decir como tenemos siete personas menos uno nos dan seis etapas. La
segunda columna nos muestra la reducción de la matriz principal que era de 7 x
7 y que en la primera etapa quedó reducida a una matriz de 6 x 6 y así
sucesivamente. La tercera columna nos muestra el valor de la similitud a la que
se eslabonaron las dos primeras personas presentadas en la columna 5 que en
este caso fueron la 5 y la 6 y en la séptima columna nos señala la formación del
primer conglomerado. En la etapa 2 se incorporó la persona 2 al primer
conglomerado formado por las personas 5 y 6 como se muestra en la columna 3
a una similitud de 1 o 100%. En la etapa 3 se forma un nuevo conglomerado
como se aprecia en la columna 5 formado por las personas 1 y 7 a una similitud
de 2/3 ó 66.667%. En la etapa 4 se incorporó la persona 4 al segundo
conglomerado formado por las personas 1 y 7 como se muestra en la columna 3
a una similitud de 2/3 ó 66.667%. En la etapa 5 se incorporó la persona 3 al
sugundo conglomerado formado por las personas 1,7 y 3 como se muestra en la
columna 3 a una similitud de 2/3 ó 66.667% y finalmente en la etapa 6 se
eslabonaron ambos conglomerados a una similitud final de 1/3 ó 33.333%.
Minitab presenta la misma información en una tabla semejante haciendo
hincapié que debido a se tomaron fracciones para desarrollar el problema los
resultados de Minitab pueden variar sensiblemente.

Análisis de observaciones de conglomerado: Altura, Peso, Busto

Distancia euclediana cuadrada, Enlace simple


Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. En el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 6 100.000 0 5 6 5 2
2 5 100.000 0 2 5 2 3
3 4 66.667 1 1 7 1 2
4 3 66.667 1 1 4 1 3
5 2 66.667 1 1 3 1 4
6 1 33.333 2 1 2 1 7

Dendograma

El dendograma es un gráfico formado por rectángulos que unen a los elementos


agrupados en el eje horizontal y su altura en el eje vertical indica el nivel de
similitud a la cual se unieron dichos elementos.

Es importante señalar que en el dendograma no deben cruzarse las líneas que


indican los eslabonamientos para lo cual es conveniente construirlo conforme a
los elementos que forman cada conglomerado en nuestro caso el conglomerado
1 está formado por las personas (5,6,2) y el conglomerado 2 por las personas
(1,7,4,3).

Cabe mencionar que a menor nivel de similitud en que se realiza el


eslabonamiento de los elementos para formar un conglomerado, es mayor la
diferencia entre ellos.

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________267


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Ejemplo ilustrativo 2. Dendograma de datos antropométricos


Enlace simple, Distancia euclediana cuadrada

33.33

Nivel de similitud
55.56

77.78

100.00
1 7 4 3 2 5 6
Personas del género FEMENINO
Elaboró: M. en Admón.: Javier Bech Vertti

Numero de conglomerados a dejar como solución

¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una


agrupación útil depende por completo de su situación particular, debe
especificar los criterios para colocar la partición final. Puede definir la colocación
basándose en el número de grupos que desee obtener o por el nivel de similitud
que requiere dentro de los conglomerados. Examine los niveles de similitud en
los resultados de la tabla de eslabonamiento resumen y en el dendograma. La
similitud de eslabonamiento en cualquier etapa es el valor de la similitud mínima
en la etapa, en relación con la similitud máxima entre observaciones dentro de
los datos. El patrón de cómo los valores de similitud cambian de paso a paso
puede ayudar a elegir la agrupación final. El paso donde los valores cambian de
manera abrupta podría identificar un buen punto para cortar el dendograma, si
esto tiene sentido para sus datos. En este caso entre la etapa 5 y 6 los valores
de similitud cambian de 2/3 a 1/3 cuando se unen ambos grupos o
conglomerados por lo tanto, la solución más factible parece ser la de 2
conglomerados (5,6,2,) y (1,7,4,3).

· Con el eslabonamiento 2. Eslabonamiento Completo:


completo, o "del vecino más
lejano", la similitud entre dos Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
conglomerados es la siguientes pasos:
similitud mínima entre una Paso 1. Agrupar. Reducir la matriz con la similitud más grande, es decir cuya
observación en un similitud entre sí se acerque más o sea igual a 1, para formar el primer
conglomerado y una conglomerado.
observación en el otro
Paso 2. Eslabonar. Llenar la matriz con la similitud más pequeña, es decir cuya
conglomerado. Este método
garantiza que todas las similitud entre sí se acerque más o sea igual a 0 al contrastar las similitudes de

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________268


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

observaciones en un los elementos agrupados con el resto de los elementos.


conglomerado se encuentren
dentro de una similitud Paso 1. Agrupar
mínima y tiende a producir
conglomerados con
diámetros similares. Los
Como en este ejemplo se utilizan similitudes, los elementos más próximos se
resultados pueden ser elegirán con la similitud más grande. Como existen tres parejas de personas con
sensibles a valores atípicos. similitudes igual a 1 ( 2 con 5, 2 con 6 y 5 con 6) podemos elegir cualquiera de
ellas para formar el primer conglomerado, en este caso tomaremos la pareja
formada por las personas 5 y 6.

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Una vez seleccionada la similitud de los elementos que se van a agrupar, se


determina quiénes son las personas; al seguir por renglón y columna vemos
que son las personas 5 y 6, como se muestra en la siguiente matriz inferior:

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

El nuevo conglomerado (5,6) se pone en primer lugar dentro de la nueva matriz,


cuyas dimensiones ahora son reducidas de 7 x 7 a 6 x 6, como se muestra a
continuación:
(5,6) 1 2 3 4 7
(5,6) 1
1 1
2 1
3 1
4 1
7 1

Paso 2. Eslabonar
Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino
más lejano, al momento de eslabonar se debe tener cuidado de elegir la

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________269


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

similitud más grande, es decir se compara al nuevo conglomerado (5,6) con el


resto de las personas; al comparar (5,6) con la persona 1 se debe verificar en la
matriz anterior las similitudes entre la persona 1 con la 5 que es 0 y la de la
persona 1 con la 6 que es 0, eligiendo entonces la menor similitud de las dos
personas que en este caso es 0. Lo anterior se puede resumir con el siguiente
diagrama de flujo:
con 5 es de 0
La similitud 1 la menor es 0
con 6 es de 0
La

El valor eslabonado se coloca en la matriz reducida:


(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1
3 1
4 1
7 1

Siguiendo el mismo criterio se eslabona la persona 2 con la pareja de personas


(5,6), eligiendo entonces la menor similitud de las dos personas que en este
caso es 1. Lo anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1
La similitud 2 la menor es 1
con 6 es de 1
La
El valor eslabonado se coloca en la matriz reducida:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 1
3 1
4 1
7 1

Sigue eslabonar a la persona 3 con la pareja de personas (5,6), eligiendo


entonces la menor similitud de las dos personas que en este caso es 1/3. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1/3
La similitud 3 la menor es 1/3
con 6 es de 1/3
La

Sigue eslabonar a la persona 4 con la pareja de personas (5,6), eligiendo


entonces la menor similitud de las dos personas que en este caso es 1/3. Lo

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________270


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1/3
La similitud 4 la menor es 1/3
con 6 es de 1/3
La

Sigue eslabonar a la persona 7 con la pareja de personas (5,6), eligiendo


entonces la menor similitud de las dos personas que en este caso es 1/3. Lo
anterior se puede resumir con el siguiente diagrama de flujo:

con 5 es de 1/3
La similitud 7 la menor es 1/3
con 6 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 1
3 1/3 1
4 1/3 1
7 1/3 1

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original:
(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 0 1
3 1/3 2/3 1/3 1
4 1/3 2/3 1/3 1/3 1
7 1/3 2/3 1/3 1/3 1/3 1

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, que en este caso sería la persona 2 que se
eslabonaría al conglomerado formado por las personas (5,6) con la similitud
mayor que en este caso es de 1 como se muestra a continuación:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________271


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

(5,6) 1 2 3 4 7
(5,6) 1
1 0 1
2 1 0 1
3 1/3 2/3 1/3 1
4 1/3 2/3 1/3 1/3 1
7 1/3 2/3 1/3 1/3 1/3 1

La nueva matriz se reduce de 6 x 6 a una de 5 x 5 de la siguiente manera:


(5,6,2) 1 3 4 7
(5,6,2) 1
1 1
3 1
4 1
7 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
similitud menor, es decir se compara al conglomerado (5,6,2) con el resto de
las personas; al comparar (5,6) con la persona 1 se debe verificar en la matriz
anterior las similitudes entre la persona 1 con las 5 y 6 que es 0 y la de la
persona 1 con la 2 que es 0, eligiendo entonces la similitud menor de las dos
combinaciones o tres personas que en este caso es 0. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 5,6 es de 0
La similitud 1 la mayor es 0
con 2 es de 0
La

El valor eslabonado se coloca en la matriz reducida

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3
4 1
7 1

Sigue eslabonar a la persona 3 con el conglomerado de personas (5,6,2),


eligiendo entonces la menor similitud de las tres personas. Primero se compara
a la persona 3 con las personas 5 y 6 con una similitud de 1/3 y segundo a la
persona 3 con la persona 2 con una similitud de 1/3 eligiendo la similitud menor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________272


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

siguiente diagrama de flujo:


con 5,6 es de 1/3
La similitud 3 la mayor es 1/3
con 2 es de 1/3
La

Sigue eslabonar a la persona 4 con el conglomerado de personas (5,6,2),


eligiendo entonces la menor similitud de las tres personas. Primero se compara
a la persona 4 con las personas 5 y 6 con una similitud de 1/3 y segundo a la
persona 4 con la persona 2 con una similitud de 1/3 eligiendo la similitud menor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:
con 5,6 es de 1/3
La similitud 4 la mayor es 1/3
con 2 es de 1/3
La

Sigue eslabonar a la persona 7 con el conglomerado de personas (2,5,6),


eligiendo entonces la menor similitud de las tres personas. Primero se compara
a la persona 7 con las personas 5 y 6 con una similitud de 1/3 y segundo a la
persona 7 con la persona 2 con una similitud de 1/3 eligiendo la similitud menor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 5,6 es de 1/3


La similitud 7 la mayor es 1/3
con 2 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 1
4 1/3 1
7 1/3 1

Los valores faltantes de la matriz se llenan con los mismos datos de la matriz
original:
(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1
7 1/3 2/3 1/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________273


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado. En este caso se forma un nuevo conglomerado con
las personas 1 y 3 o con las personas 1 con 7. Como ambos grupos tienen la
misma similitud de 2/3 se podría seleccionar cualquiera de los 2. Suponga que
se eligió a la persona 1 y 7 como se muestra a continuación:

(5,6,2) 1 3 4 7
(5,6,2) 1
1 0 1
3 1/3 2/3 1
4 1/3 2/3 1/3 1
7 1/3 2/3 1/3 1/3 1

La nueva matriz se reduce de 5 x 5 a una de 4 x 4 de la siguiente manera:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 1
3 1
4 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
similitud menor, es decir se compara al conglomerado (5,6,2) con el resto de
las personas; al comparar (5,6,2) con la persona 1 se debe verificar en la matriz
anterior las similitudes entre la persona 1 con las personas (5,6,2) que es 0 y la
persona 7 con las (5,6,2) que es 1/3, eligiendo entonces la similitud menor de
las dos combinaciones o cinco personas que en este caso es 0. Lo anterior se
puede resumir con el siguiente diagrama de flujo:

con 1 es de 0
La similitud 5,6,2 la menor es 0
con 7 es de 1/3
La

El valor eslabonado se coloca en la matriz reducida

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 0 1
3 1
4 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________274


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

En la etapa anterior podemos observar que ya tenemos el eslabonamiento de la


persona 3 con el conglomerado (5,6,2) con una similitud de 1/3 y a la persona 4
con el conglomerado (5,6,2) con una similitud de 1/3, estos valores se pasan
directamente a la matriz reducida:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 0 1
3 1/3 1
4 1/3 1

Sigue eslabonar a la persona 3 con el nuevo conglomerado de personas (1,7)


eligiendo entonces la menor similitud de las tres personas. Primero se compara
a la persona 3 con las personas 1 con una similitud de 2/3 y segundo a la
persona 3 con la persona 7 con una similitud de 1/3 eligiendo la similitud menor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 2/3
La similitud 3 la menor es 1/3
con 7 es de 1/3
La

Sigue eslabonar a la persona 4 con el nuevo conglomerado de personas (1,7)


eligiendo entonces la menor similitud de las tres personas. Primero se compara
a la persona 4 con las personas 1 con una similitud de 2/3 y segundo a la
persona 4 con la persona 7 con una similitud de 1/3 eligiendo la similitud menor
de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 1 es de 2/3
La similitud 4 la mayor es 1/3
con 7 es de 1/3
La

Los valores resultantes se acomodan en la matriz reducida:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 0 1
3 1/3 1/3 1
4 1/3 1/3 1

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________275


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor faltante de la matriz se llena con el mismo dato de la matriz original:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 0 1
3 1/3 1/3 1
4 1/3 1/3 1/3 1

Paso 1. Agrupar
Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, como es el caso de las personas 3 o 4 que pueden
formar un nuevo conglomerado con una similitud más grande de 1/3 o se
pueden eslabonar al conglomerado formado por las personas (1,7) con la
similitud más grande de 1/3 o al conglomerado formado por las personas (5,6,2)
con la similitud más grande de 1/3. Como se puede elegir cualquiera de las tres
opciones, se elegirá en este caso formar un nuevo conglomerado como se
muestra a continuación:

(5,6,2) (1,7) 3 4
(5,6,2) 1
(1,7) 0 1
3 1/3 1/3 1
4 1/3 1/3 1/3 1

La nueva matriz se reduce de 4 x 4 a una de 3 x 3 de la siguiente manera:

(3,4
(5,6,2) (1,7)
)
(5,6,2) 1
(1,7) 1
(3,4) 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
similitud menor, es decir se compara al conglomerado (5,6,2) con el resto de
las personas; al comparar (5,6,2) con la persona 1 y7 se debe verificar en la
matriz anterior las similitudes entre la persona 1 con las personas (5,6,2) que
es 0 y la persona 7 con las personas (5,6,2) que es 1/3, eligiendo entonces la
similitud menor de las dos combinaciones o cinco personas que en este caso es
1/3. Lo anterior se puede resumir con el siguiente diagrama de flujo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________276


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

con 1 es de 0
La similitud 5,6,2 la menor es 0
con 7 es de 1/3
La

El valor eslabonado se coloca en la matriz reducida

(3,4
(5,6,2) (1,7)
)
(5,6,2) 1
(1,7) 0 1
(3,4) 1

Sigue eslabonar a las personas 3 y 4 con el conglomerado de personas (5,6,2)


eligiendo entonces la menor similitud de las cinco personas. Primero se compara
a la persona 3 con las personas (5,6,2) con una similitud de 1/3 y segundo a la
persona 4 con las personas (5,6,2) con una similitud de 1/3 eligiendo la similitud
menor de ambas comparaciones que es 1/3. Lo anterior se puede resumir con el
siguiente diagrama de flujo:

con 3 es de 1/3
La similitud 5,6,2 la menor es 1/3
con 4 es de 1/3
La

El valor eslabonado se coloca en la matriz reducida

(3,4
(5,6,2) (1,7)
)
(5,6,2) 1
(1,7) 0 1
(3,4) 1/3 1

Sigue eslabonar a las personas 3 y 4 con el conglomerado de personas (1,7)


eligiendo entonces la menor similitud de las cuatro personas. Primero se
compara a la persona 3 con las personas (1,7) con una similitud de 1/3 y
segundo a la persona 4 con las personas (1,7) con una similitud de 1/3 eligiendo
la similitud menor de ambas comparaciones que es 1/3. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

con 3 es de 1/3
La similitud 1,7 la menor es 1/3
con 4 es de 1/3
La

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________277


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

El valor eslabonado se coloca en la matriz reducida

(3,4
(5,6,2) (1,7)
)
(5,6,2) 1
(1,7) 0 1
(3,4) 1/3 1/3 1

Paso 1. Agrupar

Una vez llena la matriz se repiten los dos pasos de agrupar y eslabonar ya
sea para formar un nuevo conglomerado o para eslabonar una persona al
conglomerado ya formado, como en este caso el conglomerado (3,4) se puede
eslabonar a cualquiera de los dos conglomerados (5,6,2) o (1,7) con la similitud
más grande de 1/3, se elige el conglomerado formado por las personas(5,6,2)
como se muestra a continuación:

(3,4
(5,6,2) (1,7)
)
(5,6,2) 1
(1,7) 0 1
(3,4) 1/3 1/3 1

La nueva matriz se reduce de 3 x 3 a una de 2 x 2 de la siguiente manera:

(5,6,2,
(1,7)
3,4)
(5,6,2,
1
3,4)
(1,7) 1

Paso 2. Eslabonar

Como se eligió el criterio de vinculación o eslabonamiento completo o del vecino


más lejano, al momento de eslabonar se debe tener cuidado de elegir la
similitud menor, es decir se compara al conglomerado (1,7) con el resto de las
personas que forman los otros conglomerados (5,6,2) y (3,4); al comparar (1,7)
con las personas (5,6,2) se debe verificar en la matriz anterior las similitudes
entre las personas 1,7 con las personas (5,6,2) que es 0 y las personas 1 y 7
con las (3,4) que es 1/3, eligiendo entonces la similitud menor de las dos
combinaciones o siete personas que en este caso es 0. Lo anterior se puede
resumir con el siguiente diagrama de flujo:

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________278


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

con 5,6,2 es de 0
La similitud 1,7 la menor es 0
con 3,4 es de 1/3
La

El valor resultante se acomoda en la matriz reducida:

(5,6,2,
(1,7)
3,4)
(5,6,2,
1
3,4)
(1,7) 0 1

Tabla de eslabonamiento

La información de las etapas realizadas se puede resumir en la siguiente tabla:

Etapa Número de Nivel de Personas Nuevo


conglomera similitud incorporadas conglomerado
dos
1 6 1 5 6 2
2 5 1 2 5 3
3 4 2/3 1 7 2
4 3 1/3 3 4 2
5 2 1/3 2 3 5
6 1 0 1 2 7

En la tabla anterior se presenta en la primera columna el número de etapas que


se realizaron, la cual se puede calcular como el número de elementos menos
uno, es decir como tenemos siete personas menos uno nos dan seis etapas. La
segunda columna nos muestra la reducción de la matriz principal que era de 7 x
7 y que en la primera etapa quedó reducida a una matriz de 6 x 6 y así
sucesivamente. La tercera columna nos muestra el valor de la similitud a la que
se eslabonaron las dos primeras personas presentadas en la columna 5 que en
este caso fueron la 5 y la 6 y en la séptima columna nos señala la formación del
primer conglomerado. En la etapa 2 se incorporó la persona 2 al primer
conglomerado formado por las personas 5 y 6 como se muestra en la columna 3
a una similitud de 1 o 100%. En la etapa 3 se forma un segundo o nuevo
conglomerado como se aprecia en la columna 5 formado por las personas 1 y 7
a una similitud de 2/3 ó 66.667%. En la etapa 4 se forma un nuevo
conglomerado como se aprecia en la columna 5 formado por las personas 3 y 4
a una similitud de 1/3 ó 33.333%. En la etapa 5 se incorporó el último
conglomerado formado por las personas 3 y 4 al segundo y primer

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________279


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

conglomerado formado por las personas 5,6,2 como se muestra en la columna 3


a una similitud de 1/3 ó 33.333% y finalmente en la etapa 6 se eslabonaron los
dos conglomerados (5,6,2,3,4) y el (1,7) a una similitud final de 0 ó 0.000%.
Minitab presenta la misma información en una tabla semejante haciendo
hincapié que debido a se tomaron fracciones para desarrollar el problema los
resultados de Minitab pueden variar sensiblemente.

Análisis de observaciones de conglomerado: Altura, Peso, Busto


Distancia euclediana cuadrada, Enlace completo
Pasos de amalgamación

Número Número de
de Nivel de Nivel de Grupos Nuevo obs. en el
Paso grupos semejanzal distancia incorporados grupo grupo nuevo
1 6 100.000 0 5 6 5 2
2 5 100.000 0 2 5 2 3
3 4 66.667 1 1 7 1 2
4 3 33.333 2 3 4 3 2
5 2 33.333 2 2 3 2 5
6 1 0.000 3 1 2 1 7

Dendograma

El dendograma es un gráfico formado por rectángulos que unen a los elementos


agrupados en el eje horizontal y su altura en el eje vertical indica el valor de
distancia a la cual se unieron dichos elementos.
Es importante señalar que en el dendograma no deben cruzarse las líneas que
indican los eslabonamientos para lo cual es conveniente construirlo conforme a
los elementos que forman cada conglomerado en este caso el conglomerado 1
está formado por las personas (5,6,2,3,4) y el conglomerado 2 por las personas
(1,7). Minitab puede dibujar los conglomerados en diferente orden, primero el 1
o el 2 o bien primero el 2 y luego el 1, lo cual no cambia la solución.
Cabe mencionar que mientras a menor similitud se realiza el eslabonamiento de
los elementos para formar un conglomerado, es mayor la diferencia entre ellos.

Ejemplo Ilustrativo 2. Dendograma de datos antropométricos


Enlace completo, Distancia euclediana cuadrada

0.00
Nivel de Similitud

33.33

66.67

100.00
1 7 2 5 6 3 4
Personas del género FEMENINO
Elaboró: M. en Admón. Javier Bech Vertti

Elaboró: Arq. y M. en Admón. JAVIER BECH VERTTI____________________________________280


___________Cuaderno de trabajo: Análisis Multivariado. CAPÍTULO 2 MÉTODOS DE REDUCCIÓN

Numero de conglomerados a dejar como solución

¿Cómo saber dónde cortar el dendograma?. Debido a que la definición de una


agrupación útil depende por completo de su situación particular, debe
especificar los criterios para colocar la partición final. Puede definir la colocación
basándose en el número de grupos que desee obtener o por el nivel de similitud
que requiere dentro de los conglomerados. Examine los niveles de similitud en
los resultados de la tabla de eslabonamiento resumen y en el dendograma. La
similitud de eslabonamiento en cualquier etapa es el valor de la similitud mínima
en la etapa, en relación con la similitud máxima entre observaciones dentro de
los datos. El patrón de cómo los valores de similitud cambian de paso a paso
puede ayudar a elegir la agrupación final. El paso donde los valores cambian de
manera abrupta podría identificar un buen punto para cortar el dendograma, si
esto tiene sentido para sus datos. En este caso entre la etapa 5 y 6 los valores
de similitud cambian de 0.00 a 1/3 cuando se unen ambos grupos o
conglomerados por lo tanto, la solución más factible parece ser la de 2
conglomerados (5,6,2,3,4) y (2,7).

· Con el eslabonamiento 3. Eslabonamiento Promedio:


promedio, la similitud entre
dos conglomerados es la Una vez elegido el tipo de eslabonamiento que se va a aplicar, se realizarán los
similitud media entre una siguientes pasos:
observación en un
conglomerado y una Paso 1. Agrupar. Reducir la matriz con la similitud más grande, es decir cuya
observación en el otro similitud entre sí se acerque más o sea igual a 1 , para formar el primer
conglomerado. En vista de conglomerado.
que los métodos de
eslabonamiento simple o Paso 2. Eslabonar. Llenar la matriz con la similitud promedio, o sea contrastar
completos agrupan
las similitudes de los elementos agrupados con el resto de los elementos.
conglomerados sobre la base
de similitudes entre pares
individuales, el Paso 1. Agrupar
eslabonamiento promedio
utiliza una medida de Como en este ejemplo se utilizan similitudes, los elementos más próximos se
ubicación más central. elegirán con la similitud más grande. Como existen tres parejas de personas con
similitudes igual a 1 (2 con 5, 2 con 6 y 5 con 6) podemos elegir cualquiera de
ellas para formar el primer conglomerado, en este caso tomaremos la pareja
formada por las personas 5 y 6.

1 2 3 4 5 6 7
1 1
2 0 1
3 2/3 1/3 1
4 2/3 1/3 1/3 1
5 0 1 1/3 1/3 1
6 0 1 1/3 1/3 1 1
7 2/3 1/3 1/3 1/3 1/3 1/3 1

Una vez seleccionada la similitud de los elementos que se van a agrupar, se


determina qu