Análisis
Multivariante
Análisis Multivariante
¿Qué es?
Son todas aquellas técnicas estadísticas que
simultáneamente analizan múltiples resultados en los
individuos u objetos bajo investigación.
Para que un análisis se considere multivariado todas
las variables deben ser aleatorias y relacionadas de
tal manera que el efecto que producen no pueda ser
interpretado de manera individual.
La estadística multivariante se
refiere a diferentes métodos que
estudian y examinan el efecto
simultáneo de múltiples variables.
Los métodos estadísticos
multivariados se utilizan para
analizar el comportamiento
conjunto de más de una variable
aleatoria. Existe una amplia gama
de técnicas multivariadas
disponibles.
Análisis Multivariante
¿Para qué sirve?
1. Representar datos de forma inteligible.
2.Esclarecer la distribución real de “varias variables”.
3.Desarrollar un modelo de predicción basado en
múltiples variables.
4.Hallar las relaciones de causa-efecto entre
variables.
Análisis Multivariante
¿Para qué sirve?
1. Representar datos de forma inteligible.
2. Esclarecer la distribución real de “varias variables”.
3.Desarrollar un modelo de predicción basado
en múltiples variables.
Probabilidad de muerte = F(Edad, ASA, APACHE II, alb)
Probabilidad de supervivencia = F(T,N,M,BRAC, etc)
Análisis Multivariante
¿Para qué sirve?
1. Representar datos de forma inteligible.
2. Esclarecer la distribución real de “varias variables”.
3.Desarrollar un modelo de predicción basado en
múltiples variables.
4.Hallar las relaciones de causa-efecto entre
variables.
Análisis Multivariante ¿ Porqué?
El propósito del análisis multivariante es medir,
explicar y predecir el grado de relación que existe
entre la variación (combinación lineal ponderada
de las variables).
El carácter multivariante del análisis descansa no
sólo en el número de variables sino en las
múltiples combinaciones existente entre las
variables.
Análisis Multivariante Conceptos básicos
Variante: Combinación lineal ponderada de las variables
bajo estudio.
Escalas de medición: Partición, identificación y medida de
un conjunto de variables.
No métricas: cualitativas.
Métricas: cuantitativas.
Mediciones del error.
Mediciones multivariantes.
Nivel de significancia vs. Potencia de la prueba
Análisis Multivariante Indicaciones
¿Cuándo es necesario el análisis
multivariante?:
Siempre que el diseño no controle la confusión ...
¿y eso cuándo ocurre?
No se puede saber a priori: el mejor método para evitar
confusión es la selección aleatoria, pero no lo garantiza.
Introducción al Análisis
Análisis Multivariante Multivariante
Guía para el desarrollo e interpretación de un
análisis multivariante:
Establecer significancia práctica tanto como significancia
estadística.
El tamaño de la muestra afecta todos los resultados.
Conozca sus datos.
Use sólo las variables necesarias.
Aprenda de sus errores.
Valide sus resultados.
Análisis Multivariante Escalas de medición
Variable cuantitativa o métrica: es aquella
que identifica al sujeto como diferente a los
demás en cuanto a cantidad o grado.
Variable cualitativa o no métrica: se va a
identificar al objeto de estudio por
características, propiedades, categorías o
atributos que posee.
Análisis Multivariante Escalas de medición
Para variables métricas se utilizan intervalos y
razones.
Para variables no métricas se utilizan
nominales y ordinales.
Análisis Multivariante Escalas de medición
Escala nominal: asigna un número a una
característica o atributo.
Escala ordinal: jerarquiza los datos en relación a
la cantidad que poseen.
Los intervalos y las razones son iguales sólo
que las razones tienen sentido físico y los
intervalos pueden tener un sentido arbitrario.
Análisis Multivariante Tipos de Técnicas
Regresiónmúltiple
Unavariable Cuantitativa Supervivencia
dependiente
Técnicas Cualitativa Discriminante múltiple(certesa) Regresión
funcionales logística (probabilidad)
Varias variables Cuantitativas
dependiente Análisis devarianzaANOVA
Correlación canónica
Cualitativas Análisis Conjunto
Análisis de factores
Información Análisis de componenetes principales
cuantitativa Análisis de agrupamientos. Cluster analisis
Técnicas Escalas multidimensionales
estructurales
Información Escalas multidimensionales
cualitativa
¿Cuáles son las técnicas multivariadas?
1. Gráfico de matriz
El gráfico de matriz se utiliza para mostrar todos
los pares de gráficos X-Y de un conjunto de
variables cuantitativas. Es una excelente técnica
si queremos detectar pares de variables
altamente correlacionadas. También puede
detectar casos con valores atípicos.
2. Análisis de correlación
El proceso de análisis de correlación tiene como
objetivo resumir dos o más columnas de datos
numéricos. Calcula estadísticas resumidas para
cada variable, así como la correlación y
covarianza entre ambas.
33. Diagrama de araña
El diagrama de araña -también conocido como
gráfico de radar- se utiliza para mostrar los
valores de varias variables cuantitativas según la
situación.
4. Análisis factorial
El análisis factorial produce una combinación
lineal de múltiples variables cuantitativas,
estas variables representan el mayor porcentaje
de variación. Estos tipos de análisis son
utilizados para reducir el alcance del problema
con el fin de comprender mejor los factores que
afectan estas variables.
En la mayoría de casos, una pequeña cantidad
de componentes puede representar una gran
parte de la variabilidad general. La interpretación
adecuada de estos factores puede proporcionar
información importante sobre los mecanismos en
funcionamiento.
5. Análisis de regresión logística
El análisis de regresión logística -también
conocido como modelo de selección- es
una variante de regresión múltiple que
permite predecir eventos y estudia la
influencia de dos tipos de variables entre
sí: variables dependientes y variables no
dependientes. La primera es una variable
explicativa, mientras que la segunda es
una variable no explicativa.
La primera variable describe el estado
actual de la base de datos y la
segunda interpreta los datos a través
de la dependencia entre dos
variables. Esta técnica ayuda a predecir
las elecciones que los consumidores
pueden tomar al elegir alternativas.
6. Análisis de conglomerados
El análisis de conglomerados o grupos
se refiere a un algoritmo que agrupa
objetos similares en grupos. El análisis de
conglomerados es un conjunto de grupos,
donde cada uno es diferente entre sí y los
objetos de cada grupo son muy similares
entre sí.
7. Análisis discriminante lineal
El análisis discriminante lineal fue
diseñado para ayudar a distinguir dos o más
conjuntos de datos basados en un conjunto
de variables cuantitativas. Esto se logra
estableciendo una función discriminante o
combinación lineal de variables.
8. Análisis de correspondencias 9. Escalado multidimensional
Esta técnica proporciona una reducción de la
dimensionalidad de la pendiente del objeto en un El escalado multidimensional es una
conjunto de atributos, generando así un mapa de técnica que crea un mapa que muestra las
percepción de la pendiente. Sin embargo, la posiciones relativas de varios objetos, con
variable independiente y la variable dependiente solo una tabla de las distancias entre ellos.
se verifican al mismo tiempo.
El mapa puede constar de una, dos, tres o
Esta es una técnica combinada que puede ser
muy útil en situaciones donde hay muchos
incluso más dimensiones y calcula la
atributos. Se usa comúnmente para evaluar la solución métrica o no métrica.
efectividad de las campañas publicitarias. También
se puede utilizar cuando los atributos son
demasiado similares para el análisis factorial.
El principal enfoque estructural es el
desarrollo de una tabla de contingencia,
también conocida como tabulación cruzada. Esto
significa que la forma de las variables no debe ser
métrica. El análisis de correspondencias es difícil
de interpretar, ya que las dimensiones son una
combinación de variables independientes y
dependientes.
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
2) Diseño del análisis
3) Hipótesis del análisis
4) Realización del análisis
5) Interpretar resultados
6) Validación del análisis
Análisis Multivariante
ETAPAS
1) Objetivos del análisis • Define el problema
• Especifica los objetivos
2) Diseño del análisis • Escoge las técnicas multivariantes
3) Hipótesis del análisis
• Establecer el problema en términos
conceptuales definiendo:
4) Realización del análisis
•los conceptos
•las relaciones fundamentales
5) Interpretar resultados
6) Validación del análisis • Establecer si dichas relaciones son:
•de dependencia
•de interdependencia
• Se determinan las variables a
observar.
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
Se determina
2) Diseño del análisis •el tamaño muestral
•las ecuaciones a estimar (si
3) Hipótesis del análisis procede)
•las distancias a calcular (si
4) Realización del análisis procede)
5) Interpretar resultados •las técnicas de estimación a
emplear
6) Validación del análisis
•decidir qué hacer con los “datos
perdidos”
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
Escoger formulación de hipótesis
2) Diseño del análisis subyacente a la técnica:
3) Hipótesis del análisis •Normalidad
•Linealidad
4) Realización del análisis
•Independencia
5) Interpretar resultados •Homocedasticidad
6) Validación del análisis
En estadística se dice que un modelo predictivo
presenta homocedasticidadcuando la varianza del
error condicional a las variables explicativas es
constante a lo largo de las observaciones.Un
modelo estadístico relaciona el valor de una
variableapredecirconeldeotras.
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
1) Se estima el modelo
2) Diseño del análisis 2) Se evalúa el ajuste a los datos
3) Hipótesis del análisis Observaciones atípicas (outliers)
4) Realización del análisis
5) Interpretar resultados
6) Validación del análisis
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
Evitar la procrastinación
2) Diseño del análisis
La procrastinación es la acción o hábito de
3) Hipótesis del análisis retrasar actividades o situaciones que deben
atenderse, sustituyéndolas por otras situaciones
4) Realización del análisis másirrelevantesoagradables.
5) Interpretar resultados Reespecificaciones adicionales:
6) Validación del análisis
• de las variables
• del modelo
>> volver a los pasos 3 y 4
Análisis Multivariante
ETAPAS
1) Objetivos del análisis
Establecer la validez de los resultados
2) Diseño del análisis obtenidos analizando sí los resultados
obtenidos con la muestra se
3) Hipótesis del análisis generalizar a la población de la que
procede.
4) Realización del análisis
5) Interpretar resultados Dividir la muestra en varias partes
6) Validación del análisis Técnicas de remuestreo
METODO FACTORIAL COMPLETO
GENERAL EL DISEÑO DE
DISEÑO DE EXPERIMENTOS EXPERIMENTOS ES
ALTAMENTE EFECTIVO
ES UNA TÉCNICA ESTADISTICA PARA AQUELLOS
SISTEMATICA CUYO OBJETIVO ES PROCESOS, QUE SU
REALIZAR UNA SERIE DE PRUEBAS
EN LAS QUE SE INDUCEN CAMBIOS
RENDIMIENO SE VE
DELIBERADOS PARA AVERIGUAR SI AFECTADO POR VARIOS
DETERMINADOS FACTORES INFLUYEN FACTORES.
EN LA VARIABLE DE INTERES O DE
ESTUDIO Y, SI EXISTE INFLUENCIA DE
ALGÚN FACTOR EN EL PROCESO O
PRODUCTO ,CUANTIFICARLA.
MÉTODO FACTORIAL
EJEMPLOS
-EN EL RENDIMIENTO DE UN DETERMINADO TIPO DE MÁQUINA
(UNIDADES PRODUCIDAS POR DIA); SE DESEA ESTUDIAR LA
INFUENCIA DEL TRABAJADOR QUE LA MANEJA Y LA MARCA DE
LA MÁQUINA.
- SE REQUIERE ESTUDIAR LA INFLUENCIA DE UN TIPO DE PILA
ELECTRICA Y DE LA MARCA, EN LA DURACIÓN DE LAS PILAS.
OBJETIVOS
1.- DETERMINAR CUALES SON LAS
VARIABLES QUE TIENE MAYOR
INFLUENCIA SOBRE LA RESPUESTA
Y.
2.- DETERMINAR CUAL ES L AJUSTE
DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE Y ESTÉ CASI
SIEMPRE CERCA DEL VALOR
NOMINAL DESEADO.
3.- DETERMINAR CUAL ES L AJUSTE
DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE LA
VARIABLILIDAD SEA REDUCIDA.
4.- DETERMINAR CUAL ES EL AJUSTE
DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE LOS
EFECTOS DE LAS VARIABLES
Z1,Z2,......Zm SEAN MINIMO.
Etapas a seguir
1.- IDENTIFICACION DEL PROBLEMA Y DEFINIR LOS
OBJETIVOS.
2.- ELECCIÓN DE LOS FACTORES Y LOS NIVELES
(RANGOS).
3.-SELECCION DE LA VARIABLE RESPUESTA.
4.-ELECCION DEL DISEÑO EXPERIMENTAL
5.- REALIZACION DEL EXPERIMENTO.
6.- ANALISIS ESTADÍSTICO DE LOS DATOS.
7.- MEJORAS, CONTROL Y CONCLUSIONES.
MÉTODOS ESTADÍSTICOS PARA EL DISEÑO DE
EXPERIMENTOS
EXPERIMENTOS CON UN SOLOS FACTOR (ANOVA)
DISEÑO DE BLOQUES COMPLETOS.
DISEÑOS FACTORIALES
DISEÑO FACTORIAL 2 K.
DISEÑOS ANIDADOS.
SUPERFICIES DE RESPUESTA
EJEMPLO DE DISEÑO FACTORIAL COMPLETO
El departamento de control de calidad de una planta de acabados textiles estudia los efectos de
varios factores sobre l teñido de una tela combinada de algodón y fibra sintética que se usa para
hacer camisas.
Se seleccionan dos operadores (A), tres duraciones del ciclo (B) y dos temperaturas (C), y dos
ejemplos de prueba pequeños de tela se tiñeron bajo cada conjunto de condiciones. La tela
terminada se comparó con un patrón y se asigno una puntuación numérica.
Los resultados se presentan en la siguiente tabla:
temperatura
300 350
duración del ciclo
operador operador
enuncie y pruebe
1 2 1 2
las hipótesis
24 28 23 36
apropiadas usando
40 25 26 28 35
el análisis de
35 38 39 38
varianza con a=
50 36 39 35 36
0.05
24 35 29 37
60 27 34 25 34