0% encontró este documento útil (0 votos)
171 vistas33 páginas

Técnicas y Aplicaciones del Análisis Multivariante

Cargado por

sode luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
171 vistas33 páginas

Técnicas y Aplicaciones del Análisis Multivariante

Cargado por

sode luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Análisis

Multivariante
Análisis Multivariante
¿Qué es?

Son todas aquellas técnicas estadísticas que


simultáneamente analizan múltiples resultados en los
individuos u objetos bajo investigación.

Para que un análisis se considere multivariado todas


las variables deben ser aleatorias y relacionadas de
tal manera que el efecto que producen no pueda ser
interpretado de manera individual.
La estadística multivariante se
refiere a diferentes métodos que
estudian y examinan el efecto
simultáneo de múltiples variables.
Los métodos estadísticos
multivariados se utilizan para
analizar el comportamiento
conjunto de más de una variable
aleatoria. Existe una amplia gama
de técnicas multivariadas
disponibles.
Análisis Multivariante
¿Para qué sirve?

1. Representar datos de forma inteligible.

2.Esclarecer la distribución real de “varias variables”.


3.Desarrollar un modelo de predicción basado en
múltiples variables.

4.Hallar las relaciones de causa-efecto entre


variables.
Análisis Multivariante
¿Para qué sirve?

1. Representar datos de forma inteligible.

2. Esclarecer la distribución real de “varias variables”.


3.Desarrollar un modelo de predicción basado
en múltiples variables.
Probabilidad de muerte = F(Edad, ASA, APACHE II, alb)

Probabilidad de supervivencia = F(T,N,M,BRAC, etc)


Análisis Multivariante
¿Para qué sirve?

1. Representar datos de forma inteligible.

2. Esclarecer la distribución real de “varias variables”.


3.Desarrollar un modelo de predicción basado en
múltiples variables.

4.Hallar las relaciones de causa-efecto entre


variables.
Análisis Multivariante ¿ Porqué?

El propósito del análisis multivariante es medir,


explicar y predecir el grado de relación que existe
entre la variación (combinación lineal ponderada
de las variables).

El carácter multivariante del análisis descansa no


sólo en el número de variables sino en las
múltiples combinaciones existente entre las
variables.
Análisis Multivariante Conceptos básicos

Variante: Combinación lineal ponderada de las variables


bajo estudio.

Escalas de medición: Partición, identificación y medida de


un conjunto de variables.
No métricas: cualitativas.
Métricas: cuantitativas.

Mediciones del error.


Mediciones multivariantes.
Nivel de significancia vs. Potencia de la prueba
Análisis Multivariante Indicaciones

¿Cuándo es necesario el análisis


multivariante?:

Siempre que el diseño no controle la confusión ...


¿y eso cuándo ocurre?

No se puede saber a priori: el mejor método para evitar


confusión es la selección aleatoria, pero no lo garantiza.
Introducción al Análisis
Análisis Multivariante Multivariante

Guía para el desarrollo e interpretación de un


análisis multivariante:

Establecer significancia práctica tanto como significancia


estadística.
El tamaño de la muestra afecta todos los resultados.
Conozca sus datos.
Use sólo las variables necesarias.
Aprenda de sus errores.
Valide sus resultados.
Análisis Multivariante Escalas de medición

Variable cuantitativa o métrica: es aquella


que identifica al sujeto como diferente a los
demás en cuanto a cantidad o grado.

Variable cualitativa o no métrica: se va a


identificar al objeto de estudio por
características, propiedades, categorías o
atributos que posee.
Análisis Multivariante Escalas de medición

Para variables métricas se utilizan intervalos y


razones.

Para variables no métricas se utilizan


nominales y ordinales.
Análisis Multivariante Escalas de medición

Escala nominal: asigna un número a una


característica o atributo.
Escala ordinal: jerarquiza los datos en relación a
la cantidad que poseen.

Los intervalos y las razones son iguales sólo


que las razones tienen sentido físico y los
intervalos pueden tener un sentido arbitrario.
Análisis Multivariante Tipos de Técnicas

Regresiónmúltiple
Unavariable Cuantitativa Supervivencia
dependiente
Técnicas Cualitativa Discriminante múltiple(certesa) Regresión
funcionales logística (probabilidad)

Varias variables Cuantitativas


dependiente Análisis devarianzaANOVA
Correlación canónica
Cualitativas Análisis Conjunto

Análisis de factores
Información Análisis de componenetes principales
cuantitativa Análisis de agrupamientos. Cluster analisis
Técnicas Escalas multidimensionales
estructurales

Información Escalas multidimensionales


cualitativa
¿Cuáles son las técnicas multivariadas?
1. Gráfico de matriz
El gráfico de matriz se utiliza para mostrar todos
los pares de gráficos X-Y de un conjunto de
variables cuantitativas. Es una excelente técnica
si queremos detectar pares de variables
altamente correlacionadas. También puede
detectar casos con valores atípicos.

2. Análisis de correlación
El proceso de análisis de correlación tiene como
objetivo resumir dos o más columnas de datos
numéricos. Calcula estadísticas resumidas para
cada variable, así como la correlación y
covarianza entre ambas.

33. Diagrama de araña


El diagrama de araña -también conocido como
gráfico de radar- se utiliza para mostrar los
valores de varias variables cuantitativas según la
situación.
4. Análisis factorial

El análisis factorial produce una combinación


lineal de múltiples variables cuantitativas,
estas variables representan el mayor porcentaje
de variación. Estos tipos de análisis son
utilizados para reducir el alcance del problema
con el fin de comprender mejor los factores que
afectan estas variables.
En la mayoría de casos, una pequeña cantidad
de componentes puede representar una gran
parte de la variabilidad general. La interpretación
adecuada de estos factores puede proporcionar
información importante sobre los mecanismos en
funcionamiento.
5. Análisis de regresión logística

El análisis de regresión logística -también


conocido como modelo de selección- es
una variante de regresión múltiple que
permite predecir eventos y estudia la
influencia de dos tipos de variables entre
sí: variables dependientes y variables no
dependientes. La primera es una variable
explicativa, mientras que la segunda es
una variable no explicativa.

La primera variable describe el estado


actual de la base de datos y la
segunda interpreta los datos a través
de la dependencia entre dos
variables. Esta técnica ayuda a predecir
las elecciones que los consumidores
pueden tomar al elegir alternativas.
6. Análisis de conglomerados

El análisis de conglomerados o grupos


se refiere a un algoritmo que agrupa
objetos similares en grupos. El análisis de
conglomerados es un conjunto de grupos,
donde cada uno es diferente entre sí y los
objetos de cada grupo son muy similares
entre sí.
7. Análisis discriminante lineal

El análisis discriminante lineal fue


diseñado para ayudar a distinguir dos o más
conjuntos de datos basados ​en un conjunto
de variables cuantitativas. Esto se logra
estableciendo una función discriminante o
combinación lineal de variables.
8. Análisis de correspondencias 9. Escalado multidimensional
Esta técnica proporciona una reducción de la
dimensionalidad de la pendiente del objeto en un El escalado multidimensional es una
conjunto de atributos, generando así un mapa de técnica que crea un mapa que muestra las
percepción de la pendiente. Sin embargo, la posiciones relativas de varios objetos, con
variable independiente y la variable dependiente solo una tabla de las distancias entre ellos.
se verifican al mismo tiempo.
El mapa puede constar de una, dos, tres o
Esta es una técnica combinada que puede ser
muy útil en situaciones donde hay muchos
incluso más dimensiones y calcula la
atributos. Se usa comúnmente para evaluar la solución métrica o no métrica.
efectividad de las campañas publicitarias. También
se puede utilizar cuando los atributos son
demasiado similares para el análisis factorial.
El principal enfoque estructural es el
desarrollo de una tabla de contingencia,
también conocida como tabulación cruzada. Esto
significa que la forma de las variables no debe ser
métrica. El análisis de correspondencias es difícil
de interpretar, ya que las dimensiones son una
combinación de variables independientes y
dependientes.
Análisis Multivariante
ETAPAS

1) Objetivos del análisis


2) Diseño del análisis
3) Hipótesis del análisis
4) Realización del análisis
5) Interpretar resultados
6) Validación del análisis
Análisis Multivariante
ETAPAS

1) Objetivos del análisis • Define el problema


• Especifica los objetivos
2) Diseño del análisis • Escoge las técnicas multivariantes
3) Hipótesis del análisis
• Establecer el problema en términos
conceptuales definiendo:
4) Realización del análisis
•los conceptos
•las relaciones fundamentales
5) Interpretar resultados
6) Validación del análisis • Establecer si dichas relaciones son:
•de dependencia
•de interdependencia
• Se determinan las variables a
observar.
Análisis Multivariante
ETAPAS

1) Objetivos del análisis


Se determina
2) Diseño del análisis •el tamaño muestral
•las ecuaciones a estimar (si
3) Hipótesis del análisis procede)
•las distancias a calcular (si
4) Realización del análisis procede)
5) Interpretar resultados •las técnicas de estimación a
emplear
6) Validación del análisis
•decidir qué hacer con los “datos
perdidos”
Análisis Multivariante
ETAPAS

1) Objetivos del análisis


Escoger formulación de hipótesis
2) Diseño del análisis subyacente a la técnica:

3) Hipótesis del análisis •Normalidad


•Linealidad
4) Realización del análisis
•Independencia
5) Interpretar resultados •Homocedasticidad

6) Validación del análisis


En estadística se dice que un modelo predictivo
presenta homocedasticidadcuando la varianza del
error condicional a las variables explicativas es
constante a lo largo de las observaciones.​Un
modelo estadístico relaciona el valor de una
variableapredecirconeldeotras.
Análisis Multivariante
ETAPAS

1) Objetivos del análisis


1) Se estima el modelo
2) Diseño del análisis 2) Se evalúa el ajuste a los datos

3) Hipótesis del análisis Observaciones atípicas (outliers)


4) Realización del análisis
5) Interpretar resultados
6) Validación del análisis
Análisis Multivariante
ETAPAS

1) Objetivos del análisis


Evitar la procrastinación
2) Diseño del análisis
La procrastinación es la acción o hábito de
3) Hipótesis del análisis retrasar actividades o situaciones que deben
atenderse, sustituyéndolas por otras situaciones
4) Realización del análisis másirrelevantesoagradables.

5) Interpretar resultados Reespecificaciones adicionales:


6) Validación del análisis
• de las variables
• del modelo

>> volver a los pasos 3 y 4


Análisis Multivariante
ETAPAS

1) Objetivos del análisis


Establecer la validez de los resultados
2) Diseño del análisis obtenidos analizando sí los resultados
obtenidos con la muestra se
3) Hipótesis del análisis generalizar a la población de la que
procede.
4) Realización del análisis
5) Interpretar resultados Dividir la muestra en varias partes
6) Validación del análisis Técnicas de remuestreo
METODO FACTORIAL COMPLETO
GENERAL EL DISEÑO DE
DISEÑO DE EXPERIMENTOS EXPERIMENTOS ES
ALTAMENTE EFECTIVO
ES UNA TÉCNICA ESTADISTICA PARA AQUELLOS
SISTEMATICA CUYO OBJETIVO ES PROCESOS, QUE SU
REALIZAR UNA SERIE DE PRUEBAS
EN LAS QUE SE INDUCEN CAMBIOS
RENDIMIENO SE VE
DELIBERADOS PARA AVERIGUAR SI AFECTADO POR VARIOS
DETERMINADOS FACTORES INFLUYEN FACTORES.
EN LA VARIABLE DE INTERES O DE
ESTUDIO Y, SI EXISTE INFLUENCIA DE
ALGÚN FACTOR EN EL PROCESO O
PRODUCTO ,CUANTIFICARLA.
MÉTODO FACTORIAL

EJEMPLOS

-EN EL RENDIMIENTO DE UN DETERMINADO TIPO DE MÁQUINA


(UNIDADES PRODUCIDAS POR DIA); SE DESEA ESTUDIAR LA
INFUENCIA DEL TRABAJADOR QUE LA MANEJA Y LA MARCA DE
LA MÁQUINA.

- SE REQUIERE ESTUDIAR LA INFLUENCIA DE UN TIPO DE PILA


ELECTRICA Y DE LA MARCA, EN LA DURACIÓN DE LAS PILAS.
OBJETIVOS
1.- DETERMINAR CUALES SON LAS
VARIABLES QUE TIENE MAYOR
INFLUENCIA SOBRE LA RESPUESTA
Y.
2.- DETERMINAR CUAL ES L AJUSTE
DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE Y ESTÉ CASI
SIEMPRE CERCA DEL VALOR
NOMINAL DESEADO.

3.- DETERMINAR CUAL ES L AJUSTE


DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE LA
VARIABLILIDAD SEA REDUCIDA.
4.- DETERMINAR CUAL ES EL AJUSTE
DE LAS X QUE TIENE MAYOR
INFLUENCIA PARA QUE LOS
EFECTOS DE LAS VARIABLES
Z1,Z2,......Zm SEAN MINIMO.
Etapas a seguir

1.- IDENTIFICACION DEL PROBLEMA Y DEFINIR LOS


OBJETIVOS.
2.- ELECCIÓN DE LOS FACTORES Y LOS NIVELES
(RANGOS).
3.-SELECCION DE LA VARIABLE RESPUESTA.
4.-ELECCION DEL DISEÑO EXPERIMENTAL
5.- REALIZACION DEL EXPERIMENTO.
6.- ANALISIS ESTADÍSTICO DE LOS DATOS.
7.- MEJORAS, CONTROL Y CONCLUSIONES.
MÉTODOS ESTADÍSTICOS PARA EL DISEÑO DE
EXPERIMENTOS

EXPERIMENTOS CON UN SOLOS FACTOR (ANOVA)

DISEÑO DE BLOQUES COMPLETOS.

DISEÑOS FACTORIALES

DISEÑO FACTORIAL 2 K.

DISEÑOS ANIDADOS.

SUPERFICIES DE RESPUESTA
EJEMPLO DE DISEÑO FACTORIAL COMPLETO
El departamento de control de calidad de una planta de acabados textiles estudia los efectos de
varios factores sobre l teñido de una tela combinada de algodón y fibra sintética que se usa para
hacer camisas.

Se seleccionan dos operadores (A), tres duraciones del ciclo (B) y dos temperaturas (C), y dos
ejemplos de prueba pequeños de tela se tiñeron bajo cada conjunto de condiciones. La tela
terminada se comparó con un patrón y se asigno una puntuación numérica.
Los resultados se presentan en la siguiente tabla:

temperatura
300 350
duración del ciclo
operador operador
enuncie y pruebe
1 2 1 2
las hipótesis
24 28 23 36
apropiadas usando
40 25 26 28 35
el análisis de
35 38 39 38
varianza con a=
50 36 39 35 36
0.05
24 35 29 37
60 27 34 25 34

También podría gustarte