Trabajo Multivariable S
Trabajo Multivariable S
TEMA: MULTIVARIANTES
ALUMNOS :
VEGA TALEXIO MARILYN LUCERO
MARINGO CHOTA ARIANE
JIMENEZ BAOS JHANETH PRISCILA
IQUITOS – PERÚ
2021
Investiga y redacta con fuente bibliográfica:
I. ANALISIS DE MUTIVARIANTES
3
[Link]
4
[Link]
5
[Link]
El análisis factorial se utiliza para identificar factores que expliquen una
variedad de resultados en diferentes pruebas. Por ejemplo, investigación en
inteligencia halla que la gente que obtienen una nota alta en una prueba de
habilidad verbal también se desempeña bien en pruebas que requieren
habilidades verbales. Los investigadores explican esto mediante el uso de
análisis factorial para aislar un factor a menudo llamado inteligencia cristalizada
o inteligencia verbal, que representa el grado en el cual alguien es capaz de
resolver problemas usando habilidades verbales.6
Así, por ejemplo, si un analista financiero quiere determinar la cual es el estado
de salud financiero de una empresa a partir del conocimiento de un número de
ratios financieros, construyendo varios índices numéricos que definan su
situación, el problema se resolvería mediante un Análisis de Componentes
Principales.7
1.2.2 Análisis Clúster
Definición:
Un análisis de cluster o análisis de grupos es un método de agrupamiento
estadístico utilizado para analizar grandes cantidades de datos. Aquí, los
objetos bajo revisión se dividen en diferentes grupos (clusters) y se comparan
en base a características específicas.8
Objetivo:
Su objetivo es clasificar una muestra de entidades (individuos o variables) en
un número pequeño de grupos de forma que las observaciones pertenecientes
a un grupo sean muy similares entre sí y muy disimilares del resto. A diferencia
del Análisis Discriminante se desconoce el número y la composición de dichos
grupos.
En otro decir, es crear grupos homogéneos a partir de objetos individuales
heterogéneos. Hoy en día, el análisis de cluster es una parte común del
marketing y se utiliza, entre otras cosas, como base para las medidas
publicitarias
Por ejemplo, clasificar grupos de alimentos (pescados, carnes, vegetales y
leche) en función de sus valores nutritivos.
La diferencia fundamental entre el análisis cluster y el discriminante reside en
que en el análisis cluster los grupos son desconocidos a priori y son
precisamente lo que queremos determinar; mientras que en el análisis
discriminante, los grupos son conocidos y lo que pretendemos es saber en qué
medida las variables disponibles nos discriminan esos grupos y nos pueden
ayudar a clasificar o asignar los individuos en/a los grupos dados.9
Importancia
Como puede comprenderse fácilmente el análisis cluster tiene una
extraordinaria importancia en la investigación científica, en cualquier rama del
saber. Téngase presente que la clasificación es uno de los objetivos
fundamentales de la ciencia. Y en la medida en que el análisis cluster nos
6
[Link]
7
[Link]
8
[Link]
9
[Link]
proporciona los medios técnicos para realizarla, se nos hará imprescindible en
cualquier investigación.
Ya desde Linneo, las clasificaciones y taxonomías fueron piezas clave en las
investigaciones biológicas, y, en consecuencia, no puede resultarnos extraño
que haya sido en los entornos de este tipo de ciencias donde hayan surgido las
técnicas del análisis cluster. Los trabajos de Sokal y Sneath , marcan el inicio
de las técnicas de clusterización, que, poco a poco, han ido extendiendo sus
aplicaciones a todos los ámbitos científicos.
Con el análisis cluster se pretende encontrar un conjunto de grupos a los que ir
asignando los distintos individuos por algún criterio de homogeneidad. Por lo
tanto, se hace imprescindible definir una medida de similitud o bien de
divergencia para ir clasificando a los individuos en unos u otros grupos.10
Características:
Motivación: Necesidad de diseñar una estrategia que permita definir
grupos de objetos homogéneos. Tarea de clasificación.
Aplicabilidad: Psicología, biología, sociología, ingeniería, investigación
de mercados, marketing, etc.
Similitud con el análisis factorial: Mientras que el análisis cluster agrupa
objetos, el análisis factorial se centra en la agrupación de variables.
Inconvenientes del análisis cluster: Descriptivo, ateórico y no
inferencial, se utiliza habitualmente como una técnica exploratoria. No
ofrece soluciones únicas, a pesar de que existen una estructura de
clasificación ´´verdadera¨ en los datos, las soluciones dependen de las
variables y del método de análisis cluster empleado.
Definicion:
El análisis de correspondencias es una técnica descriptiva desarrollada
por Jean-Paul Benzécri. Suele aplicarse al estudio de tablas de contingencia y
es conceptualmente similar al análisis de componentes principales con la
diferencia de que en el análisis de correspondencias los datos se escalan de
modo que filas y columnas se tratan de modo equivalente.
10
[Link]
11
[Link]
El análisis de correspondencias descompone el estadístico del test de la ji-
cuadrado asociado a una tabla de contingencia en componentes ortogonales.
Dado que se trata de una técnica descriptiva, puede aplicarse incluso en
circunstancias en las que la prueba anterior no es apropiada.
El análisis de correspondencias es una técnica descriptiva para representar
tablas de contingencia. Los datos de partida para el análisis de
correspondencias es una matriz X de dimensiones n × k que representa las
frecuencias absolutas observadas en una tabla de contingencia de dos
variables, donde la primera se representa por filas y tiene n categorías y la
segunda por columnas y tiene k categorías. Por ejemplo, clasificamos un
conjunto de estudiantes en n posibles procedencias geográficas y k posibles
opiniones respecto a la docencia. En general, el elemento xij de la matriz X
representa la frecuencia absoluta observada en la casilla (i, j) de la tabla de
contingencia.12
Importancia:
El Análisis de correspondencias es una técnica de reducción de dimensiones,
una técnica para visualizar una nube de puntos multidimensional en dos
dimensiones. Consiste, como las demás técnicas de reducción de dimensiones,
en un procedimiento de traslado de una nube de puntos definida en un espacio
de muchas dimensiones a un espacio de dos dimensiones donde poder
visualizar la posición relativa de unos puntos. Este traslado se hará respetando
al máximo las posiciones relativas de los puntos en la nube de puntos original.
Veamos un ejemplo que puede ilustrar lo que estamos diciendo: Tomamos 100
seguidores del Alianza Lima, Universitario de deportes, Sporting Cristal,
Cienciano, y del CNI. Y les pedimos que elijan de entre esos cinco equipos dos
preferentes. Uno, evidentemente será el propio equipo del que es seguidor
pero el segundo debe ser el que más les simpático les caiga o el que por el que
menos antipatía sientan. Esto nos permitirá analizar la posición relativa de los
seguidores de esos equipos respecto a esos equipos.13
Objetivo:
Cuando estudiamos dos o más variables cualitativas cada una de ellas tiene
una serie de valores posibles, de valores que en realidad son categorías, son
valores nominales (es por esto que a las variables cualitativas se les
denomina también categóricas o nominales). Por ejemplo, la variable sexo:
Hombre y Mujer, la variable fumar: Fuma y No fuma, etc.
El objetivo del Análisis de correspondencias crear un mapa de la posición
relativa de las variables cualitativas estudiadas con cada uno de sus valores
posibles. Una posición que refleje el grado de asociación entre ellas. Es una
técnica que, aunque está basada en unos métodos algebraicos complejos, es
muy intuitiva, como se verá a continuación. Básicamente el objetivo es
representar cada uno de los valores posibles de cada una de las variables
estudiadas en un plano donde la posición relativa de los puntos refleje el
grado de asociación entre cada uno de los conceptos representados.
Tipos:
12
[Link]
13
[Link]
Análisis de correspondencias simples: Cuando sean dos variables
cualitativas estudiadas
Definición:
Un modelo de regresión es un modelo matemático que busca determinar la relación
entre una variable dependiente (Y), con respecto a otras variables, llamadas
explicativas o independientes (X).
El análisis de regresión es una técnica usada para modelar la relación entre
variables. Se desea establecer como una o varias variables dependientes se
comportan respecto a una o más variables independientes. Mediante esta técnica
podemos obtener información sobre como una variable de interés Y, variable
dependiente, varia cuando una de las independientes lo hace. Es común considerar
que la relación entre Y y X es descrita por una función.
Y = A + BX + u
Dado que un análisis de regresión nos facilita que podamos calcular un valor futuro
de una variable, existen múltiples aplicaciones posibles en el día a día. Tanto
a nivel empresarial como personal o social, el análisis de regresión es una
herramienta muy práctica.
Por ejemplo, para evaluar el riesgo de accidentes en una zona determinada de la
carretera respecto a su geografía, o comprobar la eficacia de un cambio realizado
en un proyecto comercial o académico basándose en los resultados obtenidos tras
introducir un cambio.
Los análisis de regresión se emplean con gran frecuencia en el mundo
corporativo. Gracias a los resultados que arrojan, las empresas pueden
comprender mejor cuáles son los elementos que tienen un mayor impacto en los
resultados, cuales afectan a otros elementos de la compañía o cuales se pueden
ignorar.
De esta forma, las empresas obtienen información importante que pueden aplicar
rápidamente en sus organizaciones para mejorar su eficiencia.14
Características:
14
[Link]
Elegir el modelo de regresión correcto es tanto una ciencia como un arte. Los
métodos estadísticos pueden ayudar a orientar en la dirección correcta, pero, en
última instancia, se deben de incorporar otras consideraciones.
Podría pensar que los problemas complejos requieren modelos complejos, pero
muchos estudios muestran que los modelos más simples generalmente
producen predicciones más precisas. Dados varios modelos con capacidad
explicativa similar, el más simple es probablemente la mejor opción. Comience
de manera simple, y solo haga el modelo más complejo según sea necesario.
Cuanto más complejo sea su modelo, más probable será que adapte el modelo
específicamente a su conjunto de datos y la generalización sufra.
Los métodos van a depender de como los datos fueron obtenidos. No es lo
mismo lo que ocurre en un proceso industrial, donde se pueden controlar una
serie de efectos, que en un estudio biológico, donde hay variaciones no
controladas modeladas por errores, como son los efectos ambientales.
El modelo de regresión se suele utilizar en las Ciencias Sociales con el fin de
determinar si existe, o no, relación causal entre una variable dependiente (Y) y
un conjunto de otras variables explicativas (X). Asimismo, el modelo busca
determinar cuál será el impacto sobre la variable Y ante un cambio en las
variables explicativas (X).
Dependerá del número de variables que necesitemos incluir elegir entre un modelo u
otro.
Modelo de regresión Lineal Simple
El análisis de regresión lineal simple es el más utilizado y el más sencillo de
todos. Se trata de estudiar el efecto de una variable independiente sobre
una única variable dependiente de la primera —o que al menos a nivel
teórico hemos considerado que es dependiente—. Empleando esta ecuación
de regresión lineal simple se puede realizar una estimación basándose en los
datos obtenidos.
Fórmula de la regresión lineal simple
y = B0 + B1 x + ε
Ejemplos
Podemos preguntarnos si hay alguna relación entre las el consumo de
electricidad, las horas de trabajo, la eficiencia de las calderas y el tiempo
de vida de los engranajes de las máquinas del taller. La primera
aproximación seria representa pares de variables en un plano. Así,
obtendríamos una nube de puntos la cual podría indicarnos visualmente la
existencia o no de algún tipo de relación entre las variables.15
Por ejemplo, en un proceso químico, supóngase que el rendimiento del
producto está relacionado con la temperatura de operación del proceso. El
análisis de regresión puede emplearse para construir un modelo que
permita predecir el rendimiento para una temperatura dada. Como
ilustración, considérense los datos de la siguiente tabla. En ella, Υ es la
pureza del oxígeno producido en un proceso de destilación químico, y x es
el porcentaje de hidrocarburos presentes en el condensador principal de la
unidad de destilación. La figura 1 presenta el diagrama de dispersión de
los datos contenidos en la Tabla 1. El análisis de este diagrama de
dispersión indica que, si bien una curva no pasa exactamente por todos los
puntos, existe una evidencia fuerte de que los puntos están dispersos de
manera aleatoria alrededor de una línea recta. Por consiguiente es
razonable suponer que la media de la variable aleatoria Υ está relaciona
con x por la siguiente relación lineal: E(Υ|x) = β0 + β1 x Donde la pendiente
y la ordenada al origen de la recta reciben el nombre de coeficientes de
regresión.16
Así, por ejemplo, un economista podría estar interesado en determinar la
relación entre el ingreso de los trabajadores y su nivel de educación. Para
esto, podría llevar acabo un modelo de regresión en el que la variable
independiente (Y), será el ingreso del trabajador. En cuanto a las variables
explicativas (X), se deben incluir todas aquellas que podrían explicar el
ingreso entre las que se encuentran por supuesto la educación, la
experiencia, la educación de los padres, etc.
15
[Link]
NES/links/5a871265a6fdcc6b1a3abe40/[Link]
16
[Link]
1.4 Indicadores en una investigación:
Definición:
Un indicador es una medida de resumen, de preferencia estadística, referida a la
cantidad o magnitud de un conjunto de parámetros o atributos. Permite ubicar o
clasificar las unidades de análisis con respecto al concepto o conjunto de
variables o atributos que se están analizando.17
Un indicador es una característica específica, observable y medible que puede
ser usada para mostrar los cambios y progresos que está haciendo un programa
hacia el logro de un resultado específico.
Los indicadores son características de la realidad y deben ser claros,
específicos, oportunos, referidos al concepto, comparables, disponibles,
observales, medibles, cuantificables.18
Un indicador es una característica específica, observable y medible que puede
ser usada para mostrar los cambios y progresos que está haciendo un programa
hacia el logro de un resultado específico. Deber haber por lo menos
un indicador por cada resultado. El indicador debe estar enfocado, y ser claro y
específico.19
Objetivo:
Caracteristicas:
Deber haber por lo menos un indicador por cada resultado. El indicador debe
estar enfocado, y ser claro y específico. El cambio medido por el indicador
debe representar el progreso que el programa espera hacer.
17
[Link]
18
[Link]
19
[Link]
20
[Link]
Un indicador debe ser definido en términos precisos, no ambiguos, que
describan clara y exactamente lo que se está midiendo. Si es práctico, el
indicador debe dar una idea relativamente buena de los datos necesarios y de
la población entre la cual se medirá el indicador.
En un mundo perfecto, los indicadores considerados de más calidad y más
útiles serían los elegidos para monitorear y evaluar las actividades del
programa.
Sin embargo, en el mundo real intervienen muchos otros factores. Como lo
indican los marcos de monitoreo y evaluación, son importantes los vínculos
con las actividades del programa, y también las necesidades del programa
para la toma de decisiones.
Muchos indicadores comúnmente usados no están definidos en términos
claros, o por lo menos incluyen terminología que podría se podría mejorar
para dar más precisión. Por ejemplo, “conocimientos sobre violencia en el
noviazgo”, “actitud hacia la violencia contra la mujer”, “disposición para buscar
ayuda” de las víctimas de violencia, o “calidad de los servicios”, todas ellas
pueden indicar cosas diferentes en circunstancias diferentes.
Cuanto más definido esté el indicador, habrá menos lugar para confusiones o
complicaciones posteriores. Por ejemplo, “porcentaje de mujeres que acceden
a los servicios de salud en la institución X, desde la FECHA A a la FECHA B,
quienes expresan haber recibido los cuidados y asistencia apropiados” o
“porcentaje de hombres que expresan que no es aceptable golpear,
abofetear, dar puñetazos a sus esposas, con las manos u otros objetos bajo
ninguna circunstancia.”
Los indicadores ideales pueden no ser prácticos; la factibilidad de usar ciertos
indicadores puede estar limitada por la disponibilidad de los datos y los
recursos humanos y financieros. Puede ser necesario tener que dar prioridad
a los requisitos y necesidades de los donantes, el gobierno, las sedes de los
organismos y otros.
• En la práctica ocurre que ciertas variables contienen indicadores más
complejos que otros, por ejemplo, los indicadores “nivel de escolaridad” y
“estilo de vida”. Este último debe desglosarse en subindicadores.
Cuando se Características:
Modelos Constan de un modelo estructural que
utiliza Estructurales especifica las relaciones de
dependencia entre los constructos.
Conjunto de metodos Y de un modelo de medida que
estadisticos cuya finalidad es Interdependencia especifica como los indicadores se
analizar los conjuntos de
datos multivariantes Multivariantes relacionan con sus respectivos
constructos.