0% encontró este documento útil (0 votos)
20 vistas47 páginas

Estadistica Aplicada

Cargado por

Nicole Camposano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas47 páginas

Estadistica Aplicada

Cargado por

Nicole Camposano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA APLICADA:

UNIDAD 1. ANÁLISIS EXPLORATORIO DE DATOS.


Cuando se tiene una base de datos se debe examinar cada variable que se vaya a usar.
1. Graficar: para conocer las distribuciones de los datos
o Histograma: idea clara para conocer la distribución de las variables.
o Diagrama de tallo hoja – moda: muestra la asimetría, el rango de los datos,
en donde están concentrados y muestra la presencia de datos atípicos.
o Grafico de caja de bigotes: Muestra el análisis resumido de un conjunto de
datos univariante. Estudia la simetría y valores atípicos
o Gráfico de simetría: Analiza visualmente la simetría, en el gráfico va en la x:
por debajo de la mediana y en la y: por encima de la variable
o Gráfico de dispersión: se ve la relación entre dos variables, si es una línea
recta hay relación entre las variables.
Si dentro de mis datos no tengo que mis variables no siguen una distribución normal debo
aplicar métodos para convertirlos en normal.
Transformación de las variables:
Lógica: Puede eliminarse variables sin respuesta o convertirse en una variable de
intervalo dummy.
Lineal: se suma, resta, divide, multiplica las variables con un constante para su
interpretación.
Algebraica: se aplica transformaciones no lineales monotónicas:
o Raíz: Tiende a llevar a los datos a la mitad
o Logaritmo: uso cuando tengo un sesgo acumulado a un solo lado.

Método de Box Cox:


Método más efectivo y suele aplicarse también en ordinales.
2. Análisis de datos ausentes:
Puede darse a un registro defectuoso de datos o ausencia natural de respuestas.
Se debe comprobar que los datos ausentes obedezcan un proceso aleatorio para que el
análisis de los datos sea confiable, antes de esto se debe hacer una imputación de los
datos.
Eliminación de fila/ observación: eliminamos todas las respuestas de esa persona.
Eliminación por pares: se elimina cuando hay 2 datos ausentes
Imputación: reemplazamos el dato
Con la media o la mediana
Con la regresión
Método Hot Deck: observar los patrones en vertical y poner el que mas se repite
3. Detectar datos atípicos: Son datos que no siguen el mismo comportamiento que
el resto. Estos se deben eliminar o buscar un método para incluirlos.

Puede darse estos por:


o Error en codificación.
o Observación que ocurre como consecuencia de un acontecimiento
extraordinario.
o Las observaciones extraordinarias no tienen explicación.
o Observaciones que se sitúan fuera de los rangos ordinarios de las variables.

SUPUESTOS:
Normalidad
Multicolinealidad
Heterocedasticidad
Autocorrelación

Para detectar datos atípicos en un análisis multivariante:


Se usa estadísticos basados en distancias
Se calcula la distancia
Y los datos que tengamos dentro de las distancias se usan y lo que no se rechazan.
Utilizamos chi2 para conocer si existe un patrón
Ho: no lleva patrón
H1: Si lleva patrón

UNIDAD 2. MANOVA.
Diferencia en análisis de varianza (los datos cuali y cuanti) y análisis de regresión
(todos los datos son cuantitativos) es en cómo se trata las variables
Datos cualitativos: los factores del análisis de la varianza
Datos cuantitativos: los covariantes.

El análisis de la varianza múltiple Manova es una técnica estadística usada para


analizar la relación entre variables dependientes métricas y variables
independientes no métricas.
Mide la significancia estadística de las diferencias entre los vectores de las medias
de las variables independientes y dependientes.

Debe cumplir 11 supuestos:


1. Variable independiente categórica
2. Variables dependientes métricas
3. Los grupos de la variable independiente son mutuamente excluyentes (pueden
suceder al mismo tiempo).
4. El numero de los casos son el numero de las variables dependientes
5. La relación entre las variables dependientes es aproximadamente lineal.
6. Las variables dependientes deben seguir distribución normal
7. No existe multicolinealidad
8. No hay valores atípicos significativos en las variables dependientes
9. No hay valores atípicos (outliers) multivariante significativo.
10. Homogeneidad en las varianzas
11. Homogeneidad en las matrices de la varianza
Interpretación:
Factores inter sujetos: número de categorías que tengo
Estadísticos descriptivos: interpretar media y desviación estándar
Prueba de Box: Si las varianzas son iguales, cumple con el supuesto de
homogeneidad.
Ho: varianza igual
H1: varianza desigual
P > 0,05 acepto Ho
Prueba Multivariante: MANOVA
Según el cuadro anterior:
Acepto Ho – Uso lambda de Wilks – me dice que tan relacionada están las variables
un valor cercano a 0, indica diferencias significativas en los grupos
Rechazo Ho – Uso Traza de Pillarí- un valor alto indica diferencia entre los grupos
Ho: Media vectorial es igual – existe diferencias estadísticamente significativas
entre los grupos que se compara
H1: Media vectorial no es igual – no existe diferencias significativamente entre los
grupos que se compara.
Prueba de igualdad de Levene:
Comprobamos el supuesto de homogeneidad entre los grupos que comparamos.
Ho: homogeneidad
H1: heterogeneidad
P > 0,05 acepto Ho
Prueba de efectos Inter sujetos:
Saber si existen diferencias generales en el comportamiento de las variables
dependientes entre sus grupos.
Ho: No hay diferencia – medias iguales
H1: Si hay diferencia – medias desiguales
P > 0.05 acepto Ho
Contraste de hipótesis personalizada:
Pruebas Post Hoc:
Uso Tukey – cuando las varianzas son iguales en su interpretación asume que todas
las varianzas en los grupos son iguales
Uso Games Howell – cuando las varianzas son desiguales – en su interpretación no
asume igualdad en las varianzas.
Aquí se analiza cada resultada y el que tenga una media diferente se elimina.

MANCOVA.
Se agrega una covariable a todas las variables anteriores.
Covariable – es una variable independiente, que puede influir entre las variable
independientes y dependientes.
El Mancova es un análisis múltiples variables dependientes mientras se controla el
efecto de covariables, que permite una estimación más precisa
Variables métricas - dependientes
Variables métricas y no métricas – independientes
SUPUESTOS:
Normalidad
Homogeneidad
Linealidad
DIFERENCIAS:
MANOVA - comparar grupos en múltiples variables dependientes sin la influencia de otras
variables.

MANCOVA - permite controlar el efecto de variables covariables para obtener una


estimación más precisa de las diferencias entre grupos en las variables dependientes.

ANALISIS DE DATOS DISCRIMIANTES


Separa/ Discrimina datos en grupos según sean tengan sus mismas características.
Dependiente – dos o más categorías
Independiente/clasificatoria - métrica
Características:
Predictiva – Indica que dato es mas probable vaya a un grupo
Explicativa - Determina cuanto aporta las variables independientes o clasificatorias
Supuestos:
Normalidad
Ausencia de multicolinealidad
Tamaño de muestra adecuado
Homogeneidad de matrices de covarianza
INTERPRETACIÓN:
Estadísticos descriptivos: explicamos las medias.
Prueba de igualdad de las medias de grupos:
Ho: Varianza igual – no discrimina e influye
H1: Varianza desigual – discrimina y no influye
P > 0,05 acepto Ho.
“Las variables que discriminan son edad, linfocitos, peso y consumo de cigarro, al parecer
el nivel socioeconómico no discrimina por lo que de este no dependen las muertes por
covid”.
PRUEBA DE BOX:
Ho: homocedasticidad – todas las varianzas son iguales
H1: heterocedasticidad- las varianzas son diferentes
Es deseable que no haya diferencia.
P > 0.05 – acepto Ho
0.000 rechazho ho
“Al tener un valor p de 0,000 tenemos evidencia suficiente para rechazar Ho, es decir que
las varianzas son diferentes y no existe homocedasticidad en las varianzas. “
RESUMEN DE FUNCIONES CANONICAS:
Contrastan la capacidad de discriminar cada función.

H0: No son discriminantes


H1: Son discriminantes, medias no iguales (lo que se espera)
- Autovalor: Compara la dispersión entre grupos en 2 funciones. Que se acerque a 1
indica que las varianzas dependientes son capaces de discriminar entre grupo, nos
conviene que discrimine.

- Correlación canónica: si se acerca a 1 dice que las variables son capaces de


discriminar.
- Lambda de Wilks: es recomendable que se rechace Ho y esté cercano a 1, es
recomendable, ya que son capaces de discriminar.
COEFICIENTES DE LA FUNCIÓN DISCRIMINANTE CANÓNICA ESTANDARIZADA:
Representa la contribución de cada variable predictora a la discriminación entre
categorías de la variable de respuesta. Estos coeficientes indican la importancia
relativa de cada variable en la formación de la función discriminante y están
expresados en unidades de desviación estándar.
FUNCIONES EN CENTROIDES DE GRUPOS:
Tabla de si – no
Si sale + es si
Si sale – es no
Los valores que estén por encima de la media, se van a los respectivos grupos.
Los datos que se acerquen 0 son irrelevantes.
Aquí voy interpretando según la media y a que grupo pertenece
COEFICIENTE DE FUNCIÓN DE CLASIFICATORIA:
SE HACE LA FUNCIÓN, REEMPLZAR Y ESCOGER EL RESULTADO MAYOR.

ANALISIS CLÚSTER.
¿Qué diferencia a un análisis discriminante de un análisis clúster?
En el análisis clúster buscar identificar patrones de similitud entre observaciones
sin saber cuantos grupos hay, en cambio, el análisis discriminante se enfoca en
discriminar datos de grupos ya existentes.

ANALISIS NO JERARQUICO Y JERARQUICO.


El análisis jerárquico se agrupo de menor a mayor, es decir, se agrupa
en diferentes niveles, mientras que el no jerárquico produce una
participación de grupos y debe tener numero especifico de
conglomerados y variables métricas,
NO JERARQUICO: Se asigna los casos a grupos diferendos
¿Qué tipo de variables se necesitan para un análisis de conglomerados no
jerárquicos?

Métricas que pueden ser continuas o discretas.


¿Qué es estandarizar variables?
Es útil para colocar los datos en una escala común. Para facilitar la
comparación y el análisis de las variables, en el caso de clúster se
estandariza en desviación estándar.
SUPUESTOS:
Normalidad
Homogeneidad
Ausencia de multicolinealidad
INTERPRETACIÓN:
Estadísticos descriptivos: media
Historial de iteraciones: cuantas interacciones se hizo para crear los
clústeres.
Centro de clústeres finales: Al clúster mayor se le asigna las
características
ANOVA:
Ho: Medias son iguales
H1: Las medias son diferentes – todos los valores influyen y ninguno se
elimina.
JERARQUICO
Conseguir agrupaciones sucesivas entre ellas para que se van
integrando progresivamente a los clústeres de menor a mayor.
Variables categóricas de intervalo, nominal y dummys.
¿Qué explica el gráfico del Dendograma en el Análisis Jerárquico?
Muestra cómo se van uniendo o separando las observaciones a medida que se
forman los conglomerados en el proceso de agrupamiento.
ANOVA:
Analizamos la significancia, si influye o no.
INFORME:
Al número mayor le aplico la característica que le categoriza

TIPOS DE ANÁLISIS:
Enlace entre grupos: agrupar observaciones en la que se considera similitudes
entre observación de individuos. Quiero estructura jerárquica(J)
Enlace dentro de los grupos: agrupa observaciones en la que se considera
similitudes entre observaciones individuales DENTRO DE CADA CLUSTER. Útil para
formar clústeres compactos y densos(J)
Vecino más cercano: asigna a cada observación al clúster cuyo centroide esta mas
cerca de ella. Es adecuado usar para datos con clúster de formas irregulares y
tamaños diferentes
Vecino más lejano: asigna a cada observación al clúster cuyo centroide está más
lejano de ella. Útil para clústeres muy separados y bien ordenados
Agrupación de clústeres centroides: cuando deseas representar cada clúster
mediante un punto central y asignar cada observación al clúster cuyo centroide
este más cercano. (NJ)
Agrupación de clústeres de medianas: cuando quiero representar cada clúster
por su media de la observación, aquí asigno clúster cuyo centroide este mas cerca
de ella. Cuando busco más robustes frente a valores a típicos. (NJ)
Método Ward: Para formar clúster compactos y homogéneos minimizando la
varianza intracluster de datos. Útil cuando no se conoce la cantidad de clústeres. (j)

INTERPRETACIÓN
NUESTRO OBJETIVO ES SABER SI LOS CLIENTES DIFERENCIAN O NO
EL PUNTO DE VENTA.
ESTADITICOS DESCRIPTIVOS:

Estadísticas de grupo
N válido (por lista)
Desv. No
identifica o no el punto de venta Media Desviación ponderados Ponderados
no relación que tienen el 2,79 1,409 67 67,000
acompañante con el
encuestado
cuanto tiempo está en 96,52 47,587 67 67,000
minutos
numero de 3,03 2,283 67 67,000
acompañantes en
unidades
que representa en ese 9,64 5,449 67 67,000
grupo
distancia en metros del 15,63 9,013 67 67,000
punto de venta
si relación que tienen el 3,03 1,379 63 63,000
acompañante con el
encuestado
cuanto tiempo está en 86,33 53,091 63 63,000
minutos
numero de 3,46 2,620 63 63,000
acompañantes en
unidades
que representa en ese 8,95 4,956 63 63,000
grupo
distancia en metros del 16,68 9,254 63 63,000
punto de venta
Total relación que tienen el 2,91 1,395 130 130,000
acompañante con el
encuestado
cuanto tiempo está en 91,58 50,393 130 130,000
minutos
numero de 3,24 2,452 130 130,000
acompañantes en
unidades
que representa en ese 9,31 5,207 130 130,000
grupo
distancia en metros del 16,14 9,111 130 130,000
punto de venta

INTERPRETACIÓN DE LOS ESTADÍSTICOS DESCRIPTIVOS:

Al analizar los datos obtenemos como resultados que el promedio de no identificar el


punto de venta en relación a los acompañantes que tiene el encuestado es de 3 que es
laboral, el tiempo promedio que permanecen en la tienda es de 96 minutos, el numero
de acompañantes con los que va es de 3 personas, quien acompaña a la persona
encuestada por lo general es el abuelo y recorren una distancia de 15.63 metros.

Al estudiar los datos cuando el encuestado si identifica el punto de venta tenemos los
siguientes resultados: la relación de las personas que la acompañan es laboral, recorre la
tiendo en promedio 86 minutos, está acompañada de 3 personas, una de ellas por lo
general son sus abuelas y recorren la tienda un promedio de 16.68 metros.

PRUEBAS DE MEDIA IGUALES:


HO: Todas las varianzas son iguales

H1: Las varianzas son desiguales

Nivel de significancia de 0.005

Prueba de igualdad de medias de grupos


Lambda de
Wilks F gl1 gl2 Sig.
relación que tienen el ,993 ,967 1 128 ,327
acompañante con el
encuestado
cuanto tiempo está en ,990 1,331 1 128 ,251
minutos
numero de ,992 1,001 1 128 ,319
acompañantes en
unidades
que representa en ese ,996 ,567 1 128 ,453
grupo
distancia en metros del ,997 ,434 1 128 ,511
punto de venta

Al tener un valor p mayor a 0.05, tenemos evidencia suficiente para aceptar la hipótesis
nula, es decir, todas las varianzas son iguales así sabemos que todas las variables
influyen, es decir, que estas variables no discriminan.
Este es parecido a un análisis de correlación, pero este análisis me da un contexto
pequeño, ver si son iguales entre medias, saber si se discrimina o no.

PRUEBA DE BOX DE LA IGUALDAD DE MATRICES DE COVARIANZAS:

Saber si hay homogeneidad o no. Saber que prueba y cuál es la hipótesis nula.
Homogeneidad es un supuesto que se probar, antes debo sacar datos atípicos,
saber si es normal.

HO: Todas las varianzas de la matriz de varianzas son iguales, HOMO

H1: Las varianzas son desiguales, HETE

Nivel de significancia: 0.005

Regla de hipótesis: Debe ser mayor el valor p a 0.05, para aceptar.


Resultados de prueba
M de Box 15,118
F Aprox. ,966
gl1 15
gl2 65419,312
Sig. ,489
Prueba la hipótesis nula de
las matrices de covarianzas
de población iguales.

Al obtener un valor p de 0.489 con un nivel de significancia de 0.05 concluimos que


todas las varianzas de la matriz son iguales.

RESUMEN DE FUNCIONES DISCRIMINANTES CANÓNICAS

SE ACERQUE A UNO CON LA CORRELACIÓN CANÓNICA.


Indica que las varianzas dependientes son capaces de discriminar a los grupos y
cuando se acerca a 1 discrimina, nos conviene que discrimine.
Entre mas cerca esta a uno el estadístico Lambda de Wilks y ES
RECOMENDABLE se rechace Ho.
Si se acepta ho, no son capaces de discriminar, saco que tan relacionadas están las
variables. Aquí se ve la correlación.
Ho: No son discriminantes, las medias son iguales.
H1: Son discriminantes, las medias no son iguales (lo que se espera)
Nivel de significancia: 0.05
Al tener un valor de 0.647 siendo este mayor al nivel de significancia tenemos evidencia
suficiente para aceptar la hipótesis nula, es decir, los datos no son discriminantes.

FUNCIONES DE LAS CENTROIDES DE GRUPO:

Valor positivo, si identifica


Valor negativo, no identifica
Y se ve a que valor se apega más las variables.
Los valores que estén por encima de la media, se van a los respectivos grupos. Los
datos que se acerquen 0 son irrelevantes.
MATRIZ DE ESTRUCTURA

Nos indica la correlación, si es alta o no. La correlación es mayor a 0,4, 0.5, 0.6.
Según nuestro criterio.

COEFICIENTES DE FUNCION DE CLASIFICACIÓN:

Coeficientes de función de clasificación


identifica o no el punto de venta
No si
relación que tienen el 1,416 1,524
acompañante con el
encuestado
cuanto tiempo está en ,045 ,041
minutos
numero de acompañantes ,325 ,375
en unidades
que representa en ese grupo ,382 ,361
distancia en metros del ,219 ,225
punto de venta
(Constante) -8,883 -8,926
Funciones discriminantes lineales de Fisher

Obtenemos dos ecuaciones:

1. NO IDENTIFICA EL PUNTO DE VENTA


Z=1.416 ( relación ) +0.045 ( tiempo ) 0.325 ( acompañantes )+ 0.382 ( grupo )+ 0.219 ( distancia )+(−8.883)
Z =1.416 ( 3 ) +0.045 ( 150 )+ 0.325 ( 8 ) +0.382 ( 4 )+ 0.219 (5 )+(−8.883)
z=7.338
2. SÍ IDENTIFICA EL PUNTO DE VENTA

Z=1.524 ( relación ) +0.041 ( tiempo ) +0.375 ( acompañantes ) +0.361 ( grupo ) +0.225 ( distancia ) +(−8.926)
Z=1.524 ( 3 ) +0.041 ( 150 ) +0.375 ( 8 )+ 0.361 ( 4 )+ 0.225 (5 )+(−8.926)
z=7.365

RESPUESTA:
Al tener un valor de z de 7.365, concluimos que una persona que va acompañada de su
pareja, que recorre un tiempo promedio de 150 minutos, va con aproximadamente 5
acompañantes si identifica el punto de venta.

ANALISIS DE COMPONENTES PRINCIPALES:

1. Matriz de correlación:

Al tener un coeficiente de 0.500 concluimos que las variables de precio de la casa, dormitorios,
baños, pies cuadrados longitud, construcción y renovada si tienen relación media.

Si el determinante es alto si es un determinante aceptado.


2. Prueba de KMO:

Prueba de KMO: Al tener un valor de 0.514 se concluye que hay una muy mala adecuación de
las variables

Prueba de esfericidad de Bartlett:

Ho: La matriz de correlación es una matriz identidad

H1: La matriz de correlación no es una matriz identidad

- El valor p de 0.000 sugiere que las correlaciones entre las variables son

significativamente diferentes de cero lo que quiere decir que las variables están

correlacionadas (no es una matriz de identidad) y, por tanto, es apropiado el análisis.

3. Comunalidades:

4.Tabla de varianzas totales explicadas


5.Grafico de sedimentación

6. matriz de componente
7. Gráfico de componentes

9. Matriz de covarianza de puntuación de componente


Autovalor: cuantas veces está expresando la información a partir de una nueva variable

Cuanta info me da la nueva variable

1 – la info que solo una variable me da

1.5 variables –

REPASO ESTADISTICA:

ANALISIS DE COMPONENTES PRINCIPALES

Reducir datos, pero mantener la mayor cantidad de información.

NO explica la relación entre las variables, toma un conjunto de variables correlacionadas y las
convierte en un conjunto más pequeño que se llaman componentes principales.

INTERPRETACIÓN:

MATRIZ DE CORRELACIÓN:

- Se observa la relación de las variables con el determinante, es decir, si existe


multicolinealidad o no.
- En caso de que exista multi, se elimina una de las dos variables ya que explican lo
mismo
- Determinante: Evalúa multicolinealidad, cercano a 0.000 o cercano a 0, hay
multicolinealidad y el análisis es incorrecto.

PRUEBA DE KMO Y BARTLETT:

- KMO: Mide la proporción de la varianza común entre las variables en relación con la
varianza total. Es aceptable cuando es mayor a 0.5.

BARTLETT:

- HO: la matriz de correlación es una matriz de identidad – no correlación


- H1: la matriz de correlación no es una matriz identidad - si correlación
- P > 0,05 – Acepto Ho – no es adecuado el análisis
- P < 0.05– se rechaza Ho las variables no son correlacionadas y el análisis el apropiados

COMUNALIDADES:

- Nos da la proporción que explicada variable individualmente y cuales son más


importantes para explicar el estudio para esto deben ser mayores a 0.04 en la
extracción

VARIANZA TOTAL EXPLICADA:


- Nos da cuantos componentes se usan.
- Información crucial sobre la estructura de los datos y la efectividad del modelo
autovalores: representa la cantidad de varianza que cada factor captura. Se extraen
valores mayores a 1.
- Varianza total: muestra la varianza explicada de cada componente, evalúa la capacidad
del modelo para capturar la varianza total de datos.

Gráfico de sedimentación:

- valores mayores a 1 tomo en cuenta son los componentes


- es el grafico de la varianza que se asocia a casa factor generado y se utiliza para
comparar visualmente el tamaño de autovalores y determinar cuantos calores deben
retenerse.

Matriz de componente:

- Primer componente y veo las variables más relacionadas, las que tienen mas peso
- Segundo componente: veo las variables más relacionadas, las que tiene mas peso

Matriz de componente rotado:


- Interpreta la carga de variable en cada componente, facilita la interpretación de los
factores al hacer que las variables

Gráfico de componentes:

- Signo negativo: se encuentran las variables con tal efecto


- Signo positivo: se encuentran las variables con tal efecto
- Las variables que están cerca están altamente correlacionadas

MATRIZ DE PUNTUACION DE COMPONENTE:

Pesos utilizados para cada componente


9. Matriz de covarianza de puntuación de componente

- ANALISIS DE CORRESPONDECIA PRINCIPALES:

Se usa variables categorías y ordinales.

Se usa tablas de contingencia y pruebas de bondad de ajuste: chi cuadrado.

Supuestos:

- Independencia entre filas y columnas: me interesa que se rechazó ho para que existe
dependencia entre las variables.
- Ausencia de valores atípicos
- Frecuencias esperadas adecuadas: suficientes observaciones en cada celda de la tabla
- Homogeneidad de las varianzas: como varían los datos

Explorar la asociación entre variables categóricas, representadas en una tabla de contingencia,


a través de una técnica de reducción de dimensiones de visualización de datos.

Objetivo:

 Conocer que tan relacionadas están las variables


 Las categorías de las variables se representarán mediante puntos.
 Identificar patrones y estructura de datos
 Detectar posibles patrones o tendencias ocultas

DIFERENCIAS ENTRE CHI 2 Y ANALISIS DE CORRESPONDENCIA

Chi2: determinar si hay una asociación significativa entre 2 variables categóricas en una tabla
de contingencia

Análisis de correspondencia: explora la asociación de categorías y las reduce en dimensiones


para observar los datos.

TIPO DE NORMALIZACIÓN:

Simétrica: Para examinar diferencias o similitudes de las categorías

Principal: Examinar diferencias entre categorías de variables en lugar de las diferencias entre 2
variables.

Principal por fila: Examinar diferencias o similitudes entre categorías

Principal por columna

Personalizado

CONCEPTO DE INERCIA:

Como actúa naturalmente

Bajo: Actúan juntas las categorías

Alto: las categorías actúan por separado

ES IMPORTANTE ESETE ANALISIS, DEBIDO A QUE:

- Simplificar la compresión de datos complejos.


- Revelar relaciones inesperadas
- Ayuda a ala tomade decisiones
- Facilita la comunicación de resultados

INTERPRETACIÓN:

1.RESUMEN:

aporta información crucial para entender la fuerza y la dirección de esta asociación

ho: filas y columnas son independiente

h1: filas y columnas son dependientes

chi2 menor a valor p – rechazo ho

2.PUNTOS DE FILAS/COLUMNAS GENERALES:


Proporciona información detallada de las filas de la tabla mostrando como se distribuyen el
espacio reducido, aquí podemos identificar patrones y relación entre fila y columnas

Masa: la proporción total de la tabla de cada fila.

Masas = total de la fila/ total de toda la tabla

- COORDENADAS (PUNTUACIÓN DE DIMESIONES):

Muestra la posición de la fila en el espacio reducido.

- CONTRIBUCIÓN: DE LA FILA A LA INERCIA DE CADA DIMESION:

Muestra cuando contribuye esa fila a la variabilidad explicada por cada dimensión.

Inercia es como la varianza.

Masa*cuadrado de su coordenada

4.PUNTOS DE COLUMNA

1. Categoría: Las diferentes categorías de las columnas.


2. Dimensión 1, Dimensión 2, etc.: Las coordenadas de cada categoría en las respectivas
dimensiones.
3. Masa: La proporción de la muestra total que corresponde a cada categoría de columna.
4. Inercia: Una medida de la variación explicada por cada categoría en el análisis.
5. Contribución a la inercia total: Indica cuánto contribuye cada categoría a la inercia
total del análisis.
6. Calidad: La calidad de la representación de cada categoría en el espacio reducido
(generalmente, cuanto más cerca de 1, mejor representada está la categoría).
En masa se debe observar la categoría que mejor explica el estado civil y es casados con
0,642, en el punto de la inercia de la dimensión, vemos cuales de las categorías explica
mejor la dimensión 1 y la dimensión 2, en este caso en la dimensión 1 la categoría que
mejor explica es soltero con 0,634 y en la dimensión 2 la categoría otro con 0,626.
La dimensión de la inercia del punto explica básicamente lo mismo, con la diferencia que
en la dimensión uno explica mejor la categoría solteros con 0,983 y en la dimensión 2
explica mejor la categoría casados con 0,238.

5.GRAFICO DE PUNTOS Y COLUMNAS

Representa visualmente las relaciones entre las categorías de 2 variables categóricas de


una tabla de contingencia.

ANALISIS FACTORIAL:

- Explican las interrelaciones de las variables interrelacionadas


- Las variables originales juegan un papel de variables dependientes que se explican por
factores comunes y únicos que no son observables
- Encuentra variables sintéticas, latentes.
- Requiere de formulación de hipótesis y aplicación de métodos de inferencia estadística
- Reduce las variables en factores y los agrupa de manera que tengan una característica
similar.
- Se debe rotar hasta que quede la menor cantidad de error y que todas las variables
expliquen
- Se usa el AF para validar un test o su información
- Aplicamos el test y vemos que info nos da

ANALISI FACTORIAL EXPLORATORIO: agrupo variables en factores

ANALISIS FACTORIAL CONFIRMATORIO: ya se los factores y confirmo que tengan las


características

Hay 2 métodos:

METODO OBLICUO: no estoy seguro que están relacionadas los valores con otros.

Varimax, oblimax, quartimin

METODO ORTOGONAL: estoy seguro que los valores están relacionaos entre si

Ortomax, oblimax,quartimin
ANALISIS CONJUNTO:

Determinar qué características de un producto o servicio son las preferidas por los
consumidores y se cuantifican las mismas.

Puede incluir marca, color, precio, forma, garantía

Comprender como los consumidores valoran los diferentes atributos

Tablas:

Utilidades: usar los atributos con valores mayores y describir el producto

INTERPRETACIÓN PUNTO DE VENTA, CLÚSTER JERÁRQUICO.


OBJETIVO:
Determinar si el tiempo de recorrido y distancia son factores importantes que afectan en
la identificación de los clientes del punto de venta de nuestro local.

La media de la distancia hasta el punto de venta es de 16 metros, el tiempo recorrido del


cliente hacia el local comercial es de 91 minutos y el número de acompañantes de 3
personas.
Para el análisis se realizó hasta la onceava iteración para acumular los datos que
pertenecen al clúster.
Según el análisis, los que si identifican el punto de venta de nuestra tienda es el segundo
grupo que son las personas que tienen el local más cerca de su ubicación, sin embargo,
en cuestión al tiempo recorrido por minutos el tercer grupo son los que invierten menos
tiempo para ubicarse y por lo tanto, son los beneficiados en identificar el punto de venta
de nuestro local y, finalmente según el número de acompañantes el primer grupo logran
llegar al punto de venta con una mayor cantidad de personas.

Ho: Las medias son iguales


H1: Las medias no son iguales.
p>0.05 se acepta la hipótesis nula
En este análisis rechazamos la hipótesis nula, ya que el valor de significancia es menor a
0.05, por lo tanto, la distancia hasta el punto de venta, el tiempo recorrido por minuto, y
el número de acompañantes son factores que influyen en si nuestros clientes identifican
el punto de venta de nuestro local comercial en la ciudad de Cuenca.

En el primer clúster fue analizado 1, el segundo 60, y el tercer grupo 69 por lo tanto,
todos los datos fueron examinados y no tenemos ningún dato perdido.
ANALISIS FACTORIAL

Conocer los componentes del test de vals y que preguntas explican más que otras.

1.MATRIZ DE CORRELACIONES: Como cada variable está relacionada entre sí.

2.PRUEBA DE KMO Y BARTLETT

Prueba de KMO: la adecuación de la muestra, si están aportando o no.

Al tener un valor de 0.339, se concluye que la adecuación que la muestra no esta correcta.

Bartlett: Si tenemos matriz identidad, si tenemos correlación o no.

Ho: Matriz identidad

H1: No es matriz identidad

Con un valor menos a 0,05, se concluye que la relación entre las variables están relacionadas.

3.COMUNALIDADES

Comunalidades
Inicial Extracción
1.Me gusta probar cosas que son nuevas y diferentes " 1,000 ,806

2.Me gusta el reto de experimentar algo que nunca he hecho antes. " 1,000 ,687

3.Me gusta hacer cosas con mis manos " 1,000 ,777

4.Amo la actividad física " 1,000 ,794


5.Me gusta mirar a través de restaurantes y tiendas de alimentos " 1,000 ,901

6. Me gusta que haya variedad en mi vida " 1,000 ,750

7. Me gusta dirigir a otros." 1,000 ,838


8.Me gusta la gente y las cosas extravagantes. 1,000 ,831

9.Disfruto el reto de solucionar problemas. 1,000 ,648

10. Sigo las últimas tendencias y modas" 1,000 ,572

11. Estoy siempre en busca de una nueva emoción 1,000 ,693

12.Soy receptivo a nuevas ideas y tecnologías 1,000 ,685

13. Yo soy lo primero 1,000 ,564


14. Programo mi tiempo y actividades 1,000 ,728

15. Valoro la tecnología que proporciona un impulso de la productividad 1,000 ,740

16. Estoy comprometido con la familia y trabajo. " 1,000 ,656

17. Me gusta el dinero, estoy orientado al objetivo 1,000 ,730

18. Me gusta mi imagen y el status " 1,000 ,699

Las preguntas que más explican el test son: la pregunta 1,5,7,8.

4. VARIANZA TOTAL EXPLICADA:


Se obtiene 7 componentes que nos ayudaran a explicar de mejor manera el test, en
componente que me da más información es el primero.

5.GRÁFICO DE SEDIMENTACIÓN:

Observamos que los valores que están del 1 hacia arriba son los componentes que se usan.
6. MATRIZ DE COMPONENTE

Matriz de componente
Componente
1 2 3 4 5 6 7
17. Me gusta el dinero, estoy ,670
orientado al objetivo
10. Sigo las últimas ,603
tendencias y modas"
15. Valoro la tecnología que ,531
proporciona un impulso de la
productividad
5.Me gusta mirar a través de -,511
restaurantes y tiendas de
alimentos "
12.Soy receptivo a nuevas ,674
ideas y tecnologías
2.Me gusta el reto de ,607
experimentar algo que nunca
he hecho antes. "
1.Me gusta probar cosas que ,743
son nuevas y diferentes "
18. Me gusta mi imagen y el ,592
status "
11. Estoy siempre en busca ,541
de una nueva emoción
7. Me gusta dirigir a otros." ,505 ,658
6. Me gusta que haya ,636
variedad en mi vida "
4.Amo la actividad física " -,520
14. Programo mi tiempo y ,616
actividades
3.Me gusta hacer cosas con -,598
mis manos "
16. Estoy comprometido con ,536
la familia y trabajo. "
8.Me gusta la gente y las -,677
cosas extravagantes.
13. Yo soy lo primero
9.Disfruto el reto de
solucionar problemas.
Método de extracción: análisis de componentes principales.

Dentro del primer componente con las preguntas 5,10,15,17 explica los intereses en el estilo de
vida. En el segundo componente con las preguntas 12 y 2, explica el interés por conocer o
hacer cosas nuevas. En el tercer componente con las preguntas 1,18,11,7, explica la
personalidad, estatus social y la imagen personal. En el cuarto componente con las preguntas 4
y 6, explica si tiene un estilo de vida deportivo o no. En el quinto componente con las
preguntas 3, 14,16, explica el nivel de responsabilidad o cuan comprometido está con sus
deberes. En el sexto componente con la pregunta 8, explica si si es una persona extrovertida o
introvertida.

7.MATRIZ DE COMPONENTE ROTADO

Matriz de componente rotadoa


Componente
1 2 3 4 5 6 7
5.Me gusta mirar a través de ,924
restaurantes y tiendas de
alimentos "
6. Me gusta que haya ,731
variedad en mi vida "
10. Sigo las últimas -,627
tendencias y modas"
2.Me gusta el reto de ,738
experimentar algo que nunca
he hecho antes. "
3.Me gusta hacer cosas con ,692
mis manos "
1.Me gusta probar cosas ,685
que son nuevas y diferentes
"
12.Soy receptivo a nuevas ,522
ideas y tecnologías
7. Me gusta dirigir a otros." ,873
4.Amo la actividad física " -,579
18. Me gusta mi imagen y el ,532
status "
11. Estoy siempre en busca -,806
de una nueva emoción
9.Disfruto el reto de ,749
solucionar problemas.
17. Me gusta el dinero, estoy ,625 ,557
orientado al objetivo
14. Programo mi tiempo y ,803
actividades
16. Estoy comprometido con ,662
la familia y trabajo. "
13. Yo soy lo primero ,711
8.Me gusta la gente y las ,872
cosas extravagantes.
15. Valoro la tecnología que ,577
proporciona un impulso de la
productividad
Método de extracción: análisis de componentes principales.
Método de rotación: Varimax con normalización Kaiser.
a. La rotación ha convergido en 8 iteraciones.

Dentro del primer componente con las preguntas 5,6,10 explica los intereses en el estilo de
vida. En el segundo componente con las preguntas 1,2,3,12 explica el interés por conocer o
hacer cosas nuevas. En el tercer componente con las preguntas 4,7,18 explica la personalidad,
estatus social y la imagen personal. En el cuarto componente con las preguntas 9,11,17, explica
si tiene un estilo de vida deportivo o no. En el quinto componente con las preguntas 14,16,
explica el nivel de responsabilidad o cuan comprometido está con sus deberes. En el sexto
componente con la pregunta 17,13 explica si si es una persona extrovertida o introvertida. En
el séptimo componente con las preguntas 8 y 15, explican el gusto por las cosas nuevas y
exatacantes.
ANALISI DE CROBACH /FIABILIDAD:

1. Estadísticas de fiabilidad:

Al tener un valor menos a 0.7 observamos que la estructura de los datos es erróneos.

2. Estadísticas de total de elemento

Estadísticas de total de elemento


Varianza de Alfa de
Media de escala escala si el Correlación total Correlación Cronbach si el
si el elemento se elemento se ha de elementos múltiple al elemento se ha
ha suprimido suprimido corregida cuadrado suprimido
1.Me gusta probar 48,94 47,673 ,214 ,724 ,460
cosas que son nuevas y
diferentes "
2.Me gusta el reto de 48,78 41,725 ,523 ,460 ,378
experimentar algo que
nunca he hecho antes. "
3.Me gusta hacer cosas 48,75 48,839 ,161 ,676 ,472
con mis manos "
4.Amo la actividad 48,44 52,190 ,019 ,574 ,498
física "
5.Me gusta mirar a 48,66 53,007 -,027 ,834 ,505
través de restaurantes y
tiendas de alimentos "
6. Me gusta que haya 48,94 48,577 ,138 ,534 ,478
variedad en mi vida "
7. Me gusta dirigir a 48,69 52,673 -,004 ,755 ,501
otros."
8.Me gusta la gente y 48,44 51,286 ,117 ,650 ,480
las cosas
extravagantes.
9.Disfruto el reto de 48,66 52,878 -,022 ,390 ,505
solucionar problemas.
10. Sigo las últimas 48,44 54,125 -,085 ,682 ,508
tendencias y modas"
11. Estoy siempre en 48,59 55,152 -,157 ,485 ,526
busca de una nueva
emoción
12.Soy receptivo a 48,63 43,145 ,483 ,699 ,395
nuevas ideas y
tecnologías
13. Yo soy lo primero 49,22 50,564 ,062 ,433 ,494
14. Programo mi tiempo 48,56 50,641 ,106 ,676 ,483
y actividades
15. Valoro la tecnología 48,72 45,047 ,387 ,746 ,420
que proporciona un
impulso de la
productividad
16. Estoy 48,88 44,694 ,383 ,554 ,419
comprometido con la
familia y trabajo. "
17. Me gusta el dinero, 49,19 50,028 ,084 ,664 ,490
estoy orientado al
objetivo
18. Me gusta mi imagen 48,59 47,539 ,240 ,626 ,454
y el status "

Se elimina la pregunta 2 y 12. Que dice:


2. Me gusta el reto de experimentar algo que nunca he hecho antes
12. Soy receptivo a nuevas ideas y tecnologías

ANÁLISIS CLÚSTER NO JERARQUICO

Objetivo: saber si las personas reconocen el punto de venta.

1. Datos descriptivos:

2. Centro de clúster iniciales:

3. Historial de interacciones:
El primero no necesito interacciones.

El segundo y tercer clúster necesitaron 11 internaciones.

4. Centro de clúster finales

Dentro del análisis en la distancia en metros del punto de venta dentro del primer y
segundo clúster son positivos, es decir, en el primero grupo se muestra que la distancia
del punto de venta es buena, en el segundo grupo observamos que la distancia es
media y en el tercer grupo la distancia no es un factor importante para ese clúster.
Dentro de el tiempo que esta en la tienda dentro del primer y segundo clúster se
observan valores negativos en donde se dice que no recorren toda la tienda o el
tiempo que están dentro del lugar es corto, a comparación del clúster 3 que su tiempo
dentro de la distancia es significativo. Por último, el número de acompañantes de los
encuestados dentro del primer clúster observamos que aquí las personas van
acompañadas de varias personas, en el segundo clúster al menos una o dos personas
son acompañantes y en el tercer clúster van solos.
Gráfico:

5. ANOVA
6. Numero de casos de cada clúster

ANALISIS CONJUNTO:

a) ¿Qué es un Análisis Conjunto?

- El Análisis de Conjunto es, precisamente, una técnica estadística que


determina qué características de un producto (o servicio) son las preferidas por los
consumidores y cuantifica estas preferencias. Las características de un producto
incluyen atributos como la marca, el color, formas, precio y garantía y el análisis de
conjunto mide las preferencias del consumidor por las características particulares de
un producto.

b) ¿Por qué sería útil aplicar el Análisis Conjunto para el producto o servicio
que estás creando?
El Análisis Conjunto es una técnica estadística que se emplea para comprender
cómo los consumidores valoran los diferentes atributos de un producto o
servicio.

En nuestro caso tenemos como producto “Yogurt Griego con Granola, tenemos
consideraciones importantes de nuestros compañeros:

1.- Identificación de Atributos Clave:


El Análisis Conjunto nos permite determinar qué características del yogurt
(como el sabor, la textura, el precio, el valor nutricional y el empaque) son más
importantes para nuestros compañeros. Esto ayuda a priorizar los atributos que
más influyen en la decisión de compra.

2.- Optimización del Producto:


Al entender las preferencias específicas de nuestros compañeros de curso,
podemos diseñar un snack que maximice su satisfacción. Esto significa crear un
producto que se ajuste perfectamente a sus gustos y necesidades, aumentando así
la probabilidad de éxito en el mercado.

3.- Determinación del Precio Adecuado:

Incluir el precio como un factor en el análisis nos ayuda a comprender cuánto


están dispuestos a pagar los estudiantes por el yogurt. Esto es crucial para
establecer un precio competitivo que maximice tanto las ventas como los
márgenes de ganancia, sin sacrificar la percepción de calidad.

c) Aplica un Análisis Conjunto y especifica a continuación los factores y los


niveles que propusiste en el diseño ortogonal.

Producto: Snack saludable – Yogurt griego con granola.


Características:

Sabor:

 Básico: Yogurt con miel


 Clásico: Yogurt con granola y miel
 Gourmet: Yogurt granola y frutos rojos
 Premium: Yogurt granola chocolate y almendras

Textura:
- Suave y cremosa
- Espesa
- Gelatinosa

Precio:

- 1.30
- 1.50
- 2.00

Valor nutricional:

- Bajo en grasa
- Alto en fibra:
- Sin azúcar
- Alto en proteína

Empaque:

- Vaso de plástico transparente.


- Vaso de plástico reciclable.
- Vaso de cartón biodegradable.
- Envase de vidrio reutilizable.

d) Interpreta los resultados que obtuviste.

Utilidades
Estimaci Desv.
ón de Error
utilidad
Sabor Yogurt con miel ,267 ,173
Yogurt con granola y miel -,143 ,214
Yogurt granola y frutos -,403 ,214
rojos
Yogurt granola chocolate y ,278 ,214
almendras
Textura Suave y cremosa -,427 ,157
Espesa -,127 ,157
Gelatinosa ,553 ,188
Empaque Vaso de plástico ,080 ,173
transparente
Vaso de plástico reciclable -,120 ,214
Vaso de cartón ,140 ,214
biodegradable
Envase de vidrio reutilizable -,100 ,214
Valor Bajo en grasa -,008 ,097
Nutricional Alto en fibra -,016 ,193
Sin azúcar -,025 ,290
Alto en proteína -,033 ,387
Precio 1.30 -,173 ,151
1.50 -,346 ,301
2.00 -,519 ,452
(Constante) 4,166 ,368

Según los datos obtenidos sobre las preferencias del producto de un Snack saludable –
Yogurt griego con granola. Tenemos como resultado que, en cuanto al sabor los
consumidores optan por Yogurt granola chocolate y almendras, en cuestión de textura
escogieron gelatinosa con un empaque de vaso de plástico transparente, con un valor
nutricional bajo en grasa y con un precio de $1.30. Por lo tanto, se debería tomar en
cuenta estas características para que el producto tenga un buen rendimiento en el
mercado.

- Gráficos de cada factor:


Sabor:
Se observa que los encuestados prefieren el sabor de yogurt con granola, chocolate y
almendras, sim embargo, el sabor de yogurt con miel también tiene un porcentaje de
aceptación por parte de los posibles consumidores, por otro lado, los sabores con menos
aceptación son yogurt con granola y miel y yogurt granola y frutos rojos.

Textura:

Según nuestros posibles consumidores la textura del yogurt preferida es la gelatinosa y


la menos preferida por los mismos es la espesa, cremosa y suave.

Empaque:
Se observa que los empaques preferidos para nuestro producto son: el vaso de plástico y
un vaso de cartón biodegradable.
Valor nutricional:

Se obtuvieron resultados negativos, es decir que, para los consumidores el valor


nutricional del producto no es un atributo muy valorado, sin embargo, prefieren que el
producto sea bajo en grasa.

Precio:
Los consumidores prefieren el menor precio, es decir, un yogurt con granola con precio
de $1.30.

-Resumen de importancia:

Los atributos valorados de los consumidores para lanzar un snack saludable – yogurt
con granola son: Sabor, textura del yogurt y el empaque.

e) ¿Cuáles son tus conclusiones después de analizar los resultados del Análisis
Conjunto con respecto a tu producto o servicio?
El análisis del Yogurt Griego con Granola muestra que los consumidores prefieren el
sabor de chocolate y almendras, valoran una textura gelatinosa y un empaque en vaso de
plástico transparente, y buscan un producto con bajo contenido en grasa a un precio de
$1.30. Estos insights indican que se debe desarrollar un producto que incorpore estas
características clave. La estrategia de mercado debe enfatizar en el sabor y la textura del
producto y posicionar el producto en puntos de venta estratégicos como supermercados
especializados y gimnasios, asegurando así su máxima aceptación y
rendimiento en el mercado.

También podría gustarte