0% encontró este documento útil (0 votos)
45 vistas16 páginas

Informe Estadistica

El informe presenta un análisis estadístico de datos de clientes de una cadena de tiendas de ropa, utilizando metodologías descriptivas e inferenciales para entender patrones de compra y satisfacción. Se identifican variables relevantes, se calculan intervalos de confianza y se realizan pruebas de hipótesis, destacando que la proporción de clientas mujeres no supera el 70% y que el descuento promedio observado es inferior al 10%. Los hallazgos sugieren la importancia de la estadística en la toma de decisiones comerciales informadas para mejorar la experiencia del cliente.

Cargado por

Patricio Daniel
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
45 vistas16 páginas

Informe Estadistica

El informe presenta un análisis estadístico de datos de clientes de una cadena de tiendas de ropa, utilizando metodologías descriptivas e inferenciales para entender patrones de compra y satisfacción. Se identifican variables relevantes, se calculan intervalos de confianza y se realizan pruebas de hipótesis, destacando que la proporción de clientas mujeres no supera el 70% y que el descuento promedio observado es inferior al 10%. Los hallazgos sugieren la importancia de la estadística en la toma de decisiones comerciales informadas para mejorar la experiencia del cliente.

Cargado por

Patricio Daniel
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

INFORME CASO DE ESTUDIO ESTADISTICO

ESTADISTICA DESCRIPTIVA -INTERVALOS DE CONFIANZA-PRUEBA


DE HIPOTESIS
INGENIERIA COMERCIAL
AGUSTIN NEGRETE
IGNACIO ROJAS
CATALINA SOTO

DOCENTE FABIOLA GESELL

JULIO 2025
Contenido
INTRODUCCION ...................................................................................................................... 3
DESARROLLO ........................................................................................................................... 4
CONCLUSION ........................................................................... ¡Error! Marcador no definido.

INDICE ILUSTRACIONES

Ilustración 1:Preferencia de tiendas por parte de las mujeres............................................... 5


Ilustración 2:Histograma montos mujeres ............................................................................. 7
Ilustración 3:Calculo de coeficientes de variación , mediante el orden de los datos............. 9
INTRODUCCION
En la actualidad, las empresas del rubro comercial enfrentan una creciente necesidad de
comprender a sus clientes de forma profunda y precisa para tomar decisiones estratégicas
que les permitan mantenerse competitivas en un entorno dinámico. En este contexto, la
estadística se convierte en una herramienta fundamental para analizar grandes volúmenes
de datos, identificar patrones de comportamiento y apoyar la toma de decisiones basada en
evidencia.

El presente informe tiene como objetivo aplicar metodologías estadísticas descriptivas e


inferenciales al análisis de una base de datos perteneciente a una cadena de tiendas de
ropa, la cual ha recolectado información de clientes durante tres meses en distintos tipos
de locales: outlet, boutique y centros comerciales. Entre las variables consideradas se
encuentran edad, sexo, ingresos, monto de compra, nivel de satisfacción, descuentos
recibidos, entre otras.

A lo largo de este documento se abordarán distintos aspectos analíticos, tales como la


identificación de la población y muestra, la propuesta de nuevas variables relevantes, la
construcción de tablas y gráficos para explorar el comportamiento de compra de las
mujeres, y el análisis del nivel de homogeneidad del gasto entre hombres y mujeres.
Además, se realizarán estimaciones estadísticas mediante intervalos de confianza y pruebas
de hipótesis, utilizando el lenguaje de programación Python como herramienta principal
para el procesamiento y visualización de los datos.

Este informe no solo busca cumplir con los resultados de aprendizaje del curso, sino también
demostrar cómo la estadística aplicada puede convertirse en una poderosa aliada para el
sector económico y administrativo, especialmente en la toma de decisiones comerciales
informadas y orientadas a mejorar la experiencia del cliente.
DESARROLLO
Pregunta 1: Identifique la población, muestra en estudio y unidad de observación (3
puntos)

Población: Todos los clientes que compran en las tiendas de la cadena a nivel nacional o
regional.

Muestra: 120 clientes encuestados que visitaron los tres tipos de tiendas durante el
estudio de tres meses.

Unidad de observación: Cada cliente encuestado, ya que a cada uno se le recopila


información de forma individual.

Pregunta 2: Proponga una variable nueva para cada tipo (4 puntos)

Variable Cuantitativa Continua: Satisfacción total (0–100) basada en una escala más
detallada.

Variable Cuantitativa Discreta: Número de prendas compradas.

Variable Cualitativa Nominal: Tipo de prenda favorita (calzado, jeans, blusas, etc.).

Variable Cualitativa Ordinal: Nivel de fidelidad (bajo, medio, alto).

Pregunta 3

Tipo de Tienda Cantidad

Outlet 74

Centro comercial 43

Boutique 31
Ilustración 1:Preferencia de tiendas por parte de las mujeres

Las mujeres encuestadas prefieren claramente el tipo de tienda "Outlet", seguido por
"Centro Comercial" y finalmente "Boutique". Esto podría deberse a mejores precios o
mayor variedad en outlets.

Pregunta 4

a) Distribución de frecuencia e interpretación (4 puntos)

Se construyó una distribución de frecuencia agrupando los montos de compra en 6


intervalos. A cada clase se le asignó una marca de clase, representando el valor promedio
del intervalo. Esta tabla permite visualizar cómo se distribuye el gasto de las mujeres. Por
ejemplo, si la clase más frecuente se ubica entre $400.000 y $500.000, significa que este
es el rango de gasto más habitual entre las clientas.
Intervalo Frecuencia Valor representativo

(493104 ;
14 497219
501333]
(501333 ;
11 505447
509561]
(534245 ;
13 538360
542474]
(526017 ;
9 530131
534245]
(484876 ;
8 488990
493104]
(509561 ;
8 513675
517789]
(517789 ;
7 521903
526017]
(476648 ;
7 480762
484876]
(542474 ;
6 546588
550702]
(567158 ;
6 571272
575386]

b) Gráfico adecuado y comentario (3 puntos)

El gráfico de barras de la distribución muestra una concentración de compras en uno o dos


rangos, lo que sugiere que hay un comportamiento típico de gasto. Si el gráfico tiene una
forma simétrica, entonces el comportamiento del gasto es balanceado; si está sesgado a la
derecha o izquierda, revela la presencia de compras inusualmente altas o bajas.
Ilustración 2:Histograma montos mujeres

c) Cálculo e interpretación de media y mediana (2 puntos)

• Media: representa el promedio general del gasto de las mujeres. Este valor se ve
influido por compras muy altas o muy bajas.

• Mediana: es el valor central del gasto. La mediana es más representativa en caso


de asimetrías en los datos.

Ambas medidas permiten entender si la distribución está equilibrada o sesgada.

Media: $512.383

Mediana: $510.170

Ambas medidas son bastante cercanas, lo que sugiere una distribución relativamente
simétrica, aunque el sesgo (ver siguiente punto) revela una leve inclinación.

d) Comportamiento de la variable y su forma (2 puntos)

Si la media es mayor que la mediana, se trata de una distribución sesgada a la derecha, lo


que implica que algunas clientas gastan mucho más que el promedio. Si la media y la
mediana son similares, indica una distribución simétrica, y si la media es menor que la
mediana, sería una distribución sesgada a la izquierda. La forma y simetría del histograma
o gráfico de barras permite corroborar visualmente esta conclusión.

La distribución del monto de compra presenta un comportamiento ligeramente asimétrico


negativo con un sesgo de -0,35, lo cual indica que hay más valores concentrados hacia la
derecha (altos), y algunos valores extremos bajos que empujan un poco hacia la izquierda.

Esto se relaciona directamente con las medidas de tendencia central:

La media es ligeramente mayor que la mediana, lo que suele indicar una distribución con
ligera concentración hacia los valores más altos, pero también influenciada por compras
más bajas.

e)

Es decir, casi la mitad de las mujeres realizaron compras por un monto igual o inferior a
$507.463.

Pregunta 5

Primero, se tiene el siguiente proceso de calculo:

Orden de los datos, generando el valor monto en un extremo solo para los hombres y en
otro extremo el valor monto solo para las mujeres.

Separamos las muestras en hombres y mujeres

Calculamos, media y desviación estándar para cada muestra para proceder al calculo del
coeficiente de variación :
Sexo Compra promedio monto de compra femenino
Femenino 440471 512383,1419
Femenino 451718 promedio monto de compra masculino
Femenino 478717 529718,8431
Femenino 526872 desviacion estandar F
Femenino 454394 55411,91436
Femenino 481202 desviacion estandar M
Femenino 525515 60764,87042
Femenino 501845
Femenino 495791 CV F
Femenino 540301 0,108145467
Femenino 476169 CV M
Femenino 455672 0,114711552
Femenino 571809
Femenino 460225
Femenino 478112
Femenino 472325
Femenino 384750

Ilustración 3:Calculo de coeficientes de variación , mediante el orden de los datos

El grupo femenino tiene un comportamiento más homogéneo en cuanto al monto de


compra, ya que su coeficiente de variación es menor.

Esto significa que, en promedio, las mujeres tienden a tener una menor dispersión relativa
en sus montos de compra respecto a su media, comparado con los hombres.

Pregunta 6

Procedemos a calcular la estadística descriptiva del monto de compra :

promedio
521194,977
desvest
58742,6347
n
301

Procedemos a calcular el intervalo de confianza


Interpretación:

Con un nivel de confianza del 90%, se tiene que el valor promedio poblacional del monto de
compra se encuentra entre $515.622,79 y $526.767,17. Esto significa que si se repitiera este
procedimiento de estimación con múltiples muestras del mismo tamaño, aproximadamente
el 90% de los intervalos construidos contendrían el verdadero valor medio poblacional. Esta
afirmación se fundamenta en la teoría del muestreo y en la distribución normal del
estimador de la media cuando el tamaño muestral es suficientemente grande.

Pregunta 7

Con un 96% de confianza, se estima que la proporción de clientes muy frecuentes que
acuden a la tienda se encuentra entre 32,79% y 44,29%. Esto significa que, si se tomaran
muchas muestras del mismo tamaño y se calcularan los intervalos de confianza
correspondientes, aproximadamente el 96% de ellos contendrían la verdadera proporción
poblacional de clientes muy frecuentes.

Pregunta 8

promedio 2517972,09
desvest 292155,97
n 301

Con un 99% de confianza, se estima que la desviación estándar poblacional del ingreso se
encuentra entre $270.428,03 y $317.902,69. Esto significa que, bajo el supuesto de
normalidad, si se repitiera el proceso muchas veces con muestras de tamaño 301,
aproximadamente el 99% de los intervalos construidos contendrían la verdadera desviación
estándar de los ingresos.

Pregunta 9
Con un 90% de confianza, no se encuentra evidencia estadísticamente significativa para
afirmar que la proporción de clientas mujeres es superior al 70%. Por el contrario, la
proporción muestral observada (49,17%) se encuentra muy por debajo del umbral
planteado en la hipótesis, lo que refuerza la conclusión de que la proporción de mujeres en
la clientela probablemente no excede el 70% en la población.

Esta evidencia sugiere que cualquier política, campaña o estrategia que se base en la
presunción de una mayoría femenina superior al 70% podría estar operando bajo una
suposición errónea desde el punto de vista estadístico.

Pregunta 10

Primero pasamos los datos a decimal porcentual.

0,15
0,12
0,05
0,14
0,12
0,02
0,11
0,03

Se procede a los cálculos del estadístico de prueba :


Tras realizar la prueba de hipótesis para determinar si el descuento promedio aplicado
corresponde efectivamente al 10%, se ha calculado un valor del estadístico de prueba
−3,393. Este valor representa la cantidad de desviaciones estándar que la media muestral
(observada en los datos) se encuentra por debajo de la media hipotética postulada en la
hipótesis nula.

Bajo el supuesto de que el verdadero promedio de los descuentos sea del 10%, como
sostiene la hipótesis nula, un valor tan extremo como el observado (o más) tendría una
probabilidad muy baja de ocurrir, menor al 1%. De hecho, el valor crítico para una prueba
bilateral al 1% de significancia es ±2,576. Dado que el valor observado del estadístico cae
fuera de este intervalo (es decir, fuera de la región de aceptación), se concluye que la
diferencia es estadísticamente significativa.

Esto significa que existe evidencia suficiente para rechazar la hipótesis nula y afirmar, con
un 99% de confianza, que el verdadero promedio del descuento no es del 10%. El resultado
obtenido sugiere que el descuento observado es menor, ya que la media muestral fue de
aproximadamente 8,9%, lo cual puede tener implicancias en términos de transparencia o
cumplimiento con las políticas de marketing o ventas.

En términos prácticos, este hallazgo podría interpretarse como un indicio de que la empresa
o entidad que aplica estos descuentos no está cumpliendo con el valor promocionado o
esperado del 10%, lo que podría generar tanto consecuencias regulatorias como de
confianza por parte de los consumidores. También abre la puerta a analizar si este menor
descuento es producto de un error sistemático, un cambio en la política interna no
comunicado, o un sesgo en la aplicación práctica de los descuentos en los puntos de venta.

Pregunta 11

El cálculo muestra que, con una desviación estándar muestral de aproximadamente $58.742
y un error máximo admisible de $50.000, se requerirían al menos 5 observaciones
(redondeando hacia arriba) para poder estimar el gasto promedio con un 93% de confianza.
Sin embargo, como ya cuentas con una muestra de 301 clientes, esta muestra es mucho más
que suficiente para lograr una estimación robusta con el margen de error especificado.

Esto significa que los resultados obtenidos a partir de los 301 datos permiten realizar
inferencias sobre el gasto promedio de los clientes con gran precisión. El bajo número
mínimo requerido (5) se debe a que el error tolerado es relativamente amplio respecto a la
dispersión de los datos. En la práctica, mientras más datos tengas, más confiable y estrecho
será el intervalo de confianza.
Al comparar ambos intervalos, se puede observar que el intervalo corregido usando el error
estándar fijado de $50.000 y multiplicado por el valor crítico de 𝑧 (1,812) es
considerablemente más amplio, abarcando un rango de más de $181.000 entre sus
extremos. Esto es consecuencia directa de aceptar una mayor incertidumbre al momento
de estimar el gasto promedio de los clientes.

En cambio, el intervalo obtenido a partir de los datos reales de la muestra (301


observaciones) y su desviación estándar muestral es mucho más preciso y acotado, con una
amplitud de solo alrededor de $12.260. Esto refleja la ventaja estadística de tener una
muestra grande y bien distribuida, permitiendo una estimación mucho más exacta del
promedio poblacional.

En términos prácticos, el intervalo corregido ofrece una visión menos precisa pero suficiente
si se está en la etapa de planificación del estudio y se impone un error estándar por motivos
de costos o logística. Por otro lado, el intervalo empírico demuestra que los datos actuales
permiten realizar inferencias con mayor certeza y menor margen de error, lo que fortalece
la confianza en las decisiones que puedan tomarse a partir del análisis.

Codigos de Python

Programación Python
import pandas as pd

import numpy as np

import [Link] as plt

import seaborn as sns

from scipy import stats

from math import sqrt

# Cargar archivo

df = pd.read_excel('/content/Base_8.xlsx') # Cambiar ruta si estás en otro entorno

# Vista general

[Link]()

También podría gustarte