1.1.
Generalidades Históricas y Conceptuales de la Disciplina
La probabilidad es una medida de la posibilidad de que ocurra un evento, mientras que la estadística es
la ciencia que se ocupa de la recolección, análisis e interpretación de datos.
¿Quiénes son los padres de la probabilidad y estadística?
1.Blaise Pascal (1623-1662):
2.Pierre-Simon Laplace (1749-1827
3.Sir Francis Galton (1822-1911
4.Andréi Kolmogórov(1903-1987
5.Ronald A. Fisher (1890-1962
6.JerzyNeyman(1894-1981) y EgonPearson (1895-1980
¿Cuál es la diferencia entre la estadística y la probabilidad?
Probabilidad:
1.Definición: Trata de predecir la probabilidad de que ocurran eventos futuros basándose en
información y suposiciones previas.
2.Enfoque: Se ocupa de calcular y medir las probabilidades de diferentes resultados.
3.Aplicación: en una variedad de contextos, como juegos de azar, teoría de juegos, estadísticas
inferenciales y toma de decisiones bajo incertidumbre.
4.Objetivo: es proporcionar un marco matemático para la incertidumbre y la aleatoriedad, lo que
permite realizar predicciones basadas en modelos probabilísticos.
Estadística:
1.Definición: Se centra en la extracción de información útil a partir de conjuntos de datos.
2.Enfoque: en el estudio de datos reales observados o recopilados y cómo estos datos pueden ser
analizados y utilizados para tomar decisiones o sacar conclusiones.
3.Aplicación: La estadística se aplica en una amplia variedad de campos, incluyendo ciencias sociales,
ciencias naturales, economía, medicina, ingeniería y negocios, entre otros.
4.Objetivo: es describir, resumir y analizar datos, así como sacar inferencias o conclusiones basadas en
la información recopilada.
1.2. Aplicaciones de la Disciplina en el Ámbito de los Negocios
Optimización de la Cadena de Suministro
Predicción de la Demanda
Amazon utiliza modelos de regresión y análisis de series temporales para predecir la demanda de
productos. Esto permite a la empresa ajustar sus niveles de inventario y evitar tanto el exceso como la
escasez de productos.
Gestión de Inventarios
Amazon emplea algoritmos de machine learning para optimizar la gestión de inventarios. Estos
algoritmos analizan datos históricos y actuales para determinar la cantidad óptima de productos que
deben mantenerse en stock en cada centro de distribución.
Optimización de Rutas de Envío
Amazon utiliza análisis de datos geoespaciales y algoritmos de optimización de rutas para mejorar la
eficiencia de sus entregas. Esto incluye la minimización de distancias recorridas y la maximización de la
capacidad de carga de los vehículos.
2. Mejora de la Experiencia del Cliente
Personalización de Recomendaciones
Amazon utiliza análisis predictivos y algoritmos de machine learning para personalizar las
recomendaciones de productos. Estos algoritmos analizan el historial de compras y navegación de los
clientes para ofrecer recomendaciones precisas.
Análisis de Comportamiento del Cliente
Amazon recopila y analiza datos sobre el comportamiento de los clientes para mejorar la experiencia de
compra. Esto incluye el análisis de patrones de navegación, tiempos de permanencia en la página y
tasas de abandono del carrito de compras.
Ejemplo Gráfico: Un gráfico circular que muestra la distribución de las razones por las cuales los
clientes abandonan sus carritos de compras.
1.3. Aplicaciones de la Disciplina en el Ámbito de la Administración
Uso de técnicas estadísticas para mejorar la eficiencia y efectividad en la gestión organizacional.
Ejemplo: Evaluación del desempeño de empleados mediante análisis de datos.
Caso de Estudio:General Electricy su uso de Six Sigma para mejorar procesos y reducir defectos.
1.4. El Concepto de Población y de Muestra
La poblaciónes el conjunto completo de elementos que se estudian, mientras que la muestra es un
subconjunto representativo de esa población.
Ejemplo: Encuestas de satisfacción del cliente donde se selecciona una muestra de clientes para inferir
sobre la población total.
1.5. Estadísticas Descriptivas e Inferenciales
La estadística descriptiva resume y describe los datos, mientras que la estadística inferencial hace
predicciones y generalizaciones basadas en una muestra.
Ejemplo: Uso de gráficos y medidas de tendencia central para resumir datos de ventas (descriptiva) y
pruebas de hipótesis para evaluar estrategias de marketing (inferencial).
2.1. Las variables y los Datos
Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e
interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos
para el estudio.
Una variable es una característica de los elementos que es de interés.
Introducción a las Variables y Datos en Estadística
Una variable estadística es una característica o propiedad que puede tomar diferentes valores en un
conjunto de datos. En estadística, las variables se utilizan para representar y analizar datos. Existen dos
tipos principales de variables:
Las variables se describen como:
✓ Variables cualitativas
También conocidas como categóricas, estas variables describen cualidades o categorías.
Ejemplos y Usos de las Variables Cualitativas:
Color de Ojos:
Categorías: Azul, verde, marrón, negro.
Uso: En estudios genéticos para analizar la distribución de colores de ojos en una población.
Estado Civil:
Categorías: Soltero, casado, divorciado, viudo.
Uso: En estudios demográficos para entender la distribución del estado civil en diferentes regiones.
✓ Variables cuantitativas
Estas variables representan cantidades numéricas y pueden ser medidas.
Se dividen en:
•Discretas: Toman valores específicos y contables, como el número de empleados en una empresa.
•Continuas: Pueden tomar cualquier valor dentro de un rango , como la altura de una persona o los
ingresos anuales.
Unavariable estadísticaes una característica o propiedad que puede tomar diferentes valores en un
conjunto de datos. En estadística, las variables se utilizan para representar y analizar datos. Existen dos
tipos principales de variables:
Variables cualitativas: También conocidas como categóricas, estas variables describen cualidades o
categorías. Ejemplos incluyen el color de ojos, el estado civil, o el tipo de producto.
Variables cuantitativas: Estas variables representan cantidades numéricas y pueden ser medidas. Se
dividen en:
Discretas: Toman valores específicos y contables, como el número de empleados en una empresa.
Continuas: Pueden tomar cualquier valor dentro de un rango, como la altura de una persona o los
ingresos anuales.
Tipos de Variables en Administración Estratégica
▪ Variables Internas: Factores dentro de la empresa que pueden ser controlados.
▪ Ejemplo: Productividad de los empleados, costos operativos.
▪ Variables Externas: Factores fuera de la empresa que afectan su desempeño.
▪ Ejemplo: Condiciones económicas, competencia en el Mercado
Aplicaciones de Probabilidad y Estadística en Administración Estratégica
Análisis de Riesgos: Uso de la probabilidad para evaluar riesgos y oportunidades.
• Ejemplo: Evaluación de la probabilidad de éxito de un nuevo producto en el mercado.
• Toma de Decisiones: Cómo la estadística ayuda en la toma de decisiones informadas.
• Ejemplo: Decisiones de inversión basadas en análisis de datos históricos.
Software de Análisis Estadístico
1. Tableau
Descripción: Tableau es una herramienta de visualización de datos que permite crear gráficos
interactivos y tableros informativos.
Uso: Ideal para analizar grandes conjuntos de datos y presentar información de manera visualmente
atractiva.
Ventajas: Facilita la identificación de tendencias y patrones, lo que ayuda en la toma de decisiones
informadas.
2. Power BI
Descripción: Desarrollado por Microsoft, Power BI es una herramienta de inteligencia empresarial que se
integra fácilmente con otras aplicaciones de Microsoft.
Uso: Permite crear informes y “dashboards” interactivos.
Ventajas: Su interfaz intuitiva y su capacidad de integración con Excel y Azure lo hacen accesible y
potente para pequeñas y medianas empresas.
3. Minitab
Descripción: Minitab es una herramienta especializada en análisis estadístico y control de calidad.
Uso: Utilizada ampliamente en la industria para realizar análisis de datos y mejorar procesos.
Ventajas: Ofrece análisis estadísticos avanzados y es muy útil para la mejora continua y la gestión de
calidad.
4. SAS (Statistical Analysis System)
Descripción: SAS es una suite de software que ofrece capacidades avanzadas de análisis de datos,
inteligencia empresarial y análisis predictivo.
Uso: Ideal para análisis multivariante y gestión de datos a gran escala.
Ventajas: Su robustez y capacidad para manejar grandes volúmenes de datos lo hacen adecuado para
empresas grandes y complejas.
5. Google Analytics
Descripción: Herramienta gratuita de Google para el análisis de sitios web.
Uso: Permite rastrear y analizar el tráfico web y el comportamiento de los usuarios.
Ventajas: Es esencial para la toma de decisiones en marketing digital y optimización de sitios web.
2.1. Datos categóricos y cuantitativos
Introducción a los Datos Categóricos y Cuantitativos
Datos Categóricos: Datos que se pueden clasificar en categorías.
• Ejemplos: Género, estado civil, tipo de producto.
Datos Cuantitativos: Datos que se pueden medir numéricamente.
• Ejemplos: Ingresos anuales, número de empleados, ventas mensuales.
Tipos de Datos Categóricos y Cuantitativos
Datos Categóricos:
Nominales: Categorías sin orden específico (ejemplo: colores de productos).
Ordinales: Categorías con un orden específico (ejemplo, niveles de satisfacción).
Datos Cuantitativos:
Discretos: Valores contables (ejemplo: número de clientes).
Continuos: Valores medibles (ejemplo: tiempo de entrega).
Aplicaciones en Administración Estratégica
Análisis de Mercado: Uso de datos categóricos para segmentar el mercado.
Ejemplo: Clasificación de clientes por preferencias de producto.
Evaluación de Desempeño: Uso de datos cuantitativos para medir el rendimiento.
Ejemplo: Análisis de ventas trimestrales para evaluar estrategias de marketing.
2.2. Medidas de centro, variabilidad y posición relativa en la compresión de datos
2.3 Medidas de centro, variabilidad y posición relativa en la comprensión de datos
Medidas de Centro: Valores que representan el punto central de un conjunto de datos.
Ejemplos: Media, mediana, moda.
Medidas de Variabilidad: Indicadores de la dispersión de los datos alrededor de la medida de centro.
Ejemplos: Rango, varianza, desviación estándar.
Medidas de Posición Relativa: Valores que indican la posición de un dato en relación con el resto del
conjunto.
Ejemplos: Cuartiles, deciles, percentiles.
Aplicaciones de las Medidas de Centro en Administración Estratégica
• Media: Promedio de los datos, útil para evaluar el rendimiento promedio.
• Ejemplo: Análisis de ingresos promedio de diferentes departamentos.
• Mediana: Valor central que divide el conjunto de datos en dos partes iguales.
• Ejemplo: Evaluación de la mediana de salarios para identificar desigualdades salariales.
Moda: Valor que aparece con mayor frecuencia en el conjunto de datos.
• Ejemplo: Identificación del producto más vendido en una tienda.
Aplicaciones de las Medidas de Variabilidad en Administración Estratégica
• Rango: Diferencia entre el valor máximo y mínimo.
• Ejemplo: Análisis de la variabilidad en los tiempos de entrega de productos.
• Varianza: Promedio de las desviaciones al cuadrado respecto a la media.
• Ejemplo: Evaluación de la consistencia en la calidad de producción.
• Desviación Estándar: Raíz cuadrada de la varianza, indica la dispersión de los datos.
• Ejemplo: Análisis de la variabilidad en las ventas mensuales.
Aplicaciones de las Medidas de Posición Relativa en Administración Estratégica
• Cuartiles: Dividen el conjunto de datos en cuatro partes iguales.
• Ejemplo: Análisis de la distribución de ingresos entre diferentes cuartiles de empleados.
• Deciles: Dividen el conjunto de datos en diez partes iguales.
• Ejemplo: Evaluación de la satisfacción del cliente en diferentes deciles.
• Percentiles: Dividen el conjunto de datos en cien partes iguales.
• Ejemplo: Análisis de la posición relativa de un producto en el mercado
2.4 La Gráfica de Caja
Una gráfica de caja (también conocida como diagrama de caja y bigotes o box plot) es una
representación gráfica que muestra la distribución de un conjunto de datos a través de sus cuartiles.
Es especialmente útil para identificar la mediana, la dispersión y posibles valores atípicos en los datos.
Las características del gráfico de caja son:
a. La localización de la caja es dada por la línea que atraviesa la
caja y que representa la mediana.
b. La dispersión es dada por el largo de la caja, así como por la distancia entre los extremos de los
bigotes.
c. El sesgo (asimetría) se observa en la desviación que existe entre
la línea que representa la mediana y los extremos de los bigotes.
d. Los valores extremos (atípicos, discordantes, outliers) son representados mediante asteriscos.
Componentes de una Gráfica de Caja Caja:
Límites Inferior y Superior: Representan el primer cuartil (Q1) y el tercer cuartil (Q3),
respectivamente.
Línea Central: Indica la mediana (Q2) del conjunto de datos.
Bigotes:
Extremos: Se extienden desde los límites de la caja hasta el valor mínimo y máximo dentro de 1.5
veces el rango intercuartílico (IQR) desde los cuartiles.
Valores Atípicos:
Puntos Fuera de los Bigotes: Representan datos que se encuentran fuera del rango esperado y se
consideran atípicos.
Ejemplo de Interpretación
Supongamos que tenemos los tiempos de entrega (en días) de un producto:
• Q1 (Primer Cuartil): 3 días
• Mediana (Q2): 5 días
• Q3 (Tercer Cuartil): 7 días
• Rango Intercuartílico (IQR): Q3 - Q1 = 7 - 3 = 4 días
Los bigotes se extenderían hasta 1.5 veces el IQR desde
los cuartiles:
• Límite Inferior del Bigote: Q1 - 1.5 * IQR = 3 - 6 = -3 (ajustado al valor mínimo real si es mayor que -
3)
• Límite Superior del Bigote: Q3 + 1.5 * IQR = 7 + 6 = 13
(ajustado al valor máximo real si es menor que 13)
Uso en Administración Estratégica
• Evaluación de Desempeño: Analizar la distribución de tiempos de entrega para identificar
consistencia y posibles retrasos.
• Análisis de Calidad: Detectar valores atípicos en la producción que puedan indicar problemas de
calidad.
Datos Bivariados
Las gráficas con datos bivariados son herramientas visuales que permiten analizar la relación entre dos
variables. Aquí te presento algunas de las más comunes:
1. Gráfico de Dispersión (Scatter Plot)
• Descripción: Representa puntos en un plano cartesiano, donde cada punto corresponde a un par
de valores de las dos variables.
• Uso: Ideal para identificar patrones, tendencias y relaciones entre las variables.
• Ejemplo: Relación entre la temperatura y las ventas de helados.
2. Diagrama de Burbuja (Bubble Chart)
• Descripción: Similar al gráfico de dispersión, pero cada punto se representa como una burbuja
cuyo tamaño indica una tercera variable.
• Uso: Útil para visualizar tres dimensiones de datos simultáneamente.
• Ejemplo: Relación entre ingresos, gastos y número de empleados en diferentes departamentos
3. Gráfico de Líneas (Line Chart)
• Descripción: Muestra puntos conectados por líneas, representando la relación entre dos
variables a lo largo del tiempo.
• Uso: Ideal para analizar tendencias temporales.
• Ejemplo: Evolución de las ventas mensuales y el gasto en publicidad
4. Gráfico de Barras Apiladas (Stacked Bar
Chart)
• Descripción: Utiliza barras apiladas para mostrar la relación entre dos variables categóricas.
• Uso: Útil para comparar la composición de diferentes grupos.
• Ejemplo: Distribución de ventas por categoría de producto y región
5. Gráfico de Calor (Heatmap)
• Descripción: Utiliza colores para representar la intensidad de los valores en una matriz de datos.
• Uso: Ideal para identificar patrones y correlaciones en grandes conjuntos de datos.
• Ejemplo: Análisis de la correlación entre diferentes métricas de rendimiento
2.5. Gráficas para Datos Categóricos
Las gráficas para datos categóricos son herramientas visuales que permiten representar y analizar datos
cualitativos. Aquí te presento algunas de las más comunes:
1. Gráfico de Barras
• Descripción: Utiliza barras para mostrar la frecuencia o proporción de cada categoría.
• Uso: Ideal para comparar diferentes categorías.
• Ejemplo: Comparar las ventas de diferentes productos en una tienda.
2. Gráfico de Sectores (Pie Chart)
• Descripción: Representa las proporciones de cada categoría como segmentos de un círculo.
• Uso: Útil para mostrar la composición de un todo.
• Ejemplo: Distribución porcentual de los tipos de clientes (nuevos vs. recurrentes).
3. Gráfico de Columnas
• Descripción: Similar al gráfico de barras, pero las barras son verticales.
• Uso: Ideal para comparar categorías a lo largo del tiempo.
• Ejemplo: Evolución mensual de las quejas de clientes por tipo de problema
4. Gráfico de Tarta (Donut Chart)
• Descripción: Similar al gráfico de sectores, pero con un agujero en el centro.
• Uso: Útil para mostrar proporciones y destacar una categoría específica.
• Ejemplo: Distribución de presupuesto por departamento
5. Gráfico de Pareto
• Descripción: Combina un gráfico de barras y un gráfico de líneas para mostrar la frecuencia de
ocurrencia y la importancia relativa.
• Uso: Ideal para identificar las causas más significativas de un problema.
• Ejemplo: Análisis de las causas de defectos en un proceso de producción
3.1. La función de la probabilidad en la estadística
Probabilidad
La probabilidad es una medida cuantitativa de la incertidumbre.
Se expresa como un número entre 0 y 1, donde 0 indica imposibilidad y
1 certeza.
Importancia en la Estadística:
• Permite modelar fenómenos aleatorios y hacer predicciones.
• Es fundamental para el análisis de datos y la toma de decisiones basadas en datos.
Ejemplo:
• La probabilidad de que salga cara al lanzar una moneda es 0.5.
Importancia de la Probabilidad en la Estadística
Modelado de Incertidumbre:
• Ayuda a entender y cuantificar la variabilidad en los datos.
• Ejemplo: Predecir la demanda de un producto en base a datos históricos.
Predicciones y Estimaciones:
• Facilita la realización de inferencias sobre poblaciones a partir de muestras.
• Ejemplo: Estimar la proporción de clientes satisfechos en una encuesta.
Toma de Decisiones:
• Proporciona una base para evaluar riesgos y beneficios en situaciones inciertas.
• Ejemplo: Decidir si lanzar un nuevo producto basado en estudios de mercado probabilísticos.
Aplicaciones en la Administración Estratégica
Análisis de Riesgos:
• Evaluación de probabilidades de eventos adversos y su impacto.
• Ejemplo: Calcular la probabilidad de fallos en la cadena de suministro.
Optimización de Recursos:
• Uso de modelos probabilísticos para asignar recursos de manera eficiente.
• Ejemplo: Determinar la cantidad óptima de inventario para minimizar costos.
Toma de Decisiones Informadas:
• Utilización de datos probabilísticos para desarrollar estrategias y planes de acción.
• Ejemplo: Planificar campañas de marketing basadas en la probabilidad de éxito.
3.2 Reglas útiles de conteo
Principio de Multiplicación
Explicación:
• El principio de multiplicación se utiliza para calcular el número total de posibles combinaciones
de eventos independientes.
• Si un evento puede ocurrir de m maneras y otro evento independiente puede ocurrir de n
maneras, entonces ambos eventos pueden ocurrir de m × n maneras.
Ejemplo:
• Si tienes 3 camisas y 4 pantalones, el número total de combinaciones posibles de camisas y
pantalones es 3 × 4 = 12.
Principio de Adición
Explicación:
• El principio de adición se utiliza para calcular el número total de posibles resultados de eventos
mutuamente excluyentes.
• Si un evento puede ocurrir de m maneras y otro evento mutuamente excluyente puede ocurrir de n
maneras, entonces uno de los dos eventos puede ocurrir de m + n maneras.
Ejemplo:
• Si tienes 5 opciones de postre y 3 opciones de bebida, y puedes elegir solo una opción, el número
total de opciones posibles es 5 + 3 = 8.
Permutaciones y Combinaciones
Diferencias:
• Permutaciones: El orden importa. Se utiliza para calcular el número de maneras de ordenar un
conjunto de elementos.
• Combinaciones: El orden no importa. Se utiliza para calcular el número de maneras de
seleccionar un subconjunto de elementos de un conjunto más grande.
Aplicaciones Prácticas:
• Permutaciones: Determinar el orden de llegada en una carrera. Ejemplo: ¿De cuántas maneras se
pueden ordenar 3 corredores en una carrera?
Respuesta: 3! = 6 maneras
(3! = 1x2x3 = 6 maneras).
• Combinaciones: Seleccionar un comité de 3 personas de un grupo de 10. Ejemplo: ¿De cuántas
maneras se pueden seleccionar 3 personas de un grupo de 10? Respuesta: = 120 maneras.
3.3. Eventos y espacio muestral
Eventos:
Un evento es un conjunto de resultados posibles de un experimento aleatorio.
Tipos de Eventos:
Simples: Un solo resultado. Ejemplo: Obtener un 3 al lanzar un dado.
Compuestos: Combinación de dos o más resultados. Ejemplo: Obtener un número par al lanzar
un dado (2, 4, 6).
Mutuamente Excluyentes: No pueden ocurrir al mismo tiempo. Ejemplo:
Obtener un 3 y un 5 al mismo tiempo al lanzar un dado.
Espacio Muestral
Definición:
El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio.
Ejemplo:
Al lanzar un dado, el espacio muestral es {1, 2, 3, 4, 5, 6}.
Utilización:
Definir el espacio muestral es el primer paso para calcular probabilidades.
Permite identificar todos los posibles eventos y sus probabilidades asociadas.
Aplicación del Espacio Muestral en Problemas de Probabilidad
Ejemplo 1: Lanzamiento de una Moneda
• Espacio muestral: {Cara, Cruz}
• Probabilidad de obtener Cara: P(Cara) = 1/2
Ejemplo 2: Lanzamiento de Dos Dados
• Espacio muestral: {(1,1), (1,2), (1,3), ..., (6,6)}
• Probabilidad de obtener una suma de 7: P(7) = 6/36 = 1/6 (veamos el detalle del cálculo en la
siguiente diapositiva)
Importancia:
• Ayuda a visualizar y calcular las probabilidades de eventos complejos.
• Facilita la toma de decisiones informadas basadas en datos probabilísticos
3.4. Variables aleatorias, discretas y sus distribuciones de probabilidad
Variables Aleatorias
Definición:
Una variable aleatoria es una función que asigna un valor numérico a cada resultado posible de
un experimento aleatorio.
Puede ser discreta (toma valores específicos) o continua (toma cualquier valor en un intervalo).
Ejemplos:
Discreta: Número de caras al lanzar 3 monedas.
Continua: Tiempo que tarda en llegar un autobús.
Distribuciones de Probabilidad Discretas
Concepto:
Una distribución de probabilidad discreta describe la probabilidad de que una variable aleatoria discreta
tome ciertos valores específicos.
Ejemplo: Distribución Binomial
Definición: Describe el número de éxitos en una secuencia de n ensayos de Bernoulli independientes.
Ejemplo: Probabilidad de obtener 3 caras al lanzar una moneda 5 veces.
Ejemplo: Distribución de Poisson
Definición: Describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo.
Ejemplo: Número de llamadas recibidas por una central telefónica en una hora.
3.5. Las distribuciones discretas útiles
Distribución Binomial
Características:
• Describe el número de éxitos en una secuencia de n ensayos de Bernoulli independientes.
• Cada ensayo tiene dos posibles resultados: éxito (con probabilidad p) o fracaso (con probabilidad
1−p).
• La variable aleatoria X que cuenta el número de éxitos sigue una distribución binomial.
Distribución de Poisson
Características:
Describe el número de eventos que ocurren en un intervalo de tiempo o espacio fijo.
Los eventos ocurren con una tasa promedio constante λ y son independientes entre sí.
La variable aleatoria X que cuenta el número de eventos sigue una distribución de Poisson.
Aplicaciones Prácticas de las Distribuciones Discretas
3.6. La distribución normal de probabilidad
Definición y Propiedades de la Distribución Normal
Definición:
La distribución normal, también conocida como distribución de Gauss, es una distribución de
probabilidad continua que se caracteriza por su forma de campana simétrica.
La distribución de probabilidad más usada para describir variables aleatorias continuas es la
distribución de probabilidad normal.
Propiedades:
Simetría: La distribución es simétrica alrededor de su media (μ). Media, Mediana y Moda: Son iguales y
se encuentran en el centro de la distribución.
Desviación Estándar (σ): Controla el ancho de la campana; una mayor desviación estándar indica una
distribución más dispersa. Área Bajo la Curva: El área total bajo la curva es igual a 1.
Ejemplo:
Alturas de una población adulta suelen seguir una distribución normal con una media de 170 cm y una
desviación estándar de 10 cm.
Aplicaciones de la Distribución Normal
Control de Calidad:
Ejemplo: En una fábrica, la distribución normal se utiliza para monitorear el peso de los productos. Si el
peso promedio es 500 gramos con una desviación estándar de 5 gramos, se puede determinar la
probabilidad de que un producto pese entre 495 y 505 gramos.
Finanzas:
Ejemplo: La distribución normal se aplica para modelar los rendimientos de las inversiones. Si el
rendimiento promedio anual de una acción es 8% con una desviación estándar de 2%, se puede calcular
la probabilidad de obtener un rendimiento entre 6% y 10%.
Investigación de Mercados:
Ejemplo: En encuestas de satisfacción del cliente, los puntajes suelen seguir una distribución normal. Si
la satisfacción promedio es 4.2 en una escala de 1 a 5 con una desviación estándar de 0.5, se puede
analizar la probabilidad de obtener puntajes específicos.
Propiedades de la Distribución Normal
La distribución normal se considera no sesgada porque
es simétrica alrededor de su media. Esto significa que los valores se distribuyen de manera uniforme a
ambos lados de la media, formando una curva en forma de campana. En una distribución normal, la
media, la mediana y la moda son iguales, lo que indica que no hay inclinación hacia ningún lado.
El sesgo de una distribución normal es cero debido a su simetría perfecta. En términos estadísticos, el
sesgo mide la asimetría de una distribución de datos. Si una distribución es simétrica, como la
distribución normal, los valores se distribuyen de manera uniforme alrededor de la media, sin inclinación
hacia ningún lado. Por lo tanto, el sesgo, que cuantifica esta asimetría, resulta ser cero.
Uso de la Distribución Normal en la Administración Estratégica
Toma de Decisiones Basadas en Datos:
Ejemplo: Un gerente de ventas puede utilizar la distribución normal para prever las ventas futuras y
establecer objetivos realistas. Si las ventas mensuales promedio son 1000 unidades con una desviación
estándar de 100 unidades, se puede calcular la probabilidad de alcanzar diferentes niveles de ventas.
Evaluación de Riesgos:
Ejemplo: En la gestión de proyectos, la distribución normal se utiliza para estimar los tiempos de
finalización. Si el tiempo promedio para completar una tarea es 20 días con una desviación estándar de
2 días, se puede determinar la probabilidad de completar la tarea en un tiempo específico.
Optimización de Recursos:
Ejemplo: En la gestión de inventarios, la distribución normal ayuda a determinar los niveles óptimos de
stock. Si la demanda diaria de un producto sigue una distribución normal con una media de 50 unidades
y una desviación estándar de 5 unidades, se puede calcular la probabilidad de que la demanda supere
ciertos niveles y ajustar el inventario en consecuencia.
Cálculo de probabilidades en cualquier distribución de probabilidad normal
La razón por la cual la distribución normal estándar se ha visto de manera tan amplia es que todas las
distribuciones normales son calculadas mediante la distribución normal estándar.
Esto es, cuando distribución normal con una media μ cualquiera y una desviación estándar σ cualquiera,
las preguntas sobre las probabilidades en esta distribución se responden pasando primero a la
distribución normal estándar.
Pero qué significa el Valor de 𝒛 ?
El valor z en una distribución normal es una medida que indica cuántas desviaciones estándar un dato
está alejado de la media. Se utiliza para estandarizar datos y comparar diferentes distribuciones
normales.
Aplicaciones de la Distribución Normal
Control de Calidad:
Ejemplo: En una fábrica, la distribución normal se utiliza para monitorear el peso de los productos. Si el
peso promedio es 500 gramos con una desviación estándar de 5 gramos, se puede determinar la
probabilidad de que un producto pese entre 495 y 505 gramos.
Finanzas:
Ejemplo: La distribución normal se aplica para modelar los rendimientos de las inversiones. Si el
rendimiento promedio anual de una acción es 8% con una desviación estándar de 2%, se puede calcular
la probabilidad de obtener un rendimiento entre 6% y 10%.
Investigación de Mercados:
Ejemplo: En encuestas de satisfacción del cliente, los puntajes suelen seguir una distribución normal. Si
la satisfacción promedio es 4.2 en una escala de 1 a 5 con una desviación estándar de 0.5, se puede
analizar la probabilidad de obtener puntajes específicos
Uso de la Distribución Normal en la Administración Estratégica
Toma de Decisiones Basadas en Datos:
Ejemplo: Un gerente de ventas puede utilizar la distribución normal para prever las ventas futuras y
establecer objetivos realistas. Si las ventas mensuales promedio son 1000 unidades con una desviación
estándar de 100 unidades, se puede calcular la probabilidad de alcanzar diferentes niveles de ventas.
Evaluación de Riesgos:
Ejemplo: En la gestión de proyectos, la distribución normal se utiliza para estimar los tiempos de
finalización. Si el tiempo promedio para completar una tarea es 20 días con una desviación estándar de
2 días, se puede determinar la probabilidad de completar la tarea en un tiempo específico.
Optimización de Recursos:
Ejemplo: En la gestión de inventarios, la distribución normal ayuda a determinar los niveles óptimos de
stock. Si la demanda diaria de un producto sigue una distribución normal con una media de 50 unidades
y una desviación estándar de 5 unidades, se puede calcular la probabilidad de que la demanda supere
ciertos niveles y ajustar el inventario en consecuencia.
}
3.7. Las distribuciones muestrales
Concepto de Distribución Muestral
Definición:
Una distribución muestral es la distribución de una estadística (como la media o la proporción)
calculada a partir de múltiples muestras de una población.
Importancia:
Permite entender la variabilidad de las estadísticas muestrales.
Es fundamental para realizar inferencias sobre la población a partir de muestras.
Ejemplo:
Si tomamos múltiples muestras de 30 estudiantes cada una y calculamos la media de sus
calificaciones, la distribución de estas medias es una distribución muestral.
Teorema del Límite Central
Explicación:
El teorema del límite central establece que, para un tamaño de muestra suficientemente grande, la
distribución de la media muestral se aproxima a una distribución normal, independientemente de la
forma de la distribución de la población.
Relevancia:
Permite utilizar la distribución normal para hacer inferencias sobre la media poblacional, incluso cuando
la distribución original no es normal.
Ejemplo:
Si tomamos muestras de 50 mediciones de altura de una población con cualquier distribución, la
distribución de las medias de estas muestras será aproximadamente normal.
Aplicaciones Prácticas de las Distribuciones Muestrales
Estimación de Parámetros:
Ejemplo: Un investigador quiere estimar la media de la altura de una población. Toma 100 muestras de
30 personas cada una y calcula la media de cada muestra. La distribución de estas medias le permite
estimar la media poblacional con un intervalo de confianza.
Pruebas de Hipótesis:
Ejemplo: Un gerente de calidad quiere saber si la media de defectos en una producción es diferente de
un valor específico. Utiliza la distribución muestral de la media de defectos de varias muestras para
realizar una prueba de hipótesis.
Control de Procesos:
Ejemplo: En una línea de producción, se toman muestras periódicas del tamaño de los productos. La
distribución muestral de estos tamaños se utiliza para monitorear y controlar la calidad del proceso.
3.8. Estimación y pruebas de hipótesis de muestras grandes
Estimación
Tipos de Estimadores:
Estimadores Puntuales:
Proporcionan un único valor como estimación del parámetro poblacional.
Ejemplo: La media muestral (𝒙ഥ) es un estimador puntual de la media poblacional (μ).
Estimadores por Intervalos:
Proporcionan un rango de valores dentro del cual se espera que se encuentre el parámetro poblacional
con un cierto nivel de confianza.
Pruebas de Hipótesis
Procedimiento:
1. Formulación de Hipótesis:
Hipótesis Nula (H0): Declaración inicial que se asume verdadera hasta que se demuestre lo contrario.
Hipótesis Alternativa (H1): Declaración que se acepta si la evidencia sugiere que H0 es falsa.
2. Selección del Nivel de Significancia (α):
Probabilidad de cometer un error tipo I (rechazar H0 cuando es verdadera).
3. Cálculo de la Estadística de Prueba:
Estadística utilizada para decidir si se rechaza H0.
4. Determinación del Valor Crítico o P-valor:
Comparar la estadística de prueba con el valor crítico o calcular el p-valor.
5. Toma de Decisión:
Rechazar H0 si la estadística de prueba supera el valor crítico o si el p-valor es menor que α.
4.1. Regresión Lineal
La regresión lineal es una técnica estadística utilizada para modelar la relación entre una variable
dependiente y una o más variables independientes. En su forma más simple, la regresión lineal busca
ajustar una línea recta (llamada línea de regresión) a los datos de manera que se minimicen las
diferencias entre los valores observados y los valores predichos por el modelo.
La ecuación de una regresión lineal simple es:
Donde: y = mx + b
y es la variable dependiente,
x es la variable independiente,
m es la pendiente de la línea,
b es la intersección con el eje y.
Método de mínimos cuadrados
El método de mínimos cuadrados es un método en el que se usan los datos muestrales para hallar la
ecuación de regresión estimada.
Es la recta cuya distancia entre el valor observado y la RECTA DE REGRESIÓN ESTIMADA sea mínima.
Pendiente de la recta
Es la inclinación de la recta respecto del eje horizontal x
Ahora, aplicaremos la regresión lineal por el método de los MÍNIMOS CUADRADOS Ecuación general de
la línea recta:
𝑦 = 𝑚𝑥 + 𝑏