0% encontró este documento útil (0 votos)
42 vistas53 páginas

Estadística y Probabilidad Empresarial

u4

Cargado por

Julia Gurrea
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
42 vistas53 páginas

Estadística y Probabilidad Empresarial

u4

Cargado por

Julia Gurrea
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Matemática Empresarial I / Unidad IV

UNIDAD IV:

TRATAMIENTO DE DATOS – ESTADISTICA Y


PROBABILIDAD
Objetivos:

Al finalizar esta cuarta unidad deberás ser capaz de:


 Reconocer población, muestra, unidad experimental.
 Identificar variables discretas y continuas.
 Resumir e interpretar la información muestral en tablas y
gráficos.
 Reconocer distribuciones de frecuencia y de probabilidad.
 Interpretar los parámetros principales.

Contenidos:

Formulación de problemas y algunas definiciones fundamentales


Tablas y gráficos
Variables discretas y continuas.
Distribuciones de frecuencia y de probabilidad.
Parámetros principales.

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Introducción
La Ciencia, en general, avanza por dos metodologías
fundamentales: deducción e inducción. Con la deducción, a partir de
ciertos principios básicos y mediante razonamientos lógicamente
UN POCO DE
correctos, se va tratando de obtener consecuencias y proposiciones que
HISTORIA
constituyen la teoría. La inducción científica, procede por otro camino
bien diferente: partiendo de hechos y observaciones experimentales,
trata de llegar a conclusiones generales sobre el objeto que estudia.
La Estadística es una rama del conocimiento científico que se Desde la antigüedad,
ocupa del análisis numérico e interpretación de los resultados que reyes y emperadores
se preocuparon por
provienen de experimentos de naturaleza aleatoria. Thomas Bayes, en
conseguir datos sobre
1763, fue el primero en introducir elementos matemáticos en este
sus posesiones. El
proceso inductivo, dando así los pasos iniciales en lo que ha llegado a Imperio Romano,
ser la estadística actual. establecido en el año
La estadística es una rama del conocimiento científico que se 27 A. de C., fue el
ocupa del estudio de las mejores formas de agrupar y analizar datos y primer régimen
político que recogió
de establecer conclusiones acerca del conjunto del que se han recogido
una gran cantidad de
tales datos.
datos sobre la
La palabra estadística para designar la obtención, el estudio y población, superficie y
la interpretación de grandes masas de datos, fue utilizada por primera bienes de todos los
vez a mediados del siglo 𝑋𝑉𝐼𝐼𝐼 en Alemania. territorios bajo control.
Pero hasta comienzos
Recién, a partir, de la segunda mitad del siglo 𝑋𝐼𝑋 comienza un del siglo XVII la
período de creación y aplicación de técnicas que permiten “inferir” el estadística era
comportamiento de fenómenos a partir de estudios experimentales. puramente descriptiva,
es decir, una
La estadística se constituyó paulatinamente en una ciencia
enumeración
independiente a principios del siglo 𝑋𝑋 con los trabajos de los británicos sistemática y
Karl Pearson, sobre los mecanismos de la evolución y herencia, y de R.A. ordenada de datos
Fisher, con sus estudios sobre tecnología agrícola. Posteriormente la cálculos comerciales y
estadística se ha convertido en una base científica esencial para todas de herencias.
las ciencias.
Algunos de los campos de aplicación de la metodología
estadística son: Biología, Agronomía, Veterinaria, Zootecnia, Medicina,
Ingeniería, Física, Ciencias Sociales, etc.
La noción de estadística se derivó originalmente del vocablo
"estado" porque ha sido función tradicional de los gobiernos centrales
llevar registros de población, nacimientos, defunciones, cosechas,
impuestos y muchas otras actividades. Contar y medir estos hechos
genera muchos datos numéricos.

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Las personas no relacionadas con la actividad científica


conciben a la estadística como columnas de cifras o gráficos asociados
con, por ejemplo, promedios, índices de divorcio, precios de acciones,
exportaciones, importaciones.
Este concepto se aproxima mucho a la definición tradicional de
estadística la cual es “la compilación, organización, resumen,
presentación y análisis de datos numéricos ".
En realidad, la función principal de la estadística es elaborar
métodos y procedimientos que ayuden a tomar decisiones frente a la
incertidumbre, es decir que, además de organizar, analizar y presentar
información también la interpreta.
Como procedimiento de toma de decisiones, la estadística se
emplea en toda clase de estudios científicos.
Los métodos científicos se utilizan para contestar preguntas
tales como: ¿Es efectiva la nueva dieta?, ¿Es eficaz el nuevo
medicamento para el dolor de cabeza?
En realidad, la estadística ha llegado a ser una "herramienta"
para todos aquellos profesionales que se ponen en contacto con datos
observacionales o experimentales o bien para quienes utilizan los
resultados estadísticos determinados por otros. Tales personas
necesitan tener alguna familiaridad con principios estadísticos para
evitar el mal uso de la misma o la mala interpretación de los resultados
generados por ella.
En los últimos años el masivo acceso a los ordenadores ha
facilitado la implementación y aplicación de métodos estadísticos que
permiten describir y ensayar nuevos productos e ideas. Por ejemplo, los
médicos estudian los datos obtenidos en los experimentos para
desarrollar nuevas medicinas y poner a prueba su eficacia, el gobierno
de nuestro país emplea dinero y personas para recolectar y analizar
datos a través del Instituto Nacional de Estadísticas y Censos
(I.N.D.E.C.).
De muchas maneras se emplea a la estadística para conocer lo
que acontece y lo que pueda suceder en el futuro.
La Estadística se ocupa entonces de la recolección de datos
para descubrir, a través de ellos, nuevos hechos o sea para producir
nuevas conclusiones e ideas.

Generalmente el investigador formula un problema de su


especialidad y luego junto al estadístico lo transcribe al lenguaje
estadístico y, una vez realizado el análisis de los datos, traduce los
resultados obtenidos en términos del problema planteado. En lo que se
3

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

refiere al lenguaje estadístico, existen algunas palabras, como por


ejemplo Población y Muestra, que tienen una acepción muy particular, lo
cual requiere que se las especifique con cuidado y que se diferencie su
utilización de la dada en el lenguaje cotidiano.
Origen y aplicaciones en las ciencias económicas
En la vida cotidiana estamos rodeados de información diversa
que se nos presenta a través de diferentes tipos de datos. Por ejemplo:

 En la República Argentina el 91,4% de los niños de 5 años asisten


a la escuela, según el censo del año 2010.
 En una encuesta de Estados Unidos se encontró que el 31% de
los hombres adultos ven más de 10 horas de televisión a la
semana mientras que las mujeres solo un 26%.
 En la Provincia de Córdoba durante el año 2018 se registraron
705 mm en promedio de precipitaciones. (Fuente: Fuerza Aérea
Argentina. Servicio Meteorológico Nacional).
 En un determinado Hospital, se atienden más de 20 casos de
hipertensión diaria en varones de más de 60 años.

A estos datos numéricos se los denomina comúnmente


Estadísticas. Las mismas hacen referencia a promedios, porcentajes y
medidas.

En un sentido amplio, la estadística se define como el arte y la


ciencia de reunir datos, analizarlos, presentarlos e interpretarlos.
Especialmente en los negocios y en la economía, la información
obtenida al reunir datos, analizarlos, presentarlos e interpretarlos
proporciona a directivos, administradores y personas que deben tomar
decisiones una mejor comprensión del negocio o entorno económico,
permitiéndoles así tomar mejores decisiones con base en mejor
información.

Considerando su origen, la Estadística estuvo ligada a gobiernos


y administraciones. Surgen así los censos que comenzaron a brindar
información acerca de la población de cada país.

Actualmente la Estadística es abordada desde distintas


disciplinas y temáticas, con mayor o menor grado de dificultad
matemática, dando origen a la Estadística Empresarial, Estadística
Educativa, Estadística Médica, Estadística Psicológica, Estadística para
historiadores, entre otras. Sus aplicaciones son parte integral de la vida
cotidiana.
4

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

En las Ciencias Económicas, la Estadística puede ser utilizada


para:

 Realizar análisis de los mercados financieros obteniendo


conclusiones para tomar decisiones sobre compra o venta de
determinadas acciones.
 Realizar pronósticos sobre tasas de inflación, índices de
desempleo, predicción de las variables económicas para períodos
futuros.
 Estimar la proporción de clientes que prefieren un
producto en vez de otro y la razón de esto.
 Control de calidad, vigilando los procesos de producción,
calculando promedios, tomando muestras de productos, separando los
defectuosos para realizar ajustes en el proceso de producción.
 Minimización de Costos.
 Investigación de mercado utilizando la información de los
comercios minoristas. Se procesa y vende esta información a
fabricantes de los productos.
 Asesorar a funcionarios públicos sobre políticas
económicas, planes sociales, tasas tributarias.

Definición de Estadística

La Estadística es la rama de la ciencia que trata sobre la


recolección, organización, presentación, análisis e interpretación de
los datos obtenidos por las observaciones, para poder hacer
comparaciones y elaborar conclusiones.

El fin de la Estadística es darle sentido a los datos recolectados


a los efectos de tomar decisiones acertadas.

Estadística Descriptiva
Permite resumir y describir datos. Incluye la preparación de
tablas, elaboración de gráficos y técnicas para el cálculo de los
diferentes parámetros poblacionales.
Es fundamental que Administradores, Contadores e Informáticos
dominen estas técnicas para resumir y caracterizar sus datos con el
objeto de tomar decisiones correctas.
Permanentemente venimos hablando de datos, cabe preguntarse
de dónde se obtienen los datos.
5

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Se pueden obtener de diferentes maneras: fuentes de datos


existentes en dispositivos manuales (papel) o electrónicos (bases de
datos, tablas), encuestas, estudios experimentales con el objeto de
recolectar nuevos datos.
Las empresas cuentan con diversas bases de datos sobre sus
empleados, clientes y operaciones de negocios. Datos sobre los salarios
de los empleados, sus edades y los años de experiencia suelen
obtenerse de los registros internos del personal. Otros registros internos
contienen datos sobre ventas, gastos de publicidad, costos de
distribución, inventario y cantidades de producción. La mayor parte de
las empresas cuentan también con datos detallados de sus clientes.
La importancia de Internet como fuente de datos y de
información estadística sigue creciendo. Casi todas las empresas
cuentan con una página Web que proporciona información general
acerca de la empresa, así como datos sobre ventas, cantidad de
empleados, cantidad de productos, precios de los productos y
especificaciones de los productos. Además, muchas empresas se
especializan ahora en proporcionar información a través de Internet. Con
lo que uno puede tener acceso a cotizaciones de acciones, precios de
comidas en restaurantes, datos de salarios y a una variedad casi infinita
de información.
No obstante, esta facilidad de obtención de los datos, cabe
considerar que se pueden cometer errores en la toma de los mismos. Por
ejemplo, un entrevistador puede cometer un error de escritura al escribir
la edad de una persona, en lugar de colocar 26 coloca 62. También
pueden quedar datos ausentes o datos que quedaron sin registrar.
Existen procedimientos para revisar la consistencia de los datos
y analizar también si se trata de valores a típicos o inusuales.
Generalmente es muy difícil y/o costoso trabajar con todos los
datos de una población. Usualmente se selecciona una muestra para
someterla a análisis y con los resultados obtenidos de esta muestre se
infieren resultados hacia la población.
Estadística Inferencial
En muchas situaciones se requiere información acerca de grupos
grandes de elementos (individuos, empresas, votantes, hogares,
productos, clientes, etc.). Pero, debido al tiempo, costo y a otras
consideraciones, sólo es posible recolectar los datos de una pequeña
parte de este grupo. Al grupo grande de elementos en un determinado
estudio se le llama población y al grupo pequeño muestra.

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

La población representa el conjunto de todos los elementos de


interés en un estudio determinado, la muestra es un subconjunto de la
población. Por otra parte, el censo, es el proceso de realizar un estudio
para recolectar datos de toda una población.
La Inferencia Estadística comprende un conjunto de técnicas que
nos permiten estimar o inferir los parámetros de una población a partir
de una muestra de la misma y con ello tomar decisiones sobre esa
población. Estas decisiones incluyen un factor de riesgo, ya que las
características de la población no se infieren con certeza, lo que hace
necesario medir el error cometido.

Cómo se realiza un trabajo estadístico


Comenzamos un trabajo estadístico recordando a la Estadística
como la rama de la ciencia que trata sobre la:

 Recolección
 Organización
 Presentación
 Análisis e interpretación de los datos obtenidos por las
observaciones
 Elaboración de conclusiones.

Aunque en todo estudio estadístico el primer paso es la


recolección de datos, es usual asumir que los datos ya han sido
recolectados y que ahora están disponibles.
Por consiguiente, el trabajo comienza con el esfuerzo por
organizar y presentar estos datos de manera significativa y descriptiva.
Los datos deben colocarse en un orden lógico que revele rápida
y fácilmente el mensaje que contienen.

Luego que los datos se han organizado y se han presentado para


su revisión, deben ser analizados e interpretados.
Algunas definiciones fundamentales
Según el relevamiento industrial 2018 realizado por la Dirección
Nacional Láctea, de las 670 industrias encuestadas, unas 47 industrias
procesaban en ese momento, más de 100.000 litros de leche por día.
Por cuestiones de secreto estadístico, no es posible contar con
la información de la DNL-Agroindustria, respecto a los litros procesados
por cada industria, y tampoco se puede por motivos de defensa de la
competencia recurrir por medio de las cámaras empresariales
respectiva a esos datos. Por lo tanto, OCLA procedió a solicitar a cada
7

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

una de las empresas que tuvimos posibilidad de contacto (34), el dato


respecto al volumen de leche procesada durante el período 1° de julio de
2018 y 30 de junio de 2019 por cada industria que estimamos estuvo
alrededor o por encima de los 100.000 litros diarios procesados.
A continuación, se muestra el ranking de las empresas que se les
pidió información y accedieron a brindarla:

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Tabla N° 1
9

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Cada cifra o información volcada en la Tabla 1 constituye un dato,


por lo tanto, toda la tabla es el conjunto de datos a analizar.
Datos: Son hechos, informaciones y cifras que se recogen,
analizan y resumen para su presentación e interpretación.
Conjunto de datos: Se le llama así al conjunto de datos reunidos
para un determinado estudio.
Elemento: Individuo o entidad de los que se obtienen los datos.
En la tabla anterior, cada empresa constituye un elemento.
Por ejemplo, SanCor es un elemento, Noal SA otro elemento, La
Sibila otro.
Variable:
Es la característica que interesa de los elementos.
El conjunto de datos de la Tabla 1 contiene las 5 variables
siguientes:
a) Nombre de la Empresa.

b) Procesamiento en litros de leche por día.


c) Participación respecto al total de leche producida.
d) Participación acumulada.
e) Ranking.
Los valores encontrados para cada variable en cada uno de los
elementos constituyen los datos.
Observación:
Es el conjunto de mediciones obtenidas para un determinado
elemento.

Escalas de medición:
La Escala de medición se utiliza para determinar cuánta
información se encuentra contenida en el dato.
La recolección de datos requiere alguna de las escalas de
medición siguientes: nominal, ordinal, de intervalo o de razón.
Escala nominal:
Cuando el dato de una variable es un nombre que identifica una
característica de un elemento, se considera que la escala de medición
es una escala nominal. La escala de medición es nominal aun cuando
los datos aparezcan como valores numéricos ya que se usan para para
identificar y clasificar objetos.

10

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

No admiten criterios de orden. Cada valor se asigna a una


categoría diferente.
Por ejemplo, Estado Civil de las personas que puede tomar la
modalidad: soltero, casado, divorciado, separado o viudo.
Escala Ordinal:
Se establece un orden jerárquico entre las categorías; ejemplo:
gerente de una empresa, jefe de sección, empleado.
Al igual que en las escalas nominales, en las escalas ordinales se
emplean a menudo porcentajes y proporciones.

Escala de intervalo:
Establece una distancia entre los valores de la variable, el punto
de origen de la escala es convencional, ejemplo: la temperatura corporal.
Escala de razón:
Presenta todas las propiedades de orden y distancia de la escala
de intervalo adicionando el punto de origen; ejemplo: el peso, la talla.
Seguidamente, se comenzará formulando un problema, de tipo
experimental a partir del cual se intentará deducir algunos conceptos
útiles.

Se trata de imponer un nuevo tributo a organizaciones con un


capital superior a los 10 millones de pesos, por lo que surgen
naturalmente algunas preguntas como, ¿a qué organizaciones?, ¿a
todas las organizaciones del país?, ¿en todas las provincias?, ¿hay que
tener en cuenta si son personas jurídicas o humanas?
En primer lugar, se les impondrá el nuevo tributo a personas jurídicas
con un capital superior a los 10 millones de pesos, por tanto, se está
restringiendo el efecto del tributo a un conjunto especial "personas
jurídicas con un capital superior a los 10 millones de pesos". A este
conjunto se lo denomina Población de Unidades.

La Población de Unidades es el conjunto de unidades


experimentales con una característica cualitativa o cuantitativa en
común sobre las cuales se extraen las conclusiones del análisis
En el problema planteado la población de unidades es: “todas
las personas jurídicas con un capital superior a los 10 millones de
pesos”.
11

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Definición de Variable

Variable es una propiedad objetiva con respecto a la cual


las unidades experimentales de la población difieren de manera
apreciable. Es la característica que se mide u observa a la unidad
experimental, después de haber sido sometida al tratamiento.

En general las variables, de acuerdo a su naturaleza, pueden ser


clasificadas en:

 Cuantitativas (o Medibles): Son aquellas cuyos diferentes estados


se pueden expresar con números. Ellas a su vez pueden clasificarse
en Discretas y Continuas.
Algunas de las
Discretas: variables que se
Una variable se considera discreta cuando los valores que asume pueden medir u
pasan de un valor a otro consecutivo, sin que pueda tomar valores observar son:
ingresos, tiempo,
intermedios.
rendimiento o utilidad,
Ejemplo 1: Número de responsables inscriptos en una localidad, costos, entre otras.
número de organizaciones sin fines de lucro, numero de empresas que
obtuvieron ganancias en un periodo determinado.
Continuas:
Una variable se considera continua cuando los valores que
asume pueden tomar cualquier valor real comprendido entre dos valores
dados.
Ejemplo 2: Peso, altura, longitud, utilidad o rendimiento, ingresos,
costos, tiempo.
 Cualitativas: Son aquellas cuyos diferentes estados se
expresan por medio de categorías o cualidades.
Ejemplo 3: Responsable monotributo, exento, empresa fabril,
empresa de servicios.

Discretas

Cuantitativas

Variables Continuas

Cualitativas

Fig: 1.: Variables Cuantitativas y Cualitativas

12

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Definición de Población de Estadística

Se llama Población Estadística a el conjunto de todos los


valores que resultarían de medir la variable, luego de aplicar el
tratamiento a las unidades experimentales que forman la población
de unidades.
De ahora en más se trabajará con los conceptos sobre el
problema planteado.
"Personas jurídicas con un capital superior a los 10 millones de
pesos de la provincia de Córdoba"
Como no se puede probar el tratamiento en sólo una unidad
experimental ni tampoco en toda la población se trata de encontrar un
conjunto representativo donde hacerlo. El problema ahora es cómo
generar dicho conjunto para que sea representativo de la población en
estudio. Una forma de hacerlo para que las técnicas estadísticas puedan
ser aplicadas es la siguiente:
“Elegir 𝒏 personas jurídicas al azar de la provincia de Córdoba
con un capital superior a los 10 millones de pesos”.
Definición de Experimento Aleatorio

Cada vez que se seleccionan al azar 𝒏 unidades


experimentales para luego aplicarles un tratamiento se dice que se
realiza un Experimento Aleatorio.

Las 𝒏 unidades experimentales son las 𝒏 personas jurídicas al


azar de la provincia de Córdoba con un capital superior a los 10 millones
de pesos.
Al conjunto de unidades experimentales seleccionadas se lo
denomina Muestra de Unidades.
Luego, se puede decir que una Muestra es un subconjunto de
una Población.

Una rama de la Estadística estudia acerca de cuántas y cuáles


unidades experimentales deben ser seleccionadas para generar una
muestra representativa de la población en estudio. Cuando en
estadística se dice que una muestra es representativa, significa que es
un conjunto que reproduce la población en estudio y por tanto puede ser
utilizado para conocer alguna característica de la misma.

13

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Definición de Muestra Estadística

Al conjunto de resultados obtenidos al medir u observar la


variable a cada elemento de la muestra de unidades se la denomina
Muestra Estadística.

Notar que éste es el conjunto de valores de variable utilizado


para realizar los análisis estadísticos.
Retomando el Problema se tiene:
Muestra de Unidades: las 𝒏 personas jurídicas al azar de la
provincia de Córdoba con un capital superior a los 10 millones de pesos.
Esto se puede expresar como:
(𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝐽𝑢𝑟í𝑑𝑖𝑐𝑎1 , 𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝐽𝑢𝑟í𝑑𝑖𝑐𝑎2 , … , 𝑃𝑒𝑟𝑠𝑜𝑛𝑎 𝐽𝑢𝑟í𝑑𝑖𝑐𝑎𝑛 )
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒: Capital. 𝑇𝑖𝑝𝑜: Cuantitativa continua.
Muestra Estadística: Las 𝑛 personas jurídicas de la provincia de
Córdoba con un capital superior a los 10 millones de pesos. Esto se
puede expresar como:

(𝑐𝑎𝑝𝑖𝑡𝑎𝑙1 , 𝑐𝑎𝑝𝑖𝑡𝑎𝑙2 , … , 𝑐𝑎𝑝𝑖𝑡𝑎𝑙𝑛 )


Puede ocurrir que más de una unidad experimental tenga el
mismo capital, por ello es que se da la siguiente definición.

Definición de Frecuencia Absoluta

Se llama frecuencia absoluta de un valor de variable 𝑋𝑖 al


número 𝑓𝑖 , de veces que este valor aparece en la muestra.

Una vez obtenida la muestra estadística, es conveniente


resumir la información de la misma. Para ello se utilizan tablas, gráficos
y valores descriptivos.

Tablas y Gráficos

Tablas
Suponga que 15 empresas de cierto capital inicial de la
provincia de Córdoba obtienen las siguientes ventas mensuales
medidas en miles de pesos.

530 498 544 498 532 560 582 560


560 532 544 532 532 582 560

14

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Esta información puede ser resumida en una tabla de


frecuencias no agrupadas.

𝒇𝒊 𝒇𝒓𝒊 𝒇𝒂𝒊
𝑿𝒊 ∶ 𝒗𝒆𝒏𝒕𝒂𝒔 (Frecuencia (Frecuencia (Frecuencia
absoluta) relativa) acumulada)

498 2 2/15 2

530 1 1/15 3

532 4 4/15 7

544 2 2/15 9

560 4 4/15 13

582 2 2/15 15

15 1

Tabla N° 2

𝑋: variable en estudio, ventas


𝑋𝑖 : Diferentes valores de la variable (valores de venta).
𝑓𝑖 : Frecuencia absoluta del valor de variable 𝑋𝑖 (Nro. de
empresas con ventas mensuales 𝑋𝑖 ).
𝑓𝑟𝑖 : Frecuencia relativa del valor de variable 𝑋𝑖 (Proporción de
empresas con ventas mensuales 𝑋𝑖 ). En general:
𝑘: indica el número de valores distintos de la variable, en este
caso 𝑘 = 6 y 𝑛 indica el tamaño de la muestra, en este caso es 𝑛 = 15
(en general 𝑘 ≤ 𝑛), donde
𝑛 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑘 , lo que puede expresarse 𝑛 = ∑𝑘𝑖=1 𝑓𝑖

Definición de Frecuencia Relativa

Se llama frecuencia relativa, 𝑓𝑟𝑖 , del 𝑖 − é𝑠𝑖𝑚𝑜 valor de


variable 𝑋𝑖 a la frecuencia absoluta dividida por el tamaño de la
muestra, en símbolos:
𝑓𝑖
𝑓𝑟𝑖 =
𝑛

15

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Definición de Frecuencia Acumulada

Se llama frecuencia acumulada, 𝑓𝑎𝑖 , correspondiente al


valor 𝑋𝑖 es la suma de las frecuencias absolutas de los valores de
variable menores o iguales a 𝑋𝑖

La información de la Tabla 2 se puede leer, por ejemplo, de la


siguiente manera:
 La frecuencia absoluta indica que 4 empresas tuvieron
ventas mensuales de 532 millones de pesos.
 La frecuencia relativa indica que de los 15 empresas 4
tuvieron ventas mensuales de 532 millones de pesos, o que
aproximadamente el 27% de las empresas tienen ventas mensuales
por 532 millones de pesos.
 La frecuencia acumulada dice que 7 empresas
alcanzaron 532 millones de pesos en ventas o menos.
Si hubiera muchos valores diferentes de variable, esta tabla no
sería adecuada para resumir la información.
Suponga que 20 empresas de cierto capital inicial de la
provincia de Córdoba obtienen las siguientes ventas mensuales
medidas en miles de pesos.
Los resultados obtenidos son:
490 498 499 500 532 531 518 516 540 561
555 566 562 603 602 610 612 612 525 583
Si se trata de construir una tabla como la anterior, se podrá
observar que la misma no resume la información de la muestra.
Es por ello que surge la necesidad de construir otro tipo de
tablas, en las cuales se agrupan los valores de variable en intervalos.
Así en este caso se procede como se indica a continuación:
Dado que se deben construir intervalos, hay que tener en
cuenta la cantidad y la longitud conveniente de cada uno. En base al
ejemplo, una regla práctica para construirlos es:
 Usar 𝑘 = 5, donde 𝑘 indica el número de intervalos.
 𝑋𝑚á𝑥 = 612 y 𝑋𝑚𝑖𝑛 = 490

16

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

 (𝑋 −𝑋
ℎ = 𝑚á𝑥 5 𝑚𝑖𝑛 = 5
) 612−490
= 24,4 ≅ 25 donde ℎ indica la
longitud de cada intervalo. El resultado de ℎ se redondea siempre por
exceso y debe tener la misma cantidad de decimales que los datos
 Ahora, como 𝑋𝑚í𝑛 + ℎ = 490 + 25 = 515,entonces el
primer intervalo es (490,515), que incluye al valor 490 y no al valor 515;
el segundo intervalo y los siguientes quedan como se observa en la
tabla 2. El último es siempre un intervalo cerrado.
A continuación, se muestra la tabla de frecuencias agrupadas
para los datos del ejemplo.

𝒇𝒊 𝒇𝒓𝒊
Intervalo
Conteo (Frecuencia (Frecuencia
de Clase
absoluta) relativa

[490,515) IIII 4 4/20

[515,540) IIIII 5 5/20

[540,565) IIII 4 4/20

[565,590) II 2 2/20

[590,615] IIIII 5 5/20

20 1

Tabla N° 3

Las frecuencias 𝑓𝑖 y 𝑓𝑟𝑖 representan, respectivamente, a la


frecuencia absoluta y relativa del i-ésimo intervalo.

Para construir estos intervalos se han tenido en cuenta algunas


características, tales como:
a) El primer intervalo de clase debe contener al valor mínimo y el
último al máximo.
b) La cantidad de intervalos debe aumentar a medida que aumenta
𝑛. El número 𝑘 de intervalos aconsejable de acuerdo al tamaño
de la muestra es:
𝑛 ≤ 50 ⇒ 𝑘 =5𝑜6
50 < 𝑛 ≤ 100 ⇒ 𝑘 =6𝑜7
100 < 𝑛 ≤ 500 ⇒ 𝑘 = 7, 8 𝑜 9
500 < 𝑛 ≤ 2000 ⇒ 𝑘 = 10, 11 𝑜 12
𝑛 > 2000 ⇒ 𝑘 = 13, 14, … , 20
Notar que la elección de la tabla para resumir la información de
la muestra estadística no depende solamente de la variable en estudio,
sino también del tamaño de muestra y de las frecuencias, pues si
17

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

muchos valores de variable son coincidentes una tabla de frecuencias


no agrupadas seguramente resume muy bien la información de la
muestra, en tanto que, si los valores de variable no se repiten, entonces
una tabla de frecuencias agrupadas es la adecuada.

La frecuencia acumulada, 𝑓𝑎𝑖 ,correspondiente al 𝑖 − é𝑠𝑖𝑚𝑜


intervalo es la suma de las frecuencias absolutas de ese intervalo
con las frecuencias de los anteriores.

La información de la Tabla 3 se puede leer, por ejemplo, de la


siguiente forma:

 La frecuencia absoluta está indicando que hay 4 empresas en las


que sus ventas mensuales se encuentran entre 540 y 565
millones de pesos.

 La frecuencia relativa indica que de las 20 empresas 4 tuvieron


ventas entre 540 y 565 miles de pesos, o que aproximadamente
el 20% de las empresas venden entre 540 y 565 miles de pesos.
En los dos ejemplos anteriores se han presentado variables
cuantitativas, ahora se dará un ejemplo donde la variable observada es
de tipo cualitativa.

En una localidad se desea clasificar a las empresas de acuerdo


al tipo de actividad. Para ello se seleccionaron aleatoriamente 20
empresas clasificándolas en c: comercial i: industrial y s: servicios,
obteniéndose los siguientes datos:
i c s i s s i c c i c s c s c c c i c s
La información de una muestra estadística donde la variable
observada es de tipo cualitativo se puede resumir sólo en una tabla de
frecuencias no agrupadas. Luego para este caso se tiene:

𝒇𝒊 𝒇𝒓𝒊
𝑿𝒊 (tipo de
(Frecuencia (Frecuencia
actividad)
absoluta) relativa)

I 5 5/20

C 9 9/20

S 6 6/20

20 1

Tabla N° 3

18

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

La información de la Tabla 3 se interpreta, por ejemplo, de la


siguiente forma:
 la frecuencia absoluta está indicando que hay 5 empresas
industriales.
 la frecuencia relativa está indicando que de las 20 empresas 5
son industriales, o que el 25% de las empresas de la muestra son
industriales.
Cuando la variable en estudio es de tipo cualitativo, la
frecuencia acumulada no tiene sentido, pues los valores de variables no
tienen un orden natural.
GRÁFICOS
DESCRIPCIÓN GRÁFICA DE LOS DATOS
Presentación de datos cualitativos.
Distribución de frecuencia absoluta, relativa y porcentual
Para comprender mejor este concepto analizaremos el siguiente
ejemplo:
Se consideran 50 ventas de viajes de turismo de una empresa
mayorista de consolidada trayectoria en el rubro turismo. Esta
situación se refleja en la siguiente Tabla.
Costa Costa Costa Costa
Atlántica Atlántica Atlántica Patagonia Atlántica
Cataratas Cataratas Cataratas
del Mendoza del Mendoza del
Iguazú Iguazú Iguazú
Noroeste Costa Noroeste Noroeste
Argentino Patagonia Argentino Argentino
Atlántica
Cataratas Cataratas Noroeste
del Costa del
Patagonia Argentino
Iguazú Atlántica Iguazú
Cataratas Noroeste Noroeste Noroeste
Costa del
Atlántica Argentino Argentino Argentino
Iguazú
Costa Costa Costa Costa Noroeste
Atlántica Atlántica Atlántica Atlántica Argentino
Mendoza Costa Costa Costa Costa
Atlántica Atlántica Atlántica Atlántica
Cataratas Costa Costa
del Patagonia Mendoza
Iguazú Atlántica Atlántica
Noroeste Costa Noroeste Noroeste Noroeste
Argentino Atlántica Argentino Argentino Argentino
Noroeste Cataratas
del Costa
Argentino Mendoza Patagonia
Iguazú Atlántica
Tabla N° 4
19

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Los datos aparecen de esta manera tal como se fueron


realizando las ventas.
A continuación, se construye una tabla de distribución de
frecuencias, a los efectos de brindar una mejor interpretación de la
situación.
La variable será el destino del viaje, como se observó antes se
separan los valores de la variable en categorías que no se superponen
como muestra la tabla y se cuentan la cantidad de ventas de cada una
de las categorías.

𝒇𝒊 𝒇𝒓𝒊 (Frecuencia
Frecuencia
𝑿𝒊 𝒅𝒆𝒔𝒕𝒊𝒏𝒐 𝒕𝒖𝒓í𝒔𝒕𝒊𝒄𝒐 (Frecuencia relativa)
porcentual
absoluta)

Costa Atlántica 19 19/50=0,38 38

Cataratas del Iguazú 8 8/50=0,16 16

Noroeste Argentino 5 5/50=0,10 10

Mendoza 13 13/50=0,26 26

Patagonia 5 5/50=0,10 10

50 1 100

Tabla N° 5

Una distribución de frecuencias absoluta es la agrupación en


forma de tabla de los valores de la variable separada en clases que no
se superponen (son excluyentes) y del número de elementos que se
observa para cada clase y que se denomina frecuencia absoluta.
La frecuencia relativa es igual a la proporción de los elementos
que pertenecen a cada clase.
La frecuencia porcentual de una clase es la frecuencia relativa
multiplicada por 100.
Una distribución de frecuencia relativa es una tabla en la que se
muestra la frecuencia relativa de cada clase. Mientras que una
distribución porcentual es la misma tabla expresada en porcentaje.
Gráficos de barra y gráficos de Sectores
La forma más usual de representar una distribución de
frecuencias de una variable cualitativa es el gráfico de barras. En la
mayoría de los casos el eje horizontal muestra las categorías de la
variable de interés y el eje vertical frecuencia absoluta, frecuencia
20

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

relativa o de frecuencia porcentual. Una característica distintiva del


grafico de barras es que las categorías no son adyacentes, es decir
existe una distancia o espacio entre las barras. En síntesis, un gráfico de
barras es una representación de una distribución de frecuencias
mediante rectángulos uniformes cuya altura representa la frecuencia de
la clase.

Destinos Turísticos
20
18
16
14
12
10
8
6
4
2
0
Costa Cataratas del Noroeste Mendoza Patagonia
Atlántica Iguazú Argentino

Gráfico 1

En el Gráfico 1 se observa que Costa Atlántica, Mendoza y


Cataratas del Iguazú son los destinos preferidos.
Otro gráfico útil para describir distribuciones de frecuencias de
una variable cualitativa es el gráfico de sector y que muestra la
proporción o porcentaje que representa cada categoría de la variable,
sobre el total de la frecuencia. Para construir un gráfico se dibuja un
círculo que representa todos los datos, luego se usa la frecuencia
relativa para subdividir el círculo en sectores, o partes, que corresponden
a la frecencia relativa de cada clase.

21

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Destinos Turísticos

Costa Atlántica Cataratas del Iguazú Noroeste Argentino


Mendoza Patagonia

Gráfico 2

La distribución de frecuencias de datos cualitativos


representa la participación en el total de cada categoría, sin
embargo, es más relevante individualizar solo aquellas que no
superen el 5% y agruparlos en Otros (discrecionalmente). La suma
de las frecuencias es igual a la cantidad de elementos observados,
la suma de las frecuencias relativas siempre es igual a 1 y en
porcentaje es igual a 100.

Presentación de datos cuantitativos

Distribución de frecuencia
La distribución de frecuencias, como se explicó antes para
variable cualitativa, consiste en agrupar un conjunto de datos en
categorías excluyentes entre sí, que muestran el número de
observaciones que hay en cada una de ellas.
Como se ve esta definición se puede aplicar a una variable
cuantitativa considerando que hay ser cuidadoso al definir las clases
que se van a utilizar.
Si trabajamos con las tablas de frecuencias no agrupadas y
agrupadas (Tabla 1 y 2).

22

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Distribuciones de frecuencia relativa y de frecuencia porcentual

Tabla de frecuencias no agrupadas

𝑿𝒊 ∶ 𝒗𝒆𝒏𝒕𝒂𝒔 Frecuencia relativa Frecuencia porcentual

498 0,13333 13,33%

530 0,06666 6,66%

532 0,26666 26,66%

544 0,13333 13,33%

560 0,26666 26,66%

582 0,13333 13,33%

1 100%

Tabla N° 6

Tabla de frecuencias agrupadas:

Intervalo de Clase Frecuencia relativa Frecuencia porcentual

[490,515) 0,20 20%

[515,540) 0,25 25%

[540,565) 0,20 20%

[565,590) 0,10 10%

[590,615] 0,25 25%

1 100%

Tabla N° 7

Gráficos de puntos
Uno de los más sencillos resúmenes gráficos de datos son las
gráficas de puntos. En el eje horizontal se presenta el intervalo de los
datos. Cada dato se representa por un punto colocado sobre este eje.
Las gráficas de puntos muestran los detalles de los datos y son
útiles para comparar la distribución de los datos de dos o más variables.

23

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Ventas
30,00%

25,00%

20,00%

15,00%

10,00%

5,00%

0,00%
480 500 520 540 560 580 600

Gráfico 3
Histograma
Se utiliza usualmente para datos cuantitativos y se hace con
datos previamente resumidos mediante una distribución de frecuencia,
frecuencia relativa o porcentual. Un histograma se construye colocando
la variable de interés en el eje horizontal y la frecuencia, en el eje vertical.
La frecuencia de cada clase se indica dibujando un rectángulo
cuya base está determinada por los límites de clase sobre el eje
horizontal y cuya altura es la frecuencia correspondiente.

Gráfico 4
Los histogramas sirven para dar información respecto de la
forma de la distribución.
24

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Si se toman distintos conjuntos de datos y se realizan los


respectivos histogramas, se podrá visualizar el sesgo.

Histogramas de Frecuencias Sesgados

Gráfico 4

Otra forma de representar una distribución es mediante un


polígono de frecuencias. En este al histograma se le trazan los puntos
medios de cada rectángulo y se unen esos puntos dando origen a una
línea que da forma continua a la distribución. Estos polígonos se pueden
utilizar también para visualizar la forma de la distribución.

Polígono de Frecuencias

Gráfico 5

DESCRIPCIÓN NUMÉRICA DE LOS DATOS


Así como anteriormente, se resumieron datos mediante gráficos
y tablas de frecuencias, ahora se utilizarán medidas numéricas para
resumir datos. Estas medidas serán de posición, dispersión, forma, y
asociación.

25

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Si se calculan medidas con los datos de una muestra, se llaman,


se llaman estadísticos muestrales.
Si se calculan medidas con los datos de una población, se llaman
parámetros poblacionales.
En inferencia estadística, al estadístico muestral se le conoce
como el estimador puntual del correspondiente parámetro poblacional.

Medidas de tendencia central y Posición


Las medidas de posición tienen por objeto determinar el valor
central de un conjunto de datos.
La medida de posición debe ser fácil de calcular, pero también
hay que tener en cuenta que cuando depende de todos los datos resume
mejor la característica del fenómeno que cuando depende solamente de
algunos.
En las medidas de posición más que una gran sensibilidad a los
cambios en el valor de la variable es deseable cierta estabilidad.
Una buena medida de posición debe tener la propiedad de que, si
a cada valor de la variable aleatoria se le suma una cantidad constante,
(lo que equivale a un cambio de origen), la medida de posición se
incremente en la misma cantidad.

La medida de posición más importante y de uso más corriente es


la media aritmética porque es la que mejor cumple con los requisitos de
una buena medida de posición.

Son de uso corriente, aunque no con la misma intensidad de la


media aritmética, la mediana y la moda. La mediana se utiliza
preferentemente cuando los valores extremos pueden influir demasiado
en el promedio.
La medida de posición a utilizar depende, fundamentalmente, de
la distribución de los datos, de las características del fenómeno y del uso
que se hará de esta medida de posición.
Media
La medida de posición más importante es la media, o valor
promedio, de una variable. La media proporciona una medida de posición
central de los datos.
Si los datos son datos de una población, la media se denota con
la letra griega 𝜇.
Recuerde que el valor de la primera observación de la variable 𝑥
se denota con 𝑥1 , el valor de la segunda observación de la variable 𝑥 con
26

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

𝑥2 y así sucesivamene. El valor de la 𝑖 − é𝑠𝑖𝑚𝑎 observación de la variable


𝑥 se denota 𝑥𝑖 . La fórmula para la media muestral cuando se tiene una
muestra de 𝑛 observaciones es la siguiente:

Media Muestral ∑ 𝑥𝑖
𝑋̅ =
𝑛

El numerador es la suma de los valores de cada una de las


observaciones y el denominador la cantidad de las mismas.

Considere los siguientes datos que representan el tamaño de


cinco grupos de alumnos de una universidad.
36 44 52 42 26
𝑥𝑖 representa el número de alumnos en cada uno de los cinco
grupos, por lo tanto, 𝑥1 = 36, 𝑥2 = 44 y así sucesivamente.
La media muestral se calcula de la siguiente manera:

∑ 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 36 + 44 + 52 + 42 + 26 200
𝑋̅ = = = = = 40
𝑛 5 5 5

Por lo tanto, la media muestral del tamaño de estos grupos es


40 alumnos.
En una población, el número de observaciones se denota con 𝑁
y la media 𝜇.
Por lo tanto, la media poblacional será:

∑ 𝑥𝑖
𝜇= (2)
𝑁

En la fórmula (1) se han considerado uno por uno, todos los


valores observados, aunque algunos fueran iguales.

Anteriormente se definió el término frecuencia absoluta como la


cantidad de veces que se repite un valor de la variable:
𝒇𝒊 , la cantidad de veces que se repite un valor 𝒙𝒊 de la variable

La suma de las frecuencias absolutas, es igual al número total de


observaciones. En consecuencia, podemos obtener la media aritmética
de 𝑛 valores observados mediante la siguiente fórmula:

∑𝑟𝑖=1 𝑥𝑖 𝑓𝑖 ∑ 𝑥𝑖 𝑓𝑖
𝑋̅ = = (3)
∑𝑟𝑖 𝑓𝑖 𝑛

27

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Es necesario observar que, aunque (1) y (3) tienen distintas


estructuras, no hay dos medias aritméticas. La media aritmética es una
sola, lo que sucede es que en la fórmula (1) se consideran los valores de
cada observación aisladamente, repitiendo los valores iguales tantas
veces como aparecen, y en (3) en lugar de repetir los valores iguales, 𝑥𝑖 ,
se tiene en cuenta su frecuencia de observación, 𝑓𝑖 , y se lo coloca una
Al tomar el punto
sola vez multiplicado por 𝑓𝑖 .
medio como
Para calcular la media aritmética en las distribuciones con datos representativo de
no agrupados se utilizan las mismas formulas (1) y (3), pero en las todos los valores de
distribuciones con datos agrupados, el valor de la variable es el punto clase, se supone que
medio del intervalo de clase. los datos están
distribuidos
Actividad de aplicación: uniformemente, y
Se han registrado las ventas en un comercio durante 50 días, con cuando esto no es
los siguientes resultados, en miles de pesos: cierto se comete un
error.

153 – 123 – 129 – 132 – 147 – 138 – 137 – 134 – 131 – 147

134 – 148 – 125 – 139 – 146 – 145 – 148 – 135 – 152 – 128

138 – 138 – 122 – 146 – 137 – 151 – 145 – 124 – 132 – 138

137 – 146 – 138 – 146 – 140 – 137 – 129 – 126 – 117 – 136

128 – 127 – 146 – 144 – 137 – 128 – 143 – 141 – 136 – 138

a) Calcule la media aritmética de los datos originales.


b) Agrupe datos en un cuadro de distribución de frecuencias
agrupadas.
c) Calcule la media aritmética en base a las frecuencias absolutas.
d) Calcule la media aritmética de la muestra, en base a las medias
aritméticas de dos submuestras: 1º la primera compuesta por los
tres primeros intervalos del cuadro; y la 2º por los dos intervalos
restantes.

Solución:

∑𝑥 6862
a) 𝑋̅ = 𝑛 𝑖 = 50 = 137,24

b) Usar 𝑘 = 5, donde 𝑘 indica el número de intervalos.


𝑋𝑚á𝑥 = 153 y 𝑋𝑚𝑖𝑛 = 117
(𝑋𝑚á𝑥 −𝑋𝑚𝑖𝑛 ) 153−117
ℎ= 5
= 5
= 7,2 ≅ 8 donde ℎ indica la longitud de cada

intervalo. El resultado de ℎ se redondea siempre por exceso y debe tener


la misma cantidad de decimales que los datos.
28

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Ahora, como 𝑋𝑚í𝑛 + ℎ = 117 + 8 = 125 entonces el primer


intervalo es (117,125), que incluye al valor 117 y no al valor 125;

𝒇𝒊
Intervalo
Conteo (Frecuencia
de Clase
absoluta)

[117,125) 4 4

[125,133) 11 11

[133,141) 18 18

[141,149) 14 14

[149,157] 3 3

50

En el cuadro anterior hemos obtenido una distribución de


frecuencias en cinco intervalos de clase. Los datos así presentados no
permiten el cálculo de los distintos parámetros, para poder obtenerlos
es necesario buscar un valor que represente los valores de la variable
incluidos en cada intervalo de clase. Para eso se trabaja con los puntos
medios de cada intervalo, que se obtienen sumando el límite inferior al
límite superior y dividirlo por dos:

((𝐿𝑖 + 𝐿𝑠 )/2)
En nuestra actividad los puntos medios son los que aparecen en
el cuadro siguiente en la columna número 1.
c) Calcule la media aritmética en base a las frecuencias absolutas.
Puntos
medios 𝒇𝒊 𝒙𝒊 𝒇 𝒊 ∑ 𝒇𝒊
𝒙𝒊

121 4 484 4

129 11 1419 15

137 18 2466 33

145 14 2030 47

153 3 459 50

50 6858

∑ 𝑥𝑖 𝑓𝑖 484 + 1419 + 2466 + 2030 + 459 6858


𝑋̅ = = = = 137,16
𝑛 50 50
29

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

d) Calcule la media aritmética de la muestra, en base a las medias


aritméticas de dos submuestras: 1º la primera compuesta por los
tres primeros intervalos del cuadro; y la 2º por los dos intervalos
restantes.

Para calcular la media aritmética de la muestra, en base a las


medias aritméticas de dos submuestras hacemos:

Puntos Puntos
medios 𝒇𝒊 𝒙𝒊 𝒇 𝒊 medios 𝒇𝒊 𝒙𝒊 𝒇 𝒊
𝒙𝒊 𝒙𝒊

121 4 484 145 14 2030

129 11 1419 153 3 459

137 18 2466 Total 17 2489

Total 33 4369

∑ 𝑥𝑖 𝑓𝑖 484 + 1419 + 2466 ∑ 𝑥𝑖 𝑓𝑖 2030 + 459 2489


̅̅̅
𝑋1 = = ̅̅̅
𝑋2 = = =
𝑛 33 𝑛 17 17
4369 = 146,411
= = 132,39
33

La media aritmética nos queda:

∑ 𝑥1 𝑓1+ ∑ 𝑥2 𝑓2 4369 + 2489 6858


𝑋̅ = = = = 137,16
𝑛 33 + 17 50

o sea, se tiene que ponderar la media de cada submuestra por el tamaño


de cada submuestra.

Mediana

La mediana es la observación central; es decir, la mitad de


las observaciones es menor, y la otra mitad mayor.

En ocasiones la mediana se simboliza como 𝑀𝑒 o 𝑀𝑑 , el


procedimiento para calcularla es el siguiente:

 Las observaciones se ordenan de menor a mayor.


30

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

 Para encontrar el valor medio: en un número impar de


observaciones, la mediana es el valor medio; para un número par
de observaciones se define como la media de los dos valores
centrales.

Ejemplo I Mediana
25, 28, 29, 30, 35 29

Ejemplo II Mediana
25, 28, 29, 30, 35, 42 (29 + 30)/2 = 29,5

Supongamos un grupo de 5 personas que tienen las siguientes


edades, 5, 7, 8, 10, y 90.
La mediana es el valor de la variable que está en el medio de
todos los valores que puede asumir dicha variable, cuando éstos están
ordenados en un sentido dado; la mediana implica orden y a este orden
lo simbolizamos con (𝑀𝑒 ), siendo:
𝑁+1
𝑀𝑒 =
2
Donde 𝑁 es la cantidad de datos ordenados.

El valor de la variable que ocupa el lugar señalado por el orden


de la mediana, (𝑀𝑒 ), es la mediana. En el caso anterior de las cinco
personas, tenemos:

5 7 8 10 90 Valores de la variable
1° 2° 3° 4° 5° Orden en que se encuentran los datos

El orden de la mediana es:


5+1
𝑀𝑒 = =3
2
y la mediana es el valor que ocupa el tercer lugar:
𝑀𝑒 = 8

Cuando el número de datos es impar la expresión dada nos


permite determinar la mediana, y ésta coincide con un valor observado
de la variable.
Cuando la serie está compuesta por un número par de datos la
fórmula indica un orden que está comprendido entre dos valores
observados; por ejemplo, si la serie anterior hubiera sido de 4 términos:
3, 7, 8, y 90, el orden de la mediana sería:
31

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

4+1
𝑀𝑒 = = 2,5
2
La mediana está comprendida, ahora, entre los valores
observados 7 y 8. En este caso no hay una mediana, hay muchas,
cualquier valor entre 7 y 8 es una mediana. Por lo general se considera
como valor de la mediana a la media aritmética de estos valores
(7 + 8 ) / 2 = 7,5 pero podemos decir que éste es el valor de una
mediana que se toma como tal por convención.
El procedimiento anterior permite calcular la mediana cuando las
series no están agrupadas. Cuando las series están agrupadas se sigue
otro procedimiento.
El cálculo de la mediana para datos continuos agrupados es un
poco más complejo pues deberá utilizar Tablas de Frecuencias e
intervalos de clases.
A nivel práctico, nosotros calcularemos la mediana con los
puntos medios de los intervalos de clase.

Actividad de aplicación:
Se toman los mismos datos del ejemplo anterior. Se han
registrado las ventas en un comercio durante 50 días, con los siguientes
resultados, en miles de pesos:

153 – 123 – 129 – 132 – 147 – 138 – 137 – 134 – 131 – 147

134 – 148 – 125 – 139 – 146 – 145 – 148 – 135 – 152 – 128

138 – 138 – 122 – 146 – 137 – 151 – 145 – 124 – 132 – 138

137 – 146 – 138 – 146 – 140 – 137 – 129 – 126 – 117 – 136

128 – 127 – 146 – 144 – 137 – 128 – 143 – 141 – 136 – 138

Con estos datos se pide:


a) Calcular la mediana de los datos originales.
b) Calcular la mediana de los datos agrupados.

Solución
a) Calcular la mediana de los datos originales.

Recordar que la mediana es el valor de la variable que divide al


total de datos, ordenados en forma creciente o decreciente, en dos
partes iguales.
Por lo tanto, los datos puestos en orden creciente serian:

117 – 122 – 123 – 124 – 125 – 126 – 127 – 128 – 128 – 128
32

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

129 – 129 – 131 – 132 – 132 – 134 – 134 – 135 – 136 – 136

137 – 137 – 137 – 137 – 137 – 138 – 138 – 138 – 138 – 138

138 – 139 – 140 – 141 – 143 – 144 – 145 – 145 – 146 – 146

146 – 146 – 146 – 147 – 147 – 148 – 148 – 151 – 152 – 153

El orden de la mediana es:


50 + 1
𝑀𝑒 = = 25,5
2

Por lo tanto, cualquier valor comprendido entre 137 y 138 puede


ser el valor de la mediana, pero por convención:

137 + 138
𝑀𝑒 = = 137,5
2
b) Calcular la mediana de los datos agrupados.

Cuando los datos están agrupados, para el cálculo de la mediana,


se debe calcular, los intervalos de clase y trabajar con los puntos medios
de cada intervalo. Luego encontrar el orden de la mediana dentro de la
frecuencia acumulada y ver cuál es el valor de la variable que
corresponde a dicha frecuencia, y ese valor es el valor de la mediana de
esa distribución.

Puntos
medios 𝒇𝒊 𝒙𝒊 𝒇 𝒊
𝒙𝒊

121 4 484

129 11 1419

137 18 2466

145 14 2030

153 3 459

50 6858

Cuando la frecuencia acumulada es 33, quiere decir que el orden


que daba 25,5 se encuentra dentro de esa frecuencia y por lo tanto el
valor de la mediana en este caso es el 137.
Ejemplo:
Si considera ahora un grupo de 5 personas a las que se le
pregunta su edad, la media aritmética del grupo será:
33

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

5 + 7 + 8 + 10 + 90
𝑋̅ = = 24 𝑎ñ𝑜𝑠
5
Esta es una cifra que no representa al grupo de ninguna manera.
En cambio, si ordenamos las edades de menor a mayor y tomamos el del
medio, 8, este número si será representativo del grupo.
Aunque la media es la medida de localización central más
empleada, en algunas situaciones se prefiere la mediana.
A la media la influyen datos en extremo pequeños o
considerablemente grandes.
Al generalizar lo anterior, es posible decir que cuando los datos
contengan valores extremos, es preferible usar a la mediana como
medida de localización central.

Moda

La moda es un buen
La moda es el valor que se presenta más veces
indicador sólo si hay
una frecuencia
Por lo general, se usa para un número grande de observaciones,
dominante.
cuando el investigador desea hacer notar el valor más popular.

Ejemplo:
Considerando del ejemplo anterior, las ventas en un comercio
durante 50 días. Calcule la moda para ese conjunto de datos.

La moda es 138 que aparece 6 veces dentro del conjunto de


datos.
Hay situaciones en que la frecuencia mayor se presenta con dos
o más valores distintos. Cuando esto ocurre hay más de una moda. Si
los datos contienen más de una moda se dice que los datos son
bimodales. Si contienen más de dos modas, son multimodales. En los
casos multimodales casi nunca se da la moda, pues no resulta de mucha
utilidad.

Percentiles

Un percentil aporta información acerca de la dispersión de los


datos en el intervalo que va del menor al mayor valor de los datos.
Se dice que cerca de 𝑝 por ciento de las observaciones tienen
valores menores que el percentil 𝑝 y aproximadamente (100 − 𝑝) por
ciento de las observaciones tienen valores mayores que el percentil 𝑝. El
percentil p se define como sigue:

34

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

El percentil 𝑝 es un valor tal que por lo menos 𝑝 por ciento de


las observaciones son menores o iguales que este valor y por lo
menos (100 − 𝑝) por ciento de las observaciones son mayores o
iguales que este valor.

Las puntuaciones en los exámenes de admisión de escuelas y


universidades se suelen dar en términos de percentiles. Por ejemplo,
suponga que un estudiante obtiene 54 puntos en la parte verbal del
examen de admisión. Esto no dice mucho acerca de este estudiante en
relación con los demás estudiantes que realizaron el examen. Sin
embargo, si esta puntuación corresponde al percentil 70, entonces 70%
de los estudiantes obtuvieron una puntuación menor a la de dicho
estudiante y 30% de los estudiantes obtuvieron una puntuación mayor.
Para calcular el percentil p se emplea el procedimiento siguiente:
Ejemplo:
Se consideran ahora importes de sueldos correspondientes a
empleados iniciales (sin antigüedad) de una empresa.

34500 33550 33100 34800 34900 34800


37300 35500 35400 36500 35200 39250

Se desea determinar el percentil 85 en estos sueldos.


Primeramente, se ordenan los datos de menor a mayor:

33100 33550 34500 34800 34800 34900


35200 35400 35500 36500 37300 39250

Luego se calcula el índice:


𝑝 85
𝑖=( )𝑛 = ( ) 12 = 10,2
100 100
Como 𝑖 no es un número entero, se debe redondear.
La posición del percentil 85 es el primer entero mayor que 10,2.
Es la posición 11.
Observe ahora los datos ordenados. El percentil 85 es el dato en
la posición 11, o sea 37300.

35

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Cuartiles

Los cuartiles son valores análogos a la mediana y los


percentiles, pero en lugar de dividir los datos ordenados en dos
partes iguales, se dividen en cuatro partes. Cada parte contiene el
25% de las observaciones.

Hasta aquí vimos las medidas de posición, que nos incidan el


valor central alrededor del cual se distribuyen los valores del conjunto de
datos.

Comparación entre los estadísticos de posición

Aunque desde un punto de vista puramente descriptivo las tres


medidas proporcionan información complementaria, sus propiedades
son muy distintas: la media utiliza todos los datos y es, por tanto,
preferible si los datos son homogéneos; tiene el inconveniente de que es
muy sensible a observaciones atípicas (un error en los datos o un valor
anormal puede modificarla notablemente). Por el contrario, la mediana
utiliza menos información que la media (sólo tiene en cuenta el orden de
los datos y no su magnitud) pero, en contrapartida, no se ve alterada si
una observación o una pequeña parte de las observaciones son valores
atípicos. En tanto que la moda es el valor descriptivo más débil, ya que
en algunos casos puede no existir o puede no ser única; es útil cuando
la variable es de tipo cualitativo ya que es el único estadístico de
posición que puede calcularse.

En general es recomendable calcular la media y la mediana ya


que si hay heterogeneidad en los datos ambas medidas difieren
notoriamente.

A continuación, veremos las medidas de variación que se llaman


también medidas de concentración o medidas de dispersión, e indican
de qué manera se distribuyen los valores alrededor del valor central. Nos
dicen si estos valores están concentrados o dispersos.

Estadísticos de Dispersión

Suponga que las ventas mensuales (medidas en miles de pesos)


de dos muestras de 7 empresas del sector fabril de dos localidades de
la provincia de Córdoba que fueron subsidiadas durante el ASPO
(aislamiento social, preventivo y obligatorio) de 2020 son:

36

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

𝑚𝑢𝑒𝑠𝑡𝑟𝑎4: 400 400 400 400 400 400 400

𝑚𝑢𝑒𝑠𝑡𝑟𝑎5: 200 300 400 400 400 500 600

Si se calculan los estadísticos de posición para cada una de ellas,


se ve que son todos iguales a 400 miles de pesos., específicamente

𝑋̅4 = 𝑋̅5 = 𝑚4 = 𝑚5 = 𝑀4 = 𝑀5 = 400

A pesar de lo anterior si se observan las ventas, se puede decir


que el efecto de los subsidios durante el ASPO no fue igual en las dos
muestras, lo cual indica que no son suficientes los estadísticos de
posición para describir una muestra.
Lo que se desea es medir la diferencia que se visualiza entre las
dos muestras, que en realidad proviene de la variabilidad de las mismas.
Para esto se calcula la diferencia entre el valor máximo de la muestra
(denotado por 𝑋𝑚𝑎𝑥 ) y el valor mínimo (denotado por 𝑋𝑚𝑖𝑛 ), es decir
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 , cuyo valor para cada muestra es:

400. − 400. = 0 600. − 200 = 400.

Estos valores indican que en la primera muestra todos los datos


son iguales, mientras que en la segunda no lo son, y ahí sí se puede
observar el efecto diferente que producen los subsidios. En la primera
muestra (donde todos los valores son iguales) la diferencia es cero, en
tanto que, en la segunda muestra (donde no todos los valores son
iguales) el valor de la diferencia es distinto de cero (positivo). Se
definirán valores que tengan precisamente esas características:

 que resulten 0 cuando todos los datos son iguales;

 que sean positivos cuando hay al menos uno diferente.

Se denominan Estadísticos de Dispersión a aquellos valores


que miden la variabilidad de una muestra.

Los estadísticos de dispersión más utilizados son:

37

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Amplitud o Rango:

Es la diferencia entre el valor máximo y el valor mínimo


observado en la muestra. Se lo denota con 𝑅. En fórmula se expresa:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

Este estadístico no utiliza toda la información de la muestra (sólo


sus extremos), por ello se proponen otras medidas de dispersión que sí
la tienen en cuenta. Una de ellas surge en considerar la diferencia de las
observaciones con respecto a la media muestral:
(𝑋𝑖 − 𝑋̅)

Sin embargo, como esta es una medida para cada observación y


se requiere estudiar la variabilidad de todos los valores de la muestra, se
deberían sumar todas estas diferencias, en símbolos:
𝑛

∑(𝑋𝑖 − 𝑋̅)
𝑖=1

Se puede comprobar que esta suma es siempre cero


cualesquiera sean los datos de la muestra, motivo por el cual no puede
ser una medida de variabilidad.
Entonces basados en esta idea se define el siguiente estadístico
de dispersión:

Varianza:

La varianza es una medida de variabilidad que utiliza todos los


datos. Está basada en la diferencia entre el valor de cada observación
(𝑥𝑖 ) y la media.

Varianza Poblacional

Es un valor que mide cuanto se desvían en promedio los


datos de la media poblacional. Para calcular la varianza, estas
desviaciones respecto de la media se elevan al cuadrado. Se lo
denota con 𝜎 2 y en notación matemática se lo expresa así:
∑𝑛𝑖=1(𝑥𝑖 − μ)2
σ2 =
𝑁

38

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

En la mayor parte de las aplicaciones de la estadística, los datos


a analizar provienen de una muestra.
No se dará una explicación detallada, pero es posible demostrar
que si la suma de los cuadrados de las desviaciones respecto de la
media se divide entre 𝑁 − 1, en lugar de entre 𝑁. La varianza muestral se
define:

Varianza Muestral

Es un valor que mide cuanto se desvían en promedio los


datos de la media muestral. Se lo denota con 𝑆 2 y en notación
matemática se lo expresa así:
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1

Observe que 𝑆 2 vale cero cuando los datos son todos iguales y
es mayor que cero cuando al menos uno es diferente, con lo que se logra
lo que se espera de una medida de variabilidad, utilizando además todos
los valores de la muestra.
Dado que este estadístico tiene las unidades de los datos
elevadas al cuadrado, se define otro estadístico que tiene la misma
magnitud que los datos.
Si se dispone de los datos resumidos en una tabla de frecuencias
no agrupadas, la varianza puede calcularse como:
𝑘
1
2
𝑆 = ∑ 𝑓𝑖 (𝑥𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Por otra parte, si sólo se tiene acceso a la tabla de frecuencias


agrupadas de los datos la varianza (usando la marca de clase) se calcula
como:
𝑘
1
2
𝑆 = ∑ 𝑓𝑖 (𝑥̃𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

Es evidente que el valor numérico de 𝑆 2 describe el grado de


dispersión de la distribución con respecto a su media aritmética. Si
todas las 𝑥𝑖 fueran iguales, la media coincidiría con ese valor común y
las desviaciones serían todas nulas (también sus cuadrados),
resultando 𝑆 2 = 0

39

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Desviación Estándar (Típica)

Este estadístico mide, al igual que la varianza, cuanto se desvían


en promedio los datos de la media muestral, pero con la misma magnitud
que los datos.

La Desviación Estándar es la raíz cuadrada positiva de la


varianza. Se lo expresa de la siguiente manera:
Desviación estándar poblacional:
𝜎 = +√𝜎 2
Desviación estándar muestral:
𝑆 = +√𝑆 2

La varianza está expresada en unidades distintas que la variable


original, así si la variable es una estatura expresada en 𝑐𝑚, la varianza es
un cierto número de centímetros al cuadrado. En cambio, la 𝐷. 𝐸. está
expresada en las mismas unidades que la variable (los datos originales)
y esto permite comparar la 𝐷. 𝐸. con los valores de la variable, es decir,
las mismas unidades que los datos originales.

Coeficiente de Variación

Para que las medidas de variación de dos o más distribuciones


sean comparables es necesario considerar valores relativos de estas
medidas.
A tal fin se forma un cociente con una medida de variación en el
numerador y una medida de posición en el denominador como unidad de
medida.
𝑀𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛
𝐶𝑉 =
𝑀𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
Aunque cualquier medida de la que hemos visto se puede utilizar
en el numerador y denominador respectivamente, lo corriente es utilizar
la desviación típica como medida de variación y la media aritmética
como medida de posición.
Este estadístico de dispersión mide la variabilidad de la muestra
independientemente de la magnitud de la media, o sea determina la
variabilidad en unidades de la media. Se lo denota con 𝐶𝑉 y se lo calcula
como:

40

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Para poblaciones:
𝜎
𝐶𝑉 = ∙ 100
𝜇̅
Para muestras:
𝑠
𝐶𝑉 = ∙ 100
𝑋̅

El coeficiente de variación es un número sin unidades de medida,


generalmente expresado en porcentaje. Esta ausencia de unidades es
de gran utilidad cuando se desea comparar la variabilidad de dos o más
muestras, es decir, es útil para comparar dos series de datos que están
expresadas en unidades diferentes.
Interpretación
Retomando el ejemplo se puede observar, a simple vista que, para
4
la primera muestra tanto 𝑆42 como 𝑆4 son cero, en tanto que para la
segunda muestra ambos valores resultan mayores a cero:
(200 − 400)2 + (300 − 400)2 + 3 ∙ (400 − 400)2 + (500 − 400)2 + (600 − 400)2
𝑆52 =
6
= 16666,67 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠 2

y 𝑆5 = 129,10 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑝𝑒𝑠𝑜𝑠.

La interpretación de los valores numéricos de los estadísticos


obtenidos en la 𝑚𝑢𝑒𝑠𝑡𝑟𝑎5de ventas de empresas fabriles de localidades
de Córdoba a los que se subsidio durante el período de ASPO es:
𝑅 = 400 miles de pesos. significa que la diferencia entre las
ventas de la empresa que más vendió y de aquella que vendió menos es
de 400 miles de pesos.
𝑆5 = 129,10 miles de pesos. significa que las ventas de las 7
empresas se desvían aproximadamente 129.10 miles de pesos de las
ventas promedio.
𝐶𝑉5 = 32,275% significa que la variabilidad de las ventas relativa
a la venta promedio es aproximadamente del 32%.
Para comprender cuan útil es el coeficiente de variación se da el
siguiente ejemplo:
Se sospecha que las ventas de automóviles son más variables
que las ventas de productos alimenticios, para lo cual se determinó las
ventas medias y la desviación estándar de las ventas de los productos
en estudio, las cuales resultaron:

41

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

𝑋̅𝑃𝐴 = 10406,4 pesos 𝑆𝑃𝐴 = 557,68 pesos

𝑋̅𝐴 = 0,46 𝑝𝑒𝑠𝑜𝑠 𝑆𝐴 = 0,07 pesos

Si se tiene en cuenta el valor de las desviaciones estándar puede


parecer que las ventas de productos alimenticios varían mucho más que
las ventas de automóviles. Sin embargo, al calcular el coeficiente de
variación para cada muestra se observa que
𝐶𝑉𝑃𝐴 = 5,36% y 𝐶𝑉𝐴 = 15,22%

Lo cual indica que en realidad varía más las ventas de


automóviles que las ventas de productos alimenticios, es decir que la
muestra con los datos de las ventas de productos alimenticios es más
uniforme que las ventas de automóviles.

Comparación entre los estadísticos de dispersión

El rango brinda una rápida visualización de la variabilidad de la


muestra, aunque sólo utiliza los valores extremos de la misma. Por su
parte la varianza utiliza toda la información de la muestra, pero no posee
las unidades de medida de los datos, condición que sí es verificada por
la desviación estándar. Sin embargo, si el interés es comparar la
variabilidad de dos o más muestras, la desviación estándar no es
aconsejable pues su valor está en la magnitud de los datos; en ese caso
el coeficiente de variación es el apropiado.
Todo lo visto anteriormente, nos permite caracterizar una
población según sus medidas de posición y variación.

La media es el valor promedio. Es el valor equitativo que se


obtendría al repartir un todo entre sus elementos.
La desviación estándar mide lo equitativo que se ha hecho
ese reparto. A mayor desviación estándar, menor equilibrio.

¿Cuáles son las medidas más utilizadas para describir un


conjunto de datos y cuándo se utilizan?

 La desviación estándar y la media son las dos medidas más


utilizadas para describir un conjunto de datos.

42

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

 La desviación estándar se emplea cuando también es apropiado


el uso de la media, es decir en distribuciones simétricas de datos
numéricos.
 El rango es una medida apropiada para datos numéricos cuando
se desea enfatizar valores extremos.
 El coeficiente de variación es útil cuando se comparan dos
distribuciones numéricas medidas en escalas diferentes.

Ejercicio de aplicación:
Los datos de la tabla corresponden a dos muestras de salarios (𝑒𝑛 $)
de los empleados en dos establecimientos comerciales:
a) Calcular para cada muestra los estadísticos de posición, dispersión
y compararlos.
b) Según lo obtenido en a), ¿reflejan los estadísticos de posición y los
de dispersión la situación salarial de ambos establecimientos?
Justificar.

Establecimiento A Establecimiento B

20000 30000

20000 30000

20000 30000

30000 30000

30000 30000

30000 30000

30000 30000

90000 40000

Medidas de Asimetría y Puntiagudez

Asimetría
En las distribuciones simétricas la media, la mediana y la moda
tienen el mismo valor.
Una distribución es asimétrica derecha cuando la Moda es
menor que la Mediana y ésta menor que la Media.
Es asimétrica izquierda cuando la Media es menor que la
Mediana y ésta menor que la Moda.

43

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Cuando los valores de los parámetros, son diferentes, pero no


están ubicados en alguno de estos órdenes, simplemente decimos que
la distribución es asimétrica.

Moda
Mediana
Media
Distribución simétrica

Moda Mediana Media


Media Mediana Moda

Asimetría derecha Asimetría izquierda

Puntiagudez

Otro parámetro, que se refiere a la forma de la distribución es el


que mide la puntiagudez de la curva.

Puntiagudez normal Puntiaguda Puntiagudez achatada

44

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Análisis para dos variables


Hasta ahora se han examinado métodos numéricos que resumen
datos en una sola variable. Muchas veces quienes toman decisiones
necesitan conocer la relación entre dos variables.

A continuación, se presentan la covarianza y la correlación como


medidas descriptivas de la relación entre dos variables.
El administrador de un determinado negocio dedicado a la venta
de ropa, desea determinar la relación entre el número de comerciales
televisados en un fin de semana y las ventas del negocio durante la
semana siguiente.

En la tabla N°8 se presentan datos muestrales de las ventas


expresadas en miles de pesos. En esta tabla se presentan
10 observaciones (𝑛 = 10) , una por cada semana. El diagrama de
dispersión en el gráfico 6 muestra una relación positiva, en que las
mayores ventas (𝑦) están asociadas con mayor número de comerciales
(𝑥). En efecto, el diagrama de dispersión sugiere que podría emplearse
una línea recta como aproximación a esta relación.
Se introduce entonces la covarianza como una medida
descriptiva de la asociación entre dos variables.

Covarianza
En una muestra de tamaño 𝑛 con observaciones (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ),
etc., la covarianza muestral se define como sigue:

∑(𝑥𝑖 − 𝑋̅). (𝑦𝑖 − 𝑌̅)


𝑆𝑥𝑦 =
𝑛−1

Semana N° de Comerciales Ventas (en miles)

1 2 50

2 5 57

3 1 41

4 3 54

5 4 54

6 1 38

7 5 63

8 3 48

45

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

9 4 59

10 2 46

Tabla N° 8: Datos muestrales del comercio venta de ropa.

70

60
VENTAS (EN MILES)

50

40

30

20

10

0
0 1 2 3 4 5 6
N° DE COMERCIANTES

Gráfico 6

Para medir, en el problema del negocio de ropa, la fuerza de la


relación lineal entre el número de comerciales 𝑥 y el volumen de ventas
𝑦, se usa la ecuación 𝑆𝑥𝑦 para calcular la covarianza muestral.

En la tabla N° 9 se muestra el cálculo de 𝛴(𝑥𝑖 − 𝑥̅)(𝑦𝑖 − 𝑦̅)


Observe que 𝑥̅ = 30/10 = 3 y 𝑦̅ = 510/10 = 51. Empleando la
ecuación 𝑆𝑥𝑦 se encuentra que la covarianza muestral es:
∑(𝑥𝑖 − 𝑋̅). (𝑦𝑖 − 𝑌̅) 99
𝑆𝑥𝑦 = = = 11
𝑛−1 9

N° de Ventas (en
Semana (𝒙𝒊 − 𝒙̅) (𝒚𝒊 − 𝒚̅) (𝒙𝒊 − 𝒙̅)(𝒚𝒊 − 𝒚̅)
Comerciales miles)

1 2 50 -1 -1 1
2 5 57 2 6 12
3 1 41 -2 -10 20
4 3 54 0 3 0
5 4 54 1 3 3
46

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

6 1 38 -2 -13 26
7 5 63 2 12 24
8 3 48 0 -3 0
9 4 59 1 8 8
10 2 46 -1 -5 5
Totales 30 510 0 0 99
Tabla N° 9

La fórmula para calcular la covarianza de una población de


tamaño 𝑁 es semejante a la ecuación 𝑆𝑥𝑦 , pero la notación usada es
diferente para indicar que se está trabajando con toda la población.

∑(𝑥𝑖 − 𝜇𝑥 ). (𝑦𝑖 − 𝜇𝑦 )
𝜎𝑥𝑦 =
𝑁
Donde 𝜇𝑥 se usa para denotar la media poblacional de la variable
𝑥 y 𝜇𝑦 para denotar la media poblacional de la variable 𝑦. La covarianza
𝜎𝑥𝑦 está definida para una población de tamaño 𝑁.

Para ayudar a la interpretación de la covarianza muestral,


considere el gráfico 6; trazando una línea vertical punteada en 𝑥̅ = 3 y
una línea horizontal punteada en 𝑦̅ = 51 . Estas líneas dividen a la
gráfica en cuatro cuadrantes. Los puntos del cuadrante 𝐼 corresponden
a 𝑥𝑖 mayor que 𝑥̅ y 𝑦𝑖 mayor que 𝑦̅ , los puntos del cuadrante
𝐼𝐼 corresponden a 𝑥𝑖 menor que 𝑥̅ y 𝑦𝑖 mayor que 𝑦̅, etc.

Por tanto, los valores de (𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)serán positivos para los
puntos del cuadrante 𝐼 , negativos para los puntos del cuadrante 𝐼𝐼 ,
positivos para los puntos del cuadrante 𝐼𝐼𝐼 y negativos para los puntos
del cuadrante 𝐼𝑉.
Si el valor de 𝑺𝒙𝒚 es positivo, los puntos que más influyen sobre
𝑆𝑥𝑦 deberán encontrarse en los cuadrantes 𝐼 y 𝐼𝐼𝐼. Por tanto, 𝑆𝑥𝑦 positivo
indica que hay una asociación lineal positiva entre 𝒙 e 𝒚; es decir, que a
medida que el valor de 𝒙 aumenta, el valor de 𝒚 aumenta.
Si 𝑺𝒙𝒚 es negativo, los puntos que más influyen sobre 𝑆𝑥𝑦 deberán
encontrarse en los cuadrantes 𝐼𝐼 y 𝐼𝑉. Entonces, 𝑆𝑥𝑦 negativo indica que
hay una asociación lineal negativa entre 𝒙 e 𝒚; esto es, conforme el valor
de 𝒙 aumenta, el valor de 𝒚 disminuye.

Por último, si los puntos tienen distribución uniforme en los


cuatro cuadrantes, 𝑺𝒙𝒚 tendrá un valor cercano a cero, lo que indicará
que no hay asociación lineal entre 𝒙 e 𝒚.

47

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Coeficiente de Correlación

Para datos muestrales el coeficiente de correlación del se define


como:
𝑆𝑥𝑦
𝑟𝑥𝑦 =
𝑆𝑥 𝑆𝑦
Donde:
𝑟𝑥𝑦 : coeficiente de correlación muestral

𝑆𝑥𝑦 : covarianza muestral

𝑆𝑥 : desviación estándar muestral de 𝑥


𝑆𝑦 : desviación estándar muestral de 𝑦

Considerando nuevamente el ejemplo con el que se viene


trabajando, se calculan:
∑(𝑥𝑖 − 𝑋̅)2 20
𝑆𝑥 = √ = √ = 1,49
𝑛−1 9

∑(𝑦𝑖 − 𝑌̅)2 566


𝑆𝑦 = √ =√ = 7,93
𝑛−1 9

Recordar que 𝑆𝑥𝑦 = 11, por lo tanto, el coeficiente de correlación


será:
𝑆𝑥𝑦 11
𝑟𝑥𝑦 = = = +0,93
𝑆𝑥 𝑆𝑦 1,49 . 7,93

Para calcular el coeficiente de correlación poblacional, se


reemplaza 𝑠 por 𝜌.
𝜎𝑥𝑦
𝜌𝑥𝑦 =
𝜎𝑥 𝜎𝑦

Se concluye que existe una relación lineal fuerte entre el número


de comerciales y las ventas.
Dicho de otra manera, un aumento en el número de comerciales
se asocia con un incremento en las ventas.

La correlación proporciona una medida de la asociación lineal y


no necesariamente de la causalidad. Que la correlación entre dos
variables sea alta no significa que los cambios en una de las variables
ocasionen modificaciones en la otra. Aumentar los precios de las
prendas de vestir no hará que los comerciales mejoren.

48

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

El valor del coeficiente de correlación es independiente de


cualquier unidad usada para medir las variables y se altera por un valor
alejado o distante.
La manera más sencilla y eficaz de representar la correlación
entre variables es a través de los diagramas de dispersión, que permiten
visualizar la nube de puntos correspondientes a los diferentes pares de
la distribución.
¿Qué información proporciona r?
Si 𝒓 = −𝟏 o 𝒓 = +𝟏, la correlación es perfecta. La nube de
puntos es alargada.
Si 𝒓 se aproxima a – 𝟏 o a +𝟏 la correlación es fuerte. El riesgo
de hacer estimaciones de una variable a partir de la otra es escaso.
Si 𝒓 se acerca a 0 las variables están poco relacionadas. Nubes
de puntos redondeadas.
Si 𝒓 es positivo la correlación es directa: el aumento de una
variable es seguido por el aumento de la otra.
Si 𝒓 es negativo la correlación es inversa: el aumento de una
variable es seguido por la disminución de la otra.

Correlaciones de:
 0 𝑎 0,25 (0 − 0.25) indican correlación escasa o falta de
correlación.
 0,25 𝑎 0,5 (−0.25 𝑎 − 0.5), cierto grado de correlación.
 0,5 𝑎 0,75 (−0,5 𝑎 − 0,75) la relación es de moderada a buena.
 Mayor de 0,75 (−0.75) es muy buena o excelente.

Coeficiente de Determinación
En ocasiones la correlación se eleva al cuadrado (𝑟 2 ) para formar
el coeficiente de determinación. Para los datos de la Tabla N°9, el
coeficiente de determinación es 0,86 , esto significa que se puede
explicar o pronosticar 86 % de la variabilidad en una de las medidas,
cuando se conoce el valor de la otra medida.
El coeficiente de correlación habla del grado de la relación que
liga a dos variables.

Si deseáramos describir la forma de la relación que liga a estas


dos variables utilizaremos la regresión lineal.

49

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Actividades prácticas

Actividad 1:

Una maestra de pintura quiere incrementar el número de alumnos


que asisten a sus talleres y para ello necesita saber a qué edades les
interesa dicha disciplina. Para ello utiliza como muestra uno de los
cursos al que le dicta clases actualmente. En este grupo tiene 13
alumnos de las siguientes edades:

60, 57, 66, 68, 58, 64, 57, 70, 53, 52, 57, 59 𝑦 69.

Calcule:

a) Media
b) Mediana
c) Moda

Actividad 2:
El Ministerio de Trabajo, Empleo y Seguridad Social emite dos
veces al año un Boletín de Estadísticas Laborales. Se tomó información
sobre los salarios medios de los años 2018 y 2019, de dos actividades
relevantes como es el sector de la industria manufacturera y de la
construcción.
Para cada una de las actividades calcule moda, mediana y
media.

2018 2019
Actividades
1° T 2° T 3° T 4° T 1° T 2° T 3° T 4° T

Industria
2.672 3.417 4.184 5.408 2.322 3.825 3.784 6.358
Manufacturera
Construcción 2.180 2.883 3.619 4.747 1.990 2.595 3.186 4.164

Fuente: MTEySS - Subsecretaría de Políticas, Estadísticas y Estudios Laborales -


Dirección General de Información y Estudios Laborales, en base a EAHU (INDEC).

50

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Actividad 3:
En un gimnasio se tomó una muestra de las edades de los
socios que asisten a clases de crossfit, entre ellos se encontraron las
siguientes:

18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25
a) Calcule la media y la moda.
b) De acuerdo al Censo del 2010 la edad media del total de la
población es aproximadamente de 29 años. Use la edad mediana
de los datos anteriores para decir si las personas que toman
clases de crossfit tienden a ser más jóvenes o más viejos que la
población de todos los adultos.
c) Calcule e interprete el percentil 32.

Actividad 4:
Se considera como muestra las edades de alumnos regulares de
la facultad de Ciencias Económicas de la Universidad Nacional de Rio
Cuarto: 22, 20, 18, 28, 24 y 25. Calcule la varianza y la desviación
estándar.

Actividad 5:

Un productor ganadero de la zona necesita información sobre los


caballos que tiene en su establecimiento. Se sabe que el promedio de
vida de estos animales es de 25 años. Se tomó una muestra con valores
de edades de muerte de los cabellos fallecidos en los últimos 10 años:
15, 25, 40, 10, 30, 5, 28, 22, 8
Calcule:
a) Rango
b) Varianza
c) Desviación estándar.

51

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Actividad 6:
Una persona está evaluando la posibilidad de abrir una heladería
durante la estación de invierno, para ello analiza el mercado a fin de
recabar datos acerca de la cantidad vendida en miles de $ de acuerdo a
los grados promedio de cada mes.

Meses Grados: 𝒙 Ventas (en miles): 𝒚

1 32 25

2 30 30

3 28 26

4 20 24

5 16 24

6 9 20

7 5 19

8 5 21

9 11 24

10 21 28

11 26 30

12 31 33

a) Elabore un diagrama de dispersión con las variables dadas.


b) De acuerdo al diagrama de dispersión qué relación existe entre la
variable 𝑥 e 𝑦.

c) Calcule la covarianza muestral.


d) Calcule el coeficiente de correlación.

52

Tecnicatura en Gestión Empresarial


Matemática Empresarial I / Unidad IV

Actividad 7:

Se quiere saber la influencia que tiene en las ventas mensuales


las campañas publicitarias en forma mensual, para ello se tomó una
muestra de las principales marcas de cervezas.

Marcas N° de publicidades: 𝒙 Ventas (en miles): 𝒚

Quilmes 5 30

Imperial 3 28

Corona 4 33

Córdoba 1 12

Patagonia 4 29

Budweiser 2 16

Brahma 3 31

Total 22 179

a) Realice el diagrama de dispersión para las variables en


cuestión.
b) Determine la covarianza e interprete su resultado.
c) Determine el coeficiente de correlación e interprete su
resultado.

53

Tecnicatura en Gestión Empresarial

También podría gustarte