0% encontró este documento útil (0 votos)
112 vistas11 páginas

Medidas de Tendencia Central y Variación

Este documento describe varias medidas estadísticas comunes como la media, mediana y moda, así como conceptos como varianza, desviación estándar y forma. También explica la regla empírica, la regla de Chebyshev y el teorema del límite central, así como cómo convertir datos a una distribución normal estándar usando la fórmula Z.

Cargado por

josebeber92
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
112 vistas11 páginas

Medidas de Tendencia Central y Variación

Este documento describe varias medidas estadísticas comunes como la media, mediana y moda, así como conceptos como varianza, desviación estándar y forma. También explica la regla empírica, la regla de Chebyshev y el teorema del límite central, así como cómo convertir datos a una distribución normal estándar usando la fórmula Z.

Cargado por

josebeber92
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

CENTRO UNIVERSITARIO DE ORIENTE


FACULTAD DE INGENIERIA
ESTADÍSTICA 1

Folleto no. 6

1. Medidas de tendencia central, variación y forma

 La media aritmética o simplemente media es la medida más


común de la tendencia central. La media es la medida más
común en la que todos los valores desempeñan el mismo papel.
La media sirve como punto de equilibrio para un conjunto de
datos.

Su forma de expresión a través de fórmula es la siguiente: X =


(suma de los valores)/(número de valores).

 La mediana es el valor que divide en dos partes iguales a un


conjunto de datos ya ordenado. La mediana no se ve afectada
por los valores extremos, de manera que puede utilizarse
cuando están presentes. El 50% de los valores son menores
que la mediana y el otro 50% son mayores.

 La moda es el valor del conjunto de datos que aparece con


mayor frecuencia. Al igual que la mediana y a diferencia que la
media, los valores extremos no afectan a la moda.

 Los cuartiles dividen el conjunto de datos en cuatro partes


iguales.

 La media geométrica mide la razón de cambio de una variable


en el tiempo.

 El rango es la medida numérica descriptiva más sencilla de la


variación de un conjunto, se obtiene al restar el dato mayor del
dato menor de una muestra o población.

Página 1 de 11
 Varianza de una muestra es la suma de las diferencias con
respecto a la media elevada al cuadrado y dividida por el
tamaño de la muestra menos uno. Por el contrario, a la varianza
de una población al tamaño no se le resta uno.

 La desviación estándar de la muestra es la raíz cuadrada de la


suma de los cuadrados de las diferencias con respecto a la
media dividida por el tamaño de la muestra menos uno. Para
obtener la desviación estándar de la población al tamaño no se
le resta uno.

 Coeficiente de variación es una medida relativa de la variación


que siempre se expresa como porcentaje, y no en términos de
las unidades de datos. Este mide la dispersión de los datos con
respecto a la media. Se obtiene al dividir la desviación estándar
entre la media, todo multiplicado por 100%.

 Forma es una propiedad que describe a un conjunto de datos


numéricos de acuerdo a la forma de la curva que dibujan en un
plano. La forma es el patrón de distribución de los valores de
los datos a través del rango de todos los valores. La forma es
simétrica cuando los valores pequeños y grandes se equilibran
entre sí, y puede ser asimétrica cuando existe un desequilibrio
entre los valores pequeños y grandes.

o Media < mediana, asimétrica negativa o sesgo izquierdo.


o Media = mediana, simétrica o asimetría cero.
o Media > mediana, asimétrica positiva o sesgo derecho.

2. Regla empírica
En la mayoría de conjunto de datos, los valores tienden a agruparse
cerca de la media. Si los datos tienen simetría con respecto a su
agrupamiento cercano a la media, y además la media coincide con la
mediana, la distribución tiene forma de campana.

En la distribución de esta clase, y de acuerdo a la regla empírica,


tenemos:

Página 2 de 11
 Aproximadamente el 68% de los valores se encuentra a una
distancia de  1 desviación estándar de la media.
 Aproximadamente el 95% de los valores se encuentra a una
distancia de  2 desviaciones estándar de la media.
 Aproximadamente el 99.7 % de los valores se encuentra a una
distancia de  3 desviaciones estándar de la media.

Ejemplo 3.12:
La cantidad de llenado de una población integrada por 12 latas de
gaseosa es de 12.06 onzas con una desviación estándar de 0.02.
También se sabe que esta población tiene forma de campana.
Describa la distribución de la cantidad de llenado de latas. ¿Existe
una gran probabilidad de que una lata tenga menos de 12 onzas de
gaseosas?

 Para el 68.00% de los datos:   1  = 12.06  1(0.02)


= (12.04, 12.08)

 Para el 95.00% de los datos:   2  = 12.06  2(0.02)


= (12.02, 12.10)

 Para el 99.70% de los datos:   3  = 12.06  3(0.02)


= (12.00, 12.12)

La probabilidad de que la lata tenga menos de 12 onzas es (1 –


0.9970)/2 = 0.0015.

3. La regla de Chebyshev
Establece que para todo conjunto de datos, independientemente de su
forma, el porcentaje de valores que se encuentra a una distancia de k
desviaciones estándar o menos de la media, debe ser por lo menos
igual a

 1 
Regla de Chebyshev = 1  2 100% 
 k 

Donde K debe ser un valor mayor que uno.

Página 3 de 11
La regla de Chebyshev es muy general y se aplica a cualquier tipo de
distribución. La regla señala por lo menos el porcentaje de valores que
quedan dentro de una distancia dada de la media. Sin embargo, entre
más se aproxime la forma del conjunto de datos a una distribución
normal, la regla empírica reflejará con mayor precisión la mayor
concentración de datos cerca de la media.

Ejemplo 3.7. Webster, Allen L. Estadística aplicada a los negocios y la


economía. Colombia: Editorial McGraw Hill. Tercera edición. 2002.
Una empresa de transporte de pasajeros reveló una media de 78.70
por día con una desviación estándar de 12.14. Para programar los
tiempos para una nueva ruta, la gerencia desea saber con qué
frecuencia los pasajeros están dentro de dos desviaciones estándar de
la media, y cuál es dicho intervalo.

Limite del intervalo superior = (78.7) – (2)(12.14) = 102.98


Limite del intervalo inferior = (78.7) + (2)(12.14) = 54.42

 1   1 
Regla de Chebyshev = 1  2 100%  = 1  2 100%  = 75.00%
 k   2 

4. Teorema del Límite Central


Es posible tomar varias muestras de una misma población, de cada
una de ellas se puede obtener una media muestral, y de su conjunto
establecer una distribución de medias muestrales.

Si la población se distribuye normalmente, la distribución de medias


muestrales, también lo hará, graficándose las medias muestrales como
una distribución normal, con la diferencia que la dispersión de la
población será mayor debido a que la dispersión de las medias
muestrales es:


X 
n

Página 4 de 11
No obstante, si la población no se distribuyera normalmente, de
acuerdo a lo que se establece en el Teorema del Límite Central, una
población cualquiera, a medida que n aumenta, su distribución de
medias muestrales se aproxima a una distribución normal con una

media muestral de  = µ y una desviación estándar muestral  X 
n
.

La regla general es que la distribución de muestreo de las medias


muestrales será normal si n ≥ 30, el Teorema del Límite Central
asegurará una distribución normal en las medias muestrales, incluso si
la población no es normal.

5. La desviación normal o formula Z de conversión


Puede existir un número infinito de distribuciones normales posibles,
cada una con su propia media y su desviación estándar. Ya que
obviamente no se puede analizar un número tan grande de
posibilidades, es necesario convertir todas estas distribuciones
normales a una forma estándar. Esta conversión a la distribución
normal estándar se efectúa con la fórmula de conversión (o formula
Z).

X 
Z

En donde Z es la desviación normal y X es algún valor específico de la


variable aleatoria. Después de este proceso de conversión la media de
la distribución es 0 y la desviación estándar es 1, esto significa que sin
considerar lo que valen la media y la desviación estándar se miden en
las unidades originales en la distribución, después de que se ha
aplicado la formula de conversión la media es 0 y la desviación
estándar es 1.

El valor de Z indica el número de desviaciones estándar a las que una


observación está por encima o por debajo de la media.

Ejemplo:
Un fabricante de ropa sabe que sus clientes tienen una media  = 67
y una desviación estándar  = 2; si usamos la formula de conversión,
para el valor X = 67, obtenemos el valor cero, así:

Página 5 de 11
X   67  67
Z  0
 2

Si usted mide 67 pulgadas, y usamos al formula de conversión:

X   63  67 4
Z    2
 2 2

Esta indica que usted está a 4 pulgadas de la media poblacional, y a 2


desviaciones estándar por debajo de la media.

6. Áreas bajo la curva normal


La estandarización de una distribución normal permite determinar con
facilidad la probabilidad de que ocurra cierto evento. Por ejemplo: un
fabricante de ropa puede encontrar la probabilidad de que un solo
cliente tenga entre 67 y 69 pulgadas de estatura P(67≤ X ≤69),
simplemente encontrando el área que está bajo la curva normal entre
67 y 69.

Existen tablas que proporcionan el área relacionada con el valor Z,


para el ejemplo anterior el problema se resuelve de la siguiente
manera:

X   69  67
Z1    1 , para este valor de Z, la probabilidad asociada
 2
es de 0.3413.

X   67  67
Z2    0 , para este valor de Z, la probabilidad asociada
 2
es de 0.00.

Al hacer la diferencia entre las probabilidades tenemos:

P1(0.3413) – P2(0) = 0.3413 = 34.13%

Es decir que existe un 34.13% de probabilidad de que todos los


clientes midan entre 67 y 69 pulgadas.

Página 6 de 11
Ejemplo 2:
Una compañía de comunicaciones presta servicios a un área de
negocios muy importante. Los funcionarios de la compañía han
aprendido que la transmisión satélite promedio es de 150 segundos,
con una desviación estándar de 15 segundos. Los tiempos parece que
se encuentran distribuidos normalmente.

Para estimar de manera apropiada la demanda del cliente por sus


servicios y establecer una estructura de tarifas que maximice las
utilidades corporativas, se debe determinar qué tan probable es que
algunas llamadas se presenten. Se desea que usted proporcione
estimados de la probabilidad de que una llamada dure:

a) Entre 125 y 150 segundos.

X   125  150
Z1    1.67 , la probabilidad asociada a este
 15
valor de Z de 1.67 es de 0.4525

X   150  150
Z2    0 , la probabilidad asociada a este valor
 15
de Z es de 0.00.

P2(0.4525) – P1(0)= 0.4525 = 45.25%

b) Menos de 125 segundos

X   125  150
Z1    1.67 , la probabilidad asociada es de
 15
0.4525.

El resultado se obtiene restando a 0.5-0.4525, obteniendo una


probabilidad de 4.75%

c) Entre 145 y 155 segundos.

X   145  150
Z1    0.33 , la probabilidad asociada a este
 15
valor de Z de 0.1293.

Página 7 de 11
X   155  150
Z2    0.33 , la probabilidad asociada a este
 15
valor de Z es de 0.1293.

P2(0.1293) + P1(0.1293)= 0.2586 = 25.86 %

d) Entre 160 y 165 segundos.


X   160  150
Z1    0.67 , la probabilidad asociada a este
 15
valor de Z de 0.2486.

X   165  150
Z2    1 , la probabilidad asociada a este valor
 15
de Z es de 0.3413.

P2(0.3413) – P1(0.2486)= 0.0927 = 9.27 %

7. Uso de la distribución muestral


Frecuentemente las decisiones que se toman en organizaciones se
realiza sobre la base de resultados muestrales, y estos tienen un
impacto directo y consecuencias en las decisiones que se tomen. Uno
de los tipos más comunes de aplicaciones corresponde a establecer la
probabilidad de que una media muestral se encuentre dentro de
determinado rango.

Debido a que una distribución muestral se encontrará distribuida


normalmente porque: a) la muestra se toma de una población normal,
b) si n ≥ 30 el Teorema del Límite Central garantiza la normalidad.

8. Distribución normal
El concepto de distribución normal se encuentra dentro del análisis
estadístico y es muy importante. Una distribución normal es una
distribución de datos continuos (no discretos) que produce una curva
simétrica en forma de campana, en la cual media = mediana = moda.

9. Sesgo

Página 8 de 11
No todas las distribuciones son normales, algunas se encuentran
sesgadas a la derecha y otras a la izquierda, correspondiendo el pico
de la distribución al valor de la moda, pues es la observación que
ocurre con mayor frecuencia.

Las distribuciones sesgadas a la izquierda tienen esta característica:


moda > mediana > media.

Las distribuciones sesgadas a la derecha poseen la siguiente


característica: media < mediana < moda.

El Coeficiente de Sesgo de Pearson mide el grado del sesgo,


indicando P < 0 que los datos se encuentran sesgados a la izquierda,
si P > 0, los datos se encuentran sesgados a la derecha, si el
coeficiente P = 0, la distribución no se encuentra sesgada.

3( X  mediana )
Coeficiente de sesgo = P 
s

Ejemplo: los siguientes son los punteos para la clase de Métodos


Cuantitativos II, el catedrático del curso desea saber si la distribución
que conforman se encuentra sesgada: 80, 83, 87, 85, 90, 86, 84, 82 y
88.

 = 85
Mediana = 85
s = 3.12

3( X  mediana) 3(85  85)


P  0
s 3.12

Repuesta: la distribución no se encuentra sesgada, es una distribución


normal con media = mediana = moda.

10. Coeficiente de variación


La desviación estándar es una medida de dispersión, sin embargo
tiene sus limitaciones, pues si se tienen dos distribuciones diferentes
que tienen medidas diferentes o que se encuentran en dimensiones
distintas, no es posible sacar conclusiones relacionadas con la
dispersión sobre la base de la desviación estándar, pues se estarían

Página 9 de 11
comparando medidas diferentes, o en el peor de los casos
dimensionales no compatibles.

En estos casos se debe usar el Coeficiente de Variación (CV), el cual


es una medida relativa de dispersión, pues establece el grado de
dispersión de un conjunto de datos en relación con su media.

s
CV  (100)
X

Ejemplo: usted es el Gerente General de una empresa de manufactura


y desea garantizar una mínima variabilidad en las partes que usted
utiliza, y ha decidido que a menos que su costo sea mayor a tal grado
que no le permita competir a precios de mercado, cambiara de
proveedor a todo aquel producto que tenga una variabilidad en la
calidad mayor que su insumo A, ha llegado el momento de determinar
si el insumo B, posee mayor variabilidad que A, de acuerdo a la
siguiente información:

Insumo  s
2
A 2.54 cm 0.02 cm2
B 50.00 kgs 0.06 kgs

0.02cms
CV A  x100  0.79
2.54cms

0.06kgs
CV B  x100  1.2
50.00kgs

Respuesta: la variabilidad en la calidad del insumo B sobrepasa la


variabilidad del producto A, por lo cual debe de ponerlo en la lista de
productos que se deberá estudiar si existe otro proveedor que
garantice una mejor calidad a un precio similar.
Ejemplo 3.10. Levine, David M.; Krehbiel, Timothy C. y Mark L.
Berenson. Estadística para administración. Cuarta edición. Prearson
Educación, México, 2006.

El gerente de operaciones de un servicio de entrega de paquetería


está pensando si es conveniente adquirir una nueva flota de camiones.

Página 10 de 11
Al guardar los paquetes en los camiones para su entrega, se deben
tomar en cuenta dos características principales: el peso (en libras) y el
volumen (en pies cúbicos) de cada artículo.

El gerente de operaciones toma una muestra de 200 paquetes, y


encuentra que la media del peso es de 26.00 libras, con una
desviación estándar de 3.9 libras, mientras que la media en volumen
es de 8.80 pies cúbicos, con una desviación estándar de 2.20 pies
cúbicos. ¿Cómo puede el gerente de operaciones comparar la
variación de peso y volumen?

s 3.9
CVp = (100) = (100) = 15.00%
X 26.0

s 2 .2
CVv = (100) = (100) = 25.00%
X 8.80

Página 11 de 11

También podría gustarte