0% encontró este documento útil (0 votos)
123 vistas51 páginas

Medidas de Tendencia Central

Este documento describe diferentes medidas de tendencia central para conjuntos de datos agrupados y no agrupados. Explica la media, mediana y moda como las tres medidas más comunes para identificar el centro de un conjunto de datos. También define datos agrupados como aquellos clasificados en grupos con frecuencias, versus datos no agrupados que no están clasificados. Proporciona ejemplos de cálculo de cada medida.

Cargado por

Hêrz Sparks
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
123 vistas51 páginas

Medidas de Tendencia Central

Este documento describe diferentes medidas de tendencia central para conjuntos de datos agrupados y no agrupados. Explica la media, mediana y moda como las tres medidas más comunes para identificar el centro de un conjunto de datos. También define datos agrupados como aquellos clasificados en grupos con frecuencias, versus datos no agrupados que no están clasificados. Proporciona ejemplos de cálculo de cada medida.

Cargado por

Hêrz Sparks
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIDAD 1

MEDIDAS DE
TENDENCIA
CENTRAL PARA
UN CONJUNTO
DE DATOS
AGRUPADOS
INDICE

1.4 Medidas de tendencia central para un conjunto de datos


agrupados.

1.4.1 Media, Media poderada.

1.4.2 Mediana.

1.4.3 Moda.

1.4.4 Relacion entre Mediana Media y moda.

1.5 Medidas de dispersion para un conjunto de datos y datos


agrupados.

1.5.1 Rango.

1.5.2 Desviaciòn media.

1.5.3 Varianza.

1.5.4 Desviaciòn estandar.


MEDIADAS DE TENDENCIA CENTRAL
PARA UN CONJUNTO DE DATOS
AGRUPADOS Y NO AGRUPADOS

Definición
Las medidas de tendencia central son medidas estadísticas
que pretenden resumir en un solo valor a u n conjunto de Si los datos se encuentran ordenados en una tabla
valores. Representan un centro en torno al cual se estadística diremos que se encuentran “agrupados” y si los
encuentra ubicado el conjunto de los datos. Las medidas datos no están en una tabla hablaremos de datos “no
de tendencia central más utilizadas son: media, mediana y agrupados”.
moda.

Datos agrupados Datos no agrupados

Son aquellos que están clasificados en función a un criterio, Constituyen el conjunto de datos que no han sido
mostrando una frecuencia para cada clase o grupo formado. clasificados y que son presentados en una tabla de datos
Se suelen usar datos agrupados cuando se trata de muestras en forma individual, es decir que no forman parte de un
de más de 20 datos. conjunto. De manera general constituye una cantidad de
elementos que es menor a 30 con muy poca o nula
El objetivo fundamental de agrupar los datos es que el repetición.
análisis de los mismos pueda ser más sencillo, de manera
que se pueda hacer una primera aproximación a los
resultados de forma rápida. Existen tres medidas comunes para identificar el centro de
un conjunto de datos: La Media, Mediana y Moda. En
cada caso, se ubican alrededor del punto en donde se
aglomeran los datos.
Ejemplo de datos agrupados

Un ejemplo de datos agrupados sería el siguiente, donde hemos resumido la


información sobre los ingresos mensuales de un grupo de personas:

Ingresos mensuales Frecuencia


[1.500-2.500] 120
(2.500-3.500] 210
(3.500-4.500] 300
(4.500-5.500] 250
(5.500-6.500] 400
(6.500-7.500] 510
(7.500-8.500] 420
(8.500-9.500] 416
(9.500-10.500] 100

En la tabla podemos observar que, por ejemplo, 210 personas de la muestra tienen
ingresos mensuales de entre 2.500 y 3.500 eu ros.

Ahora, si los datos no estuvieran agrupados simplemente se mostrarían como en un

Nombre Ingresos

Samuel Sánchez 2.700

Alex Benavides 3.100

Ernesto Jiménez 4.500

Alicia Fernández 6.100

Beatriz Borja 2.900

Vilma Zapata 3.400

listado:
I. Bibliografía
Westreicher, G. (10 de Diciembre de 2021). [Link]. Obtenido de
[Link]

1.4.1 Media, Media poderada.

Media

Es el valor que se obtiene con la suma de todos los datos entre el total de datos.
1.
Ejemplo:
Tenemos cuatro vasos con una bebida y cada vaso tiene un volumen diferente
cada uno, y debemos obtener la media del volumen contenido en los vasos.
.
x = V1+ V1+ V1+ V1
4
Vaso 1 = 200 ml
Vaso 2 = 175 ml
Vaso 3 = 125 ml
Vaso 4 = 255 ml.
.
x = 200 + 175 + 125+ 255 = 755 = 188.75 ml
4
.
X = 188.75 ml
2. Ejemplo:
Se compran 5 terrenos con diferentes áreas y precios cada uno, y debemos
obtener la media del área contienen los terrenos.
.
x = A1+ A2+ A3+ A4+A5
5
Terreno 1 = 200 mts2
Terreno 2 = 300 mts2
Terreno 3 = 350 mts2
Terreno 4 = 250 mts2.
Terreno 5 = 500 mts2
.
x = 200 + 300 + 350+ 250 + 500 = 1600 = 320 mts2
5. 5
.
X = 320 mts2
3. Ejemplo:
Se compran 5 terrenos con diferentes áreas y precios cada uno, y debemos
obtener la media del costo de los terrenos.
.
x = C1+ C2+ C3+ C4+C5
5
Terreno 1 = 200,000.00
Terreno 2 = 300,000.00
Terreno 3 = 175,000.00
Terreno 4 = 500,000.00
Terreno 5 = 1,000,000.00
.
x = 200,000 + 300,000 + 175,000+ 500,000 + 1,000,000
5
.
x = 2,675,000
5
.
X = 535,000
4. Ejercicio

Media

Madia; es la sumatoria de los n valores, entre los m valores.

La formula para calcularla es la siguiente:

Para un grupo de datos agrupados.

X=Σx

Dónde:

X testado = es la media, sumatoria de x = a la suma de todos y cada uno de los


valores.

Ejemplo:

X = es el símbolo de la media aritmética.

X = X1+ X2+ X3+….+ Xn

n
. n

X = Σi=1 x

Ejemplo: de media

Datos 5,7,6,4,3,8,7

5+7+6+4+3+8+7= 40

40/7 = 5.71

X = 5.71

MEDIA PONDERADA

Es un medio de centralización que da una importancia distinta a cada uno de los

valores sobre los que se calcula la media.


1. Ejemplo:
Se compran 5 terrenos con diferentes áreas y precios por mtr 2 cada uno son los
siguientes, y debemos obtener la media pon derada contienen los terrenos.
.
Xw= Σ(w • x)
Σw
W metros cuadrados. X precio
Terreno 1 = 200 mts2 1,000.00
Terreno 2 = 300 mts2 1,000.00
Terreno 3 = 350 mts2 500.00
Terreno 4 = 250 mts2. 2,000.00
Terreno 5 = 500 mts2 2,000.00

Xw= (200 • 1000)+(300•1000)+(350•500) +(250•2000) +(500•2000)

200+300 + 350+ 250+ 500

Xw= (200,000)+(300,000)+(175,000) +(500,000) +(1,000000)

1600

Xw= (2,175,000)

1,600

Xw= 1359.375 pesos por mts2


2. Ejemplo.
Se compran sodas de varias marcas como cidral Mundet, Coca-Cola, Pepsi cola,
pero cada una tienen diferentes volúmenes, el sidral Mundet contiene 350 ml y
su precio es 14.00 , la Coca-Cola contiene 350ml y su precio es 16.00, y la Pepsi
cola contiene 600ml y su precio 15.00.
.
Xw= Σ(w • x)
Σw
Datos
W volumen. X precio
Sidral Mundet 350ml. 14.00
Coca-Cola. 350ml. 16.00
Pepsi cola. 600ml. 15.00
.
Xw= (350 • 14.00)+ (350 • 16.00)+ (600 • 15.00)
350+350+600
.
Xw= (4900)+ (5600)+ (9000)= 19500
1300 1300
.
Xw=15 pesos

3. Ejemplo
En junio, un inversionista compro 300 acciones de Oracle. Una Compañía de
tecnología de la información a 20 dólares cada una.
En Agosto compro 400 acciones más a 25 dólares.
En Noviembre compro otras 400 acciones pero el precio bajo a 23 dólares. Por
titulo.
¿ Cual es el precio promedio ponderado con cada acción.
.
Xw= Σ(w • x)
Σw
W. X
Cantidad Precio
300. 20 dólares
400. 25 dólares
400. 23 dólares

Xw= (300 • 20)+(400•25)+(400•23)

300 + 400 + 400

. .

Xw= 6,000+10,000 + 9,200 = 25,200 = Xw = 22.91 dólares

1,100. 1,100

4. Ejercicio
Se compran varios lotes de calcetines de la misma calidad a una empresa que
los produce, el primer lote de 5000 pares calcetines, por escasez de materia
prima lo compraron a 10.00 cada par el segundo lote 10000 pares lo compraron
a 5.00 por haber materia prima de sobra, y el tercer lote 4000 pares nuevamente
se estaba escaseando la materia prima a un precio de 8.00 pesos.
Datos
W x
Cantidad de Precio
Calcetines. Por par
5000. 10.00
10000. 5.00
4000. 8.00

.
Xw= (5000 • 10.00)+(10000•5.00)+(4000•8.00)

5000 + 10000 + 4000

Xw= (50000)+(50000)+(32000)

19000

Xw = 132,000

19000

Xw= 6.95 precio por par de calcetines.

Bibliografía

[Link]
-[Link]

YouTube ejercicios de moda, y moda ponderada tutorial


La mediana

La mediana es el valor que ocupa el lugar central


de todos los datos cuando éstos están ordenados
de menor a mayor. junto con la media y
la varianza es un estadístico muy ilustrativo de una
distribución. Al contrario que la media que puede
estar desplazada hacia un lado o a otro, según la
distribución, la mediana siempre se sitúa en el
centro de esta. Una vez definida la mediana vamos a
pasar a calcularla. Para ello,
necesitaremos una fórmula. La fórmula
no nos dará el valor de la mediana, lo
que nos dará es la posición en la que
Formula: está dentro del conjunto de datos.
Debemos tener en cuenta, en este
sentido, si el número total de datos u
• Cuando el número de observaciones es observaciones que tenemos (n) es par
par: o impar.
Mediana = (n+1) / 2 → Media de las
observaciones

• Cuando el número de observaciones es


Ejemplo de cálculo simple de la mediana

1Ordenamos los datos de menor a mayor.

2Si la serie tiene un número impar de medidas la mediana es la puntuación central de


la misma

3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
Fórmula y cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la


mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre.

=es el límite inferior de la clase donde se encuentra la mediana

=es la semisuma de las frecuencias absolutas


= es la frecuencia absoluta de la clase mediana
= es la frecuencia acumulada anterior a la clase mediana
= es la amplitud de la clase
La mediana es independiente de las amplitudes de los intervalos

Las ventajas con respecto a


la media son: Es la medida más
representativa en caso de variables
que sólo admiten la escala ordinal.
Es sencilla de calcular. Tiene una
fácil interpretación.
ALGUNOS EJERCICIOS:
A. Ejemplo de cálculo de la mediana
Imaginemos que tenemos los siguientes datos:

2,4,12,6,8,14,16,10,18.

En primer lugar los ordenamos de menor a mayor con lo que tendríamos lo siguiente:

2,4,6,8,10,12,14,16,18.

Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la misma
cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones tenemos? 9
observaciones. Calculamos la posición con la fórmula de la mediana correspondiente.

Mediana = 9+1 / 2 = 5

¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.

Por lo tanto, la mediana de esta sería de datos sería el número 10, ya que está en la
posición quinta. Además, podemos comprobar cómo tanto a la izquierda del 5 hay 4
valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y 18).

1. Otro ejemplo de la mediana


Imaginemos ahora que tenemos los siguientes números:

1,2,4,2,5,9,8,9.

Si los ordenamos tendríamos lo siguiente:

1,2,2,4,6,8,9,9.

En este caso, la cantidad de observaciones es par. Por tanto, de tener en cuenta las
consideraciones para el número de observaciones par. La fórmula nos indica lo
siguiente:

Mediana = 8+1 / 2 = 4,5

Claro que pensaréis, ¿cuál es la posición 4,5? O está en la posición 4 o está en la


posición 5, pero la 4,5 no existe. Lo que haremos será una media de los valores que
están en la posición 4 y 5. Esos números son el 4 y el 6. La media entre estos dos
números es 5 [ (4+6) / 2 ].
El valor de la mediana, por tanto, sería 5. El número 5 (nos lo imaginamos) dejaría al
lado izquierdo (1, 2, 2 y 4) la misma cantidad de observaciones que al lado derecho (6,
8, 9 y 9).

[Link]
[Link]/apuntes/escolar/matematicas/estadistica/descriptiva/[Link]
[Link]
muy-importante-qu%C3%A9-ventajas-tiene-respecto-a-la-media
[Link]
en-una-empresa-931627764560
[Link]
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE
DATOS Y DATOS AGRUPADOS

1.4.3 MODA

Moda

La moda de una La moda es el La moda es el dato


distribución se valor que tiene que más se repite
define como el mayor frecuencia o el dato que
valor de la variable entre todos los ocurre con mayor
que más se repite. datos agrupados frecuencia.

En un polígono de
frecuencia la moda es el valor que se
corresponde al Una muestra Un grupo de datos tener una moda (bimodal) o más de
puede tener más es decir repite más veces puede no tener dos modas dos modas
valor de la variable en el conjunto de (unimodal),
que está bajo el de una moda. moda (multimodal).
datos inicial.
punto más alto del
gráfico.

Definición

La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados; es
decir, es el valor que se repite más veces en el conjunto de datos inicial.
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo
el punto más alto del gráfico. Una muestra puede tener más de una moda.

La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia..

Un grupo de datos puede no tener moda, tener una moda (unimodal), dos modas

(bimodal) o más de dos modas (multimodal).

Formulas:

Cuando se tiene una cantidad de datos muy grande, para calcular la moda de los datos
agrupados se utiliza la siguiente fórmula:

Fórmula para calcular la moda en datos agrupados es:

Mo = Li + (fi – fi-1 / [fi – fi-1] + [fi – fi+1] * ai

Siendo:

Li: límite inferior

Fi: frecuencia absoluta

Fi-1: frecuencia absoluta inferior

Fi+1: frecuencia absoluta posterior

Ai: amplitud
Mo = Li + (Ls-Li)*(frecuencia de Li – Frecuencia de L(i-1)) / ((frecuencia de Li –
Frecuencia de L(i-1)) + (frecuencia de Li –Frecuencia de L(i+1)))

El intervalo [Li,Ls) es el intervalo donde se encuentra la frecuencia mayor. Para el


ejemplo hecho en este artículo se tiene que la moda viene dada por:

Mo = 5 + (7-5)*(6-4)/((6-4)+(6-4)) = 5 + 2*2/4 = 5+1 = 6.

Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la siguiente:

Mo = Li + (Ls-Li)*(frecuencia L(i+1))/(frecuencia L(i-1) + frecuencia L(i+1)).

Con esta fórmula, las cuentas quedan como sigue a continuación:

Mo = 5 + (7-5)*4/(4+4) = 5 + 2*4/8 = 5+1 = 6.

Ejemplos:

• Ejemplo 1

Moda para datos no agrupados

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la

marca de gaseosa que más consume a la semana:

Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3

Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1

Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1

Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2


Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

SOLUCIÓN

PASO 1: Determinar las frecuencias de cada valor de la variable.

La marca 1 se repite 15 veces

La marca 2 se repite 6 veces

La marca 3 se repite 9 veces

PASO 2: la moda representa el valor que más se repite. En este caso es la

marca 1.

Mo = Marca 1

Moda para datos agrupados

Calcular la moda a partir de la siguiente tabla de frecuencia:

Ni Lm Ls f Mc

1 [4 6) 2 5

2 [6 8) 4 7

3 [8 10 ) 4 9

4 [ 10 12 ) 5 11

5 [ 12 14 ] 5 13

Total 20

SOLUCIÓN

Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto decimos

que es un caso donde aparecen dos modas (bimodal).

Mo1 = 11

Mo2 = 13
• Ejemplo 2:

Como se mencionó con anterioridad, la moda corresponde al valor o valores, si es

multimodal, que más se repiten en una distribución; para el caso de datos agrupados
se

deben seguir los siguientes pasos para obtener el valor de la moda.

Pasos para buscar la moda

1. Ubicar la clase de la moda y ésta es la clase donde se tienen más datos, es


decir, hay 12 datos entre 6.63 y 6.84, como puedes observar en la cuarta fila
2. Ubicar el límite inferior de la clase de la moda, el cual es 6.63
3. Calcular (𝑓𝑖 − 𝑓𝑖−1) = 12 − 7 = 5
4. Calcular (𝑓𝑖 − 𝑓𝑖+1) = 12 − 8 = 4
5. Ubicar la amplitud de la clase 21

El siguiente esquema representa algunos de los pasos descritos:

Li Ls Fi Fa

5.97 6.18 2 2

6.19 6.4 5 7

6.41 6.62 7 14

6.63 6.84 12 26

6.85 7.06 8 34

7.07 7.28 6 40

Sustituyendo en la fórmula de la moda se tiene 6.74


• Ejemplo 3:

Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30.

Mo = 25 es unimodal

b) Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.

Mo= 20 y 25, se dice que es bimodal.

c) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.

Mo= 20, 25 y 30, se dice que es multimodal.

En los datos agrupados la Mo es la marca de clase de la clase que contenga la

mayor frecuencia absoluta.

Intervalo de clase Fi Xc Fi * Xc fa Limites reales

5.2 - 6.0 3 5.6 16.8 3 5.15 - 6.05

6.1 - 6.9 5 6.5 32.5 8 6.05 – 6.95

7.0 - 7.8 9 7.4 66.6 17 6.95 – 7.85

7.9 - 8.7 7 8.3 58.1 24 7.85 – 8.75

8.8 - 9.6 5 9.2 46 29 8.75 – 9.65

9.7 - 10.5 3 10.1 30.3 32 9.65 – 10.55

Total 32 250.4

Mo = 7.4
• Ejemplo 4:

También se puede calcular a través de la formula:

, donde

Lir: límite inferior verdadero de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi-1 es la frecuencia de clase absoluta anterior a la clase modal

fi+1 es la frecuencia de clase absoluta posterior a la de la clase modal.

i es el intervalo de clase.

La clase modal es aquella que contiene la mayor frecuencia absoluta.

Intervalo de clase Fi Xc Fi * Xc fa Limites reales

5.2 - 6.0 3 5.6 16.8 3 5.15 - 6.05

6.1 - 6.9 5 6.5 32.5 8 6.05 – 6.95

7.0 - 7.8 9 7.4 66.6 17 6.95 – 7.85

7.9 - 8.7 7 8.3 58.1 24 7.85 – 8.75

8.8 - 9.6 5 9.2 46 29 8.75 – 9.65

9.7 - 10.5 3 10.1 30.3 32 9.65 – 10.55

Total 32 250.4
d1 = 9 – 4 = 4

d2 = 9 – 7 = 2

Mo = 6.95 + ( 4 / 4 + 2) * 0.9 = 6.95 + ( 4 / 6) * 0.9 = 6.95 + 0.66 * 0.9

Mo = 6.95 + 0.59

Mo = 7.55 ≈ 7.6

Es mejor utilizar la fórmula para el cálculo de la moda.

Ventajas e inconvenientes:

- Su cálculo es sencillo.

- Es de fácil interpretación.

- Es la única medida de posición central que puede obtenerse en las variables

de tipo cualitativo.

- En su determinación no intervienen todos los valores de la distribución.

BIBLIOGRAFÍAS:

Skcp.588, F. L. D. E. B. (2020b, febrero 15). MEDIDAS DE TENDENCIA CENTRA


PARA DATOS AGRUPADOS. issuu. [Link]
convertido/s/10217359

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL. (2007). Microsoft Word -


[Link]. Recuperado 2 de diciembre de 2022, de
[Link]

Estadística básica. (2021). UnADM. Recuperado 2 de diciembre de 2022, de


[Link]
es/EBA_U3_contenido.pdf
DEFINICIÓN

Media

Ejemplo :

Encuentre la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.

Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.

= 6.75

Así, la media es 6.75.

Mediana

Ejemplo 1 :

Encuentre la mediana del conjunto {2, 5, 8, 11, 16, 21, 30}.

Hay 7 números en el conjunto, y estos están acomodados en orden ascendente. El


número medio (el cuarto en la lista) es 11.

Así, la mediana es 11.

Ejemplo 2 :

Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.

Primero, arregle los números en orden ascendente.

{3, 5, 8, 10, 24, 36, 79, 255}


Hay 8 números en el conjunto – un número par. Así, encuentre el promedio de los dos
números medios, 10 y 24.

(10 + 24)/2 = 34/2 = 17

Así, la mediana es 17

Moda

Ejemplo 1 :

Encuentre la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}.

El 2, 3, 7, 10 y 12 aparecen una vez cada uno.

El 5 aparece dos veces y el 9 aparece tres veces.

Así, el 9 es la moda.

Ejemplo 2 :

Encuentre la moda del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.

En este caso, hay dos modas – el 5 y el 8 ambos aparecen dos veces, mientras que los
otros números solo aparecen una vez.
1.4.4. Relación entre media,mediana Y moda

Mediana Moda
Media

La mediana representa el valor La moda es el valor que aparece


de la variable de posición con mayor frecuencia en un
Una media o promedio es central en un conjunto de datos conjunto de datos. Esto va en
una medida de tendencia ordenados. Se le denota forma de una columna cuando
central. Resulta al efectuar mediana. Si la serie tiene un encontremos dos modas, es
una serie determinada de número par de puntuaciones, la decir, dos datos que tengan la
operaciones con un conjunto mediana es la media entre las misma frecuencia absoluta
de números y que, en dos puntuaciones centrales. máxima. Una distribución trimodal
determinadas condiciones, de los datos es en la que
puede representar por sí solo encontramos tres modas.
a todo el conjunto.
1.5 Medidas de dispersion para un conjunto de datos y datos
agrupados.
La dispersión o variabilidad es una característica muy importante de un conjunto
de datos. Por ejemplo, si se fabrica un medicamento donde la variación en la dosis
es muy grande, esto implica que un alto porcentaje de dosis será desechado por
ser un factor de riesgo para la salud; o si un grupo de analistas financieros detect a
ganancias ampliamente dispersas (que van de valores muy pequeños a
valores extremadamente grandes), éstas serán un indicador del riesgo que existe
para los accionistas y para los acreedores. Estos casos son más llamativos que
aquellos donde las ganancias permanecen relativamente estables. Pero ¿por qué
es importante la dispersión o variabilidad?

Porque proporciona información adicional que permite juzgar la confiabilidad de


nuestra medida de tendencia central, ya que, si los datos se encuentran muy
dispersos, entonces la dispersión o variabilidad que existe entre ellos será muy
grande; sin embargo, si son un conjunto estrecho, la variabilidad será muy
pequeña. Y la media tendrá una mayor exactitud al ser tomada como medida de
tendencia central.

Recordemos que las medidas de dispersión sirven para determinar si los datos se
encuentran en torno a la media o si están muy dispersos. Para cuantificar la
dispersión, estudiaremos las medidas más conocidas: el rango, la desviación
media, la varianza, la desviación estándar y el coeficiente de variación.
B. Mapa conceptual

Para cuantificar la dispersión,


estudiaremos las medidas más
conocidas:
Recordemos que las medidas de
dispersión sirven para determinar si
los datos se encuentran en torno a la
media o si están muy dispersos.
la desviación media, la varianza, la
desviación estándar y el coeficiente
de variación.

1.5 Medidas de dispersión para un si se fabrica un medicamento donde


conjunto de datos y datos agrupados la variación en la dosis es muy
grande, esto implica que un alto
porcentaje de dosis será desechado
por ser un factor de riesgo para la
salud

o si un grupo de analistas financieros


La dispersión o variabilidad es una detecta ganancias ampliamente
característica muy importante de un dispersas (que van de valores muy
conjunto de datos. pequeños a valores extremadamente
grandes)

éstas serán un indicadordel riesgo


que existe para los accionistas y para
los acreedores.
II. Bibliografía
1.5 Medidas de dispersión: rango, v. d. (02 de 12 de 2022). Metodología Estadística. Obtenido de
Instituto Consorcio Clavijero. (s.°f.).:
[Link]

5 Medidas de dispersión para un conjunto de datos. . . | Monografías Plus. (s. f.-b).


[Link]
P3F8DQVFCDU2Y

Rango

El rango es la diferencia entre el mas alto y el mas pequeño de los valores observados.
En forma de ecuación es:
R = Máxx – Mínx

Rango = valor de observación - valor de observación


más grande más pequeña

• Es el rango.
• Max es el valor máximo de la muestra o población.
• Mín. es el valor mínimo de la muestra o población estadística.
• x es la variable sobre la que se pretende calcular esta medida.
Es fácil entender y encontrar el rango, pero su utilidad como medida de dispersión es
limitada. El rango sólo toma en cuenta los valores más alto y bajo de una distribución y
ninguna otra observación del conjunto de datos. Como resultado, ignora la naturaleza
de la variación entre todas las demás observaciones, y tiene una gran influencia de los
valores extremos. Debido a que sólo mide dos valores, el rango tiene muchas
posibilidades de cambiar drásticamente de una muestra a la siguiente en una población
dada, aunque los valores que caen entre el más alto y el más bajo sean bastante
parecidos. Recuerde también que las distribuciones de extremo abierto no tienen
rango, pues no existe un valor “más alto” o “más bajo” en la clase de extremo abierto.
No es necesario ordenar los valores de mayor a menor o viceversa. Si sabemos cual
son los números con mayor y menor valor, tan sólo tendremos que aplicar la fórmula.
En Excel, por ejemplo, podemos utilizar las funciones =MAX(rango de datos) y
MIN(rango de datos). A la celda que contiene MAX le restamos la celda que contiene
MIN y obtenemos el rango.
Vista la definición de rango en estadística, tenemos un ejemplo resuelto para que
veamos cómo se saca el rango de un conjunto de datos.

Ejemplo 1

• En una empresa se quiere analizar estadísticamente las ventas


conseguidas de su producto estrella durante los últimos veinte años. Para
ello, te piden calcular varias métricas estadísticas entre ellas el rango. Si
las ventas del producto son las mostradas en la siguiente tabla, ¿cuál es
el rango de este conjunto de datos?

Año Ventas
1 4239
2 6674
3 7714
4 4121
5 3991
6 6648
7 9048
8 5717
9 3623
10 3433
11 3156
12 8686
13 3805
14 6828
15 1895
16 7468
17 9947
18 8941
19 8065
20 8680

En este ejercicio tenemos 20 observaciones. En realidad, el número total de observaciones


es indiferente para sacar el rango de una muestra, porque solo nos interesa el valor más
grande y el valor más pequeño.

De modo que tenemos que usar la fórmula vista más arriba para hallar el rango de esta
muestra estadística.

El valor máximo del intervalo es 9947 unidades vendidas y el valor mínimo es 1895. Por lo
tanto, tenemos que restar estos dos valores para encontrar el rango del conjunto de datos:

R=9984-1895=8052

Esto significa que la variación máxima que se ha producido de las ventas durante estos
últimos años es de 8052 unidades. A continuación, puedes ver representados el rango.
el rango muestra la diferencia entre el valor máximo y el valor mínimo de un conjunto de
datos, por lo tanto, el rango es una medida que sirve para indicar la dispersión total de
un conjunto de datos.
1.5.2 Desviaciòn media.

Formula

La desviación media se representa por

1.5.2 Descripción
Desviación
media Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable
estadística y la media aritmética.

Di = x - x
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.

• fi: frecuencia absoluta de cada valor, es decir, el número de veces que


aparece el valor en el estudio.
• xi: marca de clase. Es el punto medio del límite inferior y el límite superior de
cada intervalo.
• k: número de clases.
• D. M.: desviación media.
• x̄ : media aritmética de los datos.
Ejemplo
Calcular la desviación media de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de


la desviación media es:

Ejemplo
Calcular la desviación media de la distribución:

xi fi xi · f i |x - x| |x - x| · f i
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57
1. Ejemplo 1:

Calcular la desviación media de las edades indicadas en la tabla de frecuencias:

Solución:

Lo primero que haremos será calcular las marcas de clase xi. Recuerda que la marca
de clase es el punto medio del límite inferior y del límite superior de cada intervalo, su
fórmula es:

Agregamos una columna más a nuestra tabla para la marca de clase xi:

A continuación, calculamos el número de valores o número de datos “n”, solo tenemos


que sumar las frecuencias:
El número de valores es 30.

A continuación, vamos a calcular la media x̄, recordemos su fórmula:

En la tabla, iremos buscando las expresiones que aparecen en la fórmula. Por ello,
agregamos una columna más a nuestra tabla, en la cual colocaremos los valores de xi
・fi.

Ahora sí, aplicamos la fórmula:

El valor de la media es de 4 años.

La fórmula de la desviación media para datos agrupados es:

Agregamos 3 columnas más en la tabla de frecuencias:


Aplicamos la fórmula:

El valor de la desviación media es de 1,93 años .

Referencias

Contento Rubio Manuel Ricardo. (2019) Estadística con aplicación en R. Utadeo. Bogotá.
Ejercicio 1:

Un profesor enseña a dos grandes grupos de introducción al marketing y selecciona


aleatoriamente una muestra de calificaciones de los exámenes realizados por los
dos grupos. Halle la desviación típica de cada muestra:
Grupo 1: 50, 60, 70, 80, 90
Grupo 2: 72, 68, 70, 74, 66

Solución 1:

Grupo 1:
De acuerdo a los datos del problema tenemos:
Datos = 50, 60, 70, 80, 90
Σxᵢ = 350
N=5
x̄ = 350/5 = 70
xi xi – x
̄ (xi – x̄)2

50 -20 400
60 -10 100

70 0 0

80 10 100

90 20 400

Σxᵢ = 350 x̄ = 350/5 = 70 Σ(xᵢ – x̄ )² = 1000

Finalmente calculamos la desviación estándar muestra


Grupo 2:
De acuerdo a los datos del problema tenemos:
Datos = 72, 68, 70, 74, 66
Σxᵢ = 350
N=5
x
̄ = 350/5 = 70
xi xi – x
̄ (xi – x̄)2

72 2 4

68 -2 4

70 0 0

74 4 16

66 -4 16

Σxᵢ = 350 x̄ = 350/5 = 70 Σ(xᵢ – x̄ )² = 40

Finalmente calculamos la desviación estándar muestral:

Ejercicio 2:

Vanesa y Jimena Mora, dueñas de una tienda de fotografía, están considerando la


posibilidad de invertir en el activo A o en el B. No saben cuál de los dos es mejor y
le piden consejo a Sara Nieves, planificadora financiera. Los valores de las tasas de
rendimiento de las opciones son:
¿Cuál es la alternativa más arriesgada?

Solución 2:

Si bien ambas opciones tienen la misma tasa media de rendimiento en los últimos
5 años, es necesario determinar la variabilidad de dicha tasa. Para ello, la
desviación estándar es el indicador más frecuente para determinar el riesgo de u n
activo. En ese caso se calculará la desviación típica para ambas opciones:
Activo A:
De acuerdo a los datos del problema tenemos:
Datos = 11.3, 12.5, 13, 12, 12.2
Σxᵢ = 61
N=5
x̄ = 61/5 = 12.2
xi xi – x
̄ (xi – x̄)2

11.3 -0.9 0.81


12.5 0.3 0.09

13 0.8 0.64

12 -0.2 0.04

12.2 0 0

Σxᵢ = 61 x̄ = 61/5 = 12.2 Σ(xᵢ – x̄ )² = 1.58


Finalmente calculamos la desviación estándar muestral:

Activo B:
De acuerdo a los datos del problema tenemos:
Datos = 9.4, 17.1, 13.3, 10, 11.2
Σxᵢ = 61
N=5
x̄ = 61/5 = 12.2
xi xi – x
̄ (xi – x̄)2

9.4 -2.8 7.84


17.1 4.9 24.01

13.3 1.1 1.21

10 -2.2 4.84

11.2 -1 1

Σxᵢ = 61 x̄ = 61/5 = 12.2 Σ(xᵢ – x̄ )² = 38.9

Finalmente calculamos la desviación estándar muestral:

De los resultados obtenidos, se aprecia que la alternativa B es una inversión más


arriesgada.

Ejercicio 3:

El tiempo (en segundos) que tardaron todos los empleados del área de producción
en realizar una tarea es:
23 35 14 37 28 45
12 40 27 13 26 25
37 20 29 49 40 13
27 16 40 20 13 66
Calcular la desviación estándar
Solución 3:

De acuerdo a los datos del problema tenemos:


Σxᵢ = 695
N = 24
x̄ = 695/24 = 28.9583
xi xi – x
̄ (xi – x̄)2

23 -5.9583 35.5013
35 6.0417 36.5021

14 -14.9583 223.7507

37 8.0417 64.6689

28 -0.9583 0.9183

45 16.0417 257.3361

12 -16.9583 287.5839

40 11.0417 121.9191

27 -1.9583 3.8349

13 -15.9583 254.6673

26 -2.9583 8.7515

25 -3.9583 15.6681

37 8.0417 64.6689
20 -8.9583 80.2511
29 0.0417 0.0017

49 20.0417 401.6697

40 11.0417 121.9191

13 -15.9583 254.6673

27 -1.9583 3.8349

16 -12.9583 167.9175

40 11.0417 121.9191

20 -8.9583 80.2511

13 -15.9583 254.6673

66 37.0417 1372.0875

Σxᵢ = 695 x̄ = 695/24 = 28.9583 Σ(xᵢ – x̄ )² = 4234.9574

Finalmente calculamos la desviación estándar poblacional:

Ejercicio 4:

Un maestro quiere saber si la mayoría de los estudiantes se están desempeñando


al mismo nivel o si hay una desviación estándar alta, para lo cual tomó un examen
sorpresa con los siguientes resultados: 85, 86, 100, 76, 81, 93, 84, 99, 71, 69, 93,
85, 81, 87 y 89
Solución 4:

De acuerdo a los datos del problema tenemos:


Σxᵢ = 1279
N = 15
x̄ = 1279/15 = 85.2667
xi xi – x
̄ (xi – x̄)2

85 -0.2667 0.0711
86 0.7333 0.5377

100 14.7333 217.0701

76 -9.2667 85.8717

81 -4.2667 18.2047

93 7.7333 59.8039

84 -1.2667 1.6045

99 13.7333 188.6035

71 -14.2667 203.5387

69 -16.2667 264.6055

93 7.7333 59.8039

85 -0.2667 0.0711

81 -4.2667 18.2047

87 1.7333 3.0043

89 3.7333 13.9375

Σxᵢ = 1279 x̄ = 1279/15 = 85.2667 Σ(xᵢ – x̄ )² = 1134.9329

Finalmente calculamos la desviación estándar poblacional:


La varianza es una medida de Componentes
dispersión que representa la Los componentes que integran la
variabilidad de una serie de varianza fenotípica son la
datos respecto a su media. varianza genética, la varianza
Formalmente se calcula como la ambiental y la varianza de la
suma de los residuos al interacción genotipo-ambiente.
cuadrado divididos entre el total
de observaciones.

1.5.3 Varianza

Donde
X: variable sobre la que se pretenden
calcular la varianza
Xi: observación número i de la variable
X. i puede tomará valores entre 1 y n.
FORMULA
N: número de observaciones.
X̄: Es la media de la variable X.
Ejemplos de Varianza:

Calcular la varianza de las siguientes puntuaciones de un jugador de baloncesto en los últimos


partidos:

Puntuaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 = 120 / 6 = 20

Calculamos la Varianza:

Varianza σ2 = [(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] / 6 = 16 / 6 = 8 /3 =


2,67

Calcular la varianza de las siguientes notas de un alumno en los últimos exámenes:


Valores de las notas: 9, 10, 10, 11, 10, 10

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (9 + 10 + 10 + 11 + 10 + 10) / 6 = 60 / 6 = 10

Calculamos la Varianza:

Varianza σ2 = [(9-10)2 + (10-10)2 + (10-10)2 + (11-10)2 + (10-10)2 + (10-10)2] / 6 = 2 / 6 = 1 /3 = 0,33

Fuente: [Link]

Ejercicio 2:

Un grupo de amigos miden la altura de sus perros


(en milímetros):

Las alturas (hasta los hombros) son: 600 mm, 470


mm, 170 mm, 430 mm y 300 mm. Calcule la
varianza.

De acuerdo a los datos del problema tenemos:


Σxᵢ = 1970

N =5

X̄ = 1970/5 = 394
B. La desviación estándar o desviación típica es la
raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de


desviación.

La desviación estándar se representa por σ.

III. Desviación estándar para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

IV. Desviación estándar para datos agrupados

También podría gustarte