0% encontró este documento útil (0 votos)
123 vistas9 páginas

Resumen 3.6-3.16

Este documento describe diferentes medidas estadísticas como la mediana, moda, media, desviación estándar y varianza. La mediana representa el punto medio de los valores ordenados, la moda es el valor que aparece con más frecuencia, y la media puede verse afectada por valores extremos. La desviación estándar y varianza miden la dispersión de los datos respecto a la media.

Cargado por

Daniela Cherrez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
123 vistas9 páginas

Resumen 3.6-3.16

Este documento describe diferentes medidas estadísticas como la mediana, moda, media, desviación estándar y varianza. La mediana representa el punto medio de los valores ordenados, la moda es el valor que aparece con más frecuencia, y la media puede verse afectada por valores extremos. La desviación estándar y varianza miden la dispersión de los datos respecto a la media.

Cargado por

Daniela Cherrez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

3.6-3.

11
MEDIANA

La mediana representa el punto medio de los valores una vez que se han ordenado de

menor a mayor o viceversa. Usamos la media cuando los datos contienen uno o dos

valores muy grandes o muy pequeños y por ende la media aritmética no resulta

representativa. La mediana se determina para cualquier nivel de datos excepto los

nominales.

Propiedades de la mediana

1. No influyen en ella valores extremadamente grandes o pequeños

2. Es calculable en el caso de datos de nivel ordinal o más altos

MODA

Moda es el valor de la observación que aparece con mayor frecuencia. Es posible

determinar la moda para todos los niveles de datos, aunque de manera especial resulta

de utilidad para resumir datos de nivel nominal.

Una de las ventajas de la moda al igual que en la mediana es que tampoco influyen en

ella valores extremos; sin embargo, esta medida de ubicación se utiliza con menos

frecuencia debido a que presenta desventajas como En el caso de muchos conjuntos de

datos no existe la moda, porque ningún valor se presenta más de una vez o al contrario

cuando en algunos conjuntos de datos hay más de una moda.

POSICIONES RELATIVAS DE LA MEDIA, MEDIANA Y MODA

En una distribución en forma de campana simétrica, la media, la mediana y la moda son

iguales.
Gráfica de distribución simétrica

En una distribución no simétrica o sesgada, la relación entre las tres medidas cambia.

Así es que, en una distribución con sesgo positivo la media aritmética es la mayor de las

tres medidas; mientras que, si una distribución tiene un sesgo negativo, la media es la

menor medida

de las tres.

Gráfica con sesgo positivo Gráfica con sesgo negativo


MEDIA GEOMÉTRICA

La media geométrica de un conjunto de n números positivos se define como la raíz

enésima de un producto de n variables y resulta útil para determinar el cambio promedio

de porcentajes, razones,

índices o tasas de crecimiento. La media geométrica siempre es menor o igual (nunca

mayor que) que la media aritmética. Todos los datos deben ser positivos.

FÓRMULA

MG=√n ( X 1 ) ( X 2 ) … ( Xn )

TASA DE INCREMENTO DURANTE EL TIEMPO

Otro modelo de aplicación de la media geométrica se relaciona con la determinación de

un cambio porcentual promedio durante cierto periodo.


FÓRMULA

Valor al final del periódo


MG=

n

Valor al inicio del periódo


−1

En donde n representa el número de periodos.

¿POR QUÉ ESTUDIAR LA DISPERSIÓN?

Una medida de ubicación, como la media o la mediana, sólo describe el centro de los

datos por lo tanto desde este punto de vista resulta valiosa, pero no dice nada sobre la

dispersión de los datos.

Una medida de dispersión pequeña indica que los datos se acumulan con proximidad

alrededor de la media aritmética. Por consiguiente, la media se considera representativa

de los datos. Por el contrario, una medida grande de dispersión indica que la media no

es confiable y una segunda para estudiar la dispersión en un conjunto de datos consiste

en comparar la propagación en dos o más distribuciones.

3.12 Medidas de dispersión

- Rango: Representa la diferencia entre los valores máximo y mínimo de un conjunto

de datos.
Fórmula

RANGO = Valor máximo - Valor mínimo

Las principales características del rango son:

 Sólo dos valores se emplean en su cálculo.

 Recibe la influencia de los valores extremos.

 Es fácil de calcular y definir.

- Desviación Media: Suma de los valores absolutos de las desviaciones de la media,

dividida entre el número de observaciones. Mide la cantidad media respecto de la cual

los valores de una población o muestra varían.

Fórmula

DM =Σ∨X− X́∨ ¿ ¿
n

X = Valor de cada observación.


X́ = Media aritmética de los valores.
n = número de observaciones en la muestra.
|| = Valor absoluto.
Las principales características de la desviación media son:

 No influyen excesivamente sobre ella valores grandes o pequeños.

 Todas las observaciones se emplean para realizar el cálculo.

 Los valores absolutos son de alguna forma difíciles de manejar.

- Varianza y Desviación estándar: Se basan en las desviaciones de la media elevadas

al cuadrado.

- Varianza: Media aritmética de las desviaciones de la media elevadas al cuadrado.

- Desviación Estándar: Raíz cuadrada de la varianza.


Varianza de la población

Fórmula
2 Σ( X−μ)2
σ =
N

σ 2 = Varianza de la población
X = Valor de una observación de la población.
μ= Media aritmética de la población.
N = Número de observaciones de la población.

Proceso de cálculo de la varianza:

1. Comience por determinar la media.

2. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado

dicha diferencia.

3. Sume todas las diferencias elevadas al cuadrado.

4. Divida la suma de las diferencias elevadas al cuadrado entre el número de

elementos de la población.

La varianza resulta difícil de interpretar porque las unidades se elevan al cuadrado. La

desviación estándar se expresa en las mismas unidades que los datos.

Desviación estándar de la población

Fórmula
Σ( X−μ)2
σ=
√ N

Varianza muestral

Fórmula

Σ(X − X́ )2
s2=
n−1
s2 = Varianza muestral.
X = Valor de cada observación de la muestra.
X́ = Media de la muestra.
n = Número de observaciones realizadas.
Desviación estándar de la muestra
Fórmula
Σ (X − X́ )2
s=
√ N

Las principales características de la varianza son:

 Todas las observaciones se utilizan para realizar el cálculo.

 No influyen excesivamente sobre ella observaciones extremas.

 Resulta de alguna manera difícil trabajar con las unidades, pues son las unidades

originales elevadas al cuadrado.

Las principales características de la desviación estándar son:

 Se expresa en las mismas unidades de los datos originales.

 Es la raíz cuadrada de la distancia promedio al cuadrado de la media.

 No puede ser negativa.

 Es la medida de dispersión que se informa con más frecuencia.

3.14 Interpretación y usos de la desviación estándar

Se interpretó la desviación estándar empleando dos medidas.

1. El teorema de Chebyshev: Establece que independientemente de la forma de la

distribución, por lo menos 1 - 1/k 2 de las observaciones se encontrarán a k

desviaciones estándares de la media, siendo k mayor que 1.


2. La regla empírica: En el caso de una distribución en forma de campana,

alrededor del 68% de los valores se encontrarán a una desviación estándar de la

media; 95%, a dos y casi todas (99,7%), a tres.

X́ ± 1 s=68 % X́ ± 2 s=95 % X́ ± 3 s=99,7 %

3.15 Media y desviación estándar de datos agrupados

- Media aritmética de datos agrupados

Fórmula

Σ fM
X́ =
n

X́ =¿ Media muestral.
M = Punto medio de cada clase.
f = Frecuencia en cada clase.
fM = Frecuencia en cada clase multiplicada por el punto medio de la clase.
ΣfM = Suma de estos productos.
n = Número total de frecuencias.
- Desviación estándar de datos agrupados

Fórmula
Σ f (M − X́)2
s=
√ n−1

s = Desviación estándar de la muestra.


M = Punto medio de la clase.
f = Frecuencia de clase.
n = Número de observaciones en la muestra.
X́ = Media muestral.
3.16 Ética e informe de resultados
En este capítulo se aprendió la forma de calcular estadísticas descriptivas de naturaleza

numérica. En particular, la manera de calcular e interpretar medidas de ubicación de un

conjunto de datos: media, mediana y moda, además de sus ventajas y desventajas ya que

es importante al momento de dar un informe estadístico y cuando se emplea

información estadística para tomar decisiones.

También se aprendió a calcular medidas de dispersión: rango, desviación media y

desviación estándar. Cualquier informe estadístico requiere la comunicación honesta y

objetiva de los resultados.

También podría gustarte