0% encontró este documento útil (0 votos)
69 vistas26 páginas

Conceptos Básicos de Estadística

El documento presenta definiciones y ejemplos de conceptos estadísticos básicos como la media aritmética, la mediana, la moda y el rango. Explica cómo calcular cada uno y provee ejemplos numéricos para ilustrar los cálculos.

Cargado por

LITZ FERNANDEZ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
69 vistas26 páginas

Conceptos Básicos de Estadística

El documento presenta definiciones y ejemplos de conceptos estadísticos básicos como la media aritmética, la mediana, la moda y el rango. Explica cómo calcular cada uno y provee ejemplos numéricos para ilustrar los cálculos.

Cargado por

LITZ FERNANDEZ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD BICENTENARIA DE ARAGUA


NUCLEO SAN CRISTOBAL, EDO. TACHIRA

MOLINA R, WILDER J.
C.I. V- 27.675.644
SECCIÓN: T1
SAN CRISTÓBAL, OCTUBRE 2022
Media aritmética

Equivale al cálculo del promedio simple de un conjunto de datos,


también se puede decir que es s el valor obtenido al sumar todos los datos y
dividir el resultado entre el número total de datos. Denotamos la media con el
̅ la calculamos de la siguiente manera
símbolo 𝑋

x1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑛𝑖 1𝑥𝑖
̅=
𝑿 =
𝑁 𝑁
En donde cada xi representa uno de nuestros datos y N es el número
total de datos que tenemos.

Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87, 78 Hallar el peso medio

84 + 91 + 72 + 68 + 87
̅=
𝑿
6
480
̅=
𝑿
6
̅ = 𝟖𝟎
𝑿

El punto medio de los pesos de los 6 amigos es 80KG

Mediana,

La mediana de un conjunto de números, es el número medio en el conjunto


(después que los números han sido arreglados del menor al mayor) o, si hay un
número par de datos, la mediana es el promedio de los dos números medios.
La mediana no se debe confundir con el valor medio o el promedio. Este
se calcula sumando todos los valores y dividiendo el resultado por el número
de valores. Con la mediana nos referimos al valor que se encuentra en la
posición central dentro de una secuencia ascendente.

Para calcular la mediana en una sucesión de datos, existen dos


fórmulas que se pueden utilizar en función del número de valores observados.
̃ ; representa el número de valores
El símbolo general para la mediana es 𝑋
observados y es un valor de la sucesión de datos.

Si cuentas con un número impar de valores observados, utiliza esta fórmula:

𝑛+1
𝑋̃ = 𝑋
2

Si cuentas con un número par de valores observados, utiliza esta fórmula:

1 𝑛 𝑛
𝑋̃ = (𝑋 + 𝑋 + 1)
2 2 2

Ejemplo 1: número impar de valores

En un seminario de formación, se pregunta a once participantes por su


edad, y las respuestas son las siguientes: 28, 34, 51, 19, 62, 43, 29, 38, 45,
26, 49

En primer lugar, ordena las respuestas de menor a mayor: 19, 26, 28, 29, 34,
38, 43, 45, 49, 51, 62

Calcular la mediana utilizando la fórmula. Representa el número de


valores observados, que aquí sería 11. La fórmula es la siguiente:

𝑛+1
𝑋̃ = 𝑋
2
11 + 1
𝑋̃ = 𝑋
2

𝑋̃ = 𝑋6

X Edades

1 19

2 26

3 28

4 29

5 34

6 38

7 43

8 45

9 49

10 51

11 62

Puesto que es 38, se obtiene el mismo resultado. La mediana de las


edades recopiladas en el seminario es 38, ya que este valor se encuentra
exactamente en el medio cuando los datos se ordenan de menor a mayor.

Ejemplo 2: número par de valores


Ejemplo 2: numero par de valores

El siguiente seminario de formación se incorpora un participante, es


decir, ahora se pregunta a doce personas por sus edades. Las respuestas son
las siguientes: 28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Vuelve a ordenar los datos de menor a mayor en una sucesión numérica: 19,
26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

Partiendo de = 12, ahora se aplica la fórmula para los valores observados


pares:

1 𝑛 𝑛
𝑋̃ = (𝑋 + 𝑋 + 1)
2 2 2

1 12 12
𝑋̃ = (𝑋 +𝑋 + 1)
2 2 2

1
𝑋̃ = (𝑋6 + (𝑋6 + 1))
2

1
𝑋̃ = (𝑋6 + 𝑋7)
2

X Edades
1 19
2 26
3 28
4 29
5 33
6 34
7 38
8 43
9 45
10 49
11 51
12 62

En la sucesión ordenada, X6=34 y X7= 38, se sustituye los valores en


la formula

1
𝑋̃ = (34 + 38)
2

1
𝑋̃ = (72)
2

𝑋̃ = 36

La mediana de las edades registradas en este seminario es 36.

Moda

La moda es el valor que aparece con mayor frecuencia en un conjunto


de datos. Esto va en forma de una columna cuando encontremos dos modas,
es decir, dos datos que tengan la misma frecuencia absoluta máxima La moda,
cuando los datos están agrupados, es un punto que divide al intervalo modal
en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:

𝑝 𝑛𝑖 − 𝑛𝑖 − 1
=
𝑐 − 𝑝 𝑛𝑖 − 𝑛𝑖 + 1

Siendo la frecuencia absoluta del intervalo de la moda las frecuencias


absolutas de los intervalos anterior y posterior, respectivamente, al intervalo
modal.
𝑚𝑖 − 1
𝑚𝑖 + 1

Para obtener la moda en datos agrupados se usa la siguiente fórmula:

𝐷1
𝑀 = 𝐿𝑖 + ( )𝐴
𝐷1 + 𝐷2 𝑖

Donde:

Li = Límite inferior de la clase modal.


D1 = es la diferencia entre la frecuencia absoluta modal y la frecuencia
absoluta premodal.
D2 = es la diferencia entre la frecuencia absoluta modal y la frecuencia
absoluta postmodal.
A1= Amplitud del intervalo modal
Ejemplo. Calcular la moda de una distribución estadística que viene dada por
la siguiente tabla:

Intervalo Frecuencia Absoluta


En primer lugar buscamos el intervalo donde se encuentra la moda, que será

el intervalo que tenga la mayor frecuencia absoluta , la cual es .


Entonces:

La clase modal es:

Aplicaremos la fórmula para el cálculo de la moda para datos


agrupados, extrayendo los siguientes datos:
Límite inferior

Fórmula de la moda:

Sustitución de valores:

Por lo tanto, la moda es:

Rango
El rango es un valor numérico que sirve para manifestar la diferencia
entre el valor máximo y el valor mínimo de una muestra poblacional en
Estadística. A través del rango se puede observar la dispersión total en una
muestra en concreto. Este parámetro estadístico es especialmente utilizado en
finanzas, ya que resulta de gran utilidad para observar el tamaño que podría
adquirir una variación

Para calcular el rango se ha de utilizar la siguiente fórmula:


𝑅 = 𝑀𝑎𝑥𝑥 + 𝑀𝑖𝑛𝑥
Donde:

 R es el rango.
 Máx es el valor máximo, el dato más alto, de la muestra concreta.
 Mín es el valor mínimo, el dato más bajo, de la muestra concreta.
 X es la variable sobre la que se pretende calcular el rango.

Para poder calcular correctamente el rango es necesario que los datos o


valores sean ordenados, bien de mayor a menor, o viceversa. De esta forma,
tendremos claro cuál es el valor mínimo y cuál es el valor máximo y aplicar la
fórmula resultará mucho más sencillo.

Ejemplo. Se mide la estatura de 25 alumnos varones de una clase de


universidad. El estudiante con mayor estatura mide 1,93 metros, mientras que
el alumno con una estatura menor mide 1,67 metros. Aplicar la fórmula
anterior:
R = Máxx – Mínx
R = 1,93 – 1,67 = 0,26 m
R = 0,26 metros
Esto quiere decir que la variación máxima de estatura entre el alumno
más bajo y el alumno más alto es de 26 centímetros, de forma que las
estaturas del resto de los alumnos se situarán dentro de este rango cuya
longitud es de 26 centímetros.

Variabilidad

La variabilidad es una medida de la dispersión de los datos en una


distribución, sea esta teórica o de una muestra; medidas de variabilidad son la
varianza, la desviación estándar, cuartiles o deciles, y rango. Se puede decir
que la estadística se ocupa fundamentalmente de la variabilidad y de la
estimación de sus efectos en los resultados obtenidos; esto subraya la
necesidad de enseñar sobre variabilidad para enseñar el “pensamiento
estadístico”. En las pruebas de hipótesis, la diferencia entre los grupos se
ubica en el numerador de las fórmulas y la variabilidad en el denominador; esto
quiere decir que para una determinada diferencia, la magnitud del estadístico
calculado con la prueba es inversamente proporcional a la variabilidad y por
ende la p, e igual cosa sucede con los intervalos de confianza, es mayor
mientras mayor es la variabilidad.

La variabilidad puede ser biológica, por diferencias entre los individuos,


o bien diferencias en un mismo individuo a lo largo del tiempo, como resultado
de cambios de corto plazo o infradianos (presión arterial o frecuencia del
pulso), o en períodos más largos (circadianos o supradianos). Los ejemplos
son innumerables en torno a características físicas, fisiológicas y psicológicas:
color del pelo o estatura, metabolismo basal o natremia, carácter o
personalidad.
La variabilidad puede también provenir de errores en la medición de las
características de interés, donde error es la diferencia entre el valor observado
y el valor verdadero. Estos errores pueden ser conocidos, incluso
cuantificados, o desconocidos, y pueden derivar de los métodos o
instrumentos de medición, depender del observador u observadores, y de la
variabilidad de la característica observada.

Los errores pueden ser aleatorios o sistemáticos. Error aleatorio es


aquella parte de nuestra experiencia que no podemos predecir;
estadísticamente, es la variabilidad muestral; lo inverso de error aleatorio es la
precisión. Error sistemático o sesgo (bias en inglés) se debe a todo lo que no
es variabilidad muestral; lo inverso de sesgo es la validez. Aumentar el número
de observaciones o su repetición reduce el error aleatorio, cuya dirección no
es predecible, pero no sucede lo mismo con el error sistemático, cuya dirección
es en un solo sentido. Si se conoce la dimensión del error sistemático es
posible reducir o eliminar su impacto mediante ajustes, cosa que no es factible
en el caso del error aleatorio.

Datos Agrupados

Son aquellos que están clasificados en función a un criterio, mostrando


una frecuencia para cada clase o grupo formado.
Ejemplo de datos agrupados

Un ejemplo de datos agrupados sería el siguiente, donde hemos resumido la


información sobre los ingresos mensuales de un grupo de personas:
Ingresos
mensuales Frecuencia
euros

[1.500-2.500] 120

(2.500-3.500] 210

(3.500-4.500] 300

(4.500-5.500] 250

(5.500-6.500] 400

(6.500-7.500] 510

(7.500-8.500] 420

(8.500-9.500] 416

(9.500-
100
10.500]

En la tabla se puede observar que, por ejemplo, 210 personas de la muestra


tienen ingresos mensuales de entre 2.500 y 3.500 euros.

Medidas de dispersión

Las medidas de dispersión tratan, a través del cálculo de diferentes


fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado
de variabilidad de una variable
En otras palabras, las medidas de dispersión son números que indican
si una variable se mueve mucho, poco, más o menos que otra. La razón de
ser de este tipo de medidas es conocer de manera resumida una característica
de la variable estudiada. En este sentido, deben acompañar a las medidas de
tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
podremos utilizar para comparar y, si fuera preciso, tomar decisiones.

2.- DADO LOS VALORES

24 12 20 18 26 20 14 16 14 12 14 16 18 20 20 24 26 20 14 17
27 67 56 44

Ordenados de menos a mayor


12, 12, 14, 14, 14, 14, 16, 16, 17, 18, 18, 20, 20, 20, 20, 20, 24, 24, 26, 26, 27,
44, 56, 67

CALCULAR

a.- Media aritmética


̅
𝑿
12 + 12 + 14 + 14 + 14 + 14 + 16 + 16 + 17 + 18 + 18 + 20 + 20 + 20 + 20 + 20 + 24 + 24 + 26 + 26 + 27 + 44 + 56 + 67
=
24

559
̅=
𝑿
24
̅ = 𝟐𝟑, 𝟐𝟗𝟏𝟔
𝑿

b.- Moda

X Dato Frecuencia
1 12 2
6 14 4
7 16 2
9 17 1
10 18 2
12 20 5
17 24 2
19 26 2
21 27 1
22 44 1
23 56 1
24 67 1
∑ 24
Al ordenar los datos, con la frecuencia de cada uno se puede observar que el
dato que más se repite es el 20, por lo tanto esa sería la moda de estos datos

c.- Mediana

Como son números pares se utiliza la siguiente formula

1 𝑛 𝑛
𝑋̃ = (𝑋 + 𝑋 + 1)
2 2 2

1 24 24
𝑋̃ = (𝑋 +𝑋 + 1)
2 2 2

1
𝑋̃ = (𝑋12 + (𝑋12 + 1))
2

1
𝑋̃ = (𝑋12 + 𝑋13)
2

X Dato
1 12
2 12
3 14
4 14
5 14
6 14
7 16
8 16
9 17
10 18
11 18
12 20
13 20
14 20
15 20
16 20
17 24
18 24
19 26
20 26
21 27
22 44
23 56
24 67
1
𝑋̃ = (20 + 20)
2

40
𝑋̃ =
2

𝑋̃ = 20

La mediana de los datos que son pares es de 20

d.- Media armónica


12, 12, 14, 14, 14, 14, 16, 16, 17, 18, 18, 20, 20, 20, 20, 20, 24, 24, 26, 26, 27,
44, 56, 67

𝐻
24
=
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
+ + + + + + + + + + + + + + + + + + + + + + +
12 12 14 14 14 14 16 16 17 18 18 20 20 20 20 20 24 24 26 26 27 44 56 67

24
=
0,083 + 0,083 + 0,071 + 0,071 + 0,071 + 0,071 + 0,062 + 0,062 + 0,058 + 0,055 + 0,055 + 0,05 + 0,05 + 0,05 + 0,05 + 0,05 + 0,041 + 0,041 + 0,038 + 0,038 + 0,037 + 0,022 + 0,017 + 0.014

24
𝐻=
1,25

𝐻 = 19,2

e.- Media geométrica

𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎
24
= √12 ∗ 12 ∗ 14 ∗ 14 ∗ 14 ∗ 14 ∗ 16 ∗ 16 ∗ 17 ∗ 18 ∗ 18 ∗ 20 ∗ 20 ∗ 20 ∗ 20 ∗ 20 ∗ 24 ∗ 24 ∗ 26 ∗ 26 ∗ 27 ∗ 44 ∗ 56 ∗ 67

24
𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎 = √43321846552989705357911654400000

𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎 = 20,806

3.- DADO LOS VALORES ( 30 PTS)

38 - 42 -58 -40 -32 -40 - 46 -52 -30 -56 - 24 – 48- 36 - 60 – 42- 44 - 56 -


54 - 52 -34- 30 -48- 25 - 27 56 44 67
Ordenado de menor a mayor

-60, -58, -56, -56, -54, -52,-52,-48,-46,-44,-42,-42,-40,-36,-34,-32,-30,-30,-27,-


25,-24,38,40,44,56,67

CALCULAR

a.- Intervalo de clase y construir tabla de frecuencias

Para poder hallar un intervalo de clase hay que tener en cuenta


los siguientes términos, rango, número de intervalos y la amplitud

1. Rango
𝑅 = 𝑥 𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
𝑅 = 67 − (−60) = 127

2. Número de intervalo, según la regla de Sturges

𝐾 = 1 + 3,322 log 𝑛
𝐾 = 1 + 3,322 log 26 = 6,11
3. Amplitud
𝑅
𝐴=
𝐾
127
𝐴= = 20,78 ≈ 21
6,11

Intervalo de
clase
Li Ls
-60 -39
-40 -18
-19 03
04 24
25 45
46 66
67 87
Construir tabla de frecuencias

Intervalo de clase fi
Li Ls
-60 -39 12
-40 -18 9
-19 03 0
04 24 0
25 45 3
46 66 1
67 87 1
∑ 26

b.- Media aritmética -60, -58, -56, -56, -54, -52,-52,-48,-46,-44,-42,-42,-40,-


36,-34,-32,-30,-30,-27,-25,-24,38,40,44,56,67

̅
𝑿
60 + 58 + 56 + 56 + 54 + 52 + 52 + 52 + 48 + 46 + 44 + 42 + 42 + 40 + 36 + 34 + 32 + 30 + 30 + 27 + 25 + 24 + 38 + 40 + 44 + 56 + 67
=
26

−643
̅=
𝑿
26
̅ = −𝟐𝟒, 𝟕𝟑
𝑿

c.- Media armónica


(−0.0167)+(−0.0172)+(−0.0179)+(−0.0179)+(−0.0185)+(−0.0192)+(−0.0192)+
(−0.0208)+(−0.0217)+(−0.0227)+(−0.0238)+(−0.0238)+(−0.025)+(−0.0278)+(
−0.0294)+(−0.0312)+(−0.0333)+(−0.0333)+(−0.037)+(−0.04)+(−0.0417)+0.02
63+0.025+0.0227+0.0179+0.0149=−0.4313

26
𝐻= = −60,2829
−0,4313

d.- Moda

La moda es el número (o los números) con mayor frecuencia en el conjunto de


datos. Si todos los valores tienen la misma frecuencia se considera que el
conjunto de datos no tiene moda.

Valor Frecuencia

38 1

40 1

44 1

56 1
67 1

-60 1

-58 1

-56 2

-54 1

-52 2

-48 1

-46 1

-44 1

-42 2

-40 1

-36 1

-34 1

-32 1

-30 2

-27 1

-25 1

-24 1

El conjunto de datos tiene 4 modas (multimodal) cuyos valores son:

-56, -52, -42, -30


e.- Media Geométrica para poder calcular se tomaran los números positivos

𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎
26
= √60 ∗ 58 ∗ 56 ∗ 56 ∗ 54 ∗ 52 ∗ 52 ∗ 48 ∗ 46 ∗ 44 ∗ 42 ∗ 42 ∗ 40 ∗ 36 ∗ 34 ∗ 32 ∗ 30 ∗ 30 ∗ 27 ∗ 25 ∗ 24 ∗ 38 ∗ 40 ∗ 44 ∗ 56 ∗ 67

26
𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎 = − √1.5653594412068493𝑒 + 42

𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚𝑒𝑡𝑟𝑖𝑐𝑎 = −41.9633

4.- DESARROLLAR EL SIGUIENTE PROBLEMA DE APLICACIÓN (30 PTS)


Se tienen los datos de una muestra de 30 cuentas por cobrar de la
tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de
frecuencias, a partir de los cuales se deberá calcular: Media, Mediana, Moda
y construir grafico de polígonos

Punto medios Frecuencia Frecuencia


absoluta acumulada
Clases (marca de
Fi
clase) fi

Xi
10-20 15 10 10
20-30 25 4 14
30-40 35 5 19
40-50 45 3 22
50-60 55 3 25
60-70 65 5 30
N=30

Media

∑ 𝑋𝑖 ∗ 𝑓𝑖
𝑋̅ =
𝑁

(15 ∗ 10) + (25 ∗ 4) + (35 ∗ 5)(45 ∗ 3) + (55 ∗ 3) + (65 ∗ 5)


𝑋̅ =
30

150 + 100 + 175 + 135 + 165 + 325


𝑋̅ =
30

1050
𝑋̅ =
30

𝑋̅ = 35
Lo primero que debemos hacer para poder calcular la mediana es
identificar la clase mediana. Para esto tenemos que buscar el intervalo en el
que se encuentre.

N/2

En este caso N / 2 = 30 / 2 ⇒ 15

Ahora debemos buscar el intervalo donde la frecuencia acumulada (F i )


contenga el valor obtenido (15).

Punto medios Frecuencia Frecuencia acumulada


absoluta Fi
Clases (marca de
clase) fi

Xi
10-20 15 10 10
20-30 25 4 14
30-40 35 5 19
40-50 45 3 22
50-60 55 3 25
60-70 65 5 30

Ahora reemplazamos los datos en la fórmula:


𝑁
− 𝐹𝑖 − 1
𝑀𝐸 = 𝐿𝑖 + 2 ∗ 𝐴𝑖
𝑓𝑖
𝐴𝑖 = 𝑙𝑠 − 𝑙𝑖
𝐴𝑖 = 40 − 30 = 10
15 − 14
𝑀𝐸 = 30 + ∗ 10
5
1
𝑀𝐸 = 30 + 5 ∗ 10 =30+10/2

30 + 2
𝑀𝐸 = 32

La moda Mo:

Lo primero que debemos hacer es identificar el intervalo modal:

Punto medios Frecuencia Frecuencia acumulada


absoluta Fi
Clases (marca de
clase) fi

Xi
10-20 15 10 10
20-30 25 4 14
30-40 35 5 19
40-50 45 3 22
50-60 55 3 25
60-70 65 5 30 Ya
que
es la frecuencia que más se repite el intervalo modal es 10-20
ni − ni−1 = 10 − 0 = 10
ni − ni+1 = 10 − 4 = 6
(ni − ni − 1) + (ni − ni + 1)
𝑀𝑂 = 𝐿𝑖 + 𝐴𝑖
(ni − ni − 1)
10 + 6
𝑀𝑂 = 10 + ∗ 10
6
16
𝑀𝑂 = 10 + ∗ 10
6
160
M𝑂 = 10 +
6

𝑀𝑂 = 10 + 10=20
Construir grafico de polígonos

Poligono de Frecuencia
12
10
Frecuencia Absoluta fi

10
8
6 5 5
4
4 3 3

2
0
15 25 35 45 55 65
Puntos Medios xi

También podría gustarte