0% encontró este documento útil (0 votos)
58 vistas11 páginas

1.1 Definiciones

Este documento describe conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se usa para analizar una muestra de datos y obtener sus características como la media, mediana y desviación estándar. Luego define datos no agrupados y agrupados, y describe medidas de tendencia central como la media aritmética, geométrica y ponderada, así como la mediana y la moda. Proporciona fórmulas y ejemplos para calcular cada medida.

Cargado por

Ahmed Beltran
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
58 vistas11 páginas

1.1 Definiciones

Este documento describe conceptos básicos de estadística descriptiva. Explica que la estadística descriptiva se usa para analizar una muestra de datos y obtener sus características como la media, mediana y desviación estándar. Luego define datos no agrupados y agrupados, y describe medidas de tendencia central como la media aritmética, geométrica y ponderada, así como la mediana y la moda. Proporciona fórmulas y ejemplos para calcular cada medida.

Cargado por

Ahmed Beltran
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PROBABILIDAD Y ESTADÍSTICA

UNIDAD I “ESTADÍSTICA DESCRIPTIVA”

1.1 Definiciones.

Cuando necesitamos analizar un proceso cualquiera, es necesario tomar una muestra de datos del
proceso en cuestión y a partir de los mismos obtener sus características tales como la media,
mediana, moda, desviación estándar, rango, etc., también es necesario visualizar de forma objetiva
el comportamiento de los datos al ser graficados de diversas formas, todo lo anterior es posible
gracias a la estadística descriptiva.

Una muestra es una parte de los datos del proceso que se desea analizar, la cual debe ser
representativa del proceso en cuanto al número d elementos que contiene y en cuanto a lo que está
ocurriendo en el proceso, esto último se logra tomando cada uno de los elementos de la muestra
de forma aleatoria o totalmente al azar; para determinar el número de elementos idóneo en la
muestra se hace uso de la inferencia estadística.

Cuando obtenemos la muestra, los datos los podemos tratar de dos formas: Datos No agrupados y
Datos agrupados.

1.2 DATOS NO AGRUPADOS

Cuando la muestra que se ha tomado de la población o proceso que se desea analizar tiene menos
de 20 elementos n < 20, entonces estos datos son analizados sin necesidad de formar clases con
ellos y a esto se le llama tratamiento de datos no agrupados.

A estos datos se les puede calcular algunas características:

1.2.1 MEDIDAS DE TENDENCIA CENTRAL:

Se les llama medidas de tendencia central a las características como la media aritmética, la mediana,
la media geométrica, la moda, etc., debido a que, al observar la distribución de los datos, estas
tienden a estar localizadas generalmente en su parte central.

1) Media Aritmética ( x ): También se le conoce como promedio ya que es el promedio de las


lecturas o mediciones individuales que se tienen en la muestra, se determina de la siguiente
manera:

∑𝒏𝒊=𝟏 𝒙𝒊
𝒙=
𝒏

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
donde:
x es la media aritmética
xi es cada dato i
n es el número de datos en la muestra

Ejemplo:
1. Se han tomado como muestra las medidas de 6 cables usados en un arnés para lavadora,
las cuales son: 15.2, 15.0, 15.1, 15.2, 15.1 y 15.0 cm, determine su media aritmética.

∑𝑛𝑖=1 𝑥𝑖 15.2 + 15 + 15.1 + 15.2 + 15.1 + 15


𝑥= = = 15.1 𝑐𝑚
𝑛 6

2. Se toman varias muestras de cierto tipo de queso y se determina la cantidad de proteína


por cada 100 gramos de queso, encontrándose lo siguiente: 26.5, 24.8, 25.3, 30.5, 21.4
gr., determine la cantidad promedio (media aritmética) de proteína encontrada en la
muestra por cada 100 gramos de queso que se elabora.

∑𝑛𝑖=1 𝑥𝑖 26.5 + 24.8 + 25.3 + 30.5 + 21.4


𝑥= = = 25.7 𝑔𝑟.
𝑛 5

2) Media Geométrica (G): Esta medida es usada cuando los datos de la muestra no son lineales,
es decir, que su valor depende de varios factores a la vez, se determina de la siguiente
manera:

𝑮 = 𝒏√𝒙𝟏 ∗ 𝒙𝟐 ∗ … ∗ 𝒙𝒏

donde:
G es la media geométrica
xi cada dato i
n es el número de datos en la muestra

Ejemplo:
1. Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4, 12.8, 11.9,
13.6 °C, determine su media geométrica.

4
𝐺 = 𝑛√𝑥1 ∗ 𝑥2 ∗ … ∗ 𝑥𝑛 = √13.4 ∗ 12.8 ∗ 11.9 ∗ 13.6 = 12.90 ℃
Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
2. Las siguientes temperaturas han sido tomadas de un proceso para fabricar queso
Chihuahua, 21.4, 23.1, 20.2, 19.7, 21.0 °C, determine la temperatura promedio de este
proceso (media geométrica).

5
𝐺 = 𝑛√𝑥1 ∗ 𝑥2 ∗ … ∗ 𝑥𝑛 = √21.4 ∗ 23.1 ∗ 20.2 ∗ 19.7 ∗ 21 = 21.048 ℃

3) Media Aritmética Ponderada (xʷ): Esta media se usa cuando el peso que tiene cada uno de
los datos de la muestra es diferente, se calcula de la siguiente manera:

∑𝒏𝒊=𝟏 𝑾𝒊 ∗ 𝑿𝒊
𝒙𝒘 =
∑𝒏𝒊=𝟏 𝑾𝒊

donde:

xʷ es la media aritmética ponderada

xi es cada dato i

wi es el peso del dato i

Ejemplo:

1. Las calificaciones de tres exámenes son 7, 5 y 9; supongamos que el peso de cada examen
es de 25%, 35% y 40% respectivamente, calcular la media aritmética ponderada.

𝑤
∑𝑛𝑖=1 𝑊𝑖 ∗ 𝑋𝑖 (7 ∗ 25) + (5 ∗ 35) + (9 ∗ 40)
𝑥 = 𝑛 = = 7.1
∑𝑖=1 𝑊𝑖 (25 + 35 + 49)

2. Calcular la media aritmética ponderada de los siguientes datos:

Dato 20 15 5 8
Peso 2 3 1 4

∑𝑛𝑖=1 𝑊𝑖 ∗ 𝑋𝑖 (20 ∗ 2) + (15 ∗ 3) + (5 ∗ 1) + (8 ∗ 4)


𝑥𝑤 = 𝑛 = = 12.2
∑𝑖=1 𝑊𝑖 (2 + 3 + 1 + 4)

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
4) Media Armónica (H): Esta media se determina de la siguiente manera:

𝒏
𝑯=
𝟏
∑𝒏𝒊=𝟏
𝒙𝒊
donde:

H es la media armónica

xi es cada dato i

n es el número de datos en la muestra

Ejemplo:

1. Determine la media armónica de los siguientes datos: 3.1, 2.8, 2.84, 3.05, 3.09

𝑛 5
𝐻= = = 2.9703
1 1 1 1 1 1
∑𝑛𝑖=1 + + + +
𝑥𝑖 3.1 2.8 2.84 3.05 3.09

2. Supóngase que una familia realiza un viaje en automóvil a una ciudad y cubre los primeros
100 km a 60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular,
en esas condiciones, la velocidad media realizada (media armónica).

𝑛 3
𝐻= = = 69.041 𝑘𝑚/ℎ𝑟
1 1 1 1
∑𝑛𝑖=1 + +
𝑥𝑖 60 70 80

5) Mediana (Xmed): La mediana es aquel valor que se encuentra en la parte central de los datos
que se tienen en la muestra una vez que estos han sido ordenados según su valor o
magnitud. Para calcular su valor se presentan dos caos:
a) Cuando el número de datos en la muestra es impar. En este caso después de ordenar
los datos de la muestra, de mayor a menor o de menor a mayor, se localiza aquel dato
que se encuentra justo en el centro de los datos; el valor de este dato será la mediana.
b) Cuando el número de datos en la muestra es par. En este caso después de ordenar los
datos, observamos que en la parte central de los datos no se encuentra dato alguno, en
este caso, la mediana tomará el valor promedio de los dos datos centrales.

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Ejemplo:

1. Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de
lavadora, sus mediciones son las siguientes: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.

Ordenamos los datos (puede ser de mayor a menor o de menor a mayor) y buscamos el
valor central.
11.2 11.2 11.2 11.3 11.4 11.5 11.5

Por lo tanto nuestra mediana Xmed = 11.3 cm

2. Los siguientes datos son las mediciones de un circuito utilizado en un arnés de lavadora y
sus mediciones son las siguientes: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, 11.4 cm.

Ordenamos los datos


11.2 11.2 11.2 11.3 11.4 11.4 11.5 11.5
De los dos datos centrales obtenemos el promedio:
11.3 + 11.4
= 11.35
2

Por lo tanto nuestra mediana Xmed = 11.35 cm

6) Moda (Xmod): La moda se define como aquel valor o valores que más se repiten o que tienen
mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una
población nos genera la distribución de los datos una vez que estos se han graficado y en
esta gráfica es posible observar la moda o modas de la misma, es por esto que una
distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda),
bimodal (tiene dos modas) o polimodal (tiene más de dos modas).

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Ejemplo:

1. Determine la moda de los datos que se muestran a continuación, que se refieren a la


estatura de un grupo de jóvenes: 1.60, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70, 1.93,
1.87, 1.85 m.

Vemos que la frecuencia de cada dato es:


Estatura Frecuencia
1.60 1
1.65 1
1.70 5
1.71 2
1.85 1
1.87 1
1.93 1

Observamos que el dato que más se repite es 1.70, por lo tanto

Xmod = 1.70 m

2. Determine la moda de los siguientes datos que se refieren a la edad de alumnos de


primer semestre de ITCH: 18, 17, 19, 21, 19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21,
20, 18, 19, 18, 19, 22, 35 años.

Vemos que la frecuencia de cada dato es:


Edad Frecuencia
17 2
18 7
19 7
20 2
21 2
22 3
35 1

Observamos que los datos que más se repiten son 18 y 19, por lo tanto tenemos dos modas

Xmod = 18 y 19 años

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
GRÁFICA DE CAJA Y BIGOTE

Ejemplo:
Los siguientes 20 datos representan a una muestra de edades de las personas que toman
una ruta de camión en particular:
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
Elabore una gráfica de caja y bigote

Lo primero que tenemos que hacer es acomodar los datos de manera ascendente y obtener
la mediana

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Xmed = q₂ = (33+34)/2 = 33.5 (la mediana será el cuartil 2)

Obtenemos el cuartil 1 y el cuartil 3, que son la mediana de la primera mitad de nuestros


datos y la mediana de la segunda mitad de nuestros datos

q₁ = (24+25)/2 = 24.5
q₃ = (39+39)/2 = 39

Obtenemos el Rango Intercuartílico (RI) = q₃ - q₁ = 39 – 24.5 = 14.5


Obtenemos el límite inferior y el límite superior:
LI = q₁ - (1.5 * RI) = 24.5 – (1.5 * 14.5) = 2.75
LS = q₃ + (1.5 * RI) = 39 + (1.5 * 14.5) = 60.75

Y graficamos:

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
NOTAS:
En esta gráfica podemos observar que los límites de la caja representan nuestros cuartiles
q₁ y q₃ (24.5 y 39 respectivamente); la línea que está en la caja representa la mediana de
nuestros datos 33.5 y la cruz que está dentro de la caja representa la media de los datos
32.55.
Las líneas fuera de la caja representan los bigotes de la gráfica y esas se deben colocar hasta
el valor de los límites superior e inferior (en este caso no se extienden hasta el valor de los
límites porque no tenemos datos hasta esos valores, es por eso que se representan en un
valor diferente).
Esta gráfica se puede construir sobre el eje vertical como la que se presenta o bien sobre el
eje horizontal.

1.2.2 MEDIDAS DE DISPERSIÓN

Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante
determinar sus medidas de tendencia central, así como también es básico determinar que
tan dispersos están los datos de la muestra, por lo que se hace necesario determinar su
rango, varianza, desviación estándar, etc., ya que una excesiva variabilidad o dispersión en
los datos indica la inestabilidad del proceso en análisis en la mayoría de los caos.

1) Rango o recorrido (R): El rango es la diferencia entre el valor mayor y el valor menor de
nuestra muestra, también se le denomina recorrido ya que nos dice entre que valores
hace su recorrido la variable de interés y se determina de la siguiente manera:

𝑹 = 𝑽𝑴 − 𝑽𝒎

donde:
R es el rango o recorrido
VM es el valor mayor
Vm es el valor menor

Ejemplo:
1. Se han tomado como muestras las mediciones de la resistencia a la tensión de la
soldadura usada para unir dos cables, estas son: 78.5, 82.4, 87.3, 78.0, 90.0, 86.5,
77.9, 92.4, 75.9 Kg., determine su rango o recorrido.

Observamos que el valor mayor es 92.4 y el valor menor es 75.9, por lo tanto

𝑅 = 𝑉𝑀 − 𝑉𝑚 = 92.4 − 75.9 = 16.5 𝐾𝑔

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
2. Se toman las mediciones de la cantidad de grasa de la leche en gramos por cada 100
ml de leche que entra a un proceso de pasteurización, estas son: 14.85, 15.32,
12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el rango o recorrido.

Observamos que el valor mayor es 17.61 y el valor menor es 12.76, por lo tanto

𝑅 = 𝑉𝑀 − 𝑉𝑚 = 17.61 − 12.76 = 4.85 𝑔𝑟𝑎𝑚𝑜𝑠

2) Varianza (s²): La varianza se determina de la siguiente manera:

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙)𝟐
𝒔𝟐 =
𝒏−𝟏

donde:

s² es la varianza

xi es cada dato i

x es la media de los datos

n es el número de datos en la muestra

Ejemplo:

1. Los siguientes datos son la cantidad de glucosa en miligramos encontrada en muestras de


sangre de algunos pacientes: 14.2, 12.1, 15.6, 18.1, 14.3 mg., determine la varianza de los
datos.

Obtenemos primero la media o promedio de los datos

∑𝑛𝑖=1 𝑥𝑖 14.2 + 12.1 + 15.6 + 18.1 + 14.3


𝑥= = = 14.86 𝑚𝑔
𝑛 5

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Ya que obtuvimos la media, calculamos la varianza

2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 (14.2 − 14.86)2 + (12.1 − 14.86)2 + ⋯
𝑠 = = = 4.853 𝑚𝑔
𝑛−1 5−1

Por lo tanto, nuestra varianza 𝑠 2 = 4.853 𝑚𝑔

3) Desviación estándar (s): La desviación estándar se calcula de la siguiente manera:

𝒔 = √𝒔𝟐

donde:

s² es la varianza

s es la desviación estándar

Ejemplo:

Del ejemplo anterior obtener la desviación estándar

𝑠 = √𝑠 2 = √4.853 = 2.2029 𝑚𝑔

Por lo tanto, nuestra desviación estándar s = 2.2029 mg.

Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando
Ing. Karla Isabel Gutiérrez Enríquez, Ing. Rita Luna Gándara, Ing. Cinthia Lucila Flores Pando

También podría gustarte