INSTITUTO TECNOLOGICO SUPERIOR DE SAN ANDRES
Probabilidad y estadística descriptiva
Probabilidad y estadística
Profesor: Enrique Juárez Hernández
Alumno: José López Méndez
Ingeniería en Gestión Empresarial
Grupo: 303-C
09-04-2021
Probabilidad y estadística descriptiva
UNIDAD 01 Distribuciones de frecuencias
Mapa mental de los temas:
1.1 Conceptos de estadística y su clasificación.
1.2 Recopilación de datos.
Reporte de Lectura de los temas:
1.3 Distribución de frecuencias.
1.3.1 polígonos de frecuencia, histogramas y ojivas
1.4 Medidas de tendencia central para un conjunto de
datos y datos agrupados.
1.4.1 Media, media ponderada
1.4.2 Mediana
1.4.3 Moda
1.5 Medidas de dispersión para un conjunto de datos y
datos agrupados.
1.5.1 Rango
1.5.2 Desviación media
1.5.3 Varianza
1.5.4 Desviación estándar
Introducción
La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa
informació n relacionada con éste y que es necesaria para la toma de decisiones, hace
que la estadística sea hoy, una importante herramienta de trabajo.
En el presente trabajo se muestran varios conceptos bá sicos en el tratamiento
estadístico como lo son los histogramas, polígonos de frecuencia que nos muestran
varias distribuciones distintas, asi como otros conceptos de importancia como la
media, mediana y moda que son medidas de tendencia central para poblaciones que
presentan ciertos nú meros de datos.
Y se tratan otros conceptos como lo son las medidas de dispersió n como lo son rango
y la desviació n media, entre otros y que nos hablan de como la variable se mueven
mucho o poco que otra.
A grandes rasgos este es el contenido del presente trabajo y que de detallará en las
pá ginas siguientes.
Gracias…
CONCEPTO DE ESTADISTICA Y SU CLASIFICACION
Estadística y su clasificación
La estadística se encarga de recopilar, organizar,
procesar e interpretar datos con el fin de estudiar las
diversas formas del comportamiento en la naturaleza.
Su objetivo es mejorar la comprensión de hechos a partir de
datos y el hacer inferencias acerca de la población con base a
la información obtenida de una muestra.
Estadística Descriptiva Estadística Inferencial
Intenta tomar decisiones basadas en aceptación o
Tipo de estadística que utiliza los números como rechazo de ciertas relaciones que se toman como
medio para describir aun conjunto de números. hipótesis; tienen margen de error, mide el grado de
incertidumbre de las inferencias en términos de
probabilidad.
Polígono de La muestra y con esta pueden generalizar
Hoja de datos Grafica
Histogramas lo que sucederá con toda la población.
circular frecuencias
RECOPILACION DE DATOS
RECOLECCION DE
INFORMACION
♦Distribución de frecuencias
Una distribució n de frecuencias es una tabla resumen en la que se disponen los datos divididos en
grupos ordenados numéricamente y que se denominan clases o categorías.
En las columnas se dispone el nú mero de ocurrencias por cada valor, porcentajes, etc. La finalidad
de las agrupaciones en frecuencias es facilitar la obtenció n de la informació n que contienen los
datos.
► Polígonos de frecuencia, histogramas y ojivas.
A- Histogramas.
Es el grá fico adecuado cuando los datos está n ordenados en tablas con intervalos, es decir,
para datos de variables continuas. También el histograma es una conformació n de
rectá ngulos, pero uno al lado de otro cuya á rea es proporcional a la frecuencia de cada
intervalo. Los extremos de la base de cada rectá ngulo son los límites reales del intervalo.
Limites reales fᵢ
4.5 – 8.5 8
8.5 – 12.5 10
12.5 – 16.5 6
16.5 – 20.5 2
20.5 – 24.5 4
24.5 – 28.5 8
Total 38
HISTOGRAMA
Frecuencia Absoluta
12
10
8.5 12.5 16.5 20.5 24.5 28.5
4.5 8.5 12.5 16.5 20.5 24.5
Limites reales
B- Polígonos de frecuencia.
Este grá fico sirve para mostrar la tendencia de la variable, se puede determinar a partir de
un histograma uniendo los puntos medios superiores de cada rectá ngulo del histograma.
También, se determina el polígono uniendo los puntos formado por la marca de clase con la
frecuencia absoluta del intervalo respectivo.
Limites reales xᵢ fᵢ
4.5 – 8.5 6.5 8
8.5 – 12.5 10. 10
5
12.5 – 16.5 14. 6
5
16.5 – 20.5 18. 2
5
20.5 – 24.5 22. 4
5
24.5 – 28.5 26. 8
5
Total 38
Polígono de frecuencias
Frecuencia Absoluta
12
10
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Marcas de Clase
C- Ojivas.
Es un grá fico que se usa para mostrar có mo se acumulan las frecuencias absolutas, relativas
o porcentuales. Se obtiene al unir los puntos formados por los límites superiores de cada
intervalo con la frecuencia absoluta o relativas acumuladas del intervalo respectivo. Si se
consideran las frecuencias porcentuales acumuladas se llama ojiva porcentual.
Limites reales xᵢ fᵢ Fᵢ
4–8 6 8 8
8 – 12 10 10 18
12 – 16 14 6 24
16 – 20 18 2 26
20 – 24 22 4 30
24 - 28 26 8 38
Total 38
Ojiva
Frecuencia Acumulada
40
36
32
28
24
20
16
12
8
4
0
4 8 12 16 20 24 28
Limites Superiores
♦Medidas de tendencia central para un conjunto de datos y datos
agrupados.
► Media, Media ponderada
I-A Media aritmética.
La media aritmética se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el nú mero total de observaciones.
Una muestra con n observaciones, tiene una media x denominada media estadística, del
elemento de una muestra.
x=
∑x
n
Una població n con N elementos tiene una media μ denominada parámetros de los datos de
una població n completa.
μ=
∑x
N
Ejemplo:
Se ofrece un estímulo especial a aquellas escuelas en las que la edad promedio de los
niñ os que asisten está por debajo de los 9 añ os. Si los siguientes datos corresponden a las
edades de los niñ os que acuden de manera regular a los centros. ¿calificara ésta para para el
estímulo?
Datos del centro educativo: 8, 5, 9, 10, 9, 12, 7, 12, 13, 7, 8
x=
∑ x = 8+ 5+9+10+9+ 12+ 7+12+13+7+8 =9.09
n 11
II-A Media ponderada (datos agrupados)
Cuando el nú mero de observaciones es grande, las operaciones para calcular la media
aritmética se simplifican si agrupamos los datos en una tabla de frecuencias.
Para calcular la media aritmética ponderada, primero calculamos el punto medio de cada
elemento, después multiplicamos cada punto medio por la frecuencia absoluta de cada
intervalo.
x=
∑ mᵢfᵢ
n
Siendo:
mᵢ: punto medio de la variable
fᵢ: frecuencia de la variable
Ejemplo:
Con la siguiente tabla de frecuencias, calcule la media ponderada.
INTERVALO mᵢ fᵢ
[50-60) 55 10
[60-70) 65 18
[70-80) 75 14
[80-90) 85 6
[90-100) 95 2
INTERVALO mᵢ fᵢ mᵢfᵢ
[50-60) 55 10 550
[60-70) 65 18 1170
[70-80) 75 14 1050
[80-90) 85 6 510
[90-100) 95 2 190
50 3470
x=
∑ mᵢfᵢ = 3470 =69.4
n 50
III- Mediana (Me)
Se define como aquel valor de la variable que destaca la mitad de las
observaciones y ocupa el valor central de estas.
Por esta razó n se le supone como valor central, ya que el promedio está
situado en el centro de la distribució n.
Para realizar el cá lculo dela mediana se requiere una clasificació n de los datos,
de menor a mayor o viceversa.
Datos no agrupados.
n+1
• Número impar de datos: La mediana es el dato que está en la posició n
2
Me= X n+1
2
Ejemplo: Sea el conjunto ordenado de datos:
2 3 5 6 8 Me= X n+1 ; Me=X 5+1 = X 3=5
X₁ X₂ X₃ X₄ X₅ 2 2
• Número par de datos: Es el promedio entre los dos datos centrales.
X n+X n
+1
2 2
Me=
2
Ejemplo: Sea el conjunto ordenado de datos.
2 3 5 6 8 9
X₁ X₂ X₃ X₄ X₅ X₆
X n +X n
2 2
+1 X 3 + X 4 5+ 6
Me= ; Me= = =5.5
2 2 2
Datos agrupados.
Si los datos está n concentrados en una distribució n de frecuencias, se elige el
intervalo de clase que domina a la mediana conocido como clase media. Para
ello, debemos establecer la frecuencia acumulada absoluta que posee al
n+1
elemento nú mero . El valor de este intervalo para la mediana se calcula
2
usando la siguiente ecuació n.
n+1
Me= X=Lm +
2
[−f i −1
fi
( h) ]
Siendo:
Me: Mediana
Lm : Limite inferior de clase media
n : Numero de datos
f i−1 : Frecuencia acumulada absoluta de la clase anterior alintervalo
dela mediana .
f i : Frecuencia absoluta de la clase mediana
h : Amplitud delintervalo
Ejemplo: Las edades de las personas que pertenecen a una casa de retiro esta
representada por la siguiente tabla:
Edades de personas en la casa de retiro
EDAD Me fᵢ fr fri% Fᵢ Fri Fri%
i
[50-60) 55 10 0.2 20 10 0.26 20
[60-70) 65 18 0.4 36 28 0.566 56
[70-80) 75 14 0.3 28 42 0.84 84
[80-90) 85 6 0.1 12 48 0.96 96
[90-100) 95 2 0 4 50 1 100
Datos agrupados. (continuación)
50+1
La clase mediana es la que contenga el elemento en la posició n , es decir,
2
en la posició n 25.5 . Buscamos en la frecuencia acumulada Fᵢ y vemos que se
halla en el intervalo [60-70)
25.5−10
Me=60+ [ 18 ]10=68.61
IV- La Moda (Mo)
Es el valor que má s se repite en un grupo de datos. La moda es otra medida de
posició n y su uso es bastante limitado. Al igual que la mediana, sus fó rmulas
no aceptan un tratamiento algebraico, tampoco es sensitivo a valores
extremos o a la variació n que se hagan a los valores de la variable diferentes al
de la moda. Su utilizació n se hace necesaria cuando la distribució n presenta el
primero y el ú ltimo intervalo abierto o no definido.
Ejemplo: Inspeccionemos tres casos de observaciones para situar en ellos el
valor de la moda:
a) 4,9,10,11,15,13,14,15 Moda (15) porque se repite 2 veces
b) 3,4,6,8,10,12,13,15 Sin moda, no hay elemento que se repita
c) 4,4,5,8,10,4,11,13,10 Bimodal, (4 y 10)
♦ Medidas de dispersión para un conjunto de datos y datos agrupados
► Rango
Indica el nú mero de valores que toma la variable. El rango es la diferencia
entre el valor má ximo y el valor mínimo de un conjunto de datos.
R=X max −X min
Si los datos está n agrupados en una tabla de frecuencias, el recorrido es la
diferencia entre el límite real superior del ú ltimo intervalo y el límite real
inferior del primer intervalo.
R=Lmax−Lmin
Ejemplo:
1) Sea el siguiente conjunto de datos:
12, 15, 17, 23, 25, 28
X max=28 X min=12 R=28−12=16
2) Sea la siguiente tabla:
Peso (Kg.) fᵢ
55.0 - 63.0 5
63.1 - 71.1 15
71.2 - 79.2 12 Lmin =54.95 Lmax=95.45
79.3 - 87.3 5
87.4 - 95.4 3
Total 40
R=95.45−54.95 R=40.5 Kg
El rango mide "la dispersió n total" del conjunto de datos. Aunque el rango es
una medida de dispersió n simple y que se calcula con facilidad, su debilidad
preponderante es que no toma en consideració n la forma en que se distribuyen los
datos entre los valores má s pequeñ os y los má s grandes.
► Desviación media
Es la media aritmética de los valores absolutos de las desviaciones de todos
los datos respecto a la media aritmética. Su símbolo es DM.
a) Desviación media para datos no agrupados
∑| xi −x́|
DM = i =1
n
Ejemplo: Obtener la desviació n media para los datos 5, 7, 8, 10, 16
5+7+8+ 10+16
x́= =9.2
5
|5−9.2|+|7−9.2|+|8−9.2|+|10−9.2|+|16−9.2|
DM =
5
15.2
DM = =3.04
5
b) Desviación media para datos agrupados
∑|xi −x́| fᵢ
DM = i =1
n
Donde x i es la marca de clase
Ejemplo. Determine la desviació n media de los siguientes datos agrupados:
Peso (Kg.) fᵢ
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
Peso (Kg) xᵢ fᵢ xᵢfᵢ |x i−x́| |x i−x́|fᵢ
60-62 61 5 305 6.45 32.25
63-65 64 18 1152 3.45 62.10
66-68 67 42 2814 0.45 18.90
69-71 70 27 1890 2.55 68.85
72-74 73 8 584 5.55 44.40
Total 100 6745 226.5
6745 226.5
x́= =67.45 DM= =2.265
100 100
► Varianza
La varianza se define como el promedio aritmético de las diferencias entre cada uno de los valores
del conjunto de datos y la media aritmética del conjunto elevadas al cuadrado.
Su símbolo es S2 si estamos trabajando con una muestra y σ 2si estamos trabajando con una
població n.
a) Varianza para datos no agrupados
n
∑ ( x i−x́ )2 donde x irepresenta los datos de la muestra
s2= i=1
n−1
N
∑ ( xi −μ )2 donde x irepresenta los datos de la població n
σ 2= i=1
N −1
Ejemplo: Determine la varianza del siguiente conjunto de datos:
25 12 23 28 17 15
25+12+28+17+15
x́= =20
6
( 25−20 )2+ ( 12−20 )2 + ( 23−20 )2+ ( 28−20 )2 + ( 17−20 )2 + ( 15−20 )2
s2=
6−1
196
s2= =39.2 (unidades al cuadrado)
5
►Desviación típica o Estándar
Es la raíz cuadrada positiva de la varianza. Su símbolo es S si se está trabajando con una muestra y
es σ si se está trabajando con una població n.
a) Desviació n está ndar para datos no agrupados
n
S=
√ ∑ ( x i− x́ )2
i=1
n−1
donde x i representa los datos de la muestra
N
σ=
√ ∑ ( x i−μ )2
i=1
N −1
donde x i representa los datos de la població n
Ejemplo: Para el conjunto de datos 25,12,23,28,17,15 donde se obtuvo que su varianza era
S2=39.2 ; tendremos entonces que su desviació n está ndar es:
S= √39.2=6.26 unidades
b) Desviació n está ndar para datos agrupados
m m
√ √
2
∑ ( x i− x́ ) f i ∑ ( x i−μ )2 f i donde x i es la marca de clase
i=1 i=1
S= σ=
n−1 N −1
La varianza y la desviació n está ndar miden la dispersió n "promedio" en torno a la media aritmética,
es decir, có mo fluctú an las observaciones mayores por encima de la media aritmética y có mo se
distribuyen las observaciones menores por debajo de ella.
Conclusión
La estadística nos permite realizar estudios reales, con poblaciones exactas; lo cual
nos ayuda a mejorar nuestros proyectos.
Responde a la actividad planificadora de la sociedad. Con la Revolució n Industrial
aparecen nuevos problemas, en este caso las emisiones atmosféricas. La Estadística
es un instrumento para identificar causas e impactos que esta problemá tica genera
en la sociedad.
Los diferentes tipos de distribuciones nos permiten prever eventos que puedan
ocurrir, teniendo en cuenta lo que ha sucedido anteriormente (datos histó ricos).
En resumen la estadística y la probabilidad son herramientas sumamente
importantes para la comprensió n y aná lisis de diversos problemas que se
encuentran en la naturaleza y desde enfoque completamente variados del á mbito
científico.
Referencias
1- https://economipedia.com/definiciones/distribucion-de-frecuencias.html
2- Estadistica Y Probabilidad, Universidad Catolica De La Santisima Concepcion
3- Estadística aplicada a la administración y economía, 1ra edición, Tapia T - Jijón G
4- Estadística y probabilidades; de Estuardo Morales
5- Probabilidad y estadística, quinto semestre, SEP-TELEBACHILLERATO COMUNITARIO
6- https://editorialpatria.com.mx/pdffiles/9786074385144.pdf
7- http://repositorio.cidecuador.org/bitstream/123456789/72/1/Estadistica%20Aplicada%20a
%20la%20Administracion%20y%20la%20Economia.pdf
8- https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-
semestre/estadistica/rel-empirica-de-la-media-mediana-y-moda.pdf
9- https://es.wikipedia.org/wiki/Media_ponderada
10- https://economipedia.com/definiciones/media-ponderada.html