Módulo de Estadística Aplicada
Módulo de Estadística Aplicada
El contenido del presente Módulo es de carácter reservado para uso exclusivo de la Policía
Nacional en el área académica, se prohíbe su reproducción total o parcial y la
comercialización del mismo.
3
TABLA DE CONTENIDOS
Estadística Aplicada ............................................................................................................ 4
UNIDAD I............................................................................................................................. 5
1.1. Estadística Aplicada ............................................................................................. 5
1.1.1. Definición ........................................................................................................ 5
1.1.2. Razonamiento deductivo e inductivo .............................................................. 5
1.1.3. Introducción a la inferencia estadística ........................................................... 6
1.1.4. Desarrollo intelectual de la estadística aplicada .............................................. 7
1.1.5. Víctima/victimario de violencia y delincuencia .............................................. 8
UNIDAD II ......................................................................................................................... 10
2.1. Medidas ................................................................................................................ 10
2.1.1. Medidas de Tendencia Central ...................................................................... 10
2.1.2. Medidas de posición ...................................................................................... 19
2.1.3. Medidas de dispersión ................................................................................... 26
UNIDAD III ....................................................................................................................... 33
3.1. Análisis Estadístico ............................................................................................. 33
3.1.1. Variación Absoluta ........................................................................................ 33
3.1.2. Variación porcentual. - Porcentaje de cambio. .............................................. 33
3.1.3. Porcentaje, peso porcentual o proporción...................................................... 34
UNIDAD IV ........................................................................................................................ 36
4.1. Cuadros ................................................................................................................ 36
4.1.1. Cuadros comparativos ................................................................................... 36
4.1.2. Representación o lectura de los colores ......................................................... 37
4.1.3. Representación gráfica .................................................................................. 38
GLOSARIO........................................................................................................................ 43
BIBLIOGRAFÍA ............................................................................................................... 45
NETGRAFÍA ..................................................................................................................... 46
4
Estadística Aplicada
Estadística es mucho más que sólo números apilados y gráficas. Es una ciencia con
tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias.
Su uso ha sido generalizado en los últimos años no solo como herramienta de análisis sino
también como auxiliar en el estudio y valoración de cualquier investigación. El propósito
de este módulo es proporcionar a los cursantes al inmediato grado superior, el material
básico exigido en el presente módulo.
En este módulo empezaremos con algunos conceptos introductorios que nos sirven
de fundamento a toda la estadística, después analizaremos la forma de describir y
representar un conjunto de datos, ya sea de manera gráfica o usando medidas de posición y
de dispersión; finalmente nos introduciremos al estudio de algunas distribuciones
probabilísticas (discretas y continuas).
5
UNIDAD I
1.1.1. Definición
1. Inferencia paramétrica.
La inferencia paramétrica se ocupa de aquellos casos en los que la
distribución de probabilidad de la población objeto de estudio se
supone conocida salvo los valores que toman ciertos coeficientes,
llamados parámetros. El objetivo es estimar, dar intervalos de confianza
o contrastar Hipótesis sobre dichos parámetros, por ejemplo: (Delitos
del Cuadro de mando Integral en el Ecuador).
2. Inferencia no paramétrica.
La inferencia no paramétrica trata problemas similares cuando se
tiene una distribución poblacional totalmente desconocida, sobre la cual
tan solo se realizan suposiciones muy generales como, por ejemplo:
(número de armas de fuego en la Zona 5).
1. Generacional.
Al realizar el análisis estadístico se observa que tanto la víctima
como el victimario están en un rango de edad de 20 a 25 años; se
denomina violencia o delincuencia generacional.
2. Intergeneracional.
Durante el análisis estadístico se observa que la víctima está en un
rango de edad de 65 a 70 años y el victimario están en un rango de edad
de 20 a 25 años; se denomina violencia o delincuencia
intergeneracional.
UNIDAD II
2.1. Medidas
1. Media Aritmética.
Se le conoce como PROMEDIO, es el valor obtenido al sumar
todos los datos y dividir el resultado entre el número total de datos.
Fórmula:
̅
12
∑
̅
Dónde:
= marca de clase
= frecuencia
Marca de clase f
Xi *fi
( ) i
(10 – 20) 15 1 15
1
(30 – 40) 35 350
0
4
TOTAL 1.820
2
Tabla Nro. 1 Marca de Clase
Fuente: Propia
2. Mediana.
a. Mediana simple
Es el valor central de un conjunto de valores ordenados en
forma creciente o decreciente. La mediana solo se puede hallar para
variables de tipo cuantitativo, es decir, la mediana deja un mismo
número de valores antes y después de él, en un conjunto de valores
ordenados, se representa con las letras Md.
Ejemplo:
14
Enero: 8.25; febrero 7.13; marzo 9.55; abril 5.85; mayo 6.75 y junio
7.70
MES NOTA
Enero 8,25
Febrero 7,13
Marzo 9,55
Abril 5,85
Mayo 6,75
Junio 7,70
MES NOTA
Marzo 9,55
Enero 8,25
Junio 7,70
Febrero 7,13
Mayo 6,75
Abril 5,85
15
MES NOTA
Marzo 9,55
Enero 8,25
Junio 7,70
Febrero 7,13
Mayo 6,75
Abril 5,85
Es decir que el promedio 7,53 está ubicado entre 7,70 y 7,13. Una
vez obtenidos esos datos procedemos a realizar el cálculo de la
Mediana simple.
MES NOTA
Marzo 9,55
Enero 8,25
Junio 7,70
Febrero 7,13
Mayo 6,75
16
Dónde:
Intervalos Fi Fa
(60 – 63) 5 5
(63 – 66) 18 23
(66 – 69) 42 65
(69 – 72) 27 92
(72 – 75) 8 100
TOTAL (n) 100
17
3. Moda
a. Moda simple.
Es el valor que más se repite en un conjunto de datos, si en un
conjunto de valores, no se repite ningún valor, entonces no hay
moda o también puede existir más de una moda en una serie de
datos; esta medida se puede utilizar para datos cualitativos
identificando el dato modal como el que más se repite.
Ejemplos:
La serie de datos:
2 2 5 7 9 9 9 10 10 11 12 18
La serie de datos:
18
3 5 8 10 12 15 16
La serie de datos:
2 3 4 4 4 5 5 7 7 7 9
Fórmula:
Ejemplo:
19
Intervalos Fi
(60 – 63) 5
(63 – 66) 18
(66 – 69) 42
(69 – 72) 27
(72 – 75) 8
TOTAL (n) 100
Para calcular las medidas de posición es necesario que los datos están
ordenados de menor a mayor.
1. Cuartiles.
Permiten dividir un conjunto de datos en cuatro partes iguales y
sumados nos da el 100%.
𝑸𝒊
Qi=∑ 𝒏
𝟏𝟎𝟎
∑n = Total de datos.
Qi = valor del cuartil
Ejemplos:
Obtener el cuartil 2 del siguiente conjunto de calificaciones:
NOTAS DATOS
6 7
8 7
7 6
5 4
1 3
4 3
10 3
2 2
3 2
9 2
0 1
TOTAL (n) 40
NOTAS DATOS fa
0 1 1
1 3 4
2 2 6
3 2 8
4 3 11
5 4 15
6 7 22
7 6 28
8 7 35
9 2 37
10 3 40
TOTAL (n) 40
𝑸𝒊
Qi=∑ 𝒏
𝟏𝟎𝟎
𝟓𝟎
Q2 = 40 *
𝟏𝟎𝟎
Q2 = 40 * 𝟎 𝟓
Q2 = 20
Por lo tanto, decimos que el 50% de los alumnos tienen una calificación
igual o menor que 6 puntos.
22
2. Deciles.
Dividen al conjunto de datos en 10 partes iguales y sumados nos da
100%.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Decil 1 Decil 2 Decil 3 Decil 4 Decil 5 Decil 6 Decil 7 Decil 8 Decil 9 Decil 10
𝑫𝒊
Di=∑ 𝒏
𝟏𝟎𝟎
∑n = Total de datos.
Di = valor del decil
Ejemplos:
Obtener el decil 7 del siguiente conjunto de calificaciones:
NOTAS DATOS
6 7
8 7
7 6
5 4
1 3
4 3
10 3
2 2
3 2
9 2
0 1
TOTAL (n) 40
23
NOTAS DATOS fa
0 1 1
1 3 4
2 2 6
3 2 8
4 3 11
5 4 15
6 7 22
7 6 28
8 7 35
9 2 37
10 3 40
TOTAL (n) 40
𝑫𝒊
Di=∑ 𝒏
𝟏𝟎𝟎
𝟕𝟎
D7 = 40 *
𝟏𝟎𝟎
D7 = 40 * 𝟎 𝟕
D7 = 28
24
Por lo tanto, decimos que el 70% de los alumnos tienen una calificación
igual o menor que 7 puntos.
3. Percentiles.
Dividen al conjunto de datos en 100 partes iguales y sumados nos da
100%.
1% 1% 1% 1% …. …. …. …. 1% 1%
𝑷𝒊
Pi = ∑ 𝒏
𝟏𝟎𝟎
∑n = Total de datos.
Pi = valor del percentil.
Ejemplos:
Obtener el percentil 80 del siguiente conjunto de calificaciones:
NOTAS DATOS
6 7
8 7
7 6
5 4
1 3
4 3
10 3
2 2
3 2
9 2
0 1
TOTAL (n) 40
25
NOTAS DATOS fa
0 1 1
1 3 4
2 2 6
3 2 8
4 3 11
5 4 15
6 7 22
7 6 28
8 7 35
9 2 37
10 3 40
TOTAL (n) 40
𝑷𝒊
Pi=∑ 𝒏
𝟏𝟎𝟎
𝟖𝟎
P80 = 40 *
𝟏𝟎𝟎
P80 = 40 * 𝟎 𝟖
D80 = 32
26
Por lo tanto, decimos que el 80% de los alumnos tienen una calificación
igual o menor que 8 puntos.
1. Rango.
Es la diferencia entre el valor máximo y el mínimo en nuestros
datos, esta medida de dispersión, aunque es la más fácil de obtener, pon
lo general es muy poco usada, se puede simbolizar con la letra R.
2. Desviación media.
a. Desviación media simple
La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media, se representa con
la letra DM y su fórmula de cálculo es la siguiente:
∑| ̅|
9 3 8 8 9 8 9 18
̅
28
∑| ̅|
| | | | | | | | | | | | | | | |
DM = 2.25
∑| ̅|
Marca |
Intervalo fi Xm*fi | ̅|
de clase ( ) ̅ |*fi
(10 – 15) 12,5 3 37,5 9,286 27,858
(15 – 20) 17,5 5 87,5 4,286 21,43
(20 – 25) 22,5 7 157,5 0,714 4,998
(25 – 30) 27,5 4 110,0 5,714 22,856
(30 – 35) 32,5 2 65,0 10,714 21,428
TOTAL 21 457.5 98,57
̅
29
| | | | | |
3. Varianza.
a. Varianza simple
La varianza es una medida estadística que mide la dispersión de
los valores respecto a un valor central (media), es decir, es el
cuadrado de las desviaciones. Su fórmula de cálculo es la siguiente:
̅ ̅ ̅ ̅
𝜎
∑ ̅
𝜎
9 3 8 8 9 8 9 18
̅
2 2 2 2 2 2 2 2
9 9 + 3 9 + 8 9 + 8 9 + 9 9 + 8 9 + 9 9 + 18 9
𝜎2 =
𝜎 8
̅ ̅ ̅ ̅
𝜎
30
∑ ̅
𝜎
Intervalo Marca fi Xm ̅
de clase ( ) *fi
(10 – 15 1 15 802,5889
20)
(20 – 25 8 200 2.687,9112
30)
(30 – 35 10 350 693,889
40)
(40 – 45 9 405 25,1001
50)
(50 – 55 8 440 1.089,5112
60)
(60 – 65 4 260 1.878,3556
70)
(70 – 75 2 150 2.005,9778
80)
TOTAL 42 1.820 9.183,3338
𝜎
31
4. Desviación típica.
a. Desviación típica o estándar
Es la raíz cuadrada de la varianza, se representa a través de la
siguiente expresión: σ o S
̅ ̅ ̅ ̅
𝜎 √
∑ ̅
𝜎 √
E
Intervalo
j Marca fi Xm ̅
e de clase ( ) *fi
(10 – 20)
m 15 1 15 802,5889
(20 – 30)
p 25 8 200 2.687,9112
(30 – 40)
l 35 10 350 693,889
(40 – 50)
o 45 9 405 25,1001
:
(50 – 60) 55 8 440 1.089,5112
(60 – 70) 65 4 260 1.878,3556
(70 – 80) 75 2 150 2.005,9778
TOTAL 42 1.820 9.183,3338
𝜎 √
32
5. Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el nivel
de dispersión de las, cuando más apegado a 0 los datos son más
idénticos.
𝜎
̅
CV= 0,3412
33
UNIDAD III
Fórmula:
V.A= Cantidad actual – cantidad anterior
Fórmula:
35
El Peso Porcentual de los robos a personas del mes de agosto del año
2020 es del 23%, es decir, el mes de agosto aporta con el 23% de los robos
a personas durante el año 2020.
36
UNIDAD IV
4.1. Cuadros
Ejemplo:
Ejemplo:
BOLIVIAl 25 27 8,00% 2
ECUADORa 23 25 8,70% 2
PANAMÁ 21 19 -9,52% -2
COLOMBIA 19 17 -10,53% -2
TOTAL DENUNCIAS
r 88 88 0,00% 0
1. Diagrama de Sectores.
Se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.
Figura Nro. 1
Serie de incidencias
de estafa
2. Diagrama de barras.
Un diagrama de barras se utiliza para de presentar datos cualitativos
o datos cuantitativos de tipo discreto.
Figura Nro. 2
Serie de delitos por
Subzonas
40
4. Polígono de frecuencia.
Para construir el polígono de frecuencia se toma la marca de clase
que coincide con el punto medio de cada rectángulo.
Figura Nro. 4
Serie Polígono
de
frecuencias delictual
42
GLOSARIO
Deductivo: El método deductivo consiste en extraer una conclusión con base en una
premisa o a una serie de proposiciones que se asumen como verdaderas
Rango. El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística.
Posición. Las medidas de posición son indicadores estadísticos que permiten resumir los
datos en uno solo, o dividir su distribución en intervalos del mismo tamaño.
Cuartiles. Los cuartiles son una herramienta que usamos en la estadística y que nos sirve
para administrar grupos de datos previamente ordenados
Serie. Una serie temporal es una variable estadística cuyas observaciones están ordenadas
temporalmente.
45
BIBLIOGRAFÍA
Lind, Douglas; Mason, Robert & Marchall, William. 2010. Estadística para
Administración y Economía. México D.F., México: McGraw-Hill.
NETGRAFÍA
Saéz, Castillo, José. (2010). Estadística para Ingenieros. Universidad de Jaén. España.
[Link]
[Link]
[Link]
stad%C3%ADstica+inferencial&ots=G0MFLz24en&sig=gr9zeFBtyLV8P4o8ahmqtc-
IhtQ#v=onepage&q=estad%C3%ADstica%20inferencial&f=false
47