Introducción a la Estadística Aplicada
Introducción a la Estadística Aplicada
Sesión 01
PRESENTACION DE
LOS DATOS
“ CONTENIDO TEMATICO
❑Conceptos Básicos
❑Tablas de Frecuencias
❑Gráficos estadísticos
3
CONCEPTOS
BÁSICOS
4
“
¿POR QUÉ ESTUDIAR ESTADISTICA?
Para desarrollar el
pensamiento analítico
y crítico del alumno.
5
“
DEFINICIÓN
. analizar e interpretar un
conjunto de datos
6
“
DEFINICIÓN
• en situaciones de incertidumbre,
trabaja con ella y orienta para
Ayuda tomar las decisiones con un
determinado grado de confianza.
7
“
CLASIFICACION
8
“
ESTADISTICA DESCRIPTIVA
Recolección, clasificación,
presentación y
descripción de los datos.
Describir y analizar un grupo de
datos, sin sacar conclusiones
sobre un grupo mayor.
11
“
OBJETIVO DE LA ESTADÍSTICA
DESCRIPTIVA
ANALÍTICA
PREDICTIVA
13
“
FUNCIÓN DESCRIPTIVA
Permite que los datos que están expresados en su forma natural:
15
“
FUNCIÓN PREDICTIVA
Permite estimar los resultados que ocurrirán en
el futuro.
Esta estimación dependerá del grado de
conocimiento del comportamiento pasado y
presente de las variables en estudio.
18
19
TERMINOLOGIA
TECNICA DE MUESTREO
UNIDAD
UNIVERSO POBLACION MUESTRA ESTADISTICA
Ejemplo:
Todos los alumnos de la Universidad
Nacional Mayor de San Marcos.
Todos los meses de los años 20
“
POBLACIÓN
Es la totalidad de individuos o elementos que poseen alguna
característica común susceptible de ser estudiada.
Es la totalidad de las unidades de análisis.
Ejemplos:
• Todos los alumnos del la Facultad de Ingeniaría Industrial
de la UNMSM
• Todos los meses comprendidos durante el periodo 2010- 21
2015.
“
POBLACIÓN
• Cuando es posible enumerar todos
sus elementos de tal manera que
haya un primero y un último
elemento.
Finita • Al número de elementos de una
población finita se le denota por N.
22
“
MUESTRA
Se toman muestras cuando es difícil o costoso observar
todos los elementos de la población.
El número de elementos de la muestra se denota por n.
Al proceso de obtener la muestra se llama muestreo.
TERMINOLOGIA
UNIVERSO
POBLACIÓN
MUESTRA
UNIDAD
ESTADÍSTICA
“
VARIABLE
Son observables y susceptibles de tomar distintos valores
o ser expresados en diferentes categorías.
Es una característica o propiedad determinada del
individuo, sea medible o no.
26
27
TIPOS DE VARIABLE
CUALITATIVAS CUANTITATIVAS
“
VARIABLES CUALITATIVAS
Cuando se refieren a características, atributos o
actitudes.
Son variables cuyos valores consisten
en categorías de clasificación, es decir
se refieren a la cualidad que presenta la
población.
Ejemplos:
• Estado Civil
Sus resultados no son numéricos
• Nivel socioeconómico
• Lugar de Procedencia
• Marca de PC
• Color favorito 28
• Ciclo de estudios.
“
VARIABLE CUALITATIVA NOMINAL
Ejemplos:
CUALITATIVA CUANTITATIVA
•Color de ojos
• Profesión
• Partido político
NOMINAL • Sexo
• Raza
• Nacionalidad
• Curso favorito 29
ORDINAL
• Estado Civil
• Religión
“
VARIABLE CUALITATIVA ORDINAL
30
“
VARIABLES CUANTITATIVAS
Ejemplos:
• Estatura
• Peso
• Número de PC’s
• Temperatura
• Ingresos
• Cociente intelectual 31
“
VARIABLES CUANTITATIVAS DISCRETAS
Cuando asumen valores numéricos aislados y no pueden tomar
ningún valor entre dos consecutivos.
Son contables. Se asocian con los números naturales.
Ejemplos:
CUALITATIVA CUANTITATIVA • Número de hijos.
• Número de computadoras en
reparación.
DISCRETAS • Número de cursos aprobados
• Nº Horas de Estudio
CONTINUAS
• Velocidad
33
“
DATO ESTADÍSTICO
▸ Es el valor o respuesta que adquiere la variable
en cada unidad de análisis.
▸ Son números o medidas que han sido recopilados
como resultado de observaciones, que pueden ser
comparados, analizados e interpretados.
▸ Los datos son la materia prima de la estadística.
Ejemplos:
• 50, 55, 70, 48 , 56, .....
(Peso).
• Lima, Ica, Huancayo,.....
(Lugar de procedencia).
• 3, 1, 2, 4, 0, .... (Nº de cursos desaprobados)
34
• Alto, Medio, Bajo (Nivel Socioeconómico)
“
PARÁMETRO
37
“
ESTADÍSTICO
39
“
PROPORCIÓN
Ejemplo:
▸Se tiene una población de 1200 ingenieros industriales
compuesta por 300 mujeres y 900 hombres, entonces la proporción
de hombres será:
▸ P= 900
1200
=
3
4= 0,75
40
“
PORCENTAJE
Porcentaje
Es la proporción multiplicada por 100.
Permite comparar dos o más series
estadísticas cuyos totales son
diferentes pues quedan reducidos a
100.
Expresa el tanto por 100.
41
“
PORCENTAJE
Ejemplo:
▸Se tiene una población de 1600 ingenieros compuesta por 600
mujeres y 1000 hombres, entonces el porcentaje de mujeres será:
600
P% = 100 = 37,5%
1600
42
TABLA
UNIDIMENSIONAL
DE DISTRIBUCIÓN
DE FRECUENCIAS
43
“
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
44
“
W León V
TABLA DE FRECUENCIA
45
“
W León V
ELEMENTOS DE LA TABLA
46
“
W León V
VALOR DE LA VARIABLE Xi
47
“
W León V
VALOR DE LA VARIABLE Xi
Ejemplo:
Edad
Xi
19
21
22
24
48
“
W León V
INTERVALO DE CLASE Ii
Ii : I1 , I2 , I3 , ............. , Ik
k : es el número de intervalos.
49
“
W León V
INTERVALO DE CLASE li
Ejemplo:
Ii : [Edad[
15-20
20-25
25-30
30-35
Límite Límite 50
inferior superior
“
W León V
INTERVALO DE CLASE Ii
51
“
W León V
INTERVALO DE CLASE Ii
Límites Aparentes Límites Reales.-
[Nº de [LR[
computadoras]
10-14 9.5-14.5
15-19 14.5-19.5
20-24 19.5-24.5
25-29 24.5-27.5
-0.5 +0.5
52
“
W León V
MARCA DE CLASE Xi
L i+ Ls
Xi =
2
53
“
W León V
MARCA DE CLASE Xi
Ejemplo:
Ii : Edad Xi
15-20 17.5
20-25 22.5
25-30 27.5
30-35 32.5
54
“
W León V
55
“
W León V
FRECUENCIA ABSOLUTA DE CLASE fi
Ejemplo:
Xi fi
Edad Nº de f3 = 10
personas
diez personas
18 6 tienen 21 años.
19 2
21 10
23 4
total n = 22 56
“
W León V
Ejemplo:
fi f2 = 9 → nueve
Ii : Edad Nº personas personas tienen
una edad de 20 a
15-20 4 menos de 25 años.
20-25 9
25-30 3
30-35 12
total n = 28
57
“
W León V
fi hi% = hi 100
hi =
n
59
“
W León V
60
“
W León V
h
i =1
i =1
h % = 100
i =1
i
61
“
W León V
f1 Fi n Fk = n
62
“
W León V
Ejemplo:
Edad Nº de hi hi% Nº de
Xi Personas Personas
fi Fi
18 6 6
19 2 8
21 10 18
23 4 22
total n = 22 -
Proporción: Porcentaje:
Hi % = Hi 100
64
“
W León V
65
“
W León V
PRESENTAR UNA TABLA DE FRECUENCIAS
Azul 6 0,23 23
Rojo 10 0,38 38
Negro 2 0,08 8
Blanco 8 0,31 31
total n = 26 1,00 100
f1 = 6 → Seis personas tienen como color favorito el azul.
h3 = 0,08 → La proporción de personas que prefieren el color negro es 0,08.
h2% = 38% → El 38% de las personas prefieren el color rojo. 66
“
W León V
67
“
W León V
PRESENTAR UNA TABLA DE FRECUENCIAS
Ejemplo a) Cualitativa ordinal
Grado Nº de Proporción de Porcentaje Nº de Propor. de Porcentaje de
Instrucción Mujeres Mujeres de Mujeres Mujeres Mujeres Mujeres
Xi Hi
fi Hi Hi% Fi Hi%
69
“
W León V
70
“
W León V
14-18 9
18-22 12
22-26 6
26-30 8
71
Total n=
“
W León V
15-18 8
19-22 10
23-26 4
Total n= 72
“
W León V
R = Xmáx − X mín
73
“
W León V
k 1 + 3,3 log ( n )
R
A =
k
75
“
W León V
76
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON
INTERVALOS
Si la variable Si la variable
es continua : es discreta :
Ii : Li-1 Li Ii : Li-1 Li
20 - 30 20 - 29
30 - 40 30 - 39
40 - 50 40 - 49
50 – 60 50 - 59
A= Ls - Li A= Ls – Li +1
A= 30-20=10 A= 29-20+1=10
77
“
W León V
78
“
W León V
C A B B C C F
D A B D A B C
D C A B B F D
F B C
79
“
W León V
80
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON
INTERVALOS
b) Construir una tabla de frecuencias adecuada.
TABLA Nº 1
Alumnos de la Fac. de Ing. Industrial de la UNMSM según calificaciones
Calificación Nº de Prop.de % de Nº de Prop.de % de
Xi Alumns Alumnos Alumns Alumnos Alumns Alumnos
fi hi h i% Fi Hi Hi%
F 3
D 4
C 6
B 7
A 4
81
“
W León V
F 3 0,12 12 3 0,12 12
D 4 0,17 17 7 0,29 29
C 6 0,25 25 13 0,54 54
B 7 0,29 29 20 0,83 83
83
“
W León V
Ejemplo 2:
2.-Se aplicó una encuesta a 27 trabajadores de la empresa A y se les
preguntó su edad,
84
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON
INTERVALOS
85
“
W León V
86
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON INTERVALOS
▸ A=4 Valor mínimo =17
▸ Si se sabe que la amplitud se aplica en función al tipo de variable
La amplitud para una variable La amplitud para una variable
cuantitativa continua es: cuantitativa discreta es:
87
“
W León V
TABLA Nº 2
Trabajadores de la empresa A clasificados según edad.
17-21 19 4
21-25 23 6
25-29 27 4
29-33 31 10
33-37 35 2
37-41 39 1
TOTAL 27 88
“
W León V
TABLA Nº 2
Trabajadores de la empresa A clasificados según edad.
90
“
W León V
23 20 24 36 21 34
18 17 17 29 30 26
28 15 21 32 40 35
32 16 31 33 19 30
18 42 22 37 20 32
91
“
W León V
R = 42 - 15 = 27
A = 27/6 = 4,5
A=5
93
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON INTERVALOS
▸ A=5 Valor mínimo =15
▸ Si se sabe que la amplitud se aplica en función al tipo de
variable
La amplitud para una variable La amplitud para una variable
cuantitativa continua es: cuantitativa discreta es:
94
“
W León V
20-24 22 7
25-29 27 3
30-34 32 8
35-39 37 3
40-44 42 2
TOTAL 30 95
“
W León V
CONSTRUCCIÓN DE UNA TABLA CON INTERVALOS
TABLA Nº 3
Núm de computadoras vendidas por mes durante el periodo 2000-2004
▸ c) Interpretar: f , F , H , H %
2 4 3 2
▸ f =7
2 Hay 7 meses en los que se vendieron de 20 a 24 PCs.
▸ h = 0,07 0,07 es la proporción de meses en los que se vendieron
6
de 40 a 44 PCs.
▸ h % = 23% En el 235 de los meses se vendieron de 15 a 19 PCs.
1
▸ F = 25
4 Hay 25 meses en los que se vendieron de 15 a 34 PCs.
▸ H = 0,57 En una proporción de 0,57 están los meses en que se
3
vendieron de 15 a 29 PCs.
▸ H % = 47% En el 47% de los meses se vendieron de 15 a 24 PCs.
2
97
W León V
GRÁFICOS
ESTADÍSTICOS
98
“
W León V
99
“
W León V
GRÁFICOS ESTADÍSTICOS
INTRODUCCIÓN
100
“
W León V
GRÁFICOS ESTADÍSTICOS
DEFINICIÓN
101
102 TIPOS DE GRÁFICOS
Gráfico de barras
Un gráfico de barras es una representación gráfica en un eje cartesiano de las frecuencias de una
variable cualitativa o discreta.
Producción de cereales en España. 2007
Millones de toneladas
Producción Agrícola 2007
Cereales Miles de toneladas
Cebada 11.945
Trigo Avena 6.436
Centeno 4.310
261
En uno de los ejes se posicionan las distintas categorías o modalidades de la variable cualitativa o
discreta (en el ejemplo, el tipo de cereal) y en el otro el valor o frecuencia de cada categoría en una
determinada escala (en el ejemplo, la producción en millones de toneladas de granos).
103 TIPOS DE GRÁFICOS
Gráfico de barras
La orientación del gráfico puede ser:
• Vertical: las distintas categorías están situadas en el eje horizontal y las barras de frecuencias
crecen verticalmente.
• Horizontal: las categorías se sitúan en el eje vertical y las barras crecen horizontalmente.
Suelen usarse cuando hay muchas categorías o sus nombres son demasiado largos.
Las categorías pueden ordenarse alfabéticamente facilitando su búsqueda o por sus frecuencias
facilitando la comparación de los datos. Veamos el siguiente ejemplo del porcentaje habitantes usuarios
de internet del año 2007 por países (Fuente: Unión Internacional de Telecomunicaciones).
Alemania
España
Francia
Grecia
Países Bajos
Portugal
Países Alemania España Francia Portugal Grecia Rumanía
Rumanía
104 TIPOS DE GRÁFICOS
Gráfico de barras Producción de cereales. 2008
Millones de toneladas
• Comparar magnitudes de
varias categorías.
• Ver la evolución en el
tiempo de una magnitud
concreta.
• Agrupado:
Contiene varias series de datos y cada una se
representa por un tipo de barra de un mismo color o Ciencias de la Humanidades y Ciencias Tecnología
Artes
textura. Naturaleza y de la Sociales
Salud
• Apilado:
Contiene varias series de datos. La barra se divide en
segmentos de diferentes colores o texturas y cada uno de
ellos representa una serie.
Artes Ciencias de la Humanidades Tecnología
Naturaleza y de la y Ciencias
Salud Sociales
Fuente: Ministerio de Educación. Curso 2006/07
106 TIPOS DE GRÁFICOS
Gráfico de barras
•Histograma:
Se usa para representar las frecuencias de una variable cuantitativa continua.
En uno de los ejes se posicionan las clases de la variable continua (los intervalos o las marcas de clase
que son los puntos medios de cada intervalo) y en el otro eje las frecuencias. No existe separación entre
las barras.
Euros
Fuente: Encuesta de Presupuestos Familiares. INE
107 TIPOS DE GRÁFICOS
Gráfico de barras
•Bi-direccional:
Tiene orientación horizontal y contiene dos series de datos cuyas barras de frecuencias crecen
en sentidos opuestos. Las más comunes son las pirámides de población de las que hablaremos
más adelante.
Consumo de tabaco según sexo y grupos de edad
Fumadores diarios (porcentajes)
75 y más
Varones Mujeres
De 65 a 74
De 55 a 64
De 45 a 54
De 35 a 44
De 25 a 34
De 16 a 24
50 40 30 20 10 0 10 20 30 40
0 Doctorado
2005 2006 2007 2008 2009
Fuente: Encuesta de Población Activa. INE
110 TIPOS DE GRÁFICOS
Gráfico de líneas
Casos particulares:
• Si se unen los puntos medios de las bases superiores de las barras en los gráficos de barra se obtiene el polígono de frecuencias.
El círculo representa la totalidad que se quiere observar (en el ejemplo, total de viajeros hospedados en hoteles) y cada porción, llamadas
sectores, representan la proporción de cada categoría de la variable (en el ejemplo, tipo de hotel) respecto el total. Suele expresarse en
porcentajes.
112 TIPOS DE GRÁFICOS
Gráfico de sectores
Obtención de los ángulos de cada sector:
Categoría Frecuencia absoluta Frecuencia relativa Porcentaje (% )
Cinco estrellas 4.216.253 0,06 6
Cuatro estrellas 31.960.442 0,46 46
Tres estrellas 24.079.125 0,35 35
Dos estrellas 6.331.715 0,09 9
Una estrella 2.565.219 0,04 4
Total 69.152.754 1,00 100
Aceites de cocina
• Símbolo o figuras cuyas áreas representan las frecuencias de cada categoría de la variable.
Envases de plástico, Pilas y pequeñas
Aceites de cocina Medicamentos Papel y cartón Vidrio
metálicos baterías
24 69,5 71,8 72,3 74,5 75,3
115 TIPOS DE GRÁFICOS
Gráfico de dispersión
Un gráfico de dispersión muestra en un eje cartesiano la relación que existe entre dos variables.
País Fertilizantes Nitrogenados* Produccion agrícola**