Estadística
Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los últimos años.
¿En qué áreas se aplica la estadística?
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas,
entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto
antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.
1
Estadística
Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de
salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
2
Estadística
Introducción
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado
método científico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y
precisar el universo o población.
2) Recogida de la información: consiste en recolectar los datos necesarios
relacionados al problema de investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la
información relevante en el estudio.
4) Inferencia estadística: consiste en suponer un modelo para toda la población
partiendo de los datos analizados para obtener conclusiones generales.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la población
3
Estadística
Introducción
Esquema de las etapas de un estudio estadístico
AREA DE INTERES DATOS
ORGANIZAR Y RESUMIR
Tema de Investigación ESTADÍSTICA DESCRIPTIVA
(Tablas,
-Antecedentes Previos
Gráficos, Medidas
-Objetivos Descriptivas, etc.)
INTERPRETACIÓN
-Preguntas de Investigación
Muestra
-Posibles Hipótesis
¿Población o Muestra?
-Unidad de Análisis
INFERENCIA ESTADÍSTICA
-Población Población
-Variables CONCLUSIONES
Probabilidad
INFORMACIÓN
4
Estadística
Introducción
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo.
2) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a
vestuario, alimentación, ocio y vivienda.
3) Se quiere determinar las tallas estándar en vestuario para mujeres.
4) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de
educación.
5) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una
Universidad, y si éste tiene alguna relación con su edad u otras características.
5
Estadística
Resumen de algunos conceptos planteados en la Introducción
• VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE
ANÁLISIS.
• ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una
Población o una: Muestra
• POBLACIÓN Es el total de unidades de análisis que son tema de estudio.
• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.
Población: Muestra
“Las personas que
Muestra: 60 trabajadores de empresas de comunicación
trabajan en empresas de
Unidad de análisis: Trabajador de empresa de comunicación
comunicación”
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.
6
Estadística
Variable: corresponde a la característica de la Unidad de Análisis
TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo
Toma valores enteros Característica o cualidad
cuyas categorías no tienen
Ejemplos: Número de Hijos, Número de un orden preestablecido.
empleados de una empresa, Número de
asignaturas aprobadas en un semestre, etc. Ejemplos: Sexo, Deporte
Favorito, etc.
Toma cualquier valor dentro de un intervalo
Característica o cualidad cuyas
Ejemplos: Peso; Estatura; Temperatura, etc. categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.
7
Unidad de Medida:
Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
Estadística
Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se
presenta una característica.
Variable Variable Variable Variable
Cuantitativa Cualitativa Cualitativa Cuantitativa
CONTINUA NOMINAL NOMINAL CONTINUA
DISCRETA ORDINAL ORDINAL DISCRETA
Frecuencia Absoluta (F) Frecuencia Relativa (f)
TIPO FRECUENCIA
Frecuencia Absoluta Frecuencia Relativa
Acumulada (FAA) Acumulada (fra)
8
Estadística
Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en
EJEMPLO función de algunas características.
TABLAS DE Unidad de Análisis:
Análisis: Industria de Conserva
FRECUENCIA Población:
Población: Industrias de Conservas del país
Tipo de Frecuencia Frecuencia Porcentaje Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Industria Absoluta (F j) Relativa (fj) (%) Calificación Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
A Muy Bien
B Bien
C Regular
D Mal 300 1 (o 100)
Total 300 1 100 Total 300 1 (o 100)
(2)
(1) Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Empleados Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
. (3)
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
(4) [200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%) 9
Estadística
Elementos de una tabla de frecuencia cuando la variable es continua (x)
Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1
cj = (LIj) + LSj )/2 aj = (LSj – LIj))
10
Estadística
Ejercicio: confección de una tabla de frecuencia para una variable continua
Los datos corresponden a la edad de los hijos de los
trabajadores de una empresa
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -
Datos ordenados de menor a mayor
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -
11
Estadística
TIPOS DE 1. Gráfico de Sectores Circulares (de Torta)
GRÁFICOS
Distribución de las unidades de
análisis de acuerdo a variable 1
Distribución de las unidades de análisis de
acuerdo a variable 1 D
10% A
20%
C
D A 40% B
10% 20% 30%
Distribución de las unidades de
análisis de acuerdo a variable 1
C B
40% 30%
D A
10% 20%
C
B
40%
30%
12
Estadística
TIPOS DE 2. Gráfico de Barras
GRÁFICOS
Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a
variable 1
de acuerdo a variable 1
D
500
variable 1
400 C
300
B
Nº
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1
C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis
grupos. 13
Estadística
TIPOS DE 3. Histograma
GRÁFICOS Histograma
Histograma
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
10
Frecuencia
- El eje x se refiere a la
Nº
5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14
edad
edad
- Cada barra representa la
Ejemplo
frecuencia de la variable en la
población en estudio (o la
En el gráfico se puede observar el número de muestra).
hijos , de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de -El histograma se puede
hijos de los trabajadores están entre los 10 y 12 construir desde los datos de la
años. tabla de frecuencia de la
variable en estudio.
14
Estadística
TIPOS DE 5. Polígono de Frecuencia
GRÁFICOS
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad
15
-Esta representación se basa en
el Histograma.
10 -Sólo es útil para variables
Frecuencia
edad cuantitativas.
Nº
5
-El eje x se refiere a la
variable.
0
7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
15
Estadística
TIPOS DE 5. Diagrama de Caja
GRÁFICOS
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
100
90
80
70
60 - Permite identificar gráficamente la
mediana, los cuartiles 1 y 3
Edad
50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
30 - Sólo es útil para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 16
Estadística
TIPOS DE 6. Otros
GRÁFICOS
Número de alumnos matriculados en la Número de alumnos matriculados en la
Carrera A según año de ingreso Carrera B según año de ingreso
100 100
Nº de alumnos
Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso
Número de alumnos matriculados en las Carreras
según año de ingreso
Nº de alumnos
200
año de ingreso Carrera A Carrera B
Nº de alumnos
1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
0
2003 70 75
1998 1999 2000 2001 2002 2003
Carrera B año ingreso
Carrera A 17
Estadística
-Media Aritmética (Promedio)
MEDIDAS DE TENDENCIA CENTRAL -Mediana
-Moda
Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor
x x Mediana
x
1 Media Aritmética o Promedio
x
(
1) M E x( k ) Si n es impar
x n
x
2
xi (
2)
x( k ) x( k 1) Si n es par
x i 1 ME
2
x n x
n (
n) x( k ) dato del centro
Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"
18
Estadística
-Percentil (ejemplo: 25, 50, 75)
Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los
n datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 19
Estadística
-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar
Datos Cuantitativos Varianza
x Rango n n
1 n
x ( xi x ) 2
x ( xi ) 2
n i 1
2
i
1 n 2
1 R max( xi ) min( xi ) s 2 i 1 i 1
xi x 2
x
2 n n n i 1
Desviación Típica o Estándar
x
n
s s2
Comparación entre Variables
Coeficiente de Variación
Se refiere al comportamiento de las variables cuantitativas en
s
un grupo. Por ejemplo: Si se tiene un conjunto de personas a las cv
que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál x
presenta mayor variación? 20
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.
n
Si CA=0 si la distribución es simétrica alrededor de la media.
(x
i 1
i x)3
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA Si CA>0 si la distribución es asimétrica a la derecha
n s3
n
- Si CAp=0 la distribución se dice normal (similar
( xi x ) 4
i 1
a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento CAp nombre de mesocúrtica.
n s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
21
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetría y apuntamiento
14 30 6
12 5
10
20 4
8
3
10 2
4
1 Desv. típ. = 2,42
2 Desv. típ. = 1,67 Desv. típ. = ,64
Media = 3,9 Media = 0,0 Media = 5,2
N = 30,00 N = 30,00 0 N = 28,00
0 0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 -1,0 0,0 1,0 2,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
V2 V4 V5
22
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos
Datos Histograma Medidas descriptivas
16
1 4 4 Media 3,9
14
1 4 4 Mediana 4
1 4 5
12 Moda 4
2 4 5 10 Desviación estándar 1,67
2 4 6 Varianza de la muestra 2,78
8
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetría -0,02
3 4 6 4 Rango 6
3 4 7 2
Desv. típ. = 1,77 Mínimo 1
Media = 5,4
4 4 7 N = 66,00
Máximo 7
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Cuenta 30
V1
23
Estadística
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento
para datos Agrupados (tabla de frecuencias)
Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos
Centro agrupados esta dada por:
Intervalo de clase Amplitud F f FAA fra
k
n1 f1
I1
I2
c1
c2
a1
a2 n2 f2
sc (c
j 1
j xc ) 2 f j
.
.
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetría para
Total n 1 datos agrupados esta dado por:
k
Sea cj la marca de clase (o centro de clase) y fj la (c
j 1
j xc ) 3 f j
frecuencia relativa de la clase j, donde j=1, 2,…, k. CAc
s c3
1) La Media para datos agrupados es igual a
la suma de los productos de las marcas de 4) El Coeficiente de apuntamiento para
clase por sus frecuencias relativas, de la forma: datos agrupados esta dada por:
k
(c
k
Mediac x c c j f j j xc ) 4 f j
j 1
j 1 CAp c
s c4
24