Unidad I.
Conceptos Básicos y
Estadística Descriptiva
MsC. SOLAMITA CHULVE FIGUEROA
La Estadística es la parte de las Matemáticas que se
encarga del estudio de una determinada característica en
una población, recogiendo los datos, organizándolos en
tablas, representándolos gráficamente y analizándolos
para sacar conclusiones de dicha población.
Estadística descriptiva. Realiza el estudio sobre la
población completa, observando una característica
de la misma y calculando unos parámetros que den
información global de toda la población.
Estadística inferencial. Realiza el estudio
descriptivo sobre un subconjunto de la población
llamado muestra y, posteriormente, extiende los
resultados obtenidos a toda la población.
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y
presentación de los datos referentes a un
iv fenómeno que presenta variabilidad o
a
t
r ip incertidumbre para su estudio metódico, con
e sc objeto de
D
• deducir las leyes que rigen esos fenómenos,
a d
ilid
ab
r ob
P • y poder de esa forma hacer previsiones sobre
ilos
a mismos, tomar decisiones u obtener
n c conclusiones.
re
n fe
I
5
Pasos en un estudio estadístico
Plantear hipótesis sobre una población
Los fumadores tienen “más bajas” laborales que los no fumadores
¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
Decidir qué datos recoger (diseño de experimentos)
Qué individuos pertenecerán al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
enfermedades crónicas?
Qué datos recoger de los mismos (variables)
Número de bajas
Tiempo de duración de cada baja
¿Sexo? ¿Sector laboral? ¿Otros factores?
Recoger los datos (muestreo) No tenéis que
¿Estratificado? ¿Sistemáticamente? entenderlo
Describir (resumir) los datos obtenidos (aún)
tiempo medio de baja en fumadores y no (estadísticos)
% de bajas por fumadores y sexo (frecuencias), gráficos,...
Realizar una inferencia sobre la población
Los fumadores están de baja al menos 10 días/año más de media que los no
fumadores.
Cuantificar la confianza en la inferencia
Nivel de confianza del 95%
Significación del contraste: p=2%
6
Método científico y estadística
Plantear Diseñar
hipótesis experimento
Obtener Recoger datos
conclusiones y analizarlos
7
Población y muestra
Población (‘population’) es el conjunto sobre el
que estamos interesados en obtener conclusiones
(hacer inferencia).
Normalmente es demasiado grande para poder
abarcarlo.
Muestra (‘sample’) es un subconjunto suyo al que
tenemos acceso y sobre el que realmente hacemos
las observaciones (mediciones)
Debería ser “representativo”
Esta formado por miembros “seleccionados” de
la población (individuos, unidades
experimentales).
8
Variables
Una variable es una característica observable que varía entre
los diferentes individuos de una población. La información que
disponemos de cada individuo es resumida en variables.
En los individuos de la población
española, de uno a otro es variable:
El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Ni fu ni fa, Muy Feliz} Var.
Ordinal
El número de hijos
{0,1,2,3,...} Var. Numérica discreta
La altura
{1’62 ; 1’74; ...} Var. Numérica continua
9
Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a
un número (no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus valores se pueden ordenar
Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
Discretas: Si toma valores enteros
Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Altura, Presión intraocular, Dosis de medicamento administrado, edad
10
Técnicas para recopilar datos
Encuesta
Entrevista
Observación
cuestionario
Tema 1. Introducción
Presentación ordenada de datos
7
6
Género Frec. 5
Hombre 4 4
2
Mujer 6 1
0
Hombre Mujer
Las tablas de frecuencias y las representaciones
gráficas son dos maneras equivalentes de
presentar la información. Las dos exponen
ordenadamente la información recogida en una
muestra.
12