Estadística
Tema 1: Introducción a la
estadística
1
¿Para qué sirve la estadística?
La Ciencia se ocupa en general de fenómenos observables
La Ciencia se desarrolla observando hechos, formulando leyes que los
explican y realizando experimentos para validar o rechazar dichas leyes
Los modelos que crea la ciencia son de tipo determinista o aleatorio
(estocástico)
La Estadística se utiliza como tecnología al servicio de las ciencias
donde la variabilidad y la incertidumbre forman parte de su naturaleza
2
Definición
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y
presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su
estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
3
Método científico y estadística
Plantear Diseñar
hipótesis experimento
Obtener Recoger datos
conclusiones y analizarlos
4
Población y muestra
Población (‘population’) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.
Muestra (‘sample’) es un subconjunto suyo al que tenemos
acceso y sobre el que realmente hacemos las observaciones
(mediciones)
Debería ser “representativo”
Esta formado por miembros “seleccionados” de la población
(individuos, unidades experimentales).
5
Variables
Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.
En los individuos de la población española, de uno
a otro es variable:
El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
El número de hijos
{0,1,2,3,...} Var. Numérica discreta
La altura
{1’62 ; 1’74; ...} Var. Numérica continua
6
Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus valores se pueden ordenar
Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
Discretas: Si toma valores enteros
Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Altura, Presión intraocular, Dosis de medicamento administrado, edad
7
Presentación ordenada de datos
7
6
Género Frec.
5
Hombre 4 4
3
2
Mujer 6 1
0
Hombre Mujer
Las tablas de frecuencias y las representaciones
gráficas son dos maneras equivalentes de presentar la
información. Las dos exponen ordenadamente la
información recogida en una muestra.
8
Gráficos para v. cualitativas
Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o
rel.)
Se pueden aplicar también a variables discretas
Diagramas de sectores (tartas, polares)
No usarlo con variables ordinales.
El área de cada sector es proporcional a su
frecuencia (abs. o rel.)
Pictogramas
Fáciles de entender.
El área de cada modalidad debe ser proporcional a
la frecuencia. ¿De los dos, cuál es incorrecto?.
Bioestadística. U. Málaga. 9
Gráficos diferenciales para variables numéricas 419
400 375
Son diferentes en función de que las
300
255
Recuento
215
variables sean discretas o continuas. 200
127
Valen con frec. absolutas o relativas. 100
54
24 23 17
Diagramas barras para v. discretas 0 1 2 3 4 5 6 7 Ocho o más
Se deja un hueco entre barras para indicar Número de hijos
los valores que no son posibles
250
Histogramas para v. continuas 200
Recuento
El área que hay bajo el histograma entre 150
dos puntos cualesquiera indica la cantidad 100
(porcentaje o frecuencia) de individuos en 50
el intervalo.
20 40 60 80
Edad del encuestado
10