0% encontró este documento útil (0 votos)
27 vistas19 páginas

I. - Introduccion A La Estadística-I (Documento)

La estadística es la ciencia que se encarga de la obtención, ordenación y análisis de datos para inferir sobre fenómenos con variabilidad e incertidumbre. Se basa en el método científico y utiliza técnicas de probabilidad y matemáticas para describir y prever relaciones en poblaciones a partir de muestras representativas. Los datos se presentan de manera ordenada a través de tablas de frecuencias y gráficos, facilitando la interpretación y análisis de la información.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
27 vistas19 páginas

I. - Introduccion A La Estadística-I (Documento)

La estadística es la ciencia que se encarga de la obtención, ordenación y análisis de datos para inferir sobre fenómenos con variabilidad e incertidumbre. Se basa en el método científico y utiliza técnicas de probabilidad y matemáticas para describir y prever relaciones en poblaciones a partir de muestras representativas. Los datos se presentan de manera ordenada a través de tablas de frecuencias y gráficos, facilitando la interpretación y análisis de la información.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

Estadística básica

Tema 1: Introducción a la
estadística
¿Para qué sirve la estadística?

• La Ciencia se desarrolla observando hechos, formulando hipótesis


acerca de relaciones que los explican y realizando experimentos
para validar o rechazar dichas hipótesis

• Los modelos que crea la ciencia son de tipo determinista o


aleatorio (estocástico)

• La Estadística se utiliza como tecnología al servicio de las


ciencias donde la variabilidad y la incertidumbre forman parte de su
naturaleza

• La estadística es un conjunto de técnicas que utilizan la


probabilidad y algunas áreas de las matemáticas para describir e
inferir acerca de fenómenos observables
Definición
La Estadística es la Ciencia de la

• Obtención, ordenación, sistematización, y


v apresentación de los datos referentes a un fenómeno
ti
c r ip que presenta variabilidad o incertidumbre para su
e s estudio metódico, con objeto de
D

• deducir las relaciones que rigen esos fenómenos,


a d
ilid
bab
P ro
• y poder de esa forma hacer previsiones sobre los
ci mismos, tomar decisiones u obtener conclusiones.
a
n
e re
I nf
Pasos en un estudio estadístico
• Observar
• Los fumadores tienen bajas laborales
• Plantear hipótesis sobre una población
• Los fumadores tienen “más bajas” laborales que los no fumadores
• ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

• Decidir qué datos analizar (diseño de experimentos)


– Qué individuos pertenecerán al estudio (muestras)
• Fumadores y no fumadores en edad laboral.
• Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades
crónicas?
– Qué datos obtener de los mismos (variables)
• Número de bajas
• Tiempo de duración de cada baja
• ¿Género? ¿Sector laboral? ¿Otros factores?

• obtener los datos (muestreo)


– ¿Estratificado? ¿Sistemáticamente?

• Describir (resumir) los datos obtenidos


• tiempo medio de baja en fumadores y no (estadísticos)
• % de bajas por fumadores y sexo (frecuencias), gráficos,...

• Realizar una inferencia sobre la población


• Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.

• Cuantificar la confianza en la inferencia


– Nivel de confianza del 95%
Método científico y estadística

Plantear Diseñar
hipótesis experimento

Obtener obtener datos


conclusiones y analizarlos
Población y muestra

• Población es el conjunto sobre el que estamos interesados


en obtener conclusiones (hacer inferencia).
– Normalmente es demasiado grande para poder abarcarlo.

• Muestra es un subconjunto de la población al que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
– Debería ser “representativo”
– Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales).
Variables
• Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.

• En los individuos de la población Mexicana, las características de un


individuo a otro son variables:

– El grupo sanguíneo
• {A, B, AB, O}  Var. Cualitativa
– Su nivel de felicidad “declarado”
• {Deprimido, Melancólico, Muy Feliz}  Var. Ordinal
– El número de hijos
• {0,1,2,3,...}  Var. Numérica discreta
– La altura
• {1’62 ; 1’74; ...}  Var. Numérica continua
Tipos de variables
• Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)

– Nominales: Si sus valores no se pueden ordenar


• Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

– Ordinales: Si sus valores se pueden ordenar


• Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

• Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas
con ellos)

– Discretas: Si toma valores enteros


• Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

– Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


• Altura, Presión intraocular, Dosis de medicamento administrado, edad
• Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en una hoja de cálculo.
• Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.
– Género (Cualit: Códigos arbitrarios)
• 1 = Hombre
• 2 = Mujer
– Raza (Cualit: Códigos arbitrarios)
• 1 = Blanca
• 2 = Negra,...
– Felicidad Ordinal: Respetar un orden
al codificar.
• 1 = Muy feliz
• 2 = Bastante feliz
• 3 = No demasiado feliz
• Se pueden asignar códigos a
respuestas especiales como
• 0 = No sabe
• 99 = No contesta...
• Estas situaciones deberán ser tenidas
en cuentas en el análisis. Datos
perdidos (‘missing data’)
• Los posibles valores de una variable suelen denominarse
modalidades.

• Las modalidades pueden agruparse en clases (intervalos)


– Edades:
• Menos de 20 años, de 20 a 50 años, más de 50 años
– Hijos:
• Menos de 3 hijos, De 3 a 5, 6 o más hijos

• Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
– Exhaustivo: No podemos olvidar ningún posible valor de la variable
– Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
– Bien: ¿Cuál es su grupo sanguíneo?
– Excluyente: Nadie puede presentar dos valores
simultáneos de la variable
• Estudio sobre el ocio
– Mal: De los siguientes, qué le gusta: (deporte, cine)
– Bien: Le gusta el deporte: (Sí, No)
– Bien: Le gusta el cine: (Sí, No)
– Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
• Aunque se codifiquen como números, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de cálculo estadístico.
• No todo está permitido con cualquier tipo de variable.
Presentación ordenada de datos
7

Género Frec. 5

4
Hombre 4 3

1
Mujer 6
0
Hombre Mujer

• Las tablas de frecuencias y las representaciones


gráficas son dos maneras equivalentes de presentar la
información. Las dos exponen ordenadamente la
información obtenida en una muestra.
Tablas de frecuencia
• Exponen la información obtenida en la muestra, de forma que no se pierda nada de
información (o poca).

– Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad

– Frecuencias relativas (porcentajes): Idem, pero dividido por el total

– Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas


• Muy útiles para calcular cuantiles (ver más adelante)
– ¿Qué porcentaje de individuos tiene menos de 4 hijos? Sol: 83,8
– ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

Sexo del encuestado Número de hijos

Porcentaje Porcentaje Porcentaje


Frecuencia Porcentaje válido Frecuencia Porcentaje válido acumulado
Válidos Hombre 636 41,9 41,9 Válidos 0 419 27,6 27,8 27,8
Mujer 881 58,1 58,1 1 255 16,8 16,9 44,7
Total 1517 100,0 100,0 2 375 24,7 24,9 69,5
3 215 14,2 14,2 83,8
Nivel de felicidad
4 127 8,4 8,4 92,2
Porcentaje Porcentaje 5 54 3,6 3,6 95,8
Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3
Válidos Muy feliz 467 30,8 31,1 31,1
7 23 1,5 1,5 98,9
Bastante feliz 872 57,5 58,0 89,0
Ocho o más 17 1,1 1,1 100,0
No demasiado feliz 165 10,9 11,0 100,0
Total 1509 99,5 100,0
Total 1504 99,1 100,0
Perdidos No contesta
Perdidos No contesta 8 ,5
13 ,9
Total 1517 100,0 Total 1517 100,0
Datos desordenados y ordenados en tablas

• Variable: Género Género Frec. Frec. relat.


porcentaje
– Modalidades:
• H = Hombre Hombre 4 4/10=0,4=40%
• M = Mujer
Mujer 6 6/10=0,6=60%

10=tamaño
muestral
• Muestra:

MHHMMHMMMH

– equivale a
HHHH MMMMMM
Ejemplo
• ¿Cuántas mujeres tienen Número de hijos
menos de 2 hijos?
Porcent. Porcent.
– frec. indiv. sin hijos
Frec. (válido) acum.
+
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255 1 255 16,9 44,7
= 674 individuos 2 375 24,9 69,5 ≥50%
3 215 14,2 83,8
• ¿Qué porcentaje de mujeres 4 127 8,4 92,2
tiene 6 hijos o menos? 5 54 3,6 95,8
– 97,3% 6 24 1,6 97,3
7 23 1,5 98,9
• ¿Qué cantidad de hijos es tal Ocho+ 17 1,1 100,0
que al menos el 50% de la Total 1509 100,0
población tiene una cantidad
inferior o igual?
– 2 hijos
Gráficos para variables cualitativas
• Diagramas de barras
– Alturas proporcionales a las frecuencias (abs. o rel.)
– Se pueden aplicar también a variables discretas

• Diagramas de sectores (gráficas de pastel, polares)

– El área de cada sector es proporcional a su frecuencia


(abs. o rel.)

• Pictogramas
– Fáciles de entender.
– El área de cada modalidad debe ser proporcional a la
frecuencia.
Gráficos diferenciales para variables numéricas
419
400 375

300

• Son diferentes en función de que las


255

Recuento
215
200

variables sean discretas o continuas. 127

Valen con frec. absolutas o relativas.


100

54
24 23 17

– Diagramas barras para v. discretas 0 1 2 3 4 5 6 7 Ocho o más

Número de hijos
• Se deja un hueco entre barras para indicar
los valores que no son posibles
250

– Histogramas para v. continuas 200

• El área que hay bajo el histograma entre

Recuento
150

dos puntos cualesquiera indica la cantidad


100

(porcentaje o frecuencia) de individuos en


el intervalo. 50

20 40 60 80

Edad del encuestado


Diagramas integrales
• Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral.
Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la
variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual
al mismo. Se pasan de los diferenciales a los integrales por integración y a la
inversa por derivación
¿Qué hemos visto?
• Definición de estadística
• Población
• Muestra
• Variables
– Cualitativas
– Numéricas
• Presentación ordenada de datos
– Tablas de frecuencias
• absolutas
• relativas
• acumuladas
– Representaciones gráficas
• Cualitativas
• Numéricas
– Diferenciales
– Integrales

También podría gustarte