0% encontró este documento útil (0 votos)
33 vistas25 páginas

C1 Conceptos Básicos

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
33 vistas25 páginas

C1 Conceptos Básicos

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Estadística

Conferencia 1: Conceptos básicos


Contenidos
Introducción a la estadística
Variables. Tipos de variables
Parámetros y estadísticos
Distribuciones de frecuencias
Estadística

Descriptiva Inferencial
Describe, analiza y Se apoya en el cálculo de
representa un grupo de probabilidades y a partir de
datos utilizando métodos datos muestrales, efectúa
numéricos y gráficos que estimaciones, decisiones,
resumen y presentan la predicciones u otras
información contenida en generalizaciones sobre un
ellos. conjunto mayor de datos.
Algunos conceptos básicos
 Universo muestral: Total de observaciones individuales
acerca de la cual se realizan las inferencia, que existe
en cualquier lugar del mundo. Es el conjunto de todos
los posibles valores que puede tomar una variable.
 Población estadística: Todos las poblaciones posibles
del fenómeno que se están midiendo, incluyendo la
población específica que se va a muestrear.
 Muestra: Subconjunto de los posibles valores de una
variable, o sea, subconjunto de las mediciones
realizadas para esa variable en la población.
Ejemplo
Estudio del nivel medio de un biomarcador en
niños. El universo muestral son todas las
poblaciones de niños en el mundo o en Cuba o en
Las Tunas, la población estadística son los niños de
la población que voy a muestrear en mi localidad,
policlínico, consultorio, etc. (de los cuales tampoco
tomaré todos, sino una muestra). Además cada
niño muestreado constituye una unidad muestral.
Variables
Variable: Propiedad natural susceptible de
cambio o diferencia entre individuos,
objetos, procesos o fenómenos y cuya
variación puede ser medida. Es lo que se
cuantifica de la unidad muestral.
Tipos de variables
Cualitativas:
Nominales: Dicotómicas o politómicas
(mutuamente excluyentes y sin jerarquía).
◦ Ej. Dicotómicas: Sexo, Presencia o no de una
enfermedad, etc.
◦ Ej. Politómicas: Color, Raza, etc.
Ordinal: Presentan orden o jerarquía.
◦ Ej. Intensidad del dolor(leve, moderado, intenso)
Tipos de variables
Cuantitativas:
Continuas: Toman cualquier valor numérico
dentro de un intervalo o intervalos.
◦ Ej. Glicemia, Peso, etc.
Discretas: Son aquellas que pueden tomar
solamente un número finito de valores
enteros.
◦ Ej. Edad, Número de hijos, etc.
Parámetros
Es una medida de posición o dispersión que
caracteriza a la población dada. Es toda magnitud
que tiene el mismo valor dentro de una población,
o sea, nos permite diferenciar entre sí a sus
elementos componentes. Se representa con letras
griegas
Ej. La media poblacional μ (miu), la desviación
estándar poblacional σ (sigma), la varianza
poblacional σ2 (sigma cuadrado).
Estadísticos
Caracterizan las propiedades de una muestra. Son
estimadores puntuales de los parámetros.
Ej. La media muestral , la desviación estándar
muestral S, la varianza muestral S2 .
Media poblacional y muestral
N

x i
μ  i1 N = Tamaño de la población
N
n = Tamaño de la muestra
xi = Cada una de las observaciones
n

x i
x  i1
n La media es una medida de tendencia
central. Otras son la mediana y la moda
Media poblacional y muestral
N
N = Tamaño de la población
 xi n = Tamaño de la muestra
μ  i1 xi = Cada una de las observaciones
N

x = 2, 4, 5, 3, 6, 5
n

x i
x  i1
n
Error estándar de la media e
intervalos de confianza
El error estándar es una medida de que tan
S representativa es una muestra de la población. Un
Sx 
n valor muy alto respecto a la media implica que hay
mucha variabilidad en nuestros datos.

Un intervalo de confianza es un rango de valores en el cual la


media muestral está situada. A medida que el IC es menor, mejor
es nuestra muestra para representar la población. Usualmente se
emplea un 95% de confianza para establecer el intervalo, lo que
significa que el 95% de las muestras de esta población cae en ese
intervalo.
Varianza y desviación estándar poblacional y
muestral

 i
(x  μ) 2

σ  σ2
σ 2  i1
N
n

 i
(x  x ) 2

S  S2
S 2  i1
n 1
La varianza y la desviación estándar son medidas
de dispersión. Otras son el error estándar de la
media y el rango.
Varianza y desviación estándar
poblacional y muestral
n xi xi - (xi -)2
 i
(x  x ) 2
2 -2.17 4.71
S 2  i1 4 -0.17 0.03
n 1 5 0.83 0.69

2
3 -1.17 1.37
S S 6 1.83 3.35
5 0.83 0.69
x = 2, 4, 5, 3, 6, 5 Sumatoria 0 10.83

S2 = 10.83/5 = 2.17
S = √2.17 = 1.47
Medidas de posición: Los cuantiles

Cuartiles Percentiles

Dividen a la muestra en 4 Es la medida que divide


partes iguales, con una serie de datos
frecuencias similares. Los ranqueados en 100
datos deben ordenarse de partes iguales. Los datos
menor a mayor para deben ordenarse de
calcular los cuartiles. menor a mayor para
calcular los percentiles.
Medidas empleadas en estadística
médica

Medidas empleadas en estadística
médica

Exploración gráfica de datos
Gráficos cajas o boxplots: Útiles para determinar relación entre una
variable cuantitativa y una cualitativa

2.5
2.0
1.5
1.0
0.5

ctrl trat
Gráficos de caja (boxplots)
Media o mediana
12
10

Segundo y tercer cuartil


(Región intercuartil)
8

Máx. 1,5 de la región intercuartil


6

Valor extremo
4

(outlier)
Exploración gráfica de datos
Gráficos de dispersión o scatterplots: Útiles para determinar relación
entre dos variable cuantitativas

3.0

2.5

2.0

1.5
tag

1.0

0.5

0.0

3 4 5 6 7
Muestreo
 Aleatorización: Los sujetos asignados a cada grupo
experimental deben ser distribuidos aleatoriamente.
También se pueden emplear diferentes tipos de
muestreo (estratificado, por clústeres, etc.).
 Definir los criterios de inclusión y exclusión.
 Seleccionar el tamaño de la muestra adecuado.
 Realizar las determinaciones objetivamente.

¡Evitar los sesgos!


Colección de datos
Autoevaluación
1. Dos tratamientos para reducir la glicemia a largo plazo
mostraron los siguientes valores de hemoglobina
glicosilada:
A: Media = 7; Desviación estándar = 0,5
B: Media = 6,5; Desviación estándar = 1

¿Cuál de los tratamientos considera más efectivo?


Autoevaluación
2. Observe el siguiente gráfico de dispersión y describa la
relación entre las variables.

25

20
Var1

15

10
100 150 200 250
Var2

También podría gustarte