0% encontró este documento útil (0 votos)
31 vistas83 páginas

Curso de Estadística: Análisis de Datos

Este documento presenta un curso sobre el uso de la estadística para analizar datos. Explica que la estadística descriptiva se usa para describir las características de una muestra de datos, mientras que la estadística inferencial se usa para hacer inferencias sobre la población de la que proviene la muestra. También cubre conceptos como población, muestra, variables, datos cualitativos y cuantitativos, y métodos para organizar y resumir datos como distribuciones de frecuencia y frecuencias relativas.

Cargado por

fatymavaca87
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
31 vistas83 páginas

Curso de Estadística: Análisis de Datos

Este documento presenta un curso sobre el uso de la estadística para analizar datos. Explica que la estadística descriptiva se usa para describir las características de una muestra de datos, mientras que la estadística inferencial se usa para hacer inferencias sobre la población de la que proviene la muestra. También cubre conceptos como población, muestra, variables, datos cualitativos y cuantitativos, y métodos para organizar y resumir datos como distribuciones de frecuencia y frecuencias relativas.

Cargado por

fatymavaca87
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Curso de recuperación

ESTADÍSTICA
Dra. Yesenia Fernández

Enero 2024
• Este curso tratará sobre el uso de la estadística para darle sentido a los datos

Estadística es una herramienta que nos sirve para organizar, analizar,


interpretar y difundir los datos de una investigación.

Bioestadística entonces sería la aplicación de esas herramientas a


los problemas y a los objetos de estudio de la biologías.
Estadística descriptiva e inferencial
El análisis estadístico tiene dos objetivos principales que son:

• Describir las características de la muestra

• Usar los resultados de la muestra para hacer inferencias sobre


la población muestreada
Estadística descriptiva: utilizada para describir las características de una muestra

Métodos para organizar una muestra de datos


Métodos para calcular valores promedio
Métodos para calcular valores de dispersión

Estadística inferencial: utilizada para hacer inferencias sobre


la población de la que se tomó la muestra
Análisis de intervalos de confianza
Pruebas de hipótesis
Población

Estadística descriptiva

Estadística inferencial
Describe Usa la muestra
características para elaborar
de la muestra conclusiones o
tomada de la inferencias
población sobre la
población
muestreada

Muestra
• Población = colección completa de personas, objetos o cosas en las que
tenemos un interés

• Las poblaciones pueden ser muy grandes (incluso de tamaño


infinito) o muy pequeñas

• Por ejemplo: pueden ser los niños con asma …

✓De todo el país


✓Del estado de Tlaxcala
✓De 10 años de la ciudad de Tlaxcala
✓Con padres fumadores
• Noción de muestreo de una
población

• Una vez escogida una muestra


Población representativa

• Lo que encontremos en los


individuos de la muestra es
ampliamente cierto para los
individuos de toda la población

Muestra
Datos

• Datos son los valores o números que obtenemos cuando contamos o


medimos algo.

Por ejemplo:

• Número de alumnos inscritos en 4° semestre en la UBBJ sede


Zitlaptepec
• Proporción de pacientes fumadores del IMSS Tlaxcala con cáncer
• Peso al nacimiento de los bebes en Zacatelco
Variable
• Vagamente definida, es algo cuyo valor o cualidad puede variar de persona
a persona, de objeto a objeto o de momento a momento.

• La estatura. Una persona puede medir 1.50 m y otra 1.78 m.


• El número de camas vacías en un hospital. Cero camas vacías 1, 2, 3….
• El grupo sanguíneo es una variable. A, B, AB, O.
• La satisfacción del paciente con respecto a su tratamiento es una variable debido a que puede
variar, por ejemplo desde muy satisfecho, a satisfecho, a aceptable, a insatisfecho hasta muy
insatisfecho.
Una variable es un nombre dado a cualquier cosa que pueda tomar diferentes valores o
atributos.

Tipos de
variables

Cualitativos Cuantitativos

Nominales Ordinales Discretos Continuaos

Datos numéricos que solo


Modalidad no numérica
Modalidad no numérica pueden expresar una cifra Datos numéricos que
que no admite un criterio
que lleva un orden. (números enteros). adoptan valores ilimitados.
de orden.
Ejemplo: excelente, Ejemplo: número de Ejemplo: Temperatura
Ejemplo: azul, rojo,
bueno, regular, malo. individuos con cabello ambiental: 19.5, 15.08….
morado.
rojo: 1,2, 3…
Datos cualitativos

• Los colectamos (obtenemos) al medir o contar variables


nominales u ordinales, pueden ser alfabéticos o
numéricos pero carecen de cualquier propiedad
matemática.

• En otras palabras, este tipo de datos nos indican


la cualidad del objeto de estudio, pero esta
cualidad no está matemáticamente descrita:

• Color de algo, dureza, sexo, sabor, etc.


Datos cuantitativos

• Los colectamos (obtenemos) al medir o contar


variables métricas.

• Siempre son datos numéricos y tienen


propiedades matemáticas
Distribuciones de
frecuencia y Frecuencias
agrupadas
2.1 Intervalos de clase.
2.2 Amplitud del intervalo de clase.
2.3 Marca de clase.
2.4 Tablas y gráficos.
Describir el grupo de datos de la muestra significa:

• Arreglarlos u organizarlos de tal forma que podamos obtener una


visión amplia de características que pudieran ser de interés.

• Encontrar algún tipo de medida promedio de los valores de la


muestra.

• Encontrar algún tipo de medida de dispersión de los valores de la


muestra.
Primero debemos ordenar el caos

• Cuando los datos son tomados de las hojas en que inicialmente fueron colectados
(cuestionarios contestados, escalas de medición, notas de pacientes, etc...)
inevitablemente están en desorden.

• Hay que vaciarlos en un archivo electrónico o en un documento y al mismo tiempo


limpiarlos ( excluir datos mal transferidos o erróneos).

• Primer paso: Identificar el tipo de variable.


• Segundo: Organizar los datos en orden alfabético o numérico. Así tendremos juntos
todos los valores o categorías idénticas.
Ejercicio 1:
¿Por qué el paciente no asistió a la consulta?

• Razón por la que no asistió a la consulta:


Datos cualitativos: describen el motivo por el cuál el paciente no se
presentó, por lo tanto tenemos una variable CUALITATIVA
NOMINAL.
• Observen la columna con los datos ordenados ¿pueden decir
cuál fue la razón dada con mayor proporción?

• Aún así tenemos que hacer un conteo manual de cada


categoría por lo tanto el siguiente paso es organizar los datos
en una distribución de frecuencias
Distribuciones de frecuencia
• No es más que una lista de las categorías o valores que una
variable puede tomar

• Estas categorías o valores son generalmente presentados en


tablas

• La primer columna contiene las diferentes categorías o clases.


El encabezado de está columna es, usualmente, el nombre de
la variable
Distribuciones de frecuencia

• En la segunda columna se escribe el número (conocido como la frecuencia) de valores


en cada categoría o clase. En el encabezado de esta columna se escribe el
número de lo que se esté contando (número de alumnos con determinada
discapacidad, número de pacientes, número de episodios, etc.) o
simplemente frecuencia

• El concepto de distribución de frecuencia es de gran importancia en el


análisis estadístico.
¿Qué logramos al elaborar nuestra tabla de
distribución de frecuencias?
• Organizar nuestros datos
• Tener una imagen más clara del amplio patrón de razones dadas
que cuando solo teníamos los datos crudos

• Ver claramente que las categorías “olvido” y “pérdida de tiempo


en el trabajo” son por mucho las categorías con mayor número de
pacientes
•Recuerden….
Una distribución de frecuencia es una
lista de las categorías o valores que
una variable puede tomar junto con
un conteo del número de datos en
cada categoría
Razón para no asistir No. de pacientes
Olvido 12
Pérdida de tiempo en el 9
trabajo
Problemas de transporte 6
Falta de niñera
5
Indispuesto/enfermo 4
Creé que el tratamiento es
innecesario 3

No dio razón 4

Otras 7
TOTAL 50
Frecuencia relativa

• A menudo es más informativo presentar una


distribución de frecuencia con la frecuencia de cada
categoría expresada como porcentaje de la frecuencia
total

• Son particularmente útiles cuando queremos


comparar dos muestras de diferente tamaño
¿Cómo se hace?

• Para transformar la frecuencia de cualquier categoría dada a


frecuencia relativa la dividimos por la frecuencia total y la
multiplicamos por 100

Frecuencia relativa = (frecuencia/frecuencia total) X 100


Razón para no asistir No. pacientes % pacientes
Olvido 12 24.0
Pérdida de tiempo en el 9 18.0
trabajo
Falta de niñera 5 10.0

Problemas de transporte 6 12.0


Indispuesto/enfermo 4 8.0
Día/hora equivocados 4 8.0
Cree que el tratamiento es
innecesario 3 6.0

Otras 7 14.0
TOTAL 50 100.0
Distribuciones de frecuencia
acumuladas

• Pueden ser usadas con datos ordinales no numéricos,


pero son más a menudo utilizados con datos
ordinales numéricos o datos métricos.

• No tiene sentido, por supuesto, utilizarlos con datos


nominales
Distribuciones de frecuencia acumulada
Nº de hijos Nº de Porcentaje Frecuencia Porcentaje de
familias de familias acumulada frecuencia
acumulada
0 1 3.6 1 3.6
1 9 32.1 10 35.7
2 2 7.1 12 42.8
3 5 17.9 17 60.7
4 5 17.9 22 78.6
5 3 10.7 25 89.3
6 0 0 25 89.3
7 0 0 25 89.3
8 2 7.1 27 96.4
9 1 3.6 28 100.0
Distribuciones de frecuencia agrupadas

• Agrupa los valores dentro de clases


• Así, el número de renglones en la distribución de
frecuencia es más manejable
• A tales distribuciones de frecuencia las podemos
llamar distribuciones agrupadas
• Un punto importante es que las clases no se deben
traslapar
Distribuciones de frecuencia no agrupadas
y agrupadas

• La distribución de frecuencia y la distribución de frecuencia


relativa tienen un renglón por cada categoría

• En este caso llamamos a la distribución de frecuencia una


distribución no agrupada

• El número correcto de renglones por distribución de frecuencia


es entre 7 y 12

• Si hay muchas categorías diferentes y por lo tanto muchos


renglones en la distribución de frecuencia se vuelve difícil
observar cualquier patrón que pudiera existir en los datos.
Con algunos datos cualitativos numéricos el número de valores posibles es
demasiado largo como para asignarle un renglón a cada categoría o valor
en la distribución de frecuencia. En esas circunstancias los datos pueden
agruparse dentro de un número más manejable de clases.
y además…
• Las clases son del mismo tamaño
• Las clases no se sobrelapan
• Usar entre 7 y 12 clases
Gráficas de datos cualitativos:

• Las gráficas a menudo entregan un mensaje mucho más inmediato que las tablas de
distribución de frecuencia.

• Se pueden graficar tanto las distribuciones de frecuencia no agrupadas como las


agrupadas.

• Hay diferentes tipos de gráficas por lo tanto hay que escoger el más apropiado para
un determinado tipo de datos.

• Gráfica de pastel, de barras en grupo o apiladas.


Gráfica de pastel
Gráfica de pastel

• Cada segmento (rebanada) del pastel es proporcional


al tamaño del pastel

• Recomendado para graficar datos nominales


• También son utilizadas para graficar categorías de una
variable ordinal

• No útil cuando se tienen demasiadas categorías


Gráficas de barras
• Se usan exactamente de la misma forma que
para categorías nominales,

• pero generalmente las variables ordinales tienen


más categorías por lo que las categorías pueden
agruparse y entonces graficarse
3.4 Graficando datos cualitativos

Cancer de pecho y estado menopáusico

90
80 Cancer de pecho, n = 106
70 Grupo control, n = 226
60
50

%
40
30
20
10
0
Premenopáusico Perimenopáusico Postmenopáusico

Historia como fumador y modo de alimentación


postnatal

60 Amamantado, n = 149
50
Alimentado con botella,
40 n = 182
%

30
20
10
0
Fumador Antiguo No fumador
fumador
Gráficas de datos cuantitativos: métricos
discretos
• Barras lo más delgadas posibles
No. de casos de sarampión en 23 escuelas

25
Número de casos (n = 37)

20

15

10

0
1 3 5 7 9 11 13 15 17 19 21 23
Escuelas
Gráficas de datos métricos continuos

• Dado que las variables métricas continuas pueden


tomar un número muy grande de valores,
• los datos métricos continuos a menudo se agrupan
antes de ser graficados con un histograma
Histograma de frecuencia
• Son utilizados para graficar la frecuencia o frecuencia relativa de
distribuciones de frecuencia agrupadas de datos continuos

• Similar en apariencia a las gráficas de barras difiere de estas en que


en el histograma no hay espacio entre las barras reflejando así la
naturaleza continua de los datos.
Polígono de frecuencia
• Los puntos son puestos a la altura de las frecuencias
correspondientes y se unen con líneas rectas

• La ventaja del polígono de frecuencia con respecto al histograma es


que es más fácil comparar las formas de dos polígonos de frecuencia
utilizando dos polígonos de frecuencia sobrepuestos
RESUMEN

Variable Nominal Ordinal Métrica


Cualitativa Discreta Discreta NO
Cuantitativa NO NO Discreta o continua
Frec. Relativa SI SI SI
Frec. Acumulativa NO SI SI
Gráficas Barras,
Pastel Barras Histograma,Polígono
de frecuencias
Medidas de Tendencia Central Y de
posición

4.1 Media aritmética.


4.2 Mediana.
4.3 Moda.
4.4 Cuantiles, deciles y percentiles.
MEDIDAS DE TENDENCIA CENTRAL

• Las medidas de tendencia central nos describen “el promedio”


de los valores de la muestra
• Hay tres medidas de tendencia central utilizadas comúnmente:
• La media
• La mediana
• La moda
Medidas de tendencia central

• Media aritmética. Promedio aritmético de


una distribución.
• Mediana. Valor que divide la distribución
por la mitad. La posición intermedia de la
distribución.
• Moda. Categoría o puntuación que se
representa con mayor frecuencia.
Medidas de tendencia central
• El nivel de medición de la variable determina cual
es la medida de tendencia central apropiada.
• La moda Se puede utilizar para datos nominales,
ordinales y métricos
• La mediana Se utiliza para datos ordinales y
métricos
• La media Sólo es útil para variables métricas.
Elección de medida de tendencia central y tipo de
variable

Medida de Tipo de Variable


tendencia
Central
Nominal Ordinal Métrica

Moda Si Si Si

Mediana No Si Si

Media No No Si
• Media aritmética
• X= Xi
n
24 31 35 35 38 43 45 50 57
24 + 31 + 35 + 35 + 38 + 43 + 45 + 50 + 57 39.7
9
24
• Mediana 31
• M = X(n+1)/2
M = X(9+1)/2 35 38
35
• Moda
• Mo= >f 38
43 35
45
50
57
• Media aritmética
• X= Xi
n 24 31 35 35 38 43 45 50 248

61
• Mediana
• M = X(n+1)/2
M = X(9+1)/2

• Moda 38
• Mo = >f

La mediana y la moda se obtienen por simplicidad y no


son sensibles a valores extremos.
35
• Media aritmética
• X= Xi 24 21 22 24 26
• n 23.15
22 25 21 25 22
21 22 22 23 25
• Mediana 22 20 26 25 25
• M = X(n+1)/2
M = X(20+1)/2
23
• Moda

La mediana y la moda se obtienen por simplicidad y no


son sensibles a valores extremos.
22
Medidas de tendencia central para datos
nominales

• La única medida de tendencia central posible para


datos nominales es la moda.

Parámetros: Son medidas que describen o caracterizan a


una población.
Estadísticos: Son estimaciones de los parámetros
poblacionales.
Medidas de posición

Las medidas de posición son valores que permiten dividir


el conjunto de datos en partes porcentuales iguales y se
usan para clasificar una observación dentro de una
población o muestra.
Datos no agrupados.
Cuartiles Calcular el Q1 del los siguientes datos:
1, 4, 2, 6, 9, 5, 6, 9, 7

Son valores que se obtienen a partir de los Primer paso: Ordenar los datos de menor a mayor.
datos ordenados y que dividen el conjunto
en cuatro partes porcentuales iguales. 1, 2, 4, 5, 6, 6, 7, 9, 9

𝑸𝟏 = 𝟑
25% 25% 25% 25% 𝐾⋅𝑁
𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙. =
𝑸𝟑
4
𝑸𝟏 𝑸𝟐
𝐾= Número de cuartil que se desea calcular (1, 2, 3)
N = Total de datos. (Si el tota de datos es número impar se sumará 1 al valor de N)

1 ⋅ (9 + 1)
𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
= 2.5
4
Datos no agrupados.
Deciles Calcular el D8 del los siguientes datos:
2, 5, 5, 7, 10, 13, 32, 34, 20, 8, 3, 0

• Dividen el conjunto en diez partes Primer paso: Ordenar los datos de menor a mayor.
porcentuales iguales. 1 2 3 4 5 6 7 8 9 10 11 12

• Cada uno, representa el 10% de la 0, 2, 3, 5, 5, 7, 8, 10, 13, 20, 32, 34


distribución.
𝑫𝟖 = 𝟐𝟎
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
𝐾⋅𝑁
𝑫𝟏 𝑫𝟐 𝑫𝟑 𝑫𝟗 𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑑𝑒𝑐𝑖𝑙. =
10
𝐾= Número de decil que se desea calcular (1, 2, 3… 9)
N = Total de datos. (Si el tota de datos es número impar se sumará 1 al valor de N)

8 ⋅ 12 𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑑𝑒𝑐𝑖𝑙


= 9.6≈ 10
10
Datos no agrupados.
Percentil Calcular el P80 del los siguientes datos:
2, 5, 5, 7, 10, 13, 20, 8, 3, 0

• Dividen el conjunto en cien partes Primer paso: Ordenar los datos de menor a mayor.
porcentuales iguales. 1 2 3 4 5 6 7 8 9 10

• Cada uno, representa el 1% de la 0, 2, 3, 5, 5, 7, 8, 10, 13, 20


distribución.
𝑷𝟖𝟎 = 𝟏𝟎

𝑷𝟏 𝑷𝟐 𝑷𝟑 … 𝑷𝟗𝟗
𝐾⋅𝑁
𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑑𝑒𝑐𝑖𝑙. =
100
𝐾= Número de decil que se desea calcular (1, 2, 3… 99)
N = Total de datos. (Si el tota de datos es número impar se sumará 1 al valor de N)

80 ⋅ 10 𝑃𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙


=8
100
Medidas de posición para datos agrupados.

Cuartiles Deciles Percentiles

Li: Límite inferior del intervalo donde se encuentra


F1: frecuencia absoluta del intervalo donde se encuentra posicionado
Fi-1: Frecuencia acumulada del intervalo anterior
Amp: amplitud del intervalo
N: Número total de datos
Medidas de posición para datos agrupados.

PASO 1 A
𝐾⋅𝑁 Cuartil= 4
Determinar la posición del cuartil, decil o percentil. 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛. = Decil = 10
A Percentil = 100

A partir de la siguiente tabla de distribución calcular el cuartil 2.

Intervalos Frecuencia (f) Frecuencia acumulada


(F)
10-20 4 4
20-30 6 10
30-40 10 20
40-50 8 28
50-60 2 30

2 ⋅ 30
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙. = = 15
4
Buscar en las frecuencias acumuladas
Medidas de posición para datos agrupados.

PASO 2
Sustituir los valores de la formula para obtener el valor del cuartil.

Intervalos Frecuencia (f) Frecuencia acumulada


(F)
10-20 4 4
20-30 6 10
30-40 10 20
40-50 8 28
50-60 2 30

15 − 𝐹2 15−10
𝑄2 = Li3 + ⋅ 10 𝑄2 = 30 + ⋅ 10 = 35
10
f3
Medidas de dispersión

Es la medida más común de variación, o dispersión, de los datos de


una variable.
Mide la distancia entre los valores de los datos y su media
Elección de medida de dispersión y tipo de variable

Tipo de medida Tipo de


Variable

Nominal Ordinal Métrica Métrica


nominal discreta contínua

Basadas en el No No Si Si
rango (Rango, RIQ)

Basadas en la No No No Si
desviación (DE,
CV)
Rango
Es la diferencia entre la
medida más alta y la más baja

Rango de la muestra = Xn - X1
Se utilizan junto con la mediana, cuando los
datos (métricos) están sesgados

Rango intercuartil

Es la distancia entre el primer y el tercer cuartil

Q3 – Q1
Pregunta ¿Se pueden obtener estas medidas en esta tabla?

Antes Después
f f
Extremadamente 3 1
difícil
Muy difícil 7 3
Difícil 16 14
Fácil 2 11
Muy fácil 2 1
Total 30 30

Respuesta NO, SÓLO CON


VARIABLES ORDINALES
NUMÉRICAS
105
106
106
109 Rango = 58
109
111
111
113
114
114
115
115
Rango
116 intercuartil = 12
117
118
119
121
121
123
126
137
142
147
151
163
Recordar

• El rango y el rango intercuartil se utilizan con variables métricas


(sesgadas) junto con la mediana.
• El rango es la diferencia entre el valor más grande y el más
pequeño de la muestra.
• El rango intercuartil mide la diferencia entre los valores más
bajos de la muestra (25% ó primer cuartil) y el más alto (75%
ó tercer cuartil).
Varianza
S2 = Σ (Xi - X)2
n-1

Desviación estándar
S= Σ (Xi - X)2
n-1
Coeficiente de variación

S
CV = 100
X

Donde CV = Coeficiente de variación


S = Desviación estándar
X= Media
Recordar

Tipo de medida Tipo de


Variable

Nominal Ordinal Ordinal Métrica


nominal numérica

Basadas en Si Si No No
frecuencia (ID)

Basadas en el No No Si Si
rango (Rango, RIQ)

Basadas en la No No No Si
desviación (DE,
CV)
Pruebas estadísticas
paramétricas y
no paramétricas
Pasos para la toma de decisión basada en datos

• Formular una hipótesis


1

• Hallar una prueba correcta


2

• Ejecutar la prueba
3

• Tomar una decisión basada en el resultado


4
Flores-Ruiz et al 2017
T de student
Compara 2 grupos con variables cuantitativas continuas y con distribución
normal

• Muestras relacionadas (un solo grupo antes y después)


• Muestras independientes (compara 2 grupos diferentes)

Ejemplo 2:
Ejemplo 1:
Se desea comparar la eficacia de dos
Evaluar el efecto del uso de un
tratamientos para pacientes
parche herbolario para regular la
diabéticos.
glucosa.
Al grupo A se le administra el
Se miden los niveles de glucosa
tratamiento X, y al gripo experimental
antes y después del uso del parche
2 se le administra el tratamiento Z.
por 2 semanas.
Wilcoxon
Compara 2 grupos con variables cuantitativas continuas y con distribución NO
normal

• Muestras relacionadas (un solo grupo antes y después)


U de Mann Whitney
Compara 2 grupos con variables cuantitativas continuas y con distribución NO
normal

• Muestras independientes (compara 2 grupos diferentes)


Análisis de varianza
Anova
Compara 3 o más grupos con variables cuantitativas continuas y con
distribución normal.

Se comparan los
1 vía promedios de 3 o más
grupos independientes
ANOVA
Se comparan promedio
de muestras
2 vías
relacionadas tres o
más veces
Kruskal wallis
Compara 3 o más grupos con variables cuantitativas continuas y con
distribución NO normal.

Equivalente no paramétrico de ANOVA 1 vía

• Muestras independientes (compara 3 o más grupos diferentes)


Friedman
Compara 3 o más grupos con variables cuantitativas continuas y con
distribución NO normal.

Equivalente no paramétrico de ANOVA 2 vías

• Muestras relacionadas (compara 3 o más mediciones en un grupo)


CHI cuadrada
Compara 2 o más grupos con variables cualitativas.

• Muestras independientes (compara 2 o más grupos diferentes)


Coeficiente de correlación
Cuando se desea establecer la relación de 2 variables se utilizará el coeficiente
de correlación.

Cuantitativas
Pearson continuas con
distribución normal

Coeficiente de Cuantitativas
correlación continuas con
distribución NO
normal
Spearman

Cuantitativas discretas

También podría gustarte