0% encontró este documento útil (0 votos)
32 vistas31 páginas

Estadística y Toma de Decisiones

Este documento presenta información sobre pruebas de bondad de ajuste y pruebas de independencia utilizando tablas de contingencia y el estadístico chi-cuadrado. Explica cómo calcular frecuencias esperadas, el estadístico chi-cuadrado, y los grados de libertad. También incluye un ejemplo completo sobre grupos sanguíneos que ilustra los pasos para realizar una prueba de bondad de ajuste.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
32 vistas31 páginas

Estadística y Toma de Decisiones

Este documento presenta información sobre pruebas de bondad de ajuste y pruebas de independencia utilizando tablas de contingencia y el estadístico chi-cuadrado. Explica cómo calcular frecuencias esperadas, el estadístico chi-cuadrado, y los grados de libertad. También incluye un ejemplo completo sobre grupos sanguíneos que ilustra los pasos para realizar una prueba de bondad de ajuste.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA Y TOMA DE DECISIONES

CIENCIAS ECONÓMICAS

Docente: Segundo O. Rodríguez Bellina

12° SEMANA
CUADROS DE CONTINGENCIA Y PRUEBA DE HIPÓTESIS

20/11/2021 2
PRUEBAS DE BONDAD DE AJUSTE
Se mide una única variable categórica, por lo tanto cada elemento de la
población se asigna a una y sólo una de varias categorías k
Para cada categoría se posee un valor preconcebido o supuesto o
histórico de 𝒑𝒊 y usamos información muestral para determinar si dichos
valores son correctos.
Formulación de la hipótesis
➢Dado que se cuenta solo con una muestra y se desea inferir
sobre toda la población, la pregunta se resuelve mediante una
prueba de hipótesis.
➢Las hipótesis puestas a prueba son:
𝑯𝟎 : 𝑳𝒂𝒔 proporciones de la muestra no difieren de la población.
𝑯𝟏 : Las proporciones de la muestra sí difieren de la población.
20/11/2021 3
Cálculo del valor crítico. Grados de libertad
➢Varían según la aplicación.
➢Se comienza con el número de categorías o celdas k
➢Se le resta un GL por cada restricción sobre las
probabilidades (siempre se perderá un GL ya que 𝒑𝟏 +
𝒑𝟐 +, , , , +𝒑𝒌 = 𝟏)
➢Se pierde un GL por cada parámetro que se debe estimar
para calcular 𝑭𝑬𝒊 (Frecuencias esperadas)
➢Es decir GL=k-m-1
Siendo k=cantidad de categorías
20/11/2021
m=número de parámetros estimados 4
Cálculo del valor crítico
GL=k-m-1 𝜶 = 𝒏𝒊𝒗𝒆𝒍 𝒅𝒆 𝒔𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒄𝒊ó𝒏
Siendo k, cantidad de categorías
m es la cantidad estimada de parámetro
Ejemplo si k=4, m=0 y 𝜶 = 𝟎, 𝟎𝟓
𝛼 = 0,05

20/11/2021 5
ESTADÍSTICO CHI-CUADRADO
FRECUENCIAS ESPERADAS
➢Se calculan las frecuencias esperadas con las proporciones:
𝐹𝐸𝑖 = 𝑛 ∗ 𝑃(𝑋𝑖 )
Clase 1 Clase 1 ………… Clase 1 TOTAL

𝑭𝑶𝒊 𝑶𝟏 𝑶𝟐 …………. 𝑶𝒊 n

𝑷𝒊 P(𝑶𝟏 ) P(𝑶𝟐 ) ……………. P(𝑶𝒊 ) 1

𝑭𝑬𝒊 𝑬𝟏 𝑬𝟐 …………….. 𝑬𝒊

➢¿Las diferencias son lo suficientemente grandes como para afirmar


que las preferencias en la población han cambiado?∝= 0,05
20/11/2021 6
ESTADÍSTICO CHI-CUADRADO
➢Para cuantificar las diferencias en un único número se utiliza el estadístico:

(FO − FE ) 2

X muestral = 
2 i i

FE i

➢Cuando Ho es verdadera, las diferencias entre 𝐹𝑂𝑖 y 𝐹𝐸𝑖 serán pequeñas


➢Cuando Ho es falsa, las diferencias serán grandes.
➢Para determinar si las discrepancias entre FO y FE es lo suficientemente grande,
se utiliza la distribución chi-cuadrado con cierta cantidad de grados de libertad.
➢Sin embargo este estadístico tiene una distribución que se aproxima a la chi-
cuadrado.
20/11/2021 7
Conclusión


2 2
X muestral X Tabulado

𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 𝐻0

➢ Si se rechaza la Ho
➢ Se puede afirmar con un nivel de significancia ∝
𝑸𝒖𝒆 𝒍𝒂𝒔 𝒑𝒓𝒐𝒑𝒐𝒓𝒄𝒊𝒐𝒏𝒆𝒔 de la muestra difieren al menos
en una de la población
20/11/2021 8
EJEMPLO : Grupos sanguíneos
La distribución en la ciudad de Trujillo de los grupos sanguíneos es de un
35%, 10%, 6%, y un 49% para los grupos A, B, AB Y O respectivamente.
Se desea saber si la distribución de los grupos sanguíneos en el distrito
del Porvenir difiere de toda la ciudad de Trujillo.
Para determinar si la distribución de los grupos sanguíneos en el distrito
Porvenir difiere de Trujillo se extrajo una muestra de 200 pobladores del
Porvenir: Grupo A Grupo B Grupo AB Grupo O Frecuencias observadas
61 15 6 118

En este caso, la población es multinomial: cada poblador se clasifica


según su grupo sanguíneo en 4 categorías (k=4)

20/11/2021 9
EJEMPLO : Grupos sanguíneos
Tenemos una muestra y se desea inferir sobre toda la población, la
pregunta se resuelve mediante una prueba de hipótesis.
Las hipótesis puestas a prueba son
𝑯𝟎 :Las proporciones de cada grupo sanguíneo en el distrito Porvenir
no difieren de toda la ciudad de Trujillo.
𝑯𝟏 : Las proporciones de cada grupo sanguíneo en el distrito Porvenir sí
difieren de toda la ciudad de Trujillo al menos en una.

20/11/2021 10
EJEMPLO : Grupos sanguíneos
¿Cómo se resuelve?
Se contrastaran las frecuencias observadas 𝑭𝑶𝒊 en la muestra con las frecuencias
que se esperaría observar 𝑭𝑬𝒊
Se probaran si las proporciones cambian o no cambian (es decir 𝑯𝟎 es verdadera)
Cálculo del valor crítico
Siendo k=4, cantidad de categorías m=0 no se esta estimando ningún
Parámetro. Entonces GL=4-0-1=3 𝛼 = 0,05

20/11/2021 11
Frecuencias esperadas
Tenemos: 𝒑𝟏 = 𝟎, 𝟑𝟓, 𝒑𝟐 =0,10, 𝒑𝟑 = 𝟎, 𝟎𝟔, 𝒑𝟒 = 𝟎, 𝟒𝟗
Se calculan las frecuencias esperadas con las proporciones:𝑭𝑬𝒊 = 𝟐𝟎𝟎 ∗ 𝑷(𝑿𝒊 )

Grupo A Grupo B Grupo AB Grupo O Total

𝐹𝑂𝑖 61 15 6 118 200


𝑃𝑖 0,35 0,10 0,06 0,49 1
𝐹𝐸𝑖

¿Las diferencias son lo suficientemente grandes como para afirmar que las
preferencias en la población han cambiado?𝜶 = 𝟎, 𝟎𝟓

20/11/2021 12
Cálculo del estadístico de la muestra
Grupo A Grupo B Grupo AB Grupo O Total

𝐹𝑂𝑖 61 15 6 118 200


𝑃𝑖 0,35 0,10 0,06 0,49 1
𝐹𝐸𝑖 70 20 12 98 200

20/11/2021 13
Cálculo del estadístico de la muestra
𝑭𝒐 𝑭𝒆 (𝐹𝑜 − 𝑭𝒆 ) 𝟐 (𝐹𝑜 − 𝑭𝒆 ) 𝟐
𝑭𝒆
61 70 81 1,15714286
15 20 25 1,25
6 12 36 3
118 98 400 4,08163265
200 200 9,48877551

20/11/2021 14
Conclusión
2
𝑋𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 > 𝑋2

9,488 > 7,8147

➢ Se rechaza la Ho
➢ Se puede afirmar con un nivel de significancia del 5%. Que las
proporciones de cada grupo sanguíneo si difieren al menos
en una
➢ Por lo tanto la distribución de los grupos sanguíneos en el
distrito del Porvenir difiere de toda la ciudad de Trujillo.
20/11/2021 15
Condiciones necesarias para la validez de la prueba.
Para que la aproximación 𝑋 2 de la distribución del estadístico del
contraste sea válida:
➢El tamaño de la muestra debe ser suficientemente grande(n≥ 30)
➢La muestra debe ser una muestra aleatoria simple.
➢Las frecuencias esperadas 𝐹𝐸𝑖 = 𝑛𝑝𝑖 deberían ser todas > 5
➢Si la frecuencia esperada de alguna clase es < 5, se agrupa con otra
clase (o con varias si no fuese suficiente con una)para obtener una
frecuencia esperada≥ 5.
➢Cuando la variable es nominal (no hay una ordenación única) se suele
agrupar con la(s) que tiene ( e) menor valor de 𝐹𝐸𝑖 ,
➢Si la variable es ordinal(o continua)debe juntarse la que causo el
problema con una adyacente.
20/11/2021 16
TABLAS DE CONTINGENCIA
Una tabla de contingencia resume de manera simultanea dos variables de
interés. Estudia relaciones entre dos variables cualitativas,

EJEMPLO. Si queremos estudiar la relación entre el


color de ojos y el color del pelo.

 
La variable X: Color de ojos La variable Y: Color de pelo
x1: ojos claros y1: pelo claro
x2: ojos oscuros y2: pelo oscuro
20/11/2021 17
Donde:
𝑂𝑖𝑗 : Es el número de sujetos que tienen las características 𝐴𝑖 y 𝐵𝑗 a la vez.
𝑅𝑖 : (i=1,..r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos
que posen la característica 𝐴𝑖 .
𝐶𝑗 : (j=1,,,,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de
sujetos que poseen la característica 𝐵𝑗 .
n: Representa el total de observaciones tomadas.
20/11/2021 18
PRUEBA DE INDEPENDENCIA
➢La independencia de dos variables cosiste en que la distribución de una de
las variables es similar sea cual sea el nivel que examinemos de la otra.
➢Esto se traduce en una tabla de contingencia en que las frecuencias de las
filas (y las columnas) son aproximadamente proporcionales.
➢Posiblemente sea mas cómodo reconocer lo usado en la tabla de
contingencia los porcentajes por filas (o columnas) y observando si estos
son similares.
➢La prueba de independencia Ji-cuadrada(chi-cuadrado) contrasta la
hipótesis de que las variables son independientes, frente a la hipótesis
alternativa de que una variable se distribuye de modo diferente para
diversos niveles de la otra.
➢Consiste en comprobar si dos características cualitativas están relacionadas
entre sí.
20/11/2021 19
Ejemplo

¿El color de los ojos está relacionado con el color de los


cabellos?
Este tipo de contrastes se aplica cuando se desea comparar una
variable en dos situaciones o poblaciones diferentes.
Es decir, se desea estudiar si existen diferencias en las dos
poblaciones respecto a la variable de estudio.
Se usa para analizar la frecuencia de dos variables con
categorías múltiples para determinar si las dos variables son
independientes o no.
20/11/2021 20
EJEMPLO
¿El tipo de refresco preferido por un consumidor es independiente de su grupo
de la misma edad?
¿El estado nutricional esta asociado con el desempeño académico?
¿ Determinar si la región geográfica es independiente del tipo de inversión
financiera?
La pregunta es : ¿Existirá o no relación entre las variables A y B?, es decir: Si A y B
son o no independientes.
Formulación de hipótesis:
𝑯𝟎 : Las variables X e Y son independientes, (X e Y no están relacionadas)
𝑯𝟏 :Las variables X e Y no son independientes, (X e Y están relacionadas)

20/11/2021 21
El estadístico Ji-Cuadrado esta dado por:
r c (FO − FE ) 2

= 
2 i i
X muestral
i =1 j =1 FE i

Donde:
𝑂𝑖𝑗 : es la frecuencia observada de la celda que está en la
fila i, columna j,
𝑅𝑖 ∗𝐶𝑗
𝐸𝑖𝑗 = es la frecuencia esperada de la celda ( i, j).
𝑛
La frecuencia esperada tiene que ser ≥ 5
20/11/2021 22
La frecuencia esperada es aquella que debe ocurrir para que la
hipótesis nula no sea rechazada.
La prueba estadística se distribuye como una Ji-Cuadrado con (r-
1)*(c-1) grados de libertad.
La hipótesis nula se rechaza si,


2 2
X muestral X 1−
O equivalente si el “p-value” es menor que 𝛼 (prefijado)

20/11/2021 23
Pruebas de homogeneidad
Otra de las aplicaciones interesantes de la prueba chi-cuadrado
de independencia consiste en la comprobación de la
homogeneidad de distintas muestras de una variable.
Suponga que se ha obtenido J muestras de tamaño 𝑛𝑗 de una
misma variable aleatoria (X) y se quiere comprobar si son
homogéneas, es decir, si la variable tiene la misma distribución
de probabilidad en todas ellas, bien para utilizarlas
conjuntamente, o bien porque se trate de identificar diferencias
entre las poblaciones de procedencia de las distintas muestras.

20/11/2021 24
Las hipótesis de la prueba serán:
𝑯𝟎 : Las muestras son homogéneas
𝑯𝟏 : Las muestras no son homogéneas
La prueba de homogeneidad de varias muestras cualitativas, consiste
en comprobar si varias muestras de un carácter cualitativo proceden de
la misma población.
Ejemplo: ¿Las tres muestras de alumnos provienen de poblaciones con
igual distribución de aprobados?.
Es necesario que las dos variables medibles estén representadas
mediante categorías con las cuales se construye una tabla de
contingencia
20/11/2021 25
EJEMPLO 1
El Director de transporte supone que el uso de cinturón de
seguridad en los conductores, está relacionado con el género.
Toma una muestra de 160 personas de las cuales 75 son
mujeres y 85 son hombres. Los resultados son los siguientes:

SI NO
F 50 25
M 40 45

20/11/2021 26
SOLUCIÓN
Formulación de las hipótesis:
𝑯𝟎 : El uso del cinturón de seguridad es independiente del género.
𝑯𝟏 : El uso del cinturón de seguridad no es independiente del género.
Calculo de las FE
Para calcular todos y cada uno de los valores de la tabla de
frecuencias esperadas se realiza:
𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 ∗ 𝑇𝑜𝑡𝑎𝑙 𝑓𝑖𝑙𝑎
𝐹𝐸 =
𝑆𝑢𝑚𝑎 𝑇𝑜𝑡𝑎𝑙

20/11/2021 27
SI NO Total 𝑻𝒐𝒕𝒂𝒍 𝒄𝒐𝒍𝒖𝒎𝒏𝒂 ∗ 𝑻𝒐𝒕𝒂𝒍 𝒇𝒊𝒍𝒂
𝑭𝑬 =
𝑺𝒖𝒎𝒂 𝑻𝒐𝒕𝒂𝒍
F 50 25 75
42,1875 32,8125 90 * 75 90 * 85
= 42.1875 = 47.8125
160 160
M 40 45 85
47,8125 37,1875 70 * 75 70 * 85
= 32.8125 160 = 37.1875
160
Total 90 70 160
Para obtener el valor de Chi-Cuadrado calculado se tiene la fórmula
2
=
(FO − FE )
i i
2

X calculado
FE i

(50 − 42.1875) 2 (25 − 32.8125) 2 (40 − 47.8125) 2 (45 − 37.1875) 2


X calculado = 42.1875 + 32.8125 + 47.8125 + 37.1875
2

= 1.4468 + 18601 + 1.2766 + 1.6413 = 6.2248


2
X 20/11/2021
calculado 28
Nivel de significancia 𝜶 = 𝟎, 𝟎𝟏 GL=1
Es el error que se puede cometer al rechazar la hipótesis nula siendo verdadera.
Grado de libertad 𝝑
𝜗=(cantidad de filas -1)(cantidad de columnas -1)

𝜗=(2-1)(2-1)=1(1)=1

20/11/2021 29
Decisión


2 2
X muestral X 1−

6.2248  6.635

Entonces se acepta la hipótesis nula, es decir el uso del


cinturón de seguridad es independiente del género.

20/11/2021 30
Cómo pretendes volar si no te alejas de los que te arrancan las plumas.
Rodéate de los que te animan y apoyan, y no de los que sólo critican.

https://www.google.com/search?sa=X&rlz=1C1PRFI_enPE854PE854&source=univ&tbm=isch&q=Julc%C3%A1n+Turismo&ved=2
ahUKEwj4uZyfv9TqAhUChuAKHQeADE8QsAR6BAgJEAE&biw=1024&bih=625#imgrc=gM0MlFwbRVmUGM

También podría gustarte