0% encontró este documento útil (0 votos)

133 vistas20 páginas

Anova

Cargado por

qzdkdsf6fn

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

133 vistas20 páginas

Anova

Cargado por

qzdkdsf6fn

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

BIOESTADÍSTICA

6. ANOVA

Carlos Calvo Tapia

Unidad de Biomatemática
Facultad de Ciencias Biológicas
Universidad Complutense de Madrid
2024
Homocedasticidad

Decimos que dos o más variables aleatorias son homocedásticas si presentan la misma disper-
sión o variabilidad. La homocedasticidad implica por tanto homogeneidad de varianzas. Las
gráficas de densidad de dos variables aleatorias normales homocedásticas son idénticas, salvo
traslaciones a lo largo del eje de abscisas.

distribuciones normales distribuciones normales

homocedásticas heterocedásticas
f(x) f(x)

x x
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
ANOVA
Consideremos k > 1 poblaciones normales independientes, X1 ∼ N(μ1, σ), …, Xk ∼ N(μk, σ). En ocasiones
interesa contrastar si todas ellas se distribuyen o no del mismo modo. Formalmente:
H0 : μi = μj ∀i, j ∈ {1,…, k}
{ H1 : ∃i, j ∈ {1,…, k} | μi ≠ μj {H1 :
H0 : todas las medias son iguales: μ1 = ⋯ = μk
⟺
al menos dos medias son distintas

Si k = 2 obtenemos un contraste bilateral que ya hemos resuelto en el Tema 5, usando el estimador

X̄1 − X̄2 − (μX1 − μX2)
TμX −μX = ∼ tnX +nX −2
Sp̂ 1/nX1 + 1/nX2
1 2 1 2

Si k ≥ 3 tenemos dos opciones:

Comparar de manera exhaustiva cada par de parámetros μi, μj, i ≠ j, resolviendo contrastes 2 a 2.
Es desaconsejable, tanto por la acumulación de errores como por el enorme número de
intervenciones que conlleva: en total, k (k − 1) /2 contrastes bilaterales.
Proceder mediante lo que llamamos análisis de la varianza o ANOVA (acrónimo de analysis of
variance), una transformación que permite comparar las medias poblacionales de tres o más
distribuciones normales homocedásticas a través de un solo contraste.
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
Medias por población y media de medias
Consideremos k > 2 muestras de tamaños n1, …, nk ∈ ℕ , respectivamente, tomadas sobre k pobla-
ciones normales homocedásticas e independientes:

X11, …, X1n1 ∼ X1 = N(μ1, σ) → m.a.s. sobre la población 1

⋯ ⋯
Xk1, …, Xknk ∼ Xk = N(μk, σ) → m.a.s. sobre la población k

Podemos calcular k medias muestrales independientes, una para cada población:

1
X̄1 =
n1 ( X11 + ⋯ + X1n1)
⋯
1
X̄k =
nk ( Xk1 + ⋯ + Xknk)

Si tratamos por igual las k poblaciones, sin hacer distinciones por nivel o tratamiento, podemos
construir una macro-muestra de tamaño N = n1 + ⋯ + nk formada por la unión de todas las
tomadas, X11, …, X1nX, …, Xk1, …, Xknk, y calcular la media muestral total como
k ni k
1 1
N∑ ∑ ∑
X̄ = Xij = ni X̄i
i=1 j=1
N i=1
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
SSE y SSA
Definimos la suma de cuadrados de los errores o SSE (sum of squared errors) como
k ni

∑ ∑ ( ij i) [ 11 1 ] [ k1 k ]
2
2 2 2 2
SSE = X − X̄ = (X − X̄ 1 ) + ⋯ + (X1n1 − X̄ ) + ⋯ + (X − X̄ k ) + ⋯ + (Xknk − X̄ )
i=1 j=1
( 1 ) X1 ( k ) Xk
2̂ 2̂
n −1 S n −1 S

Es un estadístico, luego podemos calcular su esperanza. Apoyándonos en la homocedasticidad

2̂ 2̂ 2
requerida, la cual garantiza que [SX1] = ⋯ = [SXk] = σ :

[SSE] = [(n1 − 1) + ⋯ + (nk − 1)] σ = (N − k) σ2 2

Si en la expresión de SSA sustituimos las Xij por X̄i y las X̄i por X̄ , obtenemos la expresión de lo que
llamamos suma de cuadrados de los tratamientos o SSA (sum of squared errors of all treatments):
k
ni (X̄i − X̄) = [(X̄1 − X̄)2 + ⋯ + (X̄1 − X̄)2] + ⋯ + [(X̄k − X̄)2 + ⋯ + (X̄k − X̄)2]
2
∑
SSA =
i=1
n1(X̄1 − X̄) nk(X̄k − X̄)
2 2

El cálculo de su esperanza es un poco más laborioso:

k
[SSA] = (k − 1) σ + ni (μi − μ̄)
2 2
∑
i=1
𝔼
𝔼
𝔼
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
Propiedades
Para obtener la expresión de la esperanza de SSA usaremos las siguientes propiedades:
1. X̄i ∼ N(μi, σ/ ni ) ∀i ∈ {1,…, k}. En efecto, dado que Xi ∼ N(μi, σ), para su media muestral: [X̄i] = μi y Var[X̄i] = σ 2 /ni
1
2. X̄ ∼ N(μ̄, σ/ N), siendo μ̄ = (n1μ1 + ⋯ + nk μk) la media ponderada de las medias poblacionales:
N
k ni k k k
1 1 1 [1] 1 1
[ ni X̄i] = ni [X̄i] = ni μi = (n1μ1 + ⋯ + nk μk) = μ̄
N∑ ∑ ∑ ∑ ∑
2.1. [X̄] = Xij =
i=1 j=1
N i=1
N i=1
N i=1
N

k ni k ni k ni 2 k 2 k 2 ni 2 2
1 1 1 σ σ σ σ σ
σ2 = 2 ni = 2 (n1 + ⋯ + nk) = 2 N =
N∑ ∑ ∑∑ ∑∑ ∑∑ ∑
2.2. Var[X̄] = Var Xij = 2 Var[Xij] = 2 1== 2
i=1 j=1
N i=1 j=1
N i=1 j=1
N i=1 j=1
N i=1
N N N
2
σ
[(X̄ − μi) ] = N + (μi − μ̄) ∀i ∈ {1,…, k}. Sumando y restando μ̄ dentro del paréntesis y desarrollando:
2 2
3.
0 2
σ
[(X̄ − μ̄ + μ̄ − μi) ] = [(X̄ − [X̄]) + (μ̄ − μi) + 2 (X̄ − μ̄) (μ̄ − μi)] = Var[X̄] + (μi − μ̄) − 2 (μi − μ̄) [X̄ − μ̄] = N + (μi − μ̄)
2 [2.1] 2 2 2 [2.2] 2

σ2
4. Cov [X̄i, X̄] = ∀i ∈ {1,…, k}. Teniendo en cuenta que X̄1, …, X̄k son independientes, ∀i ≠ j Cov [X̄i, X̄j] = 0, luego
N
k nj k
1 1 1 k 1 1 σ 2
σ 2
njCov[X̄i, X̄j] = (0 + ⋯ + niVar[X̄i] + ⋯ + 0) = ni
[1]
N∑ ∑ ∑ ∑
Cov[X̄i, X̄] = Cov X̄i, Xjl = Cov X̄i, nj X̄j = =
j=1 l=1
N j=1
N j=1
N N ni N
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
𝔼
[SSA]

Calcularemos [SSA] a partir del siguiente desarrollo, construido sobre los valores de las distintas μi:
∑i=1 ni (X̄i − X̄) = ∑i=1 ni (X̄i − μi + μi − X̄) = ∑i=1 ni [(X̄i − μi) + (X̄ − μi) − 2 (X̄i − μi) (X̄ − μi)] =
k 2 k 2 k 2 2
SSA =

∑i=1 ni (X̄i − μi) + ∑i=1 ni (X̄ − μi) − 2 ∑i=1 ni (X̄i − μi) (X̄ − μi)
k 2 k 2 k
=
A B C

k k k k k

[∑ ]
2
σ
ni (X̄i − μi) [( i i ) ]
2 [1] 2 [1] 2 2
∑ ∑ i ∑ i ni ∑
[A] = = ni X̄ − [ X̄ ] = n Var[ X̄ i] = n = σ 1 = kσ
i=1 i=1 i=1 i=1 i=1
k k k k k k

[ i=1 ] [(X̄ − μi) ] = ∑ ni ( N + (μi − μ̄) ) = N ∑ ni + ∑ ni (μi − μ̄) = σ + ∑ ni (μi − μ̄)

2 2
σ σ
ni (X̄ − μi)
2 2 [3] 2 2 2 2
∑ ∑
[B] = = ni
i=1 i=1 i=1 i=1 i=1
k k k 0 2 k k

[∑ ]
2
σ σ
ni (X̄i − μi) (X̄ − μi) = [ i i ] ∑ i( ) ∑ i
[4] 2
∑ ∑
[C] = ni ( X̄ − μi)( X̄ − μ ) = n [X̄ i − μi] [ X̄ − μi] + Cov[ X̄ i , X̄] = n = ni = σ
i=1 i=1 i=1 i=1
N N i=1

Apoyándonos en los valores de las esperanzas de estos estadísticos A, B y C:

k k
ni (μi − μ̄) − 2σ = (k − 1) σ + ni (μi − μ̄)
2 2 2 2 2 2
∑ ∑
[SSA] = [A] + [B] − 2 [C] = kσ + σ + ◼
i=1 i=1
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
MSE y MSA
A partir del estadístico SSE podemos construir la suma de cuadrados media del error o MSE . Lo
hacemos con intención de obtener un estimador insesgado de la varianza σ 2 compartida por las k
poblaciones. Por eso dividimos intencionadamente entre (N − k):
SSE SSE
MSE = =
N − k (n1 − 1) + ⋯ + (nk − 1)

Y como sabemos que [SSE] = (N − k) σ 2, entonces

1 1
( )
2 2
[MSE] = [SSE] = N − k σ = σ
N−k N−k

Análogamente, a partir del estadístico SSA podemos calcular la suma de cuadrados media de
los tratamientos o MSA:
SSA
MSA =
k−1

En este caso no podemos obtener (por poco) un nuevo estimador insesgado de σ 2:

k
1 1
ni (μi − μ̄) ≥ σ 2
2 2
k−1∑
[MSA] = [SSA] = σ +
k−1 i=1
𝔼
𝔼
𝔼
𝔼
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
2
MSE y MSA como estimadores de σ

En resumen: dadas k muestras independientes extraídas sobre poblaciones normales homocedás-

ticas N(μ1, σ), …, N(μk, σ) , hemos construido dos nuevos estadísticos independientes, MSE y MSA , tales
que:
k
1
ni (μi − μ̄)
2
[MSE] = σ 2 2
k−1∑
[MSA] = σ +
i=1

MSE es un estimador insesgado de σ 2. Es decir, de la varianza que comparten las k poblaciones.

2
MSA sin embargo es un estimador sesgado de σ , ya que en general sobrestima su valor *
Cuanto más alto es el valor que toma MSA al evaluarse sobre el conjunto de las k muestras que
participan en el contraste, mayores son las discrepancias entre los valores de las medias
poblacionales, μ1, …, μk.

A no ser que el segundo término se anule, algo que sucede si y sólo si μ1 = ⋯ = μk , esto es, si y
sólo si H0 es cierta. Ésta es la clave del contraste ANOVA.
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
𝔼
Proposición 1

Proposición 1. Consideremos k > 2 muestras de tamaños n1, …, nk ∈ ℕ, respectivamente, tomadas sobre

k poblaciones normales X1, …, Xk independientes y homocedásticas de varianza σ 2 > 0.

A) Denotando N = n1 + ⋯ + nk:
N−k 2
MSE ∼ χN−k
σ 2

B) Si además se verifica H0 : μ1 = ⋯ = μk:

k−1 2
MSA ∼ χk−1
σ 2

C) Y al ser MSE y MSA estadísticos independientes, como consecuencia inmediata de A) y B) se tiene

que, bajo la asunción de que la hipótesis nula es cierta:
MSA
∼ Fk−1,N−k
MSE

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Proposición 1 (demostración)
Demostración:
A) Haciendo uso de la Proposición 1A del Tema 4 sobre cada población X1, …, Xn:
N−k N − k SSE 1 1 n1 − 1 2̂ nk − 1 2
(( 1 ) X1 ( k ) Xk)
2̂ 2̂ ̂ 2 2
MSE = = SSE = n − 1 S + ⋯ + n − 1 S = S + ⋯ + S ∼ χ = χN−k ◼
σ 2 σ N−k σ
2 2 σ 2 σ 2 X1
σ 2 Xk ( n1 −1) +⋯+( nk − 1 )

χn21−1 χn2k−1

B) Por un lado, partiendo del desarrollo

k k k k k
ni (X̄i − μ̄) = ni (X̄i − X̄ + X̄ − μ̄) = ni (X̄i − X̄) + (X̄ − μ̄) ni + 2 (X̄ − μ̄) ( X̄i − X̄) = SSA + N (X̄ − μ̄) ,
2 2 2 2 2
∑ ∑ ∑ ∑ ∑
i=1 i=1 i=1 i=1 i=1

obtenemos, despejando, una expresión alternativa para SSA, análoga a la que obtuvimos para S 2 en el Tema 4:
k
ni (X̄i − μ̄) − N (X̄ − μ̄) .
2 2
∑
SSA =
i=1

Por otra parte, al verificarse H0, se tiene que μ1 = ⋯ = μk = μ̄ y por tanto la Propiedad [1] puede reescribirse como
X̄i ∼ N(μ̄, σ/ ni ) ∀i ∈ {1,…, k}.

Además, por la Propiedad [2]:

X̄ ∼ N(μ̄, σ/ N).
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
Proposición 1 (demostración)

Dividiendo la nueva expresión para SSA entre la varianza σ 2 compartida:

2 2
k k

∑ ( σ/ ni ) ( σ/ N )
1 1 N X̄i − μ̄ X̄ − μ̄
( )
2 2 2 2 2
∑
SSA = n (
i iX̄ − μ̄) − X̄ − μ̄ = − ∼ χk − χ1 ∼ χk−1
σ 2 σ i=1
2 σ 2
i=1

N(0,1)2 N(0,1)2

Finalmente:
1 k − 1 SSA k−1 2
SSA = = MSA ∼ χk−1 ◼
σ 2 σ k−1
2 σ 2

C) Por la propia definición de la distribución F de Fisher como el cociente de dos distribuciones chi cuadrado
independientes, divididas entre sus respectivos grados de libertad:
k−1
2 MSA
χk−1 σ2
k − 1 k − 1 MSA
Fk−1,N−k ∼ 2 ∼ = ◼
χN−k N−k MSE
MSE
N−k σ2
N−k

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Estadístico de contraste
Recordemos el contraste planteado en un inicio:
H0 : μi = μj ∀i, j ∈ {1,…, k}
{ H1 : ∃i, j ∈ {1,…, k} | μi ≠ μj

Sin más que considerar la ratio (cociente) entre los dos nuevos estimadores definidos,
MSA
T= ,
MSE
obtenemos de manera indirecta un estadístico de contraste suficiente para decidir, en base a las
diferentes muestras extraídas, si las k poblaciones comparten o no la misma distribución:
N→∞
Bajo la asunción de que H0 es cierta, T ∼ Fk−1,N−k y por tanto [T ] = (N − k)/(N − k − 2) → 1

Consecuentemente, es de esperar que la evaluación de T sobre el conjunto de k muestras valga:

mse { ≫ 1
msa ≈ 1 si H0 : μ1 = ⋯μk = es cierta
t0 = =
en otro caso
Para resolver el contraste, fijado un nivel de significación 0 < α ≪ 1:

( mse )
msa
R0 = [0, fk−1,N−k,α], R1 = (fk−1,N−k,α, + ∞), p = p Fk−1,N−k >

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

𝔼
Tabla ANOVA

Para presentar de manera unificada los resultados de un análisis de la varianza es bastante

común usar la siguiente tabla:

sumas medias
g.l. f p-valor
cuadráticas cuadráticas

tratamientos ssa k−1 msa t0 p(Fk−1,N−k > t0)

error sse N−k mse

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Proposición 2
Ahora bien, ¿qué ocurre si t0 ∈ R1, o equivalentemente, p < α? Si hay evidencias para rechazar H0, ¿qué
pares μi, μj difieren? En otras palabras, ¿qué poblaciones comparten la misma distribución y cuáles no?

Proposición 2. Bajo las mismas consideraciones que la Proposición 1, ∀i, j ∈ {1,…, k}, i < j, el estadístico
X̄i − X̄j − (μi − μj)
T= ∼ tN−k

( ni nj )
1 1
MSE +

sigue una distribución t de Student con N − k grados de libertad.

Demostración: Partiendo de la definición de la distribución t de Student y apoyándonos en la Proposición 1A,

X̄i − X̄j − (μi − μj) X̄i − X̄j − (μi − μj)

σ2 σ2 1 1
+ σ +
Z ni nj ni nj X̄i − X̄j − (μi − μj)
tN−k ∼ ∼ = = ◼
χN−k
2 N−k MSE

( ni nj )
MSE 1 1
N−k σ2 σ MSE +
N−k

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Prueba LSD de Fisher
Para determinar qué medias poblacionales difieren usaremos la llamada prueba LSD de Fisher (Least
Significant Difference), que se apoya en la Proposición anterior para establecer el siguiente protocolo:
Planteamos un total de k(k − 1)/2 contrastes bilaterales 2 a 2: para cada par (i, j) con i < j,
H0 : μi = μj H0 : μi − μj = 0
{H1 : μi ≠ μj {H1 : μi − μj ≠ 0
⟺

La gran ventaja es que el estadístico de contraste T que resuelve todos los contrastes establecidos (que
podrían ser muchos) será el definido en la Proposición 2 anterior, el cual sigue la misma distribución tN−k
independientemente de las poblaciones i y j que enfrentemos en cada caso.
Dado un nivel de significación 0 < α ≪ 1, basta por tanto definir un único par de regiones
R0 = [−tN−k,α/2, tN−k,α/2] R1 = (−∞, − tN−k,α/2) ∪ (tN−k,α/2, + ∞)

y obtener, para cada (i, j) con i < j el valor de t0 como

x̄i − x̄j
t0(i, j) =
mse (1/ni + 1/nj)

También se podría hallar el p-valor para cada par de muestras: p(i, j) = 2p (tN−k > | t0(i, j) | ). Pero en este
caso, dado el alto número de contrastes planteados, es preferible usar siempre el Método 1
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
Seminario. Hoja 6
Hoja 6· Ej. 1: Interesa comparar la rapidez con que actúan tres analgésicos. Para ello, se distribuyen N = 18
pacientes al azar en k = 4 grupos de tamaños n1 = 3 , n2 = n3 = n4 = 5 . En el momento en que el paciente
manifiesta dolor de cabeza, se le administra el fármaco y se mide el tiempo transcurrido (en unidades de 15
minutos) hasta que el dolor desaparece. Al grupo 1 se le administra un placebo y al resto, distintos fármacos,
obteniéndose los tiempos que se recogen en la siguiente tabla:
<latexit sha1_base64="wV50qjPUUaiUk7uze9M2Ui8JdIc=">AAACxHicdZFJT8MwEIWdsJetwJGLRQXiVCW0LEcWCXEEiQJSU1WOO02tOk7wglSF8iO5If4MTkjZedGTnmY+a2JPmHKmtOe9OO7U9Mzs3PxCZXFpeWW1urZ+oxIjKbRowhN5FxIFnAloaaY53KUSSBxyuA2HZ3n/9gGkYom41qMUOjGJBOszSrQtdauvQQgRE5kmoeFEjjP6+Egn37iCC0XSpAn28Q4+tD6wPsKfCgIcDPL53+g9SzVLer/M+//SDdttfFAT/0c3Szr3ZE6jIAIQvY+7dKs1r+4Vwr+DX4YaKnXZrT4HvYSaGISmnCjV9r1UdzIiNaMcxpXAKEgJHZII2jYKEoPqZMUSxnjbVnq4n0hroXFR/XoiI7FSozi0ZEz0QP3s5cW/em2j+0edjInUaBD0fVDfcKwTnG8U95gEqvnIBkIls/+K6YBIQrXde8U+gv/zyr/DzV7dP6j7V83a8Wn5HPNoE22hXeSjQ3SMLtAlaiHqnDiRkzr37rnLXeWad9R1yjMb6Jvcpze+uMKu</latexit>

grupo 1 7 6 8
Asumiendo normalidad, independencia y homocedasticidad, y escogiendo un
grupo 2 4 6 5 4 5
grupo 3 3 4 5 5 5 nivel de significación α = 0.05, razonar si los analgésicos producen algún alivio y,
grupo 4 3 3 2 4 3 en caso afirmativo, cuál o cuáles son más efectivos.

1. Medias independientes por grupos: 2. Media total y sumas de cuadrados

k ni
1
n1
1 1 1 4 1 82
( 3 ⋅ 7.0 + 5 ⋅ 4.8 + 5 ⋅ 4.4 + 5 ⋅ 3.0) =
x1j = (7 + 6 + 8) = 7.0 N∑ ∑ ∑
x̄ = xij = ni x̄i = ≃ 4.5556
n1 ∑
x̄1 = N 18 18
j=1
3 i=1 j=1 i=1
n2 k ni
1 1
∑ ∑ ( ij i)
2
x2j = (4 + 6 + 5 + 4 + 5) = 4.8 [
2 2 2
] [
2 2 2 2 2
] [
2 2 2 2 2
]+
∑
x̄2 = sse = x − x̄ = 0 + 1 + 1 + 0.8 + 1.2 + 0.2 + 0.8 + 0.2 + 1.4 + 0.4 + 0.6 + 0.6 + 0.6
n2 j=1 5 i=1 j=1

1
n3
1 + [02 + 02 + 12 + 12 + 02] = 2.0 + 2.8 + 3.2 + 2.0 = 10.0
x3j = (3 + 4 + 5 + 5 + 5) = 4.4
n3 ∑
x̄3 =
j=1
5 k
ni (x̄i − x̄) = n1 (x̄1 − x̄) + n2 (x̄2 − x̄) + n3 (x̄3 − x̄) + n4 (x̄4 − x̄) =
2 2 2 2 2
∑
n4 ssa =
1 1
n4 ∑
x̄4 = x4j = (3 + 3 + 2 + 4 + 3) = 3.0 i=1
j=1
5 = 3 ⋅ 2.44442 + 5 ⋅ 0.24442 + 5 ⋅ 0.15562 + 5 ⋅ 1.55562 ≃ 30.4444

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Seminario. Hoja 6
3. Cuadrados medios y evaluación del 5. Prueba LSD de Fisher para testar las 6 hipótesis H0 : μi = μj, con i < j, α = 0.05
estadístico de contraste
R0 = [−tN−k,α/2, tN−k,α/2] = [−t14,0.025, t14,0.025] = [−2.1448, 2.1448]
sse 10 10
mse = = = ≃ 0.7143 R1 = (−∞, tN−k,α/2) ∪ (tN−k,α/2, + ∞) = (−∞, − 2.1448) ∪ (2.1448, + ∞)
N − k 18 − 4 14
ssa 30.4444 30.4444 Para expresar las diferencias entre medias es útil usar notación matricial:
msa = ≃ = ≃ 10.1481 k
k−1 4−1 3
0 +3.56 +4.21 +6.48
MSA x̄i − x̄j
T= ∼ Fk−1,N−k = F3,14 −3.56 0 +0.75 +3.37
(t0(i, j))i,j=1 =
k
MSE =
−4.21 −0.75 0 +2.62
msa 10.1481 mse (1/ni + 1/nj) −6.48 −3.37 −2.62 0
t0 = ≃ ≃ 14.2074
mse 0.7143 i,j=1
f(x)
Tras calcular para cada (i, j) las evaluaciones de T ∼ tN−k, analizamos:
4. Resolución del contraste ANOVA:
a) t0(2,3) ∈ R0, luego no hay evidencias para rechazar H0 : no existen
Método 1: regiones de aceptación y crítica,
diferencias significativas entre los tiempos de los grupos 2 y 3.
α = 0.05
b) t0(1,2), t0(1,3), t0(1,4), t0(2,4), t0(3,4) ∈ R1, luego rechazamos H0: i) los
R0 = [0, fk−1,N−k,α] = [0, f3,14,0.05] ≃ [0, 3.3439]
tres fármacos aceleran la desaparición del dolor de cabeza,
R1 = (fk−1,N−k,α, + ∞) = (3.3439, + ∞) ∋ t0 ya que los grupos 2, 3 y 4 se recuperan significativamente
Método 2: cálculo del p-valor antes que el 1 (control); ii) los pacientes del grupo 4 se
recuperan significativamente antes que los de los grupos 2 y 3
p = p(T > t0) = p(Fk−1,N−k > t0) = p(F3,14 > 14.2075) ≃ 0.0002

Rechazamos H0 : μ1 = μ2 = μ3 = μ4
R0
R1
Luego los analgésicos surten efecto 3.34 ≃ f3,14,0.05 t0 ≃ 14.21 x
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM
Seminario. Hoja 6
Hoja 6· Ej. 2: Queremos comparar el efecto de cuatro plaguicidas distintos. Para ello planteamos un análisis
ANOVA con k = 4 niveles respecto de las variables Xi: «porcentaje de hortalizas dañadas al usar el plaguicida i»,
∀i ∈ {1,2,3,4}. Tomamos muestras de tamaños n1 = 13, n2 = 9, n3 = 7, n4 = 10 . Completar los campos vacíos de la
siguiente tabla del análisis de la varianza y razonar si los efectos de los plaguicidas difieren significativamente.

sumas medias
g.l. f p-valor
cuadráticas cuadráticas

tratamientos 3.3571 k−1 msa t0 p (Fk−1,N−k > t0)

error sse N−k 2.0751

1. A partir de los datos proporcionados, lo más fácil es co- 3. La evaluación del estadístico de contraste se calcula
menzar rellenando la columna de los grados de libertad: como el cociente entre las medias cuadráticas:
k =4⇒k−1=3 msa
t0 = = 1.1190/2.0751 ≃ 0.5393
mse
N = n1 + n2 + n3 + n4 = 13 + 9 + 7 + 10 = 39 ⇒ N − k = 39 − 4 = 35

2. Los grados de libertad establecen la relación entre las 4. Para hallar el p-valor sólo hay que evaluar en t0 la distribu-
sumas y medias cuadráticas: ción F de Fisher de (k − 1, N − k) = (3, 35) grados de libertad:
msa = ssa/(k − 1) = 3.3571/3 = 1.1190 p = p(Fk−1,N−k > t0) = p(F3,35 > 0.5393) ≃ 0.6585
mse = sse/ (N − k) ⇒ sse = (N − k) mse = 35 ⋅ 2.0751 = 72.6285

Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

Seminario. Hoja 6
Hoja 6· Ej. 2: Queremos comparar el efecto de cuatro plaguicidas distintos. Para ello planteamos un análisis
ANOVA con k = 4 niveles respecto de las variables Xi: «porcentaje de hortalizas dañadas al usar el plaguicida i»,
∀i ∈ {1,2,3,4}. Tomamos muestras de tamaños n1 = 13, n2 = 9, n3 = 7, n4 = 10 . Completar los campos vacíos de la
siguiente tabla del análisis de la varianza y razonar si los efectos de los plaguicidas difieren significativamente.

sumas medias
g.l. f p-valor
cuadráticas cuadráticas

tratamientos 3.3571 3 1.1190 0.5393 0.6585

error 72.6285 35 2.0751
densidad de una distribución
F de Fisher de (3, 35) g.l.
Con toda esta información, estamos en condiciones de resolver el contraste
ANOVA planteado, siempre y cuando asumamos: f(x)
[ MSE ]
MSA N−k 35
= [Fk−1,N−k ] = = ≃ 1.06
i) las v.a. X1, X2, X3 y X4 se distribuyen de manera Normal N − k − 2 33

ii) las v.a. X1, X2, X3 y X4 presentan la misma variabilidad (homocedasticidad)

Área :p ≃ 0.6585
iii) las muestras han sido tomadas de manera independiente

5. Dado el elevadísimo p-valor obtenido, podemos admitir que no existen 2.8742 ≃ f3,35,0.05
diferencias significativas entre los efectos producidos por los cuatro
plaguicidas testados; en otras palabras:
no existen evidencias para rechazar H0 : μ1 = μ2 = μ3 = μ4 t0 ≃ 0.54 1 x
𝔼
𝔼
Carlos Calvo Tapia· Unidad de Biomatemática· Facultad de Ciencias Biológicas· UCM

También podría gustarte

Inferencia y Estimación
Aún no hay calificaciones
Inferencia y Estimación
36 páginas
Soluciones A ECPC4 2024 - I
Aún no hay calificaciones
Soluciones A ECPC4 2024 - I
3 páginas
Cert3 MAT042P 1 2009
Aún no hay calificaciones
Cert3 MAT042P 1 2009
7 páginas
Ejercicios de Bioestadística Resueltos
Aún no hay calificaciones
Ejercicios de Bioestadística Resueltos
15 páginas
Prueba de bondad de ajuste chi-cuadrado
Aún no hay calificaciones
Prueba de bondad de ajuste chi-cuadrado
7 páginas
Problemas Resueltos Del Experto Estadistica Uned
Aún no hay calificaciones
Problemas Resueltos Del Experto Estadistica Uned
13 páginas
Ejemplo Sejer Cici Os Re Sueltos
Aún no hay calificaciones
Ejemplo Sejer Cici Os Re Sueltos
15 páginas
Fundamentos de Econometría y Estadística
Aún no hay calificaciones
Fundamentos de Econometría y Estadística
6 páginas
Formulario de Estadística y Probabilidad
Aún no hay calificaciones
Formulario de Estadística y Probabilidad
21 páginas
Propiedades de Estimadores: Sesgo y Consistencia
Aún no hay calificaciones
Propiedades de Estimadores: Sesgo y Consistencia
4 páginas
EYP1113 - 2024 - 02 (Formulario)
Aún no hay calificaciones
EYP1113 - 2024 - 02 (Formulario)
11 páginas
Distribuciones de Probabilidad y Estadística
Aún no hay calificaciones
Distribuciones de Probabilidad y Estadística
9 páginas
Fórmulas Estadísticas Esenciales
Aún no hay calificaciones
Fórmulas Estadísticas Esenciales
5 páginas
Apuntes Yolanda
Aún no hay calificaciones
Apuntes Yolanda
95 páginas
FORMULARIO-TOTAL Estadistica PDF
Aún no hay calificaciones
FORMULARIO-TOTAL Estadistica PDF
3 páginas
Formulas para Probabilidades y Estadísticas
Aún no hay calificaciones
Formulas para Probabilidades y Estadísticas
10 páginas
Pruebas de Hipótesis en Poblaciones Normales
Aún no hay calificaciones
Pruebas de Hipótesis en Poblaciones Normales
8 páginas
Estadística Descriptiva y Probabilidad
Aún no hay calificaciones
Estadística Descriptiva y Probabilidad
11 páginas
Deberestadistica
40% (5)
Deberestadistica
18 páginas
Formulario Estadística GIB
Aún no hay calificaciones
Formulario Estadística GIB
2 páginas
Comparación de Medias: ANOVA Un Factor
Aún no hay calificaciones
Comparación de Medias: ANOVA Un Factor
10 páginas
Fórmulas de Biometría y Estadística 2023
Aún no hay calificaciones
Fórmulas de Biometría y Estadística 2023
20 páginas
Análisis Estadístico en Bioingeniería
Aún no hay calificaciones
Análisis Estadístico en Bioingeniería
64 páginas
TAREA #05 Propiedades de Los Estimadores y Estimación
Aún no hay calificaciones
TAREA #05 Propiedades de Los Estimadores y Estimación
17 páginas
Problemas de Econometría III: Estimadores y Varianzas
Aún no hay calificaciones
Problemas de Econometría III: Estimadores y Varianzas
20 páginas
Estimación y Contrastes en Bioestadística
Aún no hay calificaciones
Estimación y Contrastes en Bioestadística
4 páginas
Comparación de Poblaciones
Aún no hay calificaciones
Comparación de Poblaciones
27 páginas
Supuestos en Estadística y Estimación
Aún no hay calificaciones
Supuestos en Estadística y Estimación
12 páginas
Análisis Estadístico de Datos Estudiantiles
Aún no hay calificaciones
Análisis Estadístico de Datos Estudiantiles
4 páginas
Formulario3 Estadistica 1pag
Aún no hay calificaciones
Formulario3 Estadistica 1pag
10 páginas
ANOVA: Comparación de Grupos en Estadística
Aún no hay calificaciones
ANOVA: Comparación de Grupos en Estadística
9 páginas
Apuntes AEDB20212
Aún no hay calificaciones
Apuntes AEDB20212
88 páginas
Efectos del Mercurio en Peces del Río
Aún no hay calificaciones
Efectos del Mercurio en Peces del Río
8 páginas
Hoja de Formulas Curso Bioestadistica
Aún no hay calificaciones
Hoja de Formulas Curso Bioestadistica
6 páginas
Distribución de Muestreo y Pruebas de Hipótesis
Aún no hay calificaciones
Distribución de Muestreo y Pruebas de Hipótesis
61 páginas
Guía Completa de ANOVA en Estadística
Aún no hay calificaciones
Guía Completa de ANOVA en Estadística
26 páginas
Análisis de Varianza Total
Aún no hay calificaciones
Análisis de Varianza Total
5 páginas
Taller 2 Experimentos Con Un Solo Factor
Aún no hay calificaciones
Taller 2 Experimentos Con Un Solo Factor
9 páginas
Propiedades de Esperanza y Covarianza en Econometría
Aún no hay calificaciones
Propiedades de Esperanza y Covarianza en Econometría
14 páginas
Fórmulas de Bioestadística y Pruebas Paramétricas
Aún no hay calificaciones
Fórmulas de Bioestadística y Pruebas Paramétricas
4 páginas
Fundamentos de Estadística y Probabilidad
Aún no hay calificaciones
Fundamentos de Estadística y Probabilidad
10 páginas
Anova L.cordov
Aún no hay calificaciones
Anova L.cordov
19 páginas
Pruebas de Hipotesis para Varias Muestras
Aún no hay calificaciones
Pruebas de Hipotesis para Varias Muestras
38 páginas
Guía 2 de Estadística Métodos de Estimación.
Aún no hay calificaciones
Guía 2 de Estadística Métodos de Estimación.
5 páginas
Análisis de Varianza en Estadística
Aún no hay calificaciones
Análisis de Varianza en Estadística
40 páginas
ANOVA: Métodos de Enseñanza en Biología
Aún no hay calificaciones
ANOVA: Métodos de Enseñanza en Biología
14 páginas
Ejercicios de Control Estadistica
Aún no hay calificaciones
Ejercicios de Control Estadistica
11 páginas
Formulario Bioestadistica
Aún no hay calificaciones
Formulario Bioestadistica
10 páginas
Diseños Experimentales en Agronomía
Aún no hay calificaciones
Diseños Experimentales en Agronomía
161 páginas
Diseño Completamente Al Azar (Dca)
Aún no hay calificaciones
Diseño Completamente Al Azar (Dca)
21 páginas
Fundamentos de Inferencia Estadística
Aún no hay calificaciones
Fundamentos de Inferencia Estadística
2 páginas
Lprob4 Consolucion
Aún no hay calificaciones
Lprob4 Consolucion
11 páginas
Problemas de Bioestadística UNED 2016-2017
Aún no hay calificaciones
Problemas de Bioestadística UNED 2016-2017
10 páginas
Libro Metrología
100% (9)
Libro Metrología
104 páginas
Metrologia 2 PDF
100% (7)
Metrologia 2 PDF
100 páginas
Curso 17025 Ema Remoto Enero 2023
Aún no hay calificaciones
Curso 17025 Ema Remoto Enero 2023
89 páginas
Taller de Mejores Practicas Minitab
100% (2)
Taller de Mejores Practicas Minitab
82 páginas
Mapeo de Procesos según ISO 9001:2015
92% (13)
Mapeo de Procesos según ISO 9001:2015
34 páginas
Metrologia I
100% (4)
Metrologia I
37 páginas
Curso de Metrología
100% (10)
Curso de Metrología
32 páginas
Estudio R&R de Medición en Tornillos
Aún no hay calificaciones
Estudio R&R de Medición en Tornillos
9 páginas
Normas ISO para Laboratorios de Ensayo
Aún no hay calificaciones
Normas ISO para Laboratorios de Ensayo
26 páginas
Gestión de No Conformidades en 17025
100% (1)
Gestión de No Conformidades en 17025
99 páginas
Aseguramiento de La Validez de Los Resultados II
100% (4)
Aseguramiento de La Validez de Los Resultados II
26 páginas
SGC Laboratorio 17025
88% (8)
SGC Laboratorio 17025
31 páginas
Aseguramiento de La Validez de Los Resultados
100% (4)
Aseguramiento de La Validez de Los Resultados
68 páginas
Curso ISO/IEC 17025:2017 y Calidad
100% (3)
Curso ISO/IEC 17025:2017 y Calidad
110 páginas
Matriz Riesgos A La Imparcialidad y Confidencialidad 2018
86% (29)
Matriz Riesgos A La Imparcialidad y Confidencialidad 2018
1 página
Estadistica Descriptiva e Inferencial Manuel Cordova Zamora
94% (34)
Estadistica Descriptiva e Inferencial Manuel Cordova Zamora
518 páginas
Ebook Interpretación ISO 9001-2015
94% (34)
Ebook Interpretación ISO 9001-2015
79 páginas
Barreno Chue Millones Vasquez Castillo Estadistica Aplicada PDF
100% (15)
Barreno Chue Millones Vasquez Castillo Estadistica Aplicada PDF
448 páginas
Gonzalez - Carlos - Metrologia Libro
79% (14)
Gonzalez - Carlos - Metrologia Libro
712 páginas
Seis Sigma. Guía Didáctica para Pymes PDF
100% (10)
Seis Sigma. Guía Didáctica para Pymes PDF
129 páginas
PROC 017 Procedimiento para Aseguramiento de La Validez de Los Resultados
100% (5)
PROC 017 Procedimiento para Aseguramiento de La Validez de Los Resultados
9 páginas
Libro UNICAH Control Estadístico de La Calidad
100% (6)
Libro UNICAH Control Estadístico de La Calidad
209 páginas
Aseguramiento de La Validez de Los Resultados
100% (1)
Aseguramiento de La Validez de Los Resultados
75 páginas
PC-032 Procedimiento para La Calibración de Máquinas de Ensayos Uniaxiales
100% (1)
PC-032 Procedimiento para La Calibración de Máquinas de Ensayos Uniaxiales
52 páginas
Implementación ISO/IEC 17025: Guía Completa
100% (1)
Implementación ISO/IEC 17025: Guía Completa
11 páginas
Control Estadístico de La Calidad - Douglas C. Montgomery - 3ra Edición
90% (10)
Control Estadístico de La Calidad - Douglas C. Montgomery - 3ra Edición
808 páginas
Iso 9001-2015
86% (7)
Iso 9001-2015
42 páginas
Norma ISO 17025-2017
100% (25)
Norma ISO 17025-2017
43 páginas
Procedimiento de Calibración Termométrica
100% (3)
Procedimiento de Calibración Termométrica
44 páginas
Estudio del Rango de Trabajo en Laboratorios
Aún no hay calificaciones
Estudio del Rango de Trabajo en Laboratorios
25 páginas
Contrastes de Hipótesis en Bioestadística
Aún no hay calificaciones
Contrastes de Hipótesis en Bioestadística
38 páginas
Probabilidad
Aún no hay calificaciones
Probabilidad
29 páginas
Modelos Probabilísticos
Aún no hay calificaciones
Modelos Probabilísticos
41 páginas
Variables Aleatorias
Aún no hay calificaciones
Variables Aleatorias
38 páginas
Máxima Verosimilitud y Estimación Bayesiana
Aún no hay calificaciones
Máxima Verosimilitud y Estimación Bayesiana
42 páginas
Estimación de Parámetros en Estadística
Aún no hay calificaciones
Estimación de Parámetros en Estadística
50 páginas
Análisis FTIR de aceites comestibles y biodiesel
Aún no hay calificaciones
Análisis FTIR de aceites comestibles y biodiesel
10 páginas
Examen Parcial de Pronósticos y Métodos
100% (1)
Examen Parcial de Pronósticos y Métodos
21 páginas
Estadistica T3 2025-2
Aún no hay calificaciones
Estadistica T3 2025-2
50 páginas
Parcial 1 Gerencia de Produccion
Aún no hay calificaciones
Parcial 1 Gerencia de Produccion
10 páginas
Econometria I
100% (1)
Econometria I
162 páginas
Inferencia Estadística: Estimación de Parámetros
Aún no hay calificaciones
Inferencia Estadística: Estimación de Parámetros
191 páginas
Modelos ARMA: Selección y Predicción
Aún no hay calificaciones
Modelos ARMA: Selección y Predicción
26 páginas
Ejercicios de Estadística y Probabilidades
Aún no hay calificaciones
Ejercicios de Estadística y Probabilidades
18 páginas
F6 - Estimación Puntual
Aún no hay calificaciones
F6 - Estimación Puntual
1 página
Propiedades y Comparación de Estimadores
Aún no hay calificaciones
Propiedades y Comparación de Estimadores
18 páginas
Estadistica Matematica Con Aplicaciones
Aún no hay calificaciones
Estadistica Matematica Con Aplicaciones
15 páginas
Taller de Probabilidad y Estadística
Aún no hay calificaciones
Taller de Probabilidad y Estadística
2 páginas
Filtros Adaptativos: Diseño y Aplicaciones
Aún no hay calificaciones
Filtros Adaptativos: Diseño y Aplicaciones
16 páginas
Análisis de Regresión Lineal Múltiple
Aún no hay calificaciones
Análisis de Regresión Lineal Múltiple
33 páginas
Funciones de Pertenencia en Matlab
Aún no hay calificaciones
Funciones de Pertenencia en Matlab
24 páginas
Ajuste de Curvas Lineales
Aún no hay calificaciones
Ajuste de Curvas Lineales
3 páginas
Estimación Puntual en Estadística
Aún no hay calificaciones
Estimación Puntual en Estadística
113 páginas
Intervalos de Confianza en Regresión Múltiple
Aún no hay calificaciones
Intervalos de Confianza en Regresión Múltiple
23 páginas
Bootstrap en Muestreo Poisson
Aún no hay calificaciones
Bootstrap en Muestreo Poisson
67 páginas
Diseño Experimental Unifactorial en Estadística
Aún no hay calificaciones
Diseño Experimental Unifactorial en Estadística
16 páginas
Análisis de Errores en Datos Experimentales
Aún no hay calificaciones
Análisis de Errores en Datos Experimentales
8 páginas
Analisis Estadistico de Loa Datos Simulados Estimadores
Aún no hay calificaciones
Analisis Estadistico de Loa Datos Simulados Estimadores
19 páginas
Diagnóstico de Calidad de Energía
Aún no hay calificaciones
Diagnóstico de Calidad de Energía
295 páginas
Errores en Pronósticos de Demanda
Aún no hay calificaciones
Errores en Pronósticos de Demanda
13 páginas
TEMA4
Aún no hay calificaciones
TEMA4
18 páginas
5-3 Errores en Los Pronosticos
Aún no hay calificaciones
5-3 Errores en Los Pronosticos
5 páginas
Problemas de Estimación Estadística
Aún no hay calificaciones
Problemas de Estimación Estadística
6 páginas