Murray R Spiegel - Estatística-Pearson
Murray R Spiegel - Estatística-Pearson
t/§ü sD Do
0"i . Dz.?}vq
ESTATISTICA
3a Et)tçAo
ESTATISTICA
3a EDIÇAa
j -*k,.
Â'u
ÃBI:>R
rn4 §
São Paulo
Spiegel, Murray R.
Estatística/Murray R. Spiegel.
traduçáo e revisáo técnica: Pedro Consentino
3a ediçáo - São Paulo: Pearson Education do Brasil, 1994.
93-1513 cDD-s19.5
PREFACIO . .. XIII
DISTRIBUIÇÕES DE FREQÜÊNCTA 39
VII
VIII Estatística
11 TEORTADASPEQUENASAMOSTRAS.... 283
19 TESTES NÃO-PARAMÉTRICOS . . .
Introdução. Teste do sinal. Teste U de Mann-whitney. Teste Ir de Krus-
kal-Wallis. Teste 11 corrigido para empates. Teste das séries para aleato-
riedade. Aplicações adicionais para o teste das séries. Correlação de posto
de Spearman.
ruI Estatística
APÊNDICES
PreÍácio
ruil
XN Estatística
M. R. Spiegel
Variáveis e gráÍicos
Estatística
A estatística está interessada nos métodos científicos para coleta, organização,
resumo, apresentação e anáiise de dados, bem como na obtenção de conclusões
váIidas e na tomada de decisões razoáveis baseadas em tais análises.
Em sentido mais restrito, o termo estatística é usado para designar os
próprios dados ou números deles derivados como, por exemplo, médias. Assim
falamos em estatística de empregos, de acidentes etc.
Arredondamento de dados
O resultado do arredondamento de um número como 72,8 para o inteiro mais
próximo é 73, posto que 72,8 estâ mais próximo de 73 do que de 72. Seme-
lhantemente, 72,8146 arredondado para o centésimo mais próximo, ou com duas
decimais, é 72,81, porque 72,8146 está mais próximo de 72,81do que de 72,82.
Ao arredondar 72,465 para o centésimo mais próximo, entretanto, depara-
mo-nos com um diiema poís 72,465 dista igualmente de 72,46 e de 72,47 .IJsa-se, na
prâtica, em tais casos, aproximar para o número par qlue precede o 5. Assim, 72,465
é arredondado para 72,46, 183,575 é arredondado para 183,58 e 116.500.000,
arredondado para as unidades de milhões mais próximas, é 116.000.000. Esta
prâtica é especialmente valiosa para reduzir ao mínimo os erros acumulados por
arredondamento, qteando tratar-se de grande número de operações (veja o Pro-
blema 2).
Notação cientíÍica
Ao escrever números, especialmente que comportem muitos zeros, antes ou depois da
vírgula, é conveniente enpregar a notação científica que utiliza as potências de 10.
Exemplo 1. 101 = 10; 102 = 10x 10 = 100; 105 = 10x 10x 10x 10x 10=
= 100.000; 108 = 100.000.000.
Exemplo 2. 100= 1; 10-1 = O,L;70-2 = 0,01; 10-5 = 0,00001.
Exemplo 3. 864.000.000 = 8,64x 108; 0,00003416 = 3,416 x 10-5.
Note-se que, multiplicando-se um número por 108, por exemplo, tem-se o
mesmo resultado que deslocar a vírgula, parq a direita, 8 casas. Multiplicando-se
um número por 10-b tem-se o mesmo resultado que deslocar a vírgula, para a
esquerda,6 casas.
Muitas vezes empregam-se parênteses ou pontos para indicar a multiplica-
ção de dois oumais números. Assim: (5) (3) = 5' 3 = 5 x 3 = 15; (10X10)(10) = 10 .
Cálculos
Ao efetuar cálculos que envolvem multiplicação, divisão e extração de raízes de
números, o resultado final não pode ter mais algarismos signiÍicativos do que o que
tem menor quantidade deles (veja o Problema 4).
Exemplos:1.73,24 x 4,52 = (73,24) (4,52) = 331 2.7,64810,023 -
= 72 B. \tr&, = 6,22 4. (8,416) (50) = 420,8, se 50 é exato.
Ao efetuar adições e subtrações de números, o resultado final não pode ter
mais algarismos significativos depois da vírgula do que o que tiver menor quanti-
dade deles nessa condição (veja o Problema 5).
Exemplos: 1. 3,16 * 2,7 = 5,9 2. 83,42 - 72 = 11 3. 47,816 - 25 = 22,876 se
25 for exato.
A regra acima para adiçáo e subtração pode ser ampliada.
Funções
Se a cada valor que a variável X pode assumir corresponder um ou mais valores da
variável Y, diz-se que Y é uma funçã.o de X e escreve-se Y = F(X) (ler "Y igual à
função F de X'), para indicar essa dependência funcional. Outras letras, tais como
G, Q etc., podem ser usadas em vez de .F,.
Figura 1.1
Cap. 1 Varidueis egrdficos
Gráf icos
Umgrdfico é uma representação geométrica da relação entre variáveis. Muitos tipos
de gráficos são empregados na estatística, dependendo da natureza dos dados
pertinentes e da finalidade para a qual ele é destinado. Entre estes estão osgrdficos
de barras, de setores ilustratiuos (pictogramas) etc. Essas representações gráÍicas
chamam-se grdficos ou diagramos. Assim, falamos de gráficos de barra, diagramas
de setores etc. (veja os Problemas 14,15 e 16).
Equações
Equações são relações da forma A = B, onde A é chamado o primeiro membro da
equaçã,o e B o segundo membro. Sempre que se efetuam as mesmds operações em
ambos os membros de uma equação, obtêm-se equações equiualentes. Assim, podem-
se adicionar, subtrair, multiplicar ou dividir ambos os membros de uma equaçào
pelo mesmo valor e obter uma equivalente, com a única exceção da diuisdo por zero,
que nõ.o é permitida.
Este valor de X é a soluçã.o da equação dada, pois vê-se que, substituindo-se X por
3, obtém-se 2G) + 3 = 9 ou 9 = 9, o que é umaidentidade. O processo para se obter
as soluções de uma equação é denominado resolução da equaçào.
Desigualdades
Os símbolos < e > significam "menor do que" e "maiordo que", respectivamente.
Os símbolos < e 2 significam"menor do que ou igual" e "maior do que ou igual"
respectivamente. são conhecidos como símbolos de desigualdades.
Exemplo 1. 3 < S leia-se "3 é menor do que 5".
Exemplos:Como L5> t2;(15) (3) > 12)(3) (i.e.,45 > 36) " f 'f fttto
é,5>4);
(c) quando cada membro é multiplicado ou dividido pelo mesmo número
negatiuo, desde que se proceda à inversão do símbolo de desigualdade.
Logaritmos
cada número positivo N pode ser expresso como uma potência de 10, isto é, pod.e-se
sempre determinarp de modo a que N = 10p. Denominamos p logaritmo de N na
base 10 oulogaritmo decimal de N, e escreve-se abreviadamentep
= log10N. por
exemplo, visto que 1.000 = 103, log 1.000 = B. semelhantemente, 0,01 10-2, log
=
0,01= -2. QuandoNé um número compreend.ido entre 1e 10, i.e., 100 e 101,p loá
=
N tem um valor compreendido entre 0 e 1 e pode ser encontrado nas tábuas de
logaritmos do Apêndice.
Exemplo 1. Para determinar log 2,86, procura-se na coluna à esquerd,a,
encabeçada por^f, até encontrar os dois primeiros algarismos 23.Entáo,desloca-se
para a direita, até a coluna encabeçada por 6. Encontra-se o valor g,72g.Assim, log
2,36 = 0,3729, isto é, 2,36 = 190,3729.
Antilogaritmos
Sob a forma exponencial 2,36 = 190'3729, o número 2,36 é chamado o antilogaritmo
d.e 0,872g, o, untilog 0,3729. É o número cujo logaritmo é 0,3729. Segue-se imedia-
tamente que:
antilogl,3729=23,6;antilog2,3729=236;antilog3,3129=2360;"'
M
1oSí=log-logN
log MP = plog M
Cap. 1 Varidueis e grdficos 11
logM
bg W = p
bg49!9'
- DtEÍ = ptogA + qtog B + rtogC -s tog D - tLog E.
PROBLEMAS RESOLVIDOS
Variáveis
1. Dê o domínio de cada uma das seguintes variáveis e diga se são contínuas ou
discretas.
(a) Número G de litros de água numa máquina de lavar roupa.
Domínio: Qualquer valor desde zero até a capacidade da máquina. Variável
contínua.
(ó) Número B de livros em uma estante de biblioteca.
Domínio: 0, l, 2, 3, ... até o número máximo de livros que podem ser
colocados na estante. Variável discreta.
(c) Soma S de pontos obtidos ao lançar um par de dados.
Domínio: Os pontos obtidos num dado podem ser 1,2,8,4,5 ou 6.
Então a soma de pontos de um par de dados pode ser 2,8,4,5,6,,1 ,_8,9, 10,
1l e 72, os quais são o domínio de S. Variável discreta.
(d) Diâmetro D de uma esfera.
Domínio: Se se considerar um ponto como uma esfera de diâmetro nulo, o
domínio de D compreende todos os valores de zero para cima. Variável
contínua.
(e) País C na Europa.
Domínio: Inglaterra, França, Alemanha etc., que podem ser representados
numericamente por 1,2, 3 etc. Variável discreta.
12 Estatística Cap. 1
Arredondamento de dados
2. Some os números 4,35, 8,65, 2,95, 72,45, 6,65,7,55 e 9,75.
(a) diretamente;
(b) arredondando para décimos de acordo com a convenção do número par; (c)
arredondando àe maneira que o algarismo anterior a 5 cresça de uma
unidade.
Solução
1,6 '7,6
1 ,55
q5§ 9,8 9,8
Note-se que o processo (á) é melhor do que o (c), visto que aquele método
red.uz ao mínimo os erros acumulados com arredondamen'to'
Cálculos
4. Demonstre que o produto do número 5,74 por 3,8, admitindo-se que eles
tenham, respectivamente, três e dois algarismos significativos, não pode ser
mais preciso do que com dois algarismos signiÍicativos.
Primeiro método
5,7 4 x 3,8 = 21,812, mas nem todos os algarismos desse produto são significativos. Para
determinar quantos o são, observe-se que 5,74 é o arredondamento de qualquer
número compreendido entre 5,735 e 5,745, enquanto 3,8 o é para o intervalo entre
3,75 e 3,85. Portanto, o menor valor possível do produto é 5,735 x3,75 = 21,50625
e o maior 5,745 x 3,85 = 22,11825.
Segundo método
Grifando em itáIico os algarismos que podem ser duvidosos, o produto pode ser
calculado da seguinte maneira:
5,14
3,8
4592
1722
21,812
Solução
Em (o), os algarismos duvidosos da adição estão em bipos itálicos. Aresposta final,
apenas com um algarismo duvidoso, é tomada como sendo 46,2.
15,28 1 5,28
5,9561 5,96
t2,3 t2,3
8,412 8,47
46,20165 46,20
9-25 = -16 1 ^_
u'b
16-49+L -82= r=
3@)2 4eT2+3=
ffi=t[ 144=t2
Cap. 1 Varid,ueis e grdficos 15
Funções
Tabela 1.1
1910 200 75
19',71 185 90
1972 225 100
1913 250 85
191 4 240 80
197 5 195 100
1976 210 110
1911 225 105
t978 250 95
t979 230 110
1980 235 100
(g) Qual é o domínio da variável ú? Resp.: Os anos L970, l97l ..., 1980
(D W é uma função unívoca de /?
Sim, ú é uma função de lV porque, a cada valor que 14/ pode assumir,
corresponde um ou mais valores de Í, que podem ser encontrados na tabela.
Como pode haver mais de um valor de ú correspondente a um de W (por
exemplo, quando W = 225,t = 1972 ou 1977) a função é plurívoca. Essa dependência
funcional de / em relação a W pode ser escrita t = H(W).
(j) C é uma função de W?
Solução
@) Z = 16 + 4(2)- 3(5) = 16 + 8 - 15 = 9;
(b) Z = 16 + 4Ç 3) - 3(- 7) = 76 - 12 + 27 = 25;
(c) Z = 16 + 4(- 4) - 3(2) = 16 - 16 - 6 - - 6.
A valores dados de X e Y corresponde um valor de Z. Pode-se simbolizar
esta dependência de Z sobre X e Y escrevendo Z = F(X, Y); leia-se "Z é urr.afunçào
de Xe Y' . F(2, 5) significa o valor d,e Z quando X = 2 e Y = 5, que é 9 conforme o item
(o). Semelhantemente, F(- 3, - 7) = 25 e F(- 4,2) - - 6, conforme os itens (á) e (c),
respectivamente.
As variáveis X e Y são chamadas indeperudentes e Z é a dependente.
GráÍicos
10. Localízar sobre o eixo dos X de um sistema de coordenadas os pontos corres-
pondentes a h) X = 4; (b) X = - 3; (c) X = 2,5; (d) X - - 4,3; e (e) X = 0,4, admitidos
esses valores como exatos.
Solução
-5-4-3-2-1012345
Cada valor exato de X corresponde a um e somente um ponto sobre o eixo.
Reciprocamente, demonstra-se na matemática superior que a cada ponto sobre o
eixo corresponde um e somente um valor de X.
Assim, teoricamente, existe um ponto correspondente a X = 2217 =
= 3,142857142857 ... ouX= n=3,14159265358... Naturalmente, na prâtica, nunca
se pode esperar a localizaçáo exata de um ponto, porque a marca feita pelo lápis
18 Estatística Cap. 1
tem uma certa espessura e cobre um número finito de pontos. O próximo eixo dos
X tem uma certa espessura. Assim, o diagrama anterior é uma representaçáo física
da situação matemática real.
6
5 o (2;5)
4
3
2 o (5;2)
(-3;1)o 1
(4;o) x
-6 -5 -4 -3 -2-1- 123456
-l
-2 (0;-2,5)
-3 o (1;-3)
-4
(-2,5;-4,8). _s
-6
Figura 1.2
Admitir que todos os números dados são exatos. Veja a solução na Figura 1.2.
Solução
FazendoX - -2,- 1,0, 1, 2,3 e A,têm-se Y =-7,-5, -3, -1, 1,3 e 5, respectivamente'
Os pontos do gráfico são dados por (-2; -7), (-1; -5), (0; -3), (1; -l), (2;1), (3; 3) e
(4; 5), os quais são locados em um sistema de coordenadas retangulares, como o
apresentado na Figura 1.3. Todos esses pontos, bem como os obtidos pela atribuição
de outros valores a X, situam-se sobre uma linha reta, que é o gráfico desejado.
Cap. 1 Varid.ueisegrdficos 19
Note-se que apenas dois pontos são realmente necessários para repre-
sentar uma função linear, visto que eles determinam uma reta.
-6 -5 -4 -3 -2 23456
-4
-5
-6
Figura 1.3
Solução
Os valores de Y, correspondentes a vários valores de X, estão indicados na tabela
abaixo. Por exemplo, quando X - - 2,Y = (- D2 - 2 G 2) - 8 = 4 + 4- 8 = 0.
x -3
a
-l 0 2 J 4 5
Y 1 0 -5 -8 -9 -8 -5 0 7
20 Estatística Cap. 1
-t
.1 2 3
-2
-3
-4
Figura 1.4
Nessa tabela, os pontos do gráfico são dados por (- 3; 7),(- 2; 0), (- 1; - 5),
(0; - 8), (1; - 9), (2; -8), (3; - 5), (4;0), (5; 7)' Vê-se que esses pontos, bem como
outros obtidos pela utilização de valores diferentes de X, recaem sobre a curYa
apresentada na Figura 1.4.
A curva chama-se pardbola' A relação F(X) = x2 - 2x - 8 é denominada
funçã.o do 2e grau (ou quadrática).
De maneira geral, o gráfico da equação Y = a * bX + cX2, em que a, b e c
são constantes e c + 0, é uma parábola. se c = 0, o gráfico é uma linha reta como no
Problema 12.
Solução
(o)
250
200
o
I
(§
rso
0)
c
Fo 1oo
50
0
1970 1971 1972 1973 1974 1975 1976 1977 1 978 1979 1 980
Ano
Figura 1.5
250
o
(ü
200
o
ffc rso
Ê roo
50
0 CDSIr) (oN@
r'-NN NNN
3PP o) o) o)
Ano
Figura 1.6
Estatística Cap. 1
Segundo método:
I Trigo
n Milho
400
350
300
250
o 200
(ú
E
150
õc
P 100
50
0
oc{cD<-rf)(ol--9oq)Q
b, ó o) o) o, o) o) o) o) o) o)
Ano
Figura 1.7
Solução
200*= úõ -n milho=
(o) Em 7970, a percentagem de trigo = ^^:
zUU + '.15 tz,t-,o,ade
= 1007o - 72,77o = 27,3Vo.
Tabela 1.2
l
Anos r970 1971 1972 I 973 1974 1975 1 976 1977 1978 1979 1 980
I
Percentagem 1)1 61,3 69,2 14,6 15,0 66.1 65,6 68.2 12.5 61,6 70,1
d.e Íri.so
Percentagem 21,3 32,1 30,8 25,4 25,0 11q 34,4 3 1.8 )'7 5 32.4 )gq
de milho
Cap. 1 Variúueisegráficos
100 I Trigo
tr Milho
80
E
s60
E
o
O
b40
o-
ONCD\fIO(ON@O)O
f'-NNNNF-F-Nlt'-N@
o) o, o) o) o) o) o) o) o) o) o)
Ano
Figura 1.8
Tabela 1.3
Continente Árno
(milhõe s de quilômetros quadrado s)
África 30,3
Ásia 26,9
Europa 4,9
América do Norte 24,3
Oceania 8,5
América do Sul 17,9
URSS 20.5
TOTAL 133.3
Fonte.' Nações Unidas
24 Estatística Cap. 1
Nota 1. Da Europa estão excluídos a Rússia e os países que faziam parte da antiga
URSS.
Primeiro método
AFRICA
ASIA
EUROPA
AMÉRICA DO NORTE
OCEANIA
AMÉRICA DO SUL
URSS
llllllllllll
1234567I I 10 11 12
Área (milhões de quilômetros quadrados)
Figura 1.9
Segundo método
A Figura 1.10 é chamada grd,fico em setores, gráfico circular ou cartogranLa em
setores. Para construí-lo parte-se do fato de que a área total, de 133,3 milhões de
quilômetros quadrados, corresponde ao número total de graus de uma circunferên-
cia, isto é, 360". Então, 1 milhão de quilômetros quadrados correspondem a
360'/133,3. Segue-se a Afríca, com 30,3 milhões de quilômetros quadrados, corres-
ponde um arco de 30,3 (360',/133,3) -- 82", enquanto para a Asia, Europa, América
do Norte, Oceania, América do Sul e URSS os ângulos correspondentes são de,
Cap. 1 Varidueisegrdficos
§r,oÀ
América do Norte
URSS 20,5
/.o
./6
,-g
c América
p .D do Sul
o'I 17,9
Figura 1.10
L 10,1 t6,2 ))) 33,8 42.0 53.4 66.7 7 4.5 86,6 100.0
T 0,60 0,81 0.95 t,t7 1,30 1,41 1,65 r,7 4 1,87 2,0t
Solução
(o) O gráfico indicado na Figura 1.11 foi obtido ligando os pontos de observaçào
por meio de uma curva regular.
(ó) O valor de 7 avaliad,o é 1,27 segundos.
26 Estatística Cap. 1
2,0
1,5
1,0
0,5
Figura 1.11
Equações
18. Resolver cada uma das seguintes equações:
(a) 3X+4=24-2'X.
Subtraindo 4 a ambos os membros: 3X+ 4- 4=24-2X -4 .'.3X=20 -2X.
Adicionando 2X a ambos os membros: 3X + 2X = 20 - 2X + 2X .'. 5X = 20.
Dividindo ambos os membros por 5: 5Xl5 = 2015 :. X ='4.
Conferindo:3(4) +4=24-2(4).'. 12+4=24 -8.'. 16= 16.
Este resultado pode ser obtido muito mais rapidamente, sabendo-se que
qualquer termo pode ser movimentado outransposlo de um membro de uma equaçào
para o outro, apenas com a troca do sinal. Assim, pode-se escrever:
3X + 4 = 24 - 2X .'. 3X + 2X = 24 - 4 :. 5X = 20 .'. X = 4
(b) Y +
eY 1=
Id + -2'-
Multiplicam-se primeiramente ambos os membros por 6, que é o mínimo
múltiplo comum dos denominadores.
'l+
,l+'* , I = ulrl .[+' otr ) =y.2ü+ 2\+ 6 = 3Y
(' / \/ \ ) '
2Y + 4 + 6 = 3Y, 2Y + 70 = 3Y, 10 = 3Y- 2Y,Y = 70.
Cap. 1 Varió.ueis e gró,ficos 27
[5o+7b=39
Multiplicando a primeira equação por 7: 2La * 14b = 77 (l)
Multiplicando a segunda equação por 2: Lja + 74b = 78 (2)
- 10c = '-260
Multiplicando a segunda equação por -5:-354 + 15b (1)
Assim,a=4,b=-6êc=3.
Conferindo: 3(4) + 2(-6)+ 5(3) = 15 ... 15 = 15. 7@) -3 (- 6) + 2(3) =
= 52 .'. 52 = 52. 5(4) + (- 6) - 4(3) = 2 .'. 2 = 2.
Desigualdades
20. Em cada uma das seguintes, determinar uma desigualdade para X, isto é,
resolva cada desigualdade em relação a X.
(a) 2-X < 6. Dividindo ambos os membros por 2, obtém-se X < 3.
(b) 3X - 8 > 4. Somando 8 a ambos os membros, SX> 12; dividindo ambos os
membros por 3, X > 4.
(c) 6 - 4X <- 2. Somando - 6 a ambos os membros,-4X < -8; dividindo por
-4,X>2.
Note-se que, como nas equações, pode-se transpor um termo de um membro
de uma desigualdade para o outro, apenas mediante a troca do sinal, 3X 2 8 + 4.
Y_tr
\d.) -3< 2
< 3. Multiplicando por 2, - 6 <X -5 < 6; somando 5, - 1 <X< 11.
(e) -
- 1 r1 53< 7. Multiplicando por 5, - 5 < 3 - 2Xs 35; somando
- 3,-8<-2X <32; dividindopor-2,4>X>- 16,ou-16<X <4.
Logaritmos e antilogaritmos
21. Verificar cada um dos seguintes logaritmos.
(a) Iog 87,2.Mantissa = 0,9405; característica = 1; então, log87,2 = 1,9405
Cap. 1 Varió.ueis e grd.ficos 29
(á) log 4,638. A mantissa do 1og 4.638 está situada entre as dos log 4.630 e log
4.640 e a B décimos do primeiro.
Mantissa do log 4.640 = 0,6665 Mantissa do log 4,638 = 0,6656 + (0,8)
Mantissa do log 4 630 = 0,6656 (0,0009) = 0,6663 com quatro algarismos.
Diferença tabular = 0,0009 Então, log 4,638 = 0,6663.
Esse processo é denominado interpolaçã,o linear. Se se desejar a tabela das
partes proporcionais, pode-se recorrer ao apêndice V para fornecer a mantissa
diretamente (6 656 + 7).
Solução
log P = log 784,6 + log 0,0431 - log 28,23
log784,6 = 2,8947
(+) Iog 0,0431 = 8,6345 - 10
= 11,5292 - 70
(-) log 28,23 = 1,4507 - 70
logP = 10,0785-10=0,0785.
Então, P = 1,198 ou 1,20, com 3 algarismos significativos.
Note-se o signiÍicado exponencial do cálculo. Assim,
24. p =
^[887p =
(8g7,2)t/2
Solução
1
logP
2
1og387,2 = |{z,saru) = t,2940 ; e P = 19,68.
Solução
LosP =
f, [(log 874,3 + Iog 0,03816+ 3 log 28,53- (4log 1,754+ log 0,007352)]
log 874,3 = 2,9417 2,9417
Iog 0,03816 = 8,5816 - 10 8,5816 - 10
(-) 8,8424 - L0
7,0468
4log 1,754 = 4(0,2440) 0,9760
log 0,007352 7,8664 - l0
Somando 8,8424 - 10
Então, log P = P
|fz,o+eU = 3,5234;e = 3.338.
32 Estatística Cap. 1
Variáveis
26. Dar o domínio de cada uma das seguintes variáveis e dizer se são variáveis
contínuas ou discretas.
(o) Número W'de toneladas por hectare de trigo produzido em uma fazenda,
durante certo número de anos.
(ó) Número N de indivíduos de uma família'
(c) Estado civil de um indivíduo.
29. Escrever cada um dos números seguintes, usando a notação cientíÍica. Considerar
todos os algarismos signiÍicativos, a menos que haja indicação em contrário.
(o) 0,000317; (b) 428.000.000 (quatro algarismos significativos); (c) 21.600,00;
(d) 0,000009810; (e) 732 mil (, 18,0 décimos milionésimos'
Resp.: (a) 3,17 x 10,a; (b) 4,280, 108; (c) 2,160000 x 10a; (d) 9,810 x 10-6;
(e) 7,32 x 105; (fl 1,80 x 10-3.
Cálculos
30. Mostrar que (o) o produto e (ó) o quociente dos números72,48 e 5,16, admitidos
como tendo quatro e três algarismos significativos, respectivamente, não
podem ter mais do que três algarismos significativos exatos. Escrever o pro-
duto e o quociente Precisamente'
Resp.: (a) 37 4; (b) 74,0.
31. Calcular o valor numérico de cada uma das seguintes expressões, para U = - 2,
V = ll2, W = 3, X = - 4,Y = 9, Z = 1/6, admitidos todos esses números como
exatos.
(a) 4U + 6V -2W
- XYZ
rbt uu*
2X-3Y
rc) uw+ xv
@) 3(U -X)2 +Y
34 Estatística Cap. 1
G) {u'z- rw+ w
(fl 3X(4Y + 3Z) - 2Y rcX - 5Z) - 25
*rw
(h)
(Y-4)2+(U
(i) X"+5X"
x3+5x2-6x-8
-6X-8
(/) u^--Y^lurvrw + xt)
" 7f+vPr
Resp.: (a) -11 ff) -16
(b) 2 G) \-98, ou 9,89961 aprox.
(c) 35/8 ou 4,375 (b) -7h[ 34, oa 1,20049 aprox.
(d) 27 (i) 32
(e) 3 (i ) l)l{ 17 , ou 2,42536 aprox.
@)x=;(10_n.
33. Se VÍ/ = \XZ - 4Y2 + ZXY, determinar V[quando: (a) X = l,Y = - 2, Z = 4; (b) X =
= - 5,Y = - 2, Z = 0. (c) Usando a notação funcional W =
F(X, Y, Z), achar tr'(3,
L, - 2).
Planeta Mercúrio Vênus Terra Marte Júpiter \aturnt Urano Netuno Plutão
38. A tabela seguinte mostra as áreas, em milhões de km2, dos oceanos. Repre-
sentar graficamente os dados, utilizando (o) um gráfico de barras e (ó) um
gráÍico em setores.
Equações
39. Resolver cada uma das seguintes equações:
(o) 16-5c=36
(b) 2Y-6=4-3Y
k) a(X- 3) - 11 = 15 -2(X + 4)
(d) 3(2U + 1) - 5(3 - t, + 3(U - 2)
(e) 3t2(X + 1) - 4l = 10 - 5(4 - 2X)
(f) ,1
i{t2 + }z) = 6 -j ro-t r
. í2a+ ó=10
ro'\ro-Bb= .,.lsg-98=-10
(o'tuo-48=
9 16
., lso+5b=24 2a+ b - c=
11"- 2
$t
\;; -áo =1; '' 1r;;âir1-?: = _!,
(c) [gx-gY= 2
fax*7Y=-9
Cap. 1 Varid.ueisegrdficos
aproximadamente.,r, i5E =
*98 = - = 4t B
"#E
r/--1 Essas raízes sáo números complexos e não
{=-= - 4 + 3iem que I =
aparecerão onde for empregado processo gráfico.
Desigualdades
4g. Usar os símbolos de desigualdade para exprimir cada uma das seguintes
proposições: (o) o número N de crianças está compreendido entre 30 e 50,
inclusive; (ó) a soma S dos pontos de um par de dados não é menor do que 7;
(c)Xé maior do que ouigual a-4e menor do que 3;@)P é no máximo igual
a 5; (e) X excede Y em mais do que 2.
Resp.: (a) 30 <N< 50; (ó) S > 7;k) - 4<X <3;@)p <5;(e)X-Y>2'
44. Resolver as seguintes desigualdades:
(a) 3X> 12
(b) 4x <5x- 3
(c) 2N + 15 > 10 + 3N
ü 3 + 5(Y -2)7 -3(4-Y
Estatística Cap. 1
Logaritmos
45. Calcular cada uma das seguintes expressões, mediante o emprego de logaritmos.
(o) (783,6) (L.654)
21..7
(bt
BTBp
t 0,04556 ) \624,7 )
çL4.32) ( 0,003572)
(d) (7,56Dr5
( 0,3854)4 ( 12,84)2
(e)
( 0,04382)3
(h)
(48,79 ) ( 0,00574)
(r)
( 2,143)5
,.., 3,781
v) o,o1878 ^@
Y 1o,oozas6)(6,824)
Resp.: (a) t 296 000 ou 1,296 x 106; (á) 0,05739 ou 0,0574 com 3 algarismos
significativos; (c) 556,0; (d) 804,4; (e) 40,820; (fl 0,03438; (g) 15,57; (h7
45,67; (i) 0,0004579 = 4,5L9 x 10-a ot 4,52 x 10-4, com 3 algarismos
significativos; (/) 3 096.
46. Se op - N, onde a e p sáo números positivos e a * 7,p é denominado logaritmo
de N na base a e escreve-se p = logi'a N. Calcular: (o) logsz 8, (ó) logzs 1,25, (c)
log4 llL6, (d) log112 32, (e) 1og5 1.
Distribuições de Íreqüência
Dados brutos
Dados brutos sáo aqueles que ainda não foram numericamente organizados. Um
exemplo é o conjunto das alturas de 100 estudantes do sexo masculino, tirado de
uma lista alfabética do registro de uma universidade.
Rol
Um rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente
de grandeza. A diferença entre o maior e o menor número do rol chama-se amplitude
total dos dados. Por exemplo, se a maior altura dos 100 estudantes do sexo mascu-
lino é 188 cm e a menor 152 cm, a amplitude total será de 36 cm.
Distribuições de Íreqüência
Quando se resumem grandes massas de dados brutos, costuma-se freqüentemente
distribuí-los em classes ou categorias e determinar o número de indivíduos perten-
centes a cada uma das classes, denominado freqüência da classe. Um arranjo
tabular dos dados por classes, juntamente com as freqüências correspondentes, é
denominado distribuição de freqüência ou tabela de freqüência. A Tabela 2.1 é urr,a
distribuição de freqüência das alturas (arredondadas para centímetros) de 100
estudantes do sexo masculino da Universidade XYZ.
39
40 Estatística Cap. 2
Tabela 2.1
Alturas de 100 estudantes do sexo masculino da Universidade XYZ.
Altura Número de
(cm) estudantes
151- 15 8 5
t59-166 18
t6'7 -17 4 42
t7 5-182 27
183-190 8
Total 100
áreas dos retângulos do histograma é igual à área total limitada pelo polígono de
freqüência e o eixo dos X (veja Problema 6)'
6'
'P
,0)
ao
:f,
o
(D
930
U)
o)
Ezo
io
l
a
o 10
C)
E
o
0)
E
.l
z 147 155 163 171 179 187
Altura (centímetros)
Figura 2.1
Tabela2.2
Altura Número de
(cm) estudantes
Abaixo de 151 0
Abaixo de 159 5
Abaixo de 167 23
Abaixo de 175 65
Abaixo de 183 87
100
(§
E80
f
E
5
960
.(d
o
.5 40
o
(I)
ri 20
Figura 2.2
Cap.2 Distribuições de fre qüência 45
A
como as indicadas na Figura 2.3.
t/
-/ Em forma de J Em Íorma de J invertido
V Em forma de U
Bimodal Multimodal
Figura 2.3
PROBLEMAS RESOLVIDOS
Rol
1. (o) Dispor os números 17,45,38,2'í,6, 48, !7, 57,34,22 eryr um ro}. (ó)
Determinar a amplitude total.
Solução
(o) Em ordem crescente de grandeza o rol é: 6, 17, L7,22,27,34, 38, 45, 48,
57. Em ordem decrescente de grandeza o rol é: 57, 48,45, 38, 34,27,22,
17,11,6.
(á) Visto que omenornúmeroé 6 eomaior éST,aamplitudetotalé 57 -6=57.
Resp.:Cr$ 8.999
(c) O ponto médio da terceira classe.
O ponto médio da terceira classe = 112 (Cr§ 7.000 + Cr$ 7.999) = Cr$ 7 .499.
Tabela 2.3
Salários Número de
(cruzeiros) empregados
- 6.000
5.000 8
6.000 - 7.000 10
7.000 - 8.000 t6
8.000 - 9.000 t4
9.000 - 10.000 10
10.000 - 1.000
1 5
11.000 - 12.000 2
Toral 65
Solução
(a) Amplitude do intervalo de classe = diferença comum entre dois_pontos
médios sucessivos = 68,5 - 64 = 73 -68,5 = etc. = 4,5 kg.
(ó) Como os intervalos de classe têm a mesma amplitude, os limites reais de
classe dividem ao meio a distâniia entre os pontos médios e, portanto, têm
os valores:
lrr ...
1iú4
+ 68.5): (64 + 86.5t, , (68.5 + 73),
1t86.5
+ 9l I ou
Solução
Os pontos médios 64, 68,5,73 ... 9l estão locados sobre o eixo dos X.
Os limites reais das classes estão indicados pelas linhas verticais longas,
tracejadas, e o limite das classes pelas cheias.
Solução
(a) A distribuição de freqüência relativa, apresentada na Tabela 2.4, é
deduzida da distribuição de freqüência do Problema 2, mediante a
divisão de cada freqüência de classe pelo total das freqüências (65),
exprimindo-se os resultados em percentagens.
(ó) e (c) O histograma e o histograma de freqüência relativa estão apresentados
na Figura 2.4. Note-se que, para transformar um histograma em outro
de freqüência relativa, é necessário apenas adicionar ao histograma
uma escala vertical que indique as freqüências relativas, como a que
está representada à direita.
Cap. 2 Distribuições de freqüência 51
Tabela2.4
Toral lOO,jVo
§a
(§0)
'õ
(ú
15 PE
,r
<o
a 10 §E
oo
o
LL5 10 :EB
otr
9õ
oooooo
oooooo o
o
lf)rJ)Lr)rorf)l.r) u?
rrj«jxddo
Salários (em cruzeiros)
Figura 2.4
Solução
A demonstração será feita para o caso de um histograma constituído de três
retângulos, como está indicado na Figura 2.5, e o polígono de freqüência corres-
pondente, representado em linhas tracejadas.
Área total do retângulo = área sombreada + ârea II + área IV + área V +
+ áreaVII= áreasombreada + área I + áreaIII + áreaVI +áreaVIII = áreatotal
limitada pelo polígono de freqüência e o eixo dos X.
Portanto, áreaI = árealI, ârea III = área IV, área V = área VI e área VII =
= área VIII.
Figura 2.5
Solução
As distribuições de freqüência possíveis estáo apresentadas nas Tabelas (o), (á), (c)
e (d).
(a) (b)
15.000 - 15.999 1
16.000 - t6.999 0
17.000 - r7.999 1
Total T0
54 Estatística Cap. 2
(c)
- 6.999
5.000 18
7.000 - 8.999 31
9.000 - 10.999 15
1 1.000 - 12.999 J
13.000 - t4.999 1
15.000 - 16.999 1
r 7.000 - 18.999 I
Total 70 Total T0
Solução
O histograma pedido está representado na Figura 2.6.Para construí-Io, utiliza-se
a propriedade de serem as áreas proporcionais às freqüências. Suponha-se que o
retângulo A corresponde à 1 classe (veja Tabela (d) do Problema 7) com freqüência
igual a 8. Visto que a sexta classe da Tabela (d) também tem freqüência de classe
igual a 8, o retângulo B que representa esta classe, deverá ter área igual à de Á.
Então, como B tem o dobro da largura de A deverá ter a metade de sua altura, como
foi representado.
Semelhantemente, o retângulo C, que representa a última classe da Tabela
(d), tem altura igual à metade da unidade da escala vertical.
Cap. 2 Dístribuições de freqüência 55
Solução
15
.§
I ro
(o A
:J
q
o
L
i,üá;:l
::i;;;
LL
c B
!:t: ?'!,! *|;.t;yl?l:!ll
,al!,1 C
a i: .: :: i;1 : lr) ii tà; i;1 ::: ;:tl t19t I B tãil;.:. :: .: ,9q Éii; i;
-!
Figura 2.6
Solução
(a) e (á). A distribuição de freqüência acumulada e a percentual (ou distri-
buição de freqüência acumulada relativa) estão combinadas na
Tabela 2.5.
Observe-se que o valor de cada casa da coluna 2 é obtido adicionando-se
sucessivamente os das casas da coluna 2 da tabela do Problema 2. Então, 18 = 8 +
+10,34=8+10+16etc.
56 Estatística Cap. 2
Tabela 2.5
6f,
c
o
(ú
E(õ
70 100 I
(l)
f 60 À
E 80<o
!
50 (§
o
(ú
40 60EC
'õ
c 30
(O
l(\ =
a
:f 20 (ú
o
o 208
LL 10 <o
:f
o
o
oooooooo
oooooooo
LL
qcqqqqqq
tô(oNcoo)oc\l
Figura 2.7
Cap. 2 Distribuições de freqüêncía 57
Solução
(a) Observe-se que o valor de cada casa da coluna 2 da Tabela 2.6 é obtido
adicionando-se sucessivamente os de cada casa da coluna 2 daTabela2.S
do Problema2, a partir do fim daquela tabela. Assim, 7 = 2 + 5, 77 = 2 + 5 +
+ 10 etc.
Esses valores podem também ser obtidos subtraindo-se, da freqüência
total, 65, cada valor da coluna 2 da Tabela 2.5 do Problema 9. Assim, 57 = 65 - 8,
47 = 65 - 18 etc.
870
(ú
.E
o
60
--
(õ
50
E(ú
40
=
C
=30
Ízo
.H
:=
1o
o
E
LL oooooooo
oooooooo
qeqqqccq
ro (o l.- @ o
o) c\t
Figura 2.8
58 Estatística Cap. 2
Tabela 2.6
Acima de 5.000 65
Acima de 6.000 57
Acima de 7.000 41
Acima de 8.000 31
Acima de 9.000 t7
Acima de 10.000 7
Acima de 11.000 2
Acima de 12.000 0
11. Cinco moedas foram lançadas 1.000 vezes e, em cada lance, foi anotado o
número de caras. Os números de lances nos quais foram obtidas 0,1,2 3, 4 e
5 caras estão indicados na Tabela 2.7 .
Tabela2.7
0 38
1 t44
2 342
-) 281
4 164
5 25
Total 1.000
Solução
(o) Os dados podem ser representados graficamente de um dos modos indi-
cados nas Figuras 2.9 e 2.I0.
A Figura 2.9 parece ser o gráfico de emprego mais natural, visto que, por
exemplo, o número de caras não pode ser 1,5 ou 3,2. Esse é um gráfico de barras
cuja largura é igual a zero e é, às vezes, denominado grá.fico em bastão. É usado
especialmente quando os dados são discretos.
A Figura 2.10 apresenta um histograma dos dados. Note-se que a área total
do histograma é igual à freqüência total 1.000, como seria de esperar. Ao utilizar a
representação histogrâmica ou o polígono de freqüência correspondente, tratam-se
essencialmente os dados como se fossem contínuos. Isso será útil futuramente.
Note-se que já foram utilizados anteriormente
o histograma e o polígono de freqüên-
cia para dados discretos, no Problema 5.
350
o
Q)
o
C
300
(ú
J 250
E 200
o
o 150
E
\f
100
z
50
0
1234
Número de Caras
Figura 2.9
350
o
o 300
o
c
(ú
J 250
0)
! 200
o
o 150
E
\3 It I
100 l- .
z t::r
t: .-:
i
50
t;' . "
0
1234
Número de Caras
Figura 2.10
60 Estatística Cap. 2
(á) Com referência à Tabela 2.8 pedida, note-se que ela representa simpies-
mente uma distribuição de freqüência acumulada e uma freqüência acu-
mulada percentual dos números de caras. Deve-se observar que oS valores
"menos de 1", "menos de 2" etc., poderiam ter sido, semelhantemente,
"menos de ou igual a 0", "menos de ou igual a 1" etc.
(c) O gráfico pedido pode ser representado por qualquer um dos da Figura 2.11
ou da Figura 2.12.
Tabela 2.8
menos de 0 0 0,0
menos de 1 38 3,8
a 100
o
()
880
J
€60
E
Êoo
c
$zo
o
o_
Número de Caras
Figura 2.11
Cap. 2 Distribuições de freqüência 61
(/) 100
o
o
880
J
€60
E
(D
P40
E
$zo
o
ÍL
Solução
(o) e (ó) Nas Figuras 2.13 e 2.14, os gráficos tracejados representam os
polígonos de freqüência e as ogivas e foram obtidos dos que apare-
cem nas Figura 2.1 e Figura 2.2 respectivamente. Os gráficos
suavizados pedidos (apresentados em linha cheia) são deles obti-
dos, por aproximação, sob a forma de curvas suavizadas.
(d^
.Zç 50
(d0)
t§ C
40
.(§
()oo) 30
.õE 20
5tr
Yo) 10
Figura 2.13
(õ
o(úã
tro)
=o)
l(d
OE
<b
.§9
oo)
.E?
:fE
Bs)
LL
Figura 2.14
Na prática é mais fácil suavizar uma ogiva; assim, muitas vezes obtém-se
primeiramente a ogiva suavizada e, a seguir, o polígono de freqüência suavizado é
obtido mediante a leitura dos valores daquela ogiva.
(c) Se a amostra de 100 estudantes é representativa da população de 1.546
estudantes, as curvas suavizadas dos itens (o) e (ó) podem ser admitidas
como sendo a curva de freqüência percentual e a ogiva percentual dessa
Cap. 2 Distribuições de freqüência
Tabela 2.9
300 - 399 14
400 - 499 46
500 - 599 58
600 - 699 76
700 - '799 68
800 - 899 62
900 - 999 48
1.000 - 1.199 22
1.100 - 1.199 6
Tota.l 400
Resp.: (a) 799; (ó) 1.000; (c) 949,5; (d) 1.099,5, 1.199,5; (e) 100 horas; (f;76;
@) 6214OO = 0,155 ou 15,57o; (h) 29,57a; (i) l9Vo; ç) 78Eo.
14. Construir: (o) um histograma e (á) um polígono de freqüência correspondente
à distribuição de freqüência do problema precedente.
Cap. 2 Distribuições de freqüência
16. Com os dados do Problema 13, construir: (o) uma distribuição de freqüência
acumulada; (á) uma distribuição acumulada percentual ou relativa; (c) uma
ogiva; (d) uma ogiva percentual. (Note-se que, a não ser que haja especificação
em contrário, a distribuição refere-se à construída na base de "abaixo de").
18. Estimar a percentagem das váIvulas do Problema 13, de duração: (o) menor do
que 560 horas; (á) de 970 ou mais horas; (c) compreendida entre 620 e 890
horas.
Resp.: (a) 247o; (b) llVo; (c) 467o.
20. (o) Lançar quatro moedas cinqüenta vezes e registrar o número de caras em
cada lance.
(ó) Construir uma distribuiçáo de freqüência que mostre o número de lances
em que aparecem 0, 7,2,3, 4 caras.
(c) Construir uma distribuição percentual tais resultados, compaiando as
de
percentagens obtidas com as freqüências teóricas de 6,25Va, 257o, 37,\Vo,
iSEo 6,257o (proporcionais a 1, 4, 6, 4 e 1), determinadas pelas leis da
"
probabilidade.
(d) Representar graficamente tais distribuições'
(e) Aumentar o número de lançamentos das quatro moedas para mais de
cinqüenta, verifrcando se os novos resultados são mais concordantes com
a expectativa teórica. Se não forem, indicar as possíveis razões das
diferenças.
h
*xT*P*
Capítulo
Notação de somatório
N
O símbolo 2 X: é usado para representar a soma de todos os X; desde j = 7 até
j=i
j = N, isto é, por definição
N
Z X1=X1 +X2+X3+...+XN.
j=l
66
Cap. 3 Média, mediana, moda e outras medidas da tendência central 67
N
Exemplo 1. z Xi Y j =XrYt *XzYz*Xl,rYlr.
j=t
N
Exemplo 2. 2 aXi =aXt + aX2 + ... + aXtr = o(Nr + Xz+ ...+ Xry) =
'i=r
N
= a » xi, em que 0 é uma constante. Mais simplesmente, 2 aX = aLX.
j=1
Exemplo 3. Se a, b, c, sáo constantes quaisquer, L (aX + bY - cZ) = aLX +
+ bZ Z - cZ Z (veja o Problema 1).
Média aritmética
A média aritmética, ou média, de um conjunto de N números X1, XZ, XN é repre-
sentada por (leia-se "Xbarra") e é definida por
LXi
Y=_-,X1 .-
+ X2+ X3+...+Xlv j=l »X
NNN =_ (1)
U_8+3+5_+12+10
55 =*=l,O
68 Estatística Cap. 3
SeosnúmerosX1,X2,Xg,...XKocorrerrtft,fZ,fS,...,fyvêzls,respectivamente
(isto é, ocorrerem com as freqüências ft, fz, fs, ..., fx), a média aritmética será:
K
»fli
ç _ ftXt+ fzXz+ ÍtXt+ ... + fxXx _ r= 1 »f X ZÍX
fi+fz+fi+...+fu K _ »f _ N
(2)
zÍt
j=1
K
L Íidi
v=A. r==o*+. (6)
», fj
j=t
K
emqueN = I fi = 2f a.Note-seque(5)e(6) sãoresumidasnas equações
j=1
X = A+ d (veja o Problema 11).
X=A+ c= A*
( zrr\ (7)
['-ü-.,J ''
que é equivalente à equação X = A+ c . i(veja o Problema 13). Chama-se a isto
processo abreuiado para o cá1culo da média. E um método muito rápido e deveria
ser usado sempre para dados agrupados, quando as amplitudes dos intervalos de
classe forem iguais (veja o Problema 14). Note-se que, no processo abreviado, os
valores da variávelXsão trarusformados nos valores da variável z, segundo a relaçào
X=A+c.u.
A mediana
A mediana de um conjunto de números, organizados em ordem de grandeza (isto é,
em um rol), é o valor central ou a média aritmética dos dois valores centrais.
*
IT-,'r,'l
Mediana = Lt (8)
F;,"" f
Cap. 3 Média, mediana, moda e outras medidas da tendência central 71
em que:
L1 = limite inferior da classe mediana (isto é, da classe que
contém a mediana);
A moda
A moda de um conjunto de números é o valor que ocorre com a maior freqüência, ou
seja, é o valor mais comum. A moda pode não existir e, mesmo que exista, pode não
ser única.
Exemplo 1. O conjunto 2,2, 5, 7 , 9,9, 9, 10, 10, 11, 12, 78 tem moda 9.
Exemplo 2. O conjunto 3, 5, 8, 70, L2, 75, 16 não tem moda'
Uma distribuição que tem apenas uma única moda é denominad a unimod.al.
No caso de dados agrupados para os quais foi construída uma curva de
freqüência que a eles se ajuste, a moda será o valor (ou valores) deXcorrespondente
ao ponto de ordenada máxima (ou pontos) da curva. Este valor é, algumas vezes,
^
representado porX.
Para uma distribuição de freqüência ou histograma a moda pode ser obtida
por meio da fórmula:
(L,\
Moda= L1+ I
=- lc (9)
IAr+42,
72 Estatística Cap. 3
em que:
L1 limite inferior da classe modal (isto é, a que contém a moda);
A1 excesso da freqüência modal sobre a da classe imediatamente inferior;
Figura 3.1
Cap. 3 Média, mediana, moda e outras medidas da tendência central 73
Figura 3.2
A média geométrica G
A média geométrica G de um conjunto de N números X1, X2, Xg, ..., XN é a raiz d,e
ordemN do produto desses números:
c = {x, x, x, -.xr. (11)
A média harmônica H
A média harmônica I/ de um conjunto de N números X1, X2, X8,..., XN é a recíproca
da média aritmética dos recíprocos dos números:
u- I N
(t2)
"= I .. !=J u
N'i=l x,r x
74 Estatística Cap. 3
sI
7 'x -- I -) I 13)
H_ N -N.X
(
H= r-i1 =; 11
=3.-13
-+ * 248E
-
H<G<X (14)
RMQ = !x2
- =
( 1s)
={zo=4.4i.
PROBLEMAS RESOLVIDOS
Notação de somatório
N NN
1. Provar que I (aX; + bYi - cZ) = a 2 Xi+ b 2 Yj - c Z Zi,emquea,b ec
j=r .j=1 j=t j=L
são quaisquer constantes.
76 Estatística Cap. 3
Solução
N
L (aX1+ bY1- cZ) = (aX1+ bY1 - cZ)+ (aX2+ bY2 - cZ2) + ... +
j=r
+ (aXN + bY7'1 - c27,1) =
Solução
4
Note-se que, em cada caso, foi omitido o índice 7 de X e Y e que X significa E .
j=t
4
Assim, IX, por exemplo, é abreviação de I X;.
j--t
(a) ZX = (2) +(-5) + (4) + (- 8) =2 - 5 + 4-8 - - 7
(/) (rX) (II) = (- 7) (5) -- 35, usando (o) e (ó). Observa-se que (rX) (»I1
+»XY.
@) XYz e 3)2 + (- 5) (- 8)2 + (4) (10)2 + (- 8) (6)2 = -190
= Q)
(h) »(X +Y(X-Y =ZfX2 -fl =ZX2 -r,Yz = 109 -2Og =-100, usando
@) e @).
A média aritmética
4. la 000, Cr$ 19 500
Os salários mensais de quatro homens são: Cr$ 15 000,00, Cr$
e Cr$ 90 000. (o) Determinar a média aritmética de seus salários. (ó) Poder-
se-ia dizer que essa média é típica dos salários?
78 Estatística Cap. 3
Solução
(at X = -" """ -" """ -- -"" "" """ = ---;"' = 35 625
;
(admitindo-se que todos os algarismos são signiÍicativos nos salários rela-
cionados).
(á) A média Cr$ 35 625, certamente, não é típica dos salários, e apresentar
esse valor como salário médio, sem nenhum comentário ulterior, seria
cometer erro grosseiro.
Uma grande desvantagem da média é que ela é fortemente afetada pelos
valores extremos.
5. Entre 100 números, vinte são 4, quarenta são 5, trinta são 6 e os restantes são
7. Determinar a média aritmética dos números.
Solução
(10X7) _ 530 _
A-_Lfx _zfx _ (20(4\+ (40X5)+ (30)(6)+
7
Lt N roo -loo 5 ro
Solução
Emprega-se a média aritmética ponderada, sendo o fator de ponderação a associar
a cada grau o peso atribuído a cada matéria. Então:
Solução
\arx=N=T=-g0
(á) sim, o resultado é o mesmo. Para demonstrá-lo, admita-se Que ír números
tenham a média mt e fZ tenham a média rz2. Pode-se mostrar que a média
de todos os números é:
ot M1 = ftmt e Mz - f2m2. Comoa soma de todos os (ft + /z) números e \M1 + Mz),
a média aritmética de todos eles é:
Solução
O trabalho está delineado na Tabela 3.1. Note-se que todos os estudantes que têm
alturas entre 151 e 158 cm, 159 e 166 cm etc., são considerados como medindo 154,5,
80 Estatística Cap. 3
162,5 crn etc., de altura. O problema reduz-se, então, em determinar a altura média
dos 100 estudantes, S dos quais têm 154,5 cm de altura, 18 têm 162,5 cm etc.
Tabela 3.1
t7 l-70
=z!! =z{r
x"LfN100 = út.to
Os cálcuios necessários podem tornar-se enfadonhos, especialmente nos
casos de números grandes, quando houver muitas classes. Dispõe-se de técnicas
abreviadas para diminuir o trabalho nesses casos. Veja os Problemas 12 e L4, por
exemplo.
Solução
Então:
Solução
rL r\z s7
Pordefiniçào,X = = = 1,. Então:
ff.Y i;,2
- V, »(x+Y) LX+ZY ll
,=N==N=-N=N*n=X-lY. LY - -
N
Foram omitidos os índicesT de X,Y e Z, e I significa I .
j=t
11. (o) Se N números Xt, X2, ..., XN têm desvios, em relação a um número A, dados,
respectivamente, por dt = Xt - A, dz = X2 - A, ..., dN = XN - A, provar que
N
2 di
, - o-4 »''1
^=A* N =A+ N
KK
» fidi
j=t
x=A+ /tl r f1=A+\f,r"naoíf,
1v =r/=ly'.
j=I
82 Estatística Cap. 3
1e método
Como dj = Xj - A e Xi = A + dj então:
x- ZX;
.:= LIA: ,!) _ ZA+ Zdi _ N Ar.di 4*2di
ivNNNN
= .
N
Adotou-se X em vez de I , para abreviar.
j=t
2e método
Tem-se d.=X-AouX= A+ d, omitindo os índices dede deX. Então, pelo Problema
10,
X =Ã+ã = o*'rÍ
porque a média de um certo número de constantes, todas iguais a A é A.
K
»fixi
i=\
hl X=trc
»íix.i »f
= N _ i@+
d) _ >.Aíi+ 2f idi
-
N - N
»f j
j=r
A»'íj+Lf id1
Nl .!a n- zÍjdj - o- zl'a
N - N --^- N -nr N
Solução
A operação pode ser disposta como na Tabela 3.2. Toma-se para média
Tabela 3.2
t62,5 -8 18 144
t70,5 0 42 0
178,5 8 27 2t6
186,5 16 8 128
N= X/= 100 », fd = 120
arbitrada A o ponto médio 170,5, da classe de maior freqüência, embora possa ser
adotado qualquer outro. Note-se que os cáIculos são mais simples do que os do
Problema 8. Para diminuir ainda mais o trabalho, pode-se proceder como no
Problema 14, em que se lançou mão da propriedade dos desvios (coluna 2 da tabela)
serem todos múltiplos da amplitude do intervalo de classe.
x=t.# = 170,5 +
t20
100
= 170,5+ 1,2 = 171,7cm.
Solução
(o) O resultado está ilustrado na tabela do Problema 12, na qual se pode
observar que os desvios da coluna 2 são todos múltiplos da ampiitude
do intervalo de classe c = 8 cm.
Para veriÍicar que o resultado é verdadeiro, de um modo geral, note-se que,
Xl,X2,X3 ... são pontos médios sucessivos, sua diferença comum é, nesse caso, igual
84 Estatística Cap.3
que é múltiplo de c.
(ó) De acordo com (o), os desvios de todos os pontos médios, em relação a um
outro dado, são múitiplos de c, isto é, dj = c'uj'Então, conforme o Problema
1.1(ó), tem-se:
x = A*:í"r
Zfidi
-A
Zfilc ' u)
= A+ t. Z[;u;
-r' = u* (»f u\
la- l,
\/
14. Usar o resultado do Problema 13(ó) para determinar a altura média dos
estudantes do sexo masculino da universidade XYZ (ver Problema 12).
Solução
O cálculo pode ser disposto como na Tabela 3.3. O método é denominado processo
abreuiado e deve ser empregado sempre que for possível.
x = A*(fJu'1"
A
^_ = r tos+(''.),
_,/u.JT _ nt,lcm.
loo]. =
r/r./1,,.
[, ), I
Tabela 3.3
X u Í fu
.| 10
154,5 5
t62,5 -l 18 18
114,5 0 42 0
178,s 1 27 27
186,5 2 8 T6
A mediana
15. os graus de um estudante em seis exames foram: 84, 91, 72, 68, 87 e 78.
Determinar a mediana dos graus.
Solução
Dispostos em rol, os graus são: 68, 72,78,84,87,91. como há um número par de
graus, existem dois valores centrais, 78 e L4,cuja média aritmética, ,lA + 84) =
f,
= 81, é a mediana pedida.
16. se há: (o) 85 e (á) 150 números ordenados em ro1, como se determinaria a
mediana desses números?
Solução
(a) como há 85 itens, número ímpar, há somente um valor central, corn 42
números abaixo e 42 acíma dele. Então, a mediana é o 43e número do ro1.
(ó) como há 150 itens, número par, existem dois valores centrais, com 74
números abaixo e 74 números acima dele. Os dois valores centrais são o
Z5a e o 76e números do rol, e sua média aritmética será a mediana pedida.
Solução
Tabela 3.4
59 *63 -)
63,5 - 67 ,5 5
68 -12 9
-
12,5 16,5 12
77 - 8r 5
81,5 - 85,5 4
86 -90 2
Total40
3
72,25 +
12
(16,1s - 12,2s) = 12,25 * $e,sl = 73,4 ks.
Solução
(o) A Figura 3.3(o) apresenta o histograma correspondente aos pesos do
problema precedente. A mediana é a abscissa correspondente àlinha LM
que divide o histograma em duas áreas iguais. Como as áreas corres-
pondem às freqüências do histograma, LM é tal que as áreas totais à sua
direita e à sua esquerda são iguais à metade da freqüência total, ou 20.
Ora, as âreas AMLD e MBEL correspondem às freqüências 3 e 9. Então,
AM = 3ll2AB = 3ll2(4,5) = 1,725 e a mediana tem o valor 72,25 + 1,125 =
= 73,375 ou73,4 kg, com aproximação até décimos de quilo. O valor pode,
aproximadamente, ser lido também diretamente no gráfico.
(á) A Figura 3.3(à) representa o polígono de freqüência relativa acumulada,
ou ogiva percentual, correspondente aos pesos do problema precedente. A
mediana é a abscissa do ponto P dessa ogiva, cuja ordenada é 507o. Para
calcular este valor vê-se, nos triângulos semelhantes P@,R e.ESZ, que:
BQ=19 ,"
RS S7 X = ffiffi = 1' o" modo que Ro =
T = t,t25.
Então:
Mediana = 72,25 + RQ = 72,25 + 1,125 = 73,375 kg ou 73,4kg, aproximados
para décimos de quilo. Esse valor pode, aproximadamente, ser também lido direta-
mente no gráfico.
Solução
Neste caso, N = 65,N12 = 32,5. Portanto, a soma das duas e das três primeiras
freqüências de classe são, respectivamente, 8 + 10 = 18 e 8 + 10 + 16 = 34; a classe
mediana é a 34.
Estatística Cap. 3
15
L
'õ
(ú D E
i:flÉ;
c ::1. ::
:g
q 10 ':í: ;: t,
o)
LL
Ii§
: i::.::
i,:liâ
.1tata:
5 "o:
;f ;;
2t:.! a.,.
t#t !i!lr ,::l:,.:ll :1.
â.. ij l:i ; i;i t) t:) i
l;A
:*:::
;*; twi :::§,
(o)
100
s
E
s) 80
(§
E(§
=E
l 60
o
(§
(§
õ 40
É.
(ú
'o
c
<o)
:= 20
o
o)
LL
(ó)
Figura 3.3
Cap. 3 Média, mediana, rnoda e outras medidas da tendência central 89
Usando a fórmula:
( Ntz-r r rr, ) 32.s- 18 'l
Mediana = "'Lti-' I ;t "' I c = CrS6Í
-- -)qq+ f x
./mediana l' 16 )
[ )
x Cr$ 1 000 = Cr$ 7 906.
o zfx Cr$5l85oo = Crsigii.
^=- N -= 65
A moda
20. Determinar a média, a mediana e a moda do conjunto dos números: (a) 3, 5,2,
6, 5, 9, 5, 2, 8,6; (á) 51,6, 48,7, 50,3, 49,5, e 48,9.
Solução
(o) Ordenados em rol, os números sáol. 2,2, 3, 5, 5, 5, 6,6, 8, 9.
Média= 1l].0 (2 + 2 + 3 + 5 + 5 + 5 + 6 + 6 + 8 + 9) = §,1
Mediana= média aritmética dos dois valores centrais = ll2 (5 + 5) = 5.
Moda= número que ocorre com maior freqüência = 5.
(ó) Ordenados em rol, os números sáo: 48,7, 48,9, 49,5,50,3 e 51,6.
21. Instituir uma fórmula para determinar a moda dos dados apresentados em
uma distribuição de freqüência.
Solução
Suponha-se que a Figura 3.4 represente três retângulos do histograma de uma
distribuição de freqüência e que o retângulo central corresponde à classe modal.
Suponha-se, também, que os intervalos de classe tenham a mesma amplitude.
90 Estatística Cap. 3
X=Lt
Figura 3.4
U_X^^ UI _ X
L2 a'2
Então:
^/\^^
Lz(X - L) = Lt@t - X) :. L2X-LzLr=LtUr - ÂrX .'. (Àr + Lz)x =
= LtUt+ L2L1
LyUl+ L2L1
X_
^r+&
Cap. 3 Média, mediana, moda e outras medídas da tendência central 91
[O,+Lz)
Esse resultado tem a seguinte interpretação interessante. Se se constrói
uma parábola que passa pelos três pontos médios dos topos dos retângulos da figura,
sua abscissa máxima será a moda, como foi acima obtida.
Solução
Nesse caso,Ll = Cr$ 6 999, Àr = 16 - 10 = 6, Lz- 16 - 14 = 2, c =Cr$ 1 000.
Então:
(t,)//\
ModaLl+l .:f l.=cr$6999*Í, o - lcrsl.000=Crs7750.
[^r+^2r- [6+2,J
Solução
(a) No Problema 19 encontram-se: Média = Cr$ 7 977, Mediana = Cr$ 7 906.
Então:
Moda = Média - 3 (Média - Mediana) = Cr$ 7 977 - 3 (7 977 - Cr$ 7 906)=
= Cr$ 7 764.
(ó) No Problema 22, o salárío modal determinado foi Cr$ 7 750 portanto há,
neste caso, boa concordância com o resultado empírico.
92 Estatística Cap. 3
A média geométrica
24. Determinar: (o) a média geométrica; (b) a média aritmética dos números 3, 5,
6, 6, 7, 10, L2. Admita-se que os números sejam exatos.
Solução
(a) Médiageométrica =G= i,?SgSOA
Por meio de logaritmos decimais:
ll
log G = = = 0.8081 e
11oe4534600 7(5.6564
G = 6,43 ( arredondadopara centésimos)
Outro método
I
logG =
i(log3+ log5+ 1o96+ lo96+ 1og7+ logl0+ log12) =
1
= j(0,04771+ 0,6990 + 0,1782+ 0,1182 + 0,8451 + 1,0000 + t,0792)=
25. Os números X1, X2, ..., XK ocorrem com as freqüências f 1, f2, ..., fg, sendo f 1 +
+ fz + .-. + fx= N a freqüência total-
(o) Determinar a média geométrica G dos números. (á) Deduzir uma expressão
para log G. (c) Como poderia ser utilizado o resultado para determinar a
média geométrica dos dados agrupados de uma distribuição de freqüência?
Cap. 3 Média, mediana, moda e outras medidas da tendência central 93
Solução
Solução
Como o acréscimo de 1.000 para 4.000 é d,e 30OVo, poder-se-ia ser levado a concluir
que a percentagem média de acréscimo por dia é de 300Vol3 = t00%o.Isso, contudo,
importaria em ter aumentado a contagem, durante o primeiro dia, de 1.000 para
2.000; durante o segundo de 2.000 para 4.000; e, durante o terceiro, de 4.000 para
8.000, o que é contrário aos fatos.
Para determinar essa percentagem média de acréscimo, representa-se o
acréscimo por r. Então:
94 Estatística Cap. 3
A média harmônica
27. Determinar a média harmônica 11 dos números 3,5,6,6,7,10 e 12.
Solução
r r *'H t(t r r r r r r\
-r =7[J*5u6*6ni*
u=r,t ro* 11 )=
t( t+o+ 84+ 10+ 7o+ 60+ 42+ 35 ) 5ol
7[ 420 ) 2e40
) g4o
eH=--^-"=5.87
501
Assim:
tl
; =; (0.3333+ 0,2000+ 0,1661+ 0,t661+ 0,1429+ 0,10000+ 0,833) =
t1(l .1929) e,
=Z = 5.81
r.lgZg
=
Solução
Suponha-se que a distância de A a B seja de 60 km (embora possa ser considerada
qualquer distância). Então:
Solução
= {sz = j,55.
30. Provar que a média quadrática de dois números positivos desiguais, a e b, é
maior do que sua média geométrica.
Solução
se, então, ambos os membros ao quadra ao, Lrtoz + b2) > ab, de modo que a2 + b2 >
2ab .'. o2 - 2ob + b2 > 0, ou (o - b)2 > 0. Mas, essa última desigualdade é verdadeira,
porque o quadrado de qualquer número real diferente de zero deve ser positivo.
A demonstraçâo consiste em estabelecer o inverso da proposição acima.
Para isso, partindo de (o - blz > O, que se sabe que é verdadeiro, pode-se provar que
a2 + b2 > 2ab,
f,fo' * b)z > ab
e, finalmente,
I o' * o\ > I au, como era
desejado. Observe-se que , ^'[ = somente quando a = b.
"t
Solução
(o) O primeiro quartil Qt mediante a contagem de Nl4 = 6514 =
é o salário obtido
classe (mais baixa). Como a primeira
= 16,25 casos, a partir da primeira
classe contém 8 casos, devem-se tomar 8,25 (16,25 * 8) dos 10 casos da
segunda classe. Mediante o método de interpolação linear tem-se:
32. Mostrar como os resultados do problema anterior podem ser reduzidos de uma
ogiva percentual.
Solução
A ogiva percentual, correspondente aos dados do Problema 31, representada pela
Figura 3.5.
Estatística Cap. 3
100
:ã
ô\
:
.=
(ú
80
a)
tr
€60
(ú
l
E
f,
q40
(§
'o
c
:g
ct
20
o
LL
Figura 3.5
A média aritmética
33. Os tempos de reação de um indivíduo a determinados estímulos foram medidos
por um psicologista como sendo 0,53;0,46;0,50; 0,49; 0,52;0,53 0,44 e 0,55
segundos, respectivamente. Determinar o tempo médio de reação do indivíduo
a esses estímulos.
Resp.: 0,50 segundo.
Cap. 3 Média, mediana, moda e outras medidas da tendência central 99
35. O salário médio anual pago a todos os empregados de uma companhia foi
Cr$ 500.000. Os salários médios anuais pagos aos empregados dos sexos mas-
culino e feminino da companhia foram Cr$ 520.000 e Cr$ 420.000, respectiva-
mente. Determinar as percentagens dos empregados de cada sexo, da companhia.
36. A Tabela 3.5 mostra a distribuição, em toneladas, das cargas máximas supor-
tadas por certos cabos fabricados por uma companhia. Determinar a média das
cargas máximas, usando: (a) o "método longo"; (ó) o método abreviado.
Resp.: 11,09 t.
Tabela 3.5
9,3 - 9,1 2
9,8 - 10,2 5
10,3 - t},l t2
10,8 - l1,2 t7
17,3 - tt,1 t4
11,8 - 12,2 6
12,3 - t2,1 3
12.8 - t3.2 I
A mediana
37. Determinar a média e a mediana dos conjuntos de números:
(a) 5, 4,8,7,2,9; (b) L8,3,20,6, 79,3,22,4,20,2, 18,8,79,7,20,0.
Resp.: (a) Média = 5,8, mediana = 6; (ó) Média = lg,9l, mediana = 19,85.
100 Estatística Cap. 3
A moda
40. Determinar a média, a mediana e a moda dos conjuntos de números:
(a) 7,4, 10,9,15,72,7,9,'7; (ô)8, 11,4,3,2,5, 10,6,4, l, 10,8, 12,6,5,7.
Resp.: (a) Média = 8,9, mediana = 9, moda = 7, (b) Média = 6,4, mediana = 6.
Como cada um dos números 4,5,6, 8 e 10 aparecem duas vezes, pode-se
considerar que eles são as cinco modas. Entretanto, é mais racional
concluir que, neste caso, a moda não existe.
41. Determinar o tempo modal de reação do Problema 33.
A média geométrica
45. Determinar: (o) a média geométrica G (b) a média aritmética X dos números
2,4,8,16,32.
Resp.: h) G = 8; (ólX = 12,4.
46. Determinar a média geométrica da distribuição do Problema 36, verificando
se é menor ou igual à aritmética.
Resp.: 17,07 t.
Cap. 3 Média, mediana, moda e outras medidas da tendência central 101
Resp.: 18,9Vo.
48. Um capital de Cr$ 1.000 é investido à taxa anual de juros d.e 4Vo. QuaI será o
montante total depois de 6 anos, se não for retirado o capital inicial?
Resp.: Cr$ 1.265,32.
49. Se, no problema anterior, osjuros forem acumulados trimestralmente (isto é,
se há um aumento de 17o do capital cada três meses); qual será o montante
total depois de 6 anos?
Resp.: Cr$ 1.269,73.
50. Encontrar dois números, cuja média aritmética é 9,0 e geométtica é 7,2.
Resp.: 3,6 e 14,4.
A média harmônica
51. Determinar: (o) a média aritmética; (b) a média geométrical (c) a média
harmônica dos números 0,2, 4, 6.
Resp.: (o) 3; (b) 0; (c) Não existe.
52. Se X1, Xz, X2,... representam os pontos médios de uma distribuição de
freqüência, com as correspondentes freqüências de classe fi., fz, fs,..., respec-
tivamente, demonstrar que a média harmônica 11 da distribuição é dada por:
t t(fi Íz fz ) r-r
H-N Ir,'xz'x, )-N-x
emqueN=ft+fz+...=2f.
53. Utilizar o problema anterior para determinar a média harmônica da
distribuição do Problema 36. Comparar com o Problema 46.
Resp.: 11,04.
54. As cidades A, B e C são eqüidistantes umas das outras. Um motorista viaja de
AparaB a 30 km/h, deB para c a40 km/h e de c paraA a 50 km/h. Determinar
sua velocidade média para a viagem toda.
Resp.: 38,3 km/h.
102 Estatística Cap. 3
59. Deduzir a fórmula que pode ser usada para determinar a raiz média quadrática
de dados agrupados e aplicá-Ia em uma das distribuições de freqüências
anteriormente consideradas.
(b) 25Vo obtêm grau62 ou menor (ou75Vo obtêm 62 ot maior), 50Vc obtên74
ou menor (ou 50Vo obtêm 74 ou maior), 757o obtêrr, 86 ou menor (oa 25%
obtêm 86 ou maior).
Tabela 3.6
Números de estudantes
90- r00 9
80- 89 32
70- 19 43
60- 69 2t
50- 59 l1
40- 49 J
30- 39 1
61. Com referência ao Problema 36, determinar Q1, Qz, Prc e Pzs. Interpretar
claramente o resultado de cada um.
Resp.: 8r = 10,55 t; Qz = 11,07 t; Pro = 10,15 t; Pzs = 10,55 t.
62. Todos os quartis e decis podem ser expressos como percentis? (ó) Todos os
quartis podem ser expressos como percentis? Interpretar.
63. Interpretar os resultados do Problema 60, graficamente, mediante o emprego
de (o) um histograma percentual; (á) um polígono de freqüência percentual; (c)
uma ogiva percentual.
64. Instituir uma fórmula, semelhante à Equação (8) deste capítulo, para calcular
qualquer percentil de uma distribuiçáo de freqüência.
h
MAKRON
Capítulo
O desvio padrão e
outras medidas de dispersão
Dispersão ou variação
O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor
médio chama-se uariaçõ,o ott dispersão dos dados. Dispõe-se de várias medidas de
dispersão ou de variação, sendo as mais comuns a amplitude total, o desvio médio,
a semi-interquartílica, a amplitude entre os centis 10-90 e o desvio padrão.
A amplitude total
A amplitude total de um conjunto de números é a diferença entre o maior e o menor
número do conjunto.
Exemplo: Aamplitude total do conjunto 2,3,3,5,5,5,8, 10, 12, é: 12 -2 = 10.
Algumas vezes, a amplitude total é indicada, simplesmente, pela citação do menor
e do maior número. No caso acima, por exemplo, a amplitude total poderia ser
indicada como 2 a 12 ou 2 -L2.
O desvio médio de um conjunto de 3NnúmerosXl,Xv ..., XN é definido por:
» tx,-xt »lx-xl
j=r
Desvio Médio = DM N N = lX -Íl (1)
104
Cap. 4 O desuio padrõ.o e outras medidas de dispersdo 105
MédiaAritmética=X=
2+3+6+8+ ll
=6,
DesvioMédio= DM =
4+3+0+2+5
= 2.8.
N
emqueN = , fi = I/. Essa forma é vantajosa para os dados agrupados, em que
j --t
os xj representam os pontos médios e os f, são as freqüências de classe corres-
pondentes.
Note-se que seria mais apropriado usar a terminolo gia desuio médio abso-
luto, em vez de desvio médio.
106 Estatística Cap. 4
Amplitude semi-interquartílica= Q =
Qt-Qt (3)
2
em que P1g e Pgg são o 10q e o 90q percentis referentes aos dados. A semi-amplitude
entre os percentis 10-90,
i, rrn, -Py,), pode também ser empregada mas não o é
comumente.
0 desvio padrão de um conjunto de N números X1, X2, ..., Xry é representado por
s e definido por:
K
em que N _ s f . -
- zlJ If. Esta fórmula é vantajosa para os dados agrupados.
A variância
A variância de um conjunto de dados é definida como o quadrado do desvio padrào
e é, deste modo, representada por s2, símbolo definido nas Equações (5) e (6).
K (x \
zfix? l rr,*,1
- l,=, l= »x2
l/ (8)
[N )
108 Estatística Cap.4
IN \,
|t,,t, o,l
-[,J=
a
I t-L »d' (»d \
I
t-l (e)
N INI
\/
K
z f i di2 l\,,0,Í
-ll;=,
;- ».dz (».fa\'
N -[
1
|-
\i N l- , ,,l
= (10)
(11)
*-s X+s X+ 3s
Figura 4.1
110 Estatística Cap. 4
ly'rsr2*N2s22
,2= (t2)
N1+N2
Note-se que é a média aritmética ponderada das variâncias. Esse resultado
pode ser generalizado para 3 ou mais conjuntos.
Controle de Charlier
O controle de Charlier,para os cáIculos da média e do desvio padrão pelo método
abreviado (desvio em classes), utiliza-se das seguintes identidades:
Z f (u + l) = Z fu + »,f = 2 fu + N,
A variável H,
X_N ( 16)
s
112 Estatística Cap. 4
PROBLEMAS RESOLVIDOS
A amplitude total
1. Determinar a amplitude total de cada um dos conjuntos de números: (a) 12, 6,
7,3,15,10, 18,5; (ó) 9,3,8,8,9,8,9, 18.
Solução
Em ambos os casos, amplitude total = número maior - número menor = 18 - 3 = 15.
Entretanto, como se vê nos róis de (o) e de (ó),
@) 3, 5, 6,'l , 10, L2,15, 18; (á) 3, 8, 8, 8, 9, 9, 9, 18
há variaçáo ou dispersão muito maior em (o) do que em (á). De fato, (á) consiste,
,lrincipalmente, de oitos e noves.
Como a amplitude total não indica nenhuma diferença entre os conjuntos,
nãt I é uma boa medida de dispersão para este caso. Em geral, quando houver valores
sxli'emos, a amplitude total é uma medida medíocre para a dispersão.
Solução
Há duas maneiras para definir a amplitude total para os dados agrupados.
1e método
Amplitude total = ponto médio da classe mais elevada - ponto médio
da classe mais baixa = 186,5 ' 754,5 = 32 cm.
2e método
Amplitude total = limite superior verdadeiro da classe mais
elevada - limite inferior verdadeiro da classe mais
baixa = 190,5 - 150,5 = 40 cm.
O 1e método tende a eliminar, de certo modo, os casos extremos.
O desvio médio
Solução
DesvioMédio = DM.N
- » I 4- xl
34 ,
_ 2,5+ 3,5+ 2,5+ 6,5+ 5,5+ 0,5+ 8,5+ 4,5--=*'zi, õÉ
8
114 Estatística Cap. 4
O desvio médio indica que o conjunto (ó) apresenta dispersão menor do que (a).
4. Determinar o desvio médio das alturas dos 100 estudantes do sexo masculino
da Universidade XYZ (veja a Tabela 3.2 do Problema 12 do Capítulo 3).
Solução
Na solução do Problema 12, Capítulo 3, foi determinada:
Tabela 4.1
Desvio Médio = DM =
»f lx - xl u91:o 6,04cm
N = 100 =
Cap. 4 O desuio padrõ.o e outras medidas de dispersã.o 115
Solução
X t ou = 171,70 + 6,04 éo intervalo de 165,66 cm até 177,74 crlr.
Este intervalo inclui todos os indivíduos da terceira classe + 1/8 (166,50 -
- 165,66) dos estudantes da segunda classe + ].l8 (L77,74 -174,5)limitedos da quarta
classe (visto que a amplitude do intervalo de classe = 8 cm; o superior
verdadeiro da 2ê classe = 166,50 e o limite inferior verdadeiro da 43 classe = L74,5).
O número de estudantes do intervalo X t DU 0:
Solução
O primeiro e o terceiro quartis são:
Note-se eue 507o dos casos estão compreendidos entre @1 Q3, isto é, 50
"
estudantes têm alturas compreendidas entre 166,88 cm e 177,46 cm.
central, ou seja, como a altura média. Segue-se que 507o das alturas estão situados
no intervalo (172,17 + 5,29) cm.
O desvio padrão
7. Determinar o desvio padrão de cada um dos conjuntos de números do Problema 1.
Solução
(a) Média aritmética
»X 12+6+7+3 +15+10+18+5 76
__-q\
_
N 8 8 -'"'
= {2s,75 = 4,87.
(á) Média aritmética X
9+3+8+8+9+8+9+18 =ff=0,
= =
(8-9)2 +
= ^fl5 = 8,87.
Cap. 4 O desuio padrãn e outras medidas de dispersã'o 117
Solução
Variância = s2. Então, em vista do Problema 7, tem-se: (o) s2 = 23,75;16; t2 = 15.
Solução
Nos Problemas 8, 12 ou 14, do Capítulo 3, determinou-se X = L71,70. O trabalho
pode ser disposto como na Tabela 4.2, abaixo.
Tabela 4.2
6,064
100
: ^i6os4 =
7,JBcm.
L18 Estatística Cap. 4
(ô) Usar a fórmula de (o) para determinar o desvio padrão do conjunto dos
números 12, 6, 7,3, 15, 10, 18, 5.
Solução
(o) Por definição:
26-n2
N
Então:
-z _
-NN
26 -h2 - »(x2 - 2xx + x\ - »x2 - zx »x + ttx2 _
N
1 ZX2
=zx'_.tvZX*vz_2x2
NNN -2X -+ x,-
-1 =
N -v2 =
v2 zx2_[,
=\-_x.=
-;2 ( zx f
N ,,l
»x'2 f tx i ^[ uz -uz
N [N )
--l-r=\z\--z\-
Note-se que, nos somatórios acima, foi adotada a forma abreviada, em que
X substitui Xi e Z substitui I .
'j=t
Outro método
= 9]2
8
= rt4.
çA- _ zx 12+6+7+3+15+10+18+5 '76
=q§
N 8
Então:
Solução
A modiÍicação adequada é:
,={r# [+.Í =
xt - xz
Então:
-2 LÍ(xN-n:
,-=-: - zf (x2 -zxx + P) : »Íx2 -2x »Íx+ x2 »í =
N
= r# -rx
»l# -zx2 + 7' = Uf -x2 =
,,2
(zÍx\
=
LÍxz
N IN -( ul f ou, = tN
\./ I
)
120 Estatística Cap. 4
12. Usando a fórmula do Problema 11, determinar o desvio padrão dos dados do
Problema 9.
Solução
O trabalho pode ser disposto como na Tabela 4.3.
Tabela 4.3
§=
zÍd2-[,(»f a f
N ]
Cap. 4 O desuio padrã,o e outras rnedidas de dispersd.o 121
Solução
Visto que d. = X - A, X = A + d. eX = A + d, como no Problema 11, Capítulo 3, entào:
x-x=\A+d)-(A+ d)=d-ã.
de modo que
zfrP (zfd\2
s= N -[' ]
usando o resultado do Problema 11, com X e X substituídos por d e d, respectiva-
mente.
Outro método
14. Mostrar que, se cada ponto médio X, em uma distribuição de freqüência que
tem amplitudes de intervalos de classe iguais a c, for expresso em função de
um valor u, de acordo com a relação X = A + c' tt.,em queÁ é um determinado
ponto médio, então o desvio padrão poderá ser escrito como:
Zfu' [2.Íu ,2 \
Nlnrl\/ -f
Solução
Essa expressão é deduzida imediatamente do problema precedente, porque d = X - A=
= c . u,. Então, como c é uma constante,
122 Estatística Cap.4
15. Determinar o desvio padrão das alturas dos estudantes da Universidade XYZ
usando, (o) a fórmula deduzida no Problema 13, (ó) o método abreviado do
Problema 14.
Solução
Nas Tabelas 4.4 e 4.5, escolhe-se arbitrariamente A igual ao ponto médio 170,5 cm.
Note-se que, na Tabela 4.4, todos os desvios d, = X -A são múltiplos do intervalo de
classe c = 8. Esse fator é eliminado na Tabela 4.5. Em conseqüência, os cálculos, na
Tabela 4.5, sáo grandemente simplificados. Eles poderiam ser comparados com os
dos Problemas 9 e 12. Por esta razáo, o método abreviado deve ser usado sempre
que for possível.
t54,5 16 5 80 1.280
Ponto médio X
U=-
X_A Freqüência f .fu .fo2
c
t54,5 a 5 10 20
162,5 -l 18 18 l8
A + 170,5 0 42 0 0
178,5 I 27 27 21
186,5 2 8 16 32
,.2
-8 91 tt5 \
l-l
=s{0,9a75 =7,i8cm.
100 I\/roo I
16. A Tabela 4.6 apresenta os C.I. de 480 escolares de certa escola primária.
Determinar: (o) a média; (á) o desvio padrão, usando o método abreviado.
Tabela 4.6
Freqüência f 4 9 t6 28 45 66 85 72 54 38 27 18 11 5 2
Solução
Por exemplo, uma criança de 8 anos que, de acordo com certo processo
educacional, tem mentalidade equivalente a uma de 10, teria C.I. = 10/8 = 1,25 =
= 7257o, ou simplesmente 125, ficando subentendida a percentagem.
Para determinar a média e o desvio padrão dos C.I., pode-se dispor o
trabalho como na Tabela 4.7.
Í24 Estatística Cap.4
Tabela 4.7
X u Í .fu Íu2
10 -6 4 24 t44
74 -5 9 45 225
18 -4 t6 64 256
82 --) 28 84 252
86 1 45 90 180
90 -1 66 66 66
A -, 94 0 85 0 0
98 I 12 '12 12
t02 2 54 108 216
106 -3 38 tt4 342
118 6 t1 66 396
t22 1 5 35 245
t26 8 2 l6 128
N=If=480 2fu=236 2f u2 = 3.404
@) x =A+c.u=A * + = e4 +- = e5,e7.
"
(á)s=c ="ffi= É33)
-,1
-a
Controle de Charlier
17. IJsar o controle de Charlier para auxiliar a verificação dos cálculos: (o) da
média; (ó) do desvio padrão, efetuados no Problema 16.
Cap. 4 O desuio padrã.o e outras medidas de dispersão 125
Solução
(a) » f (u + 1) - 776, da Tabela 4.8.
L fu + N = 236 + 480 ='716,da Tabela 4.7.
Tabela 4.8
-5 4 20 100
-4 9 36 144
-3 l6 48 t44
,| tt2
28 56
-1 45 45 45
0 66 0 0
1 85 85 85
2 72 144 288
J 54 t62 486
4 38 152 608
5 21 135 615
6 18 108 648
1 l1 17 539
8 5 40 320
9 2 18 162
Solução
s2 = 60,58; c =8.Variâ.nciacorrigid,a =s2 -"2172 = 60,58 -82ltz = 60,58 -5,33 = 55,25.
Desvio padrão corrigido = r/ *tia** .o.trgiau= { 5525 = I ,43 cm.
Solução
Solução
(a) X+ s = 95,97 + L0,47 é o intervalo dos C.L de 85,5 a 106,4.
O número de C.I. nesse intervalo (Xt s) e:
Solução
(a) Média do lqconjunto: = ll5(2 +5 + 8 + 11 + 14) = 8.
Média do 2e conjunto: = 113 (2 + 8 + 14) = 8.
z 12 -8;2 + i5 - 8)2 + (8 - 8)2 + (11 - 8)2 + (14 - 8)2 + (2 - 8)2 + (8 - 8)2 + (14 - 8)2
= 20,25 .
b+5
Outro método, pelo emprego da fórmula:
Ntsl * Nzsz2
variância do conjunto combinado = ,2 = N1 +N2
Solução
Agora, as médias dos dois conjuntos são 8 e 16, respectivamente, enquanto as
variâncias sáo iguais às dos conjuntos do problema anterior, a saber: s12 = 18 e
s22 = 24.
cável a este caso, porque as médias dos dois conjuntos nõ,o sáo iguais.
z tX - q)2
, , +^* valor *í-i*
tem o^ -,^r^- mínimo se e onmanio
somente ao a
se o = X.
N
Solução
uma constante, a expressão atinge seu menor valor (ou seja, é um mínimo)
Solução
(o) Dispersão absoluta de A = sa = 280 horas; de B = sB = 310 horas.
Então, a válvula B tem maior dispersão absoluta.
(á) Coeficiente de variação de A = 18,77o) de B=
= l6,5Vo. *= ffi= r- = #* =
25. (o) Definir uma medida de dispersão relativa que possa ser usada para um
conjunto de dados, cujos quartis sejam conhecidos. (ó) Exemplificar o
cálculo da medida definida em (o), usando os dados do Problema 6.
Solução
Solução
Solução
(o) O trabalho de conversão em escore reduzido pode ser disposto como na
Tabela 4.9. Nessa tabela adicionaram-se, para empregá-lo no item (á), os
pontos médios dos C.I. 66 e 130, que têm freqtiência nula. Também não se
usou a correção de Sheppard para o desvio padrão. Os escores corrigidos
neste caso são praticamente iguais aos aqui apresentados para a aproxi-
mação indicada.
(á) O gráfico de freqüência relativa em função do escore z (polígono de freqüên-
cia relativa) está indicado na Figura 4.2. O eixo horizontal está graduado
em unidades de desvio padrão s. Note-se que a distribuição é moderada-
mente assimétrica e ligeiramente desviada à direita.
132 Estatística Cap.4
cr (x) X_ X V=-
X*X Freqüência f Freqüência
§ relativa
ÍlN (7o)
Figura 4.2
Cap. 4 O desuio padrão e outras medidas de dispersã,o 133
A amplitude total
28. Determinar a amplitude total dos conjuntos de números: (o) 5, 3, B, 4,7,6, 72,
4,3; (b) 8,772, 6,453, 10,624, 8,628,9,434,6,351.
Resp.: (a) 9; (ó) 4,273.
29. A maior de 50 medidas é 8,34 kg. Se a amplitude total é 0,46 kg, determinar a
medida menor.
Resp.: 7,88 kg.
O desvio médio
30. Determinar o desvio médio dos conjuntos de números: (o) 3,7 ,9,5; (b) 2,4, 1,6,
3,8,4,1,3,4.
Resp.'. (a) 2; (b) 0,85.
31. Determinar o desvio médio: (o) em relação à média; (ó) em relação à mediana,
do conjunto de números 8, 10, 9, L2,4,8,2. Verifrcar que o desvio médio em
relação à mediana não é maior do que em relação à média.
Resp.: (o) 3,0; (b) 2,8.
32. Deduzir fórmulas abreviadas para calcular o desvio médio: (o) em relação à
média; (ó) em relação à mediana, para uma distribuição de freqüência.
O desvio padrão
37 . (o) Somando-se 5 a cada um dos números do conjunto 3, 6, 2, l, 7 , 5, obtém-se
o conjunto 8,11,7 ,6,12, 10. Mostrar que os dois conjuntos têm o mesmo desvio
padrão, nas médias diferentes. QuaI é a relação entre as médias? (b) Multipli-
cando-se cada um dos números 3, 6, 2, l, 7, 5 por 2 e depois somando-se-lhes
5, obtém-se o conjunto ll, 17,9,7,19, 15. Qual é a relação entre os desvios
padrões e as médias de ambos os conjuntos? (c) Quais as propriedades da média
e do desvio padrão que são exemplificadas pelos conjuntos particulares de
números dos itens (o) e (á)?
38. Para o Problema 36 do Capítulo 3: (o) determinar o desvio padrão; (á) deter-
minar o emprego do controle de Charlier; (c) aplicar a correção de Sheppard,
discutindo se sua aplicação é ou não justificável.
Resp.: (o) 0,733 t; (c) 0,719.
39. De um total de N números , a fraçáop é constituída de números 1, enquanto a
fração e = | - q é de zeros. Provar que o desvio padrão desse conjunto de
números é ^6q.
40. Provar que a variância de um conjunto de nnúmeros o., a + d + 2d, ..., a +
+ (n - 1) d (isto é, uma progressão aritmética com primeiro termo a e razão d)
é dada por lll2(rP -t142. [Sugestão: Fazer 7 +2 + 3 +... + n-1r= Ll2n(n-L);
12 + 22 + 32 + ... + (n - l)2 = l/6 n (n - l) (2n - 7).1
Cap. 4 O desuio padrã,o e outras medidas de dispersdo 135
Momentos
SeX1, X2, ...,X1,. são os Nvalores assumidos pela variávelX, define-se a quantidade
t Y.r
,;-r Xt'+X2''+...+Xlv' i=1 »X'
_N (l)
N - N = -r
L rX 1 - h'
*,=c! * =Y=q --xy \2)
136
Cap. 5 Momentos, ossimetria e curlose 137
em que d' =X-A é o desvio de cada valor dexem relaçáo aA. seA = 0,(B) recai em
(1). Por essa razão, (1) é muitas vezes denominado momento de ordem r centrad,o na
origem.
| *r= m'z-n'?
1 ^, = m' j - 3m'tm'2+ 2m'i (1)
, ,Z.fu' -r_
ffir=c'-fr-=crut' (8)
que pode ser empregada para a determinação de mr, mediante a aplicação das
Equações (7).
l»yg+tl =zfu + N
) ,tr+ r12 = 2f u2 + 22f u- + N (e)
I ,/,r+ 113 = Zfu3 + 32fu2 + 32,fu + N
|,/,r+ 114 = Lfua + 42fu3 + 62fu2 + 42fu + N'
As correções de Sheppard para os momentos (por extensão das idéias
referentes à correção de sheppard para a variância), são as seguintes:
m2 coffigido = m2 i. ,' t
m4 = corÍigid,o= m4 - ; r' *, * h ro .
y
sr (',1 m)' =-f!l:-
' =ry-L= (10)
",1
^r,
Cap. 5 Momentos, assimetria e curtose 139
em que
" ='[
*, eo desvio padrão. Como rnt = 0 a ff12="2, têm-sea0 = 0 ê o1 = L
Assimetria
Assimetria é o grau de desvio, ou afastamento da simetria, de uma distribuição. Se
a curva de freqüência (polígono de freqüência suavizado) de uma distribuição tem
uma "cauda" mais longa à direita da ordenada máxima do que à esquerda, diz-se
que a distribuição é assimétrica pdra a direita, ou que ela tem assimetria positiua.
Se é o inverso que ocorre, que ela é assimétrica para a esquerda. ou que tem
assimetria negatiua.
Para distribuições assimétricas, a média tende a situar-se do mesmo lado
da moda que a cauda mais longa (veja as Figuras 3.1 e 3.2, Capítulo B). Por isso,
uma medida da assimetria é proporcionada pela diferença entre a média e a moda.
Ela pode ser tomada abstratamente mediante sua divisão por uma medida de
dispersão, como desvio padrão, o que resulta na seguinte deÍinição:
Curtose
Curtose é o grau de achatamento de uma distribuiçáo, considerado usualmente em
relação a uma distribuição normal. A distribuição que tem um pico relativamente
alto, como a da curva da Figura 5.1(o), é denominada leptocúrtica, enquanto a da
curvâ da Figura 5.1(b), que tem o topo achatado, é denominada platicúrtica. A
distribuição normal, Figura 5.1(c), que não é muito pontiaguda nem muito achatada,
é denomina da me socúrtica.
Figura 5.1
",OPso-Prc ( 17)
1
em que I =; (Qs - Qr) é a amplitude semi-interquartílica.
PROBLEMAS RESOLVIDOS
Momentos
1. Determinar: (a) o primeiro;(ó) o segundo;(c) o terceiro;(d) o quarto momentos,
para o conjunto de números 2, 3,'l ,8, 10.
Solução
x= »,X 2+ 3+ 7+ 8+ 10 30
@) N =-=b
c
é o segundo momento.
(c)X, =r#'=#=-*=328
é o terceiro momento.
(d)Nn=+=#=*Y=8'818,8
é o quarto momento.
2. Determinar: (o) o primeiro; (ó) o segundo; (c) o terceiro; (d) o quarto momentos
centrados na média, para o conjunto de números do Problema 1.
Solução
h) *1 =1X-X\=Iê N -X) =
_ (2- 6)+ (3- 6)+ (7-G)+ (8- 6)+ (10- 6l = I = 0
55
m1é sempre nulo porque X -V = X - X = O (Problema g, Capítulo 3).
(btm2=6--ff=#=
= =T=n,r.
Note-se qu% m1 é a variância s2.
(c)ms=G-lq3=§fl=
_ (2- 6)3+ (3- 6)3+ (7- 6)3+ (8- 6)3+ (10- 6)8 =
= -18 ô^
5 5 = -ó'o'
-
Cap. 5 Momentos, assimetria e curtose 143
d.\ma=6-*=à-6-X)4-
_ (2- 6)a+ (3- 6)a+ (7- 6)a+ (8- 6)a+ (10- 6ta _ 610 = 1r,
55
3. Determinar: (o) o primeiro; (á) o segundo; (c) o terceiro; (d) o quarto momentos
centrados na origem 4,para o conjunto de números do Problema 1.
Solução
_ (2- 4)3+ (3- 4)3+ (7- 4)3+ (8- 4)3+ (10 - 4)B
=2?-B:59.6.
5 - 5 -uu'
Solução
Do Problema 3: m'1= 2, m'2= 13,2, m'3= 59,6, m'4= 330. Então:
(a) m2 = m'2 - m't2 = 13,2 - e)2 = 73,2 - 4 = 9,2.
(b) mz = rn'B - 3m'lm'2+ 2nL'13 =
5. Provar que:
(a) m2 - nl'z- m'12;
Solução
(a) Se d. = X-Á, então X = A + d.,X = A + íe X -X = d.-ã-
m2=1X-g2 = (d-d)2 = a2-zdaz+ã2 = d.2 -2d2+í2 = a2-Az =
=m'2-m'?'
Tabela 5.1
X u f fu Íu2 Íu3 .f ua
(at m't =
" + - (4) [ r*= ) = 1,s667.
[ }ff )=
(bt m,2 =
"r# = (4)z ,rr,nuur.
(c) m's = ,,
# = @)3(#)= rur,ouur.
146 Estatística Cap. 5
(l) X = (Á + d)3 = (A3 + gA2d. + BAd,z + d3) =A3 + BA2ã, + BAã2 +ã3 =
Controle de Charlier
7. Exemplificar o emprego do controle de Charlier para os cálculos do Problema 6.
Solução
Para efetuar o controle pedido, somam-se as seguintes colunas às do Problema 6,
com exceção da coluna 2, qu.e é aqui repetida por conveniência.
Cap. 5 Momentos, assimetria e curtose 147
Tabela 5.2
-1 45 45 45 45 45
0 66 0 0 0 0
I 85 85 85 85 0
2 72 144 288 516 1.t52
J 54 t62 486 1.458 4.37 4
4 38 t52 608 2.432 9.728
5 27 135 61s 3.37 5 16.87 5
lzft"+1)=716
I Zf " * N= 236+ 480 = 716.
| ,f f" + t)2 : 4.s56
\ rf "' + 2zf u+ N = 3.404+ 2\236)+ 480 = 4.356.
l»fo+1)3=fi.828
\ rf "'+ 32f u2+ 32f u+ N= 6.428+ 3(3.404)+ 3(236)+ 480 =17.828.
lzfw+174=122.148
lrf
I
+ 42f u3+ 62f u2+ 4Zfu+ N = 74.588+ 4(6.428)+ 6(3.404)+
"n + 4(236) + 480 722.148.
[ =
148 Estatística Cap. 5
Solução
m4 corrigido = m4 L r'*, * h ,o =
1.7
= 35.621.2853_
, t+t2 tt0g.S988t* z+o(4\1
= 34.151.9616.
Assimetria
9. Determinar: (o) o primeiro e (ó) o segundo coeficiente de assimetria de Pearson
para a distribuição dos salários dos 65 empregados da Companhia P&R (veja
o Problema 2, Capítulo 2).
Solução
Média = Cr$ 7.976, mediana = Cr$ 7.906, moda =
,,, {ff;ff =
W = o,t474ou 0,15.
,, , L=--0.1370ou0,14.
tbi 3 (média - mediana) 3 (Cr$ 7 .976 - Cr$ 7.906 )
s corrigido - Cr$ 1.533
Como os coeficientes são positivos, a distribuição tem assimetria positiva,
isto é, à direita.
Solução
m3 m3 202.8158
-rrÇF-
a3= a =
et - - r__::__:::_ = 0.1769 ou 0. 18.
Curtose
11. Determinar o coeficiente de momento de curtose, a4, para os dados do Problema 6.
Solução
y!
- s4=
*o^ 35'621'285]
= 2,9660 ou 2,9i.
m)'= ( 109.5988)'
ao
m4 corrigido 34'151
í74 corrisido - (rr2 corrigido;2
- '961§ = 2,g653 or 2,gl .
( 108.2655 )2
150 Estatística Cap. 5
PROBLEMAS SUPLEMENTARES
Momentos
12. Determinar o: (a) primeiro; (ó) segundo; (c) terceiro; (d) quarto momentos, do
conjunto de números 4,7,5,9, 8, 3, 6.
Resp.: (a) 6; (b) 40; (c) 288; (d) 2.188.
13. Determinar o: (o) primeiro; (ó) segundo; (c) terceiro; (d.) quarto momentos
centrados na média, para o conjunto de números do Problema 12.
Resp.: (o) 0; (ó) 4; (c) 0; (d) 25,86.
L4. Determinar o: (o) primeiro; (ó) segundoi (c) terceiro; @) quarto momentos
centrados no número 7,para o conjunto de números do Problema 12.
Resp.: (a) - 1; (b') 5; (c) - 9t; (d) 53.
15. Usando os resultados dos Problemas 13 e 14, verificar as relações entre os
momentos: (a) m2 = m'2 - m't?; (b) rna = m'B - 3m'1m'2 + 2m'y3; (L) ,rra = m'4 -
- 4m'1m'3 + 6m'1 2m'2-3^'14.
16. Provar que (c) m'2= m2 + h2; (b) m's = mB + 3hm2 + h3; (c) m'4 = ry4 + 4hmg +
+ 6h"m2 + h", em q:ue h = h'y
17. Se o primeiro momento centrado no número 2 é ígaal a 5, qual é a média?
Resp.: 7.
Resp.: (a) mt= 0; (ó) m2 = pq; (c) pq(q - p); (d) pq (p2 - pq + q\'
21. Provar que os 4 primeiros momentos centrados na média da progressão arit-
mética a, a + d, a + 2d, ..., + (n - 1) d são:
a
Tabela 5.3
X .f
12 1
t4 4
t6 6
18 10
20 7
)) )
Total 30
28. ExempliÍicar o emprego do controle de Charlier para os cálculos do Problema 22.
Assimetria
25. Determinar o coeficiente de momento de assimetria, aB, para a distribuição do
Problema 22. (a) sem; (á) com as correções de Sheppard.
Curtose
28. Determinar o coeficiente de momento de curtose, a4, para a distribuição do
Problema 22: h') sem as correções de Sheppard; (ó) com elas.
Resp.: (a) 2,62; (b) 2,58.
29. Determinar o coeficiente de momento de curtose para a distribuição do Pro-
blema 36, Capítulo 3: (o) sem; (ó) com a correções de Sheppard.
Resp.: (a) 2,94; (b) 2,94.
30. Os quatro momentos centrados na média das duas distribuições do Problema
26 são 230 e 780, respectivamente. Qual é a distribuição que mais se aproxima
da normal, do ponto de vista: (o) da agudeza; (ó) da assimetria?
p=Prtrrj=L'
n
Q=prjnào6 =n ;h = I -h = | -p = | -Pr e
Assim, P + q= 1 ou Prinào E] = 1.
p=prlrl= ?=+
153
154 Estatística Cap.6
Em particular:
er{r'1+ Bzl= rr{r1}+er'lr2} (6)
t 112
rr{11 E2): = er{r'1}+ Pr{z'2}= 13 ' 13 - 13
Cap. 6 Teoria elementar da probabilidade 157
visto que ambos, ás e rei, não podem ser extraídos ao mesmo tempo e por isso são
eventos mutuamente exclusivos.
Exemplo 2. Se E1 é o evento "extração de um ás de um baralho" e E2 é o
da "extração de uma carta de espada", então E1 e E2náo são mutuamente exclusivos,
visto que pode ser extraído o ás de espadas. Assim, a probabilidade de extração de
um ás ou de uma carta de espadas, ou de ambos, é:
X 2 314 5 6 1 8 9 10 l1 t2
p(x) rl36 2136 3136 4136 5t36 6136 5136 4136 3136 2136 tl36
p (x)
ab
Figura 6.1
Esperança matemática
Se p é a probabilidade de uma pessoa receber uma quantia S, a esperanÇa mate-
md.tica, ou simplesmente esperança, é definida por pS.
Exemplo: Se a probabilidade de um homem ganhar um prêmio de Cr$ 10
é de 115, sua esperança é de 1/5 (Cr$ 10) = Cr$ 2.
k
E(X) =ptXt+ pzXz+ ...+ pxXx -§ P 1X.i = ZPX (1)
j-t
Se as probabiiidadesp; forem substituídas, nessa expressão, pelas freqüên-
ciasrelativasf i /N, emque N = 2f j, aesperançareduzir-se-áa(»f X) /N,q:ueéa
média aritmética X de uma amostra de tamanho ÀI, na qual X1, X2 ...,X6 aparecem
com essas freqüências relativas. Quando N tornar-se cada vez maior, a freqüência
relativa f 1 /N aproximar-se-á da probabilidade py. Por isso, é-se conduzido a inter-
pretar E(X) como a representação da média da população da qual a amostra foi
extraída. Se for representada por m arr,édia da amostra, a da população poderá ser
indicada pela letra grega correspondente, p (mi').
A esperança pode também ser definida para variáveis aleatórias contínuas,
mas essa definição requer o uso do cáIculo infinitesimal.
Análise combinatória
Para a obtenção da probabilidade de eventos complexos, a enumeração de casos é
freqüentemente difícil, tediosa, ou ambas as coisas. Para facilitar o trabalho neces-
sário, apela-se para os conceitos básicos estudados na disciplina denominad,a anó-
lise combinatória.
Princípios Íundamentais
Se um evento pode acontecer de qualquer um de n1 modos e se, quand.o ele ocorrer,
um outro evento pode realizar-se de qualquer um de rL2 modos, então o número de
maneiras segundo as quais ambos os eventos podem ocorrer numa determinada
ordem serâ n1n2.
Exemplo: Se há 3 candidatos a governador e 5 a prefeito, os dois cargos
podem ser preenchidos de 3 x 5 = 15 modos.
Fatorial de n
O fatorial de n, representado por nt, é definido por:
nt =n(n-l')(n-2)...l. (8)
Permutações
uma permutação de z objetos diferentes, tomados r de cada vez, é um arranjo d.e r
dos z objetos, Ievando-se em consideração a ordem de sua disposição.
(e)
Cap. 6 Teoria elementar da probabilidade 161
t2!
313!2l2lllll = 3.326.400,
Combinações
Uma combinação de z objetos diferentes, tomados r de cada vez, é uma escolha de
r dos n objetos, não se levando em consideração a ordem de sua disposição. O número
de combinações de n .objetos, tomados r de cada vez, é representado por
,Cr, C (ru, r'),C n,r or) Í I l" dado por:
(', "
n\n_ l)...(n-r+ l) ,P,
nLr= =,-.qn_y1 l== rl (11)
,r.
Exemplo: o número de combinações das letras a, b e c, tomadas duas de
cada vez, é:
u
Dq o
^
3q- 2l =8.
são: aó, ac, bc. Note-se qtte ab é a mesma combinação que ba, mas não é a
mesma permutação.
nn e-' (12)
Figura 6.2
O evento E1+ E2é o conjunto de pontos que estào tanto em 81, como em E2
ou em ambos, enquanto EtEZ é o conjunto de pontos comuns a E1 e 82. Entáo, a
probabilidade de um evento, tal como Ey é a soma de todas as probabilidades
associadas a todos os pontos contidos no conjunto {1. Semelhantemente, a probabi-
lidade de,E1 + F'2, representada por Pr \81+ E2|,é soma das probabilidades
^
associadas a todos os pontos contidos no conjunto E1+ 82. Se E1e E2náo têm pontos
comuns, isto é, se os eventos são mutuamente exclusivos, então Pt{tr,1+ E2} =
= Pr{ pr't + Pr{n2}.. Se eles têm pontos comuns, então:
+82\= rr{a'1}+rr\n2} -P'l ErEzj
Cap. 6 Teoria elementar da probabilidade 163
PROBLEMAS RESOLVIDOS
3. Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 4
brancas e 5 azuis. Determinar a probabilidade de ela: (a) ser vermelha; (á) ser
branca; (c) ser azul; (d) não ser vermelha; (e) ser vermelha ou branca.
Cap. 6 Teoria elementar da probabilidade 165
Solução
Admita-se que y, B e A representam os eventos da retirada de uma bola vermelha,
de uma branca e de uma azul, respectivamente. Então:
(á)Pr,B 44
-. =
- = ti+4+5
^ 15
Outro método
Solução
Seja E1 = o eyento correspondente a "4, 5 ou 6", no primeiro lance, e E2 o de surgir
"L,2,3 ou 4" no segundo.
Cada uma das 6 maneiras, segundo as quais o dado pode cair no primeiro
lance, pode ser associada a cada uma das 6 do segundo lance, num total de 6 x 6 =
= 36 modos, todos igualmente possíveis.
166 Estatística Cap. 6
cada uma das três maneiras, segundo as quais E1 pode ocorrer, pode ser
associada a cada uma das quatro de 82, o que dá 3 x 4 = 12 modos, segundo os quais
tanto E1e 82, corr:ro EçEZ.
Solução
Seja E1 = o eYento correspondente a sair um ás na primeira retirada e E2o de ocorrer
um ás na segunda.
(o) Se a primeira carta for recolocada, E1e E2serão eventos independentes.
Então:
Pr { ambas as cartas retiradasserem ases } = P, I Er E2l =
4t
Pr E'E' = 52x I
51= 221
{ E2 lE1 } = Pr {da segunda carta ser um ás depois de ocorrer
Note-se que Pr
na.primeira) = 3/51- Nessas condições, o resultado é um exemplo da regra geral
Pr{ 11 azl =Pr{,41 i Yr { n2 lE1 } quando E1e E2 sáoeventos dãpendentãs.
Cap. 6 Teoria elementar da probabilidade 167
Solução
Seja B = o evento correspondente a haver "menino" na família e G = o de haver
"menina". Então, de acordo com a hipótese de probabilidades iguais, Pr {B} = Pr {G} =
= ll2. Em famílias de 3 crianças podem ocorrer os seguintes eventos mutuamente
exclusivos, com as correspondentes probabilidades indicadas:
(o) 3 meninos (BBB). Então, Pr IBBBI = Pr {B} Pr {B} Pr {B} = 718.
Número de meninos X 0 2 -1
Solução
O gráfico pode ser representado como na Figura 6.8 ou na Figura 6.4.
Note-se que a soma das áreas dos retângulos da Figura 6.4 é igual a 1.
Nessa figura, denominadahistograma de probabilidade, considera-seXcoÃo variá-
vel contÍnua, se bem que ela seja realmente discreta, processo que muitas vezes se
revela conveniente. A Figura 6.3, por outro lado, é usada quando não se deseja
considerar a variável como contínua.
Número de meninos
p (x)
Figura 6.3
Número de meninos
p (x)
Figura 6.4
Solução
(o) O gráfico de p()Q =l/2 - aX é u111a linha reta, como está indicado na Figura
6.5. Para determinar a, deve-se compreender que a área total entre a reta
e o eixo dosX, entreX= 0 eX = 4, deve ser igual a 1.
p (x)
Figura 6.5
p (x)
Figura 6.6
Esperança matemática
9. Em um certo empreendimento comercial, um empresário pode ter lucro de
Cr$ 300, com a probabilidade de 0,6 ou pode ter prejuízo de Cr$ 100, com a
probabilidade de 0,4. Determinar a esperança matemática do lucro do em-
preendimento.
Solução
Esperança = (300) (0,6) + (-100) (0,4) = Cr$ 1+0.
10. Determinar: (a) E (X); (b) E tx2l; @) E 16 - Xlzl ,paraa seguinte distribuição
de probabilidade.
X 8 t2 l6 20 24
Solução
(a't E(X) =»Xp(X) = (8) (1/B) + (L2) (1/6) + (16) (3/8) + (20) (].la) + (24) (1172) =
= 16.
Isso representa a média da distribuição.
Permutações
11. De quantas maneiras 10 pessoas poderão sentar-se em um banco, se houver
apenas 4 lugares?
Solução
O primeiro lugar pode ser preenchido de 10 maneiras e, quando isso tiver sido feito,
haverá 9 maneiras de preenchet o2e lugar, 8 de preencher o terceiro e 7 de preencher
o quarto.
Portanto:
Número de arranjos de 10 pessoas, tomados 4 a 4= 10 x 9 x 8 x 7 = 5.040.
Em geral:
Número de arranjos den objetos diferentes, tomados r ar =n(n-I)(n- 2)
...(n-r+1).
É também denominado número de permutações de n objetos diferentes,
tomados r de cada yez, e representado por nP, , P(n ,r) ou Pn,, . Note que quando
r=n,rPr=nl,
12. Calcular; (o) sPs ; @) aP+; (c) uPr; @) zPz
Solução
(o) aPs= 8.7.6 = 336; (b) eP+= 6.5.5.3 = 360;(c) fiPt= 3.2.1 = 6.
13. Quantos números de 4 algarismos podem ser formados com os 10 algarismos, 0,
1,2, 3, ..., 9 se: (o) forem permitidas as repetições; (ó) elas não forem permitidas,
(c) o úItimo algarismo deve ser zero e não forem permitidas as repetições?
172 Estatística Cap. 6
Solução
(o) O primeiro algarismo pode ser qualquer um dos 9 (visto que o zero não é
permitido). O segundo, terceiro e quarto algarismos podem ser qualquer
um dos 10. Então, 9 x 10 x 10 x 10 = 9.000 números podem ser formados.
(á) O primeiro algarismo pode ser qualquer um dos 9 algarismos (qualquer
um, menos o zero).
O segundo algarismo pode ser qualquer um dos 9 (qualquer um, mas nào
o usado para o primeiro).
O terceiro algarismo pode ser qualquer um dos 8 (qualquer um, menos os
usados para os dois primeiros).
O quarto algarismo pode ser qualquer um dos 7 (qualquer um , menos os
usados para os três primeiros).
Então, 9 x 9 x 8 x 7 = 4.536 números podem ser formados.
Outro método
O primeiro algarismo pode ser qualquer um dos nove e os três remanescentes podem
serescolhidosdegP3modos.Então,9 sPz = 9'9'8'7 = 4.536 númerospo-
dem ser formados.
(c) O primeiro algarismo pode ser escolhido de 9 modos, o segundo de 8 e o
terceiro de 7.
Então, 9 . B . 7 -- 504 números podem ser formados.
Outro método
O primeiro algarismo pode ser escolhido de 9 modos e os dois seguintes de gP2
modos. Então, I' aPz = 504 números podem ser forrnados.
Combinações
14. Calcular (a) zC+; (b) eCs; @) +C+.
Cap. 6 Teoria elementar da probabilidade 17J
Solução
. 1t 7.6.5.4- = 7.ç.5 _,,
tat 7c4 = = - 4l y r. i = ru.
4'l'l
(b)acs=#i =6,ou acs= ocr=6.
(c) +C+é o número das seleções de 4 objetos, tomados de uma só vez, e há
somente uma seleção. então,4C4 = 1 .
Solução
^ = 91 918x 7x 6x 5 = 126.
'ct 5:4: 5 !
16. Um rapaz tem 5 moedas, cada uma de valor diferente. Quantas somas diferen-
tes podem ser formadas?
Solução
Cada moeda pode ser tratada de 2 maneiras, isto é, pode ser escolhida ou não. Como
cada um dos 2 modos de tratar uma moeda associa-se aos 2 de tratar cada uma das
outras, o número de modos de escolher as 5 moedas = 25. Mas, os 25 modos incluem
o caso de não ter sido tomada nenhuma moeda.
Outro método
Pode-se selecionar, entre as 5 moedas, 1,2, ...,5. Então, o número desejado de somas é:
Solução
ll log3.l42+ 50log50-501og2.718 =
= , Iog 100+ ;
| (2)+
.^ I
= Q.4972\ + 50 (1,6990)-5010.4343 =64.4836.
, 2
Logo, S = 3,04 x 1064, número de 65 algarismos.
Solução
Solução
Representem-se os lances do dado pelos cinco traços:
A cada traço corresponderá um dos eventos 6 o nào 6 t6l. Por exemplo,
6ou 6 6 6 6 6 etc.
podem surgir três 6 e dois nào 6 sob as formas 6 6 6 6
=
I X I X 5X-X-I s =l ( t rtrSr'
ll- l.
6 6 6 6 6 [u)\u)
20. verifica-se, em uma fábrica, que, em média, 20vo dos parafusos produzidos
por uma determinada máquina não satisfazerrr a certas especificações. Se
forem selecionados ao acaso 10 parafusos da produção diária dessa má-
quina, determinar a probabilidade de serem defeituosos: (o) exatamente 2;
(b) 2 ot mais; (c) mais de 5.
Solução
(o) Pr {2 parafusos defeituosos} = 16c2 (0,2)2 (0,8)8 = 45 (0,04') (0,162g) =
= 0,0302, mediante raciocínio idêntico ao empregado no Problema 19.
(á) Pr {2 ou mais parafusos defeituosos} = 1 - Pr {nenhum defeituoso} p, {t
-
defeituoso) = 1 - 16C6 (0,2)0 (0,9)10 - 10C1 (0,2)r (O,g)e - 1 - (0,g)10 _
- 10(0,2) (0,8)e = 1 - 0,1074 - 0,2684 = 0,6242.
(c) Pr {mais de 5 defeituosos} =
-p. {6 def.} + Pr {Z def.} +
pr {8 def.} + pr {9
def.i + Pr {10 def.} = rcc6(0,2)6 (0rB)4 + lr,ct e,2)7 (0,g)3 + roca (0,2)B (0,8)â+
+ roCg (0,2)e (0,8) + roCro (0,2)10 = 0,00637.
Solução
(o) Número esperado = (1.000) (0,0302) = 30, de acordo com o problema 20(a).
(ó) Número esperado = (1.000) (0,6242) - 624, de acordo com o problema 2O(ü.
(c) Número esperado = (1.000) (0,00682) = 6, de acordo com o problema 20(c).
4-B
(2,6) (3,6) (4,6)
(2,1) (4,1)
Figura 6.7
Solução
(o) O espaço amostral consiste no conjunto de pontos, indicado na Figura 6.7.
A primeira coordenada de cada ponto é o número obtido em um dado e a
segundaéooutrodado.
Há 36 pontos ao todo e, a cada ponto, atribui-se uma probabilidade de 1/36.
A soma das probabilidades de todos os pontos do espaço é 1.
(ó) os conjuntos de pontos que correspondem aos eventos "soma 7" e "soma 11"
estão indicados por A e B, respectivamente.
Pr {A } = soma das probabilidades associadas a cadaponto, em A = 6136.
Pr {B } = soma das probabilidades asociadas a cada ponto, em B = 2136.
Solução
(a) Sejam A e B dois conjuntos de pontos que têm pontos comuns, repre-
sentados por AB, como na Figura 6.8. A compõe-se de AB e AB, enquanto
B compÕe-s e de BÃ e AB.
A totalidade dos pontos de A + B (A, B, ou ambos) = totalidade dos pontos
deA + totalidade dos pontos de B - totalidade dos pontos de AB.
Como a probabilidade de um evento ou conjunto é igual à soma das
probabilidades associadas aos pontos do conjunto, tem-se:
Pr {A +B} =Pr {Á} +Pr {Bi -Pr {ÁB}.
B
*,
Figura 6.8
Figura 6.9
Cap. 6 Teoria elementar da probabilidade 1Zg
PROBLEMAS SU PLEMENTARES
Resp.: (a) 5126; (b) 5136; (c) 0,98; (d) 219; (e) 718.
{f ) Pr lE1E2 + E2E3l.
Resp.: (a) Probabilidade de um rei na primeira retirada e não um rei na
segunda.
(ó) Probabilidade de um rei na primeira retirada ou na segunda.
(c) Não ocorrer um rei na primeira ou na segunda retirada, ou em ambas
(nenhum rei na primeira e na §egunda retiradas).
(d) Probabilidade de ocorrer um rei na terceira retirada, depois de ter surgido
um na primeira mas não na segunda.
(e) Nenhum rei na primeira, segunda e terceira retiradas'
(/ ) Probabilidade de ocorrer um rei na primeira e na segunda retiradas ou de
não ocorrer nenhum na segunda retirada e um na terceira'
Cap.6 Teoria elementar da probabilidade 181
Resp.: (a)
X 0 I 2 )
p (x) U6 r12 3lt0 rl30
Esperança matemática
31. Qual o preço justo a pagar para entrar em um jogo no qual se pode ganhar ou
Cr$ 25.000 com probabilidade 0,2 ou Cr$ 10.000 com probabilidade 0,4?
Resp.: Cr$ 9.000.
182 Estatística Cap. 6
32. A e B jogam uma partida, na qual lançam uma moeda honesta 3 vezes. O que
obtiver cara em primeiro lugar, vencerá a partida. Se Á é o primeiro a lançar
a moeda e se o valor total das apostas é Cr$ 20,00, qual deve ser a contribuição
de cada um, para que o jogo possa ser considerado correto?
Permutações
37. Calcular: (a) +Pzi@) Ês; (c) roPs.
Combinações
41. Calcular: h) sC$ (b) aCq; (c) roCs.
Resp.: (c ) 10; tbt 7O; k\ 45.
42. Para qual valor de n se verifica a igualdade 3 . 1,, + r)Ce =7 . nCz?
Resp.: n = 6.
43. Deve ser formada uma comissão constituída de 2 estatísticos e 3 economistas,
escolhidos dentre 5 estatísticos e 6 economistas. Quantas comissões diferentes
podem ser formadas se: (o) nenhuma restrição é imposta; (b) 2 estatísticos
indicados devem estar na comissão; (c) um economista indicado não pode estar
na comissão?
Resp.: h) 150; (b) a5; (c) 100.
44. Determinar o número de: (o) combinações; (ó) permutações, de 4 letras cada
uma, que se pode formar com as letras da palavra Tennessee?
Resp.: @) 17; (á) 163.
46. Mostrar QtJe 2nC, = 22'l^[ nn, aproximadamente, para grandes valores de ru.
PROBLEMAS RESOLVIDOS
47. Se TOVo dos rebites produzidos por uma máquina são defeituosos, qual é a
probabilidade de, entre 5 escolhidos ao acaso: (o) nenhum ser defeituoso; (ó)
um ser defeituoso; (c) pelo menos 2 serem defeituosos?
Resp.: (o) 0,59049; (á) 0,32805; (c) 0,08146.
184 Estatística Cap. 6
48. Uma prévia eleitoral entre 200 eleitores revelou as seguintes informações a
respeito de 3 candidatos,A, B eC, de um certo partido, que concorrem a três
cargos diferentes.
28 a favor de ambos, A e B;
98 a favor de Á, ou de B, mas não de C;
42 afavor de B, mas não de A ou de C;
122 a favor de B, ou de C, mas não de A;
52. Dois pontos são escolhidos ao acaso sobre um segmento de reta, cujo compri-
mento é a > 0. Determinar a probabilidade dos 3 segmentos assim formados
poderem ser os lados de um triângulo.
Resp.'. 714.
h
MAKRON
Capítulo
As distribuições binomial,
normal e de Poisson
A distribuição binomial
Sep é a probabilidade de um evento acontecer em uma tentativa única (denominada
probabilidade de um sucesso) eq = 1-p é a de que o evento não ocorra em qualquer
tentativa única (denominada probabilidade de urninsucesso), então a probabilidade
do evento ocorrer exatamente X vezes, em N tentativas (isto é, de que haja X
sucessos e N-Xinsucessos), é dada por:
YvJ-N-x
N!
P(X)= 1yC, q -xrtl,r-x)r f {-*, (1)
."^(tff ,f-'__6t:f
: it +, : 'f: 15
Iz )1, )
o'-z
IrJ: 64'
1
substituindo em (1) os valores N = 6, X = 2 e p=e=2'
-
.
"' [] i[; l "'(+lt; l
185
186 Estatística Cap. 7
Exemplo:
(q + p)a = q4 + qCt q3 p + 4C2 q2 p2 + 4C4+ p4 =
Tabela 7.1
Média lL=Np
Variância o2=Npq
Desvio padrão o={tlpq
Coeficiente do momento de assimetria q- p
Ctl
- = r-Npq
",1
A distribuição normal
Um dos mais importantes exemplos de uma distribuição contínua de probabilidade
é a distribuição ott a curuct. normal, ou a distribuiçã.o de Gauss, definida pela
equação.
Y
l-
= o!2n ,-t'z(x-vi/o2, (3)
v - I ^-l/2-' (4)
l-t(
"'l 2n
-2-1012
<-68,27"/. -->
<- 95,45% ----------i
99,73%
Figura 7.1
188 Estatística Cap.7
Tabela7.2
Média I ti
Variância I o2
Desvio padrão 6
Coeficiente de momento de I u: = 0
assimetria
Coeficiente de momento de curtose üa = 3
Desvio médio o{ Z/n =0.19:9o
Distribuição de Poisson
A distribuição discreta de probabilidade:
Cap. 7 As distribuições binomial, normal e de Poisson 189
-. = )J e-x ! (X ...),
p(Xl = 0, 1,2,3 (5)
Tabela 7.3
Média F=1"
Variância o2=)"
Desvio padrão o={T
Coeficiente de momento de u: = 1/t[
assimetria
Coeficiente de momento de curtose a+=3+lllu
A distribuição multinomial
Se os eventos.El, 82, ..., E6 podem ocorrer com as probabilidades p1, P2, ..., PK,
respectivamente, então a probabilidade de Eb 82, ..., EK ocorrerem Xt, X2, ..., XK
vezes, respectivamente, é:
1/!
p{' p* ... &K , (6)
emqueXy+X2+...+Xx=N.
Essa distribuição, que é uma generalizaçã'o da binomial, é denominada
distribuiçã,o multinomiol, visto que (6) é o termo gerai do desenvolvimento do
polinômio (pt+ pz + ... + p17)".
Exemplo: Se um dado honesto é lançado 12 vezes, a probabilidade de
serem obtidos os pontos 7,2,3,4,5 e 6, exatamente duas Yezes cada um, é:
PROBLEMAS RESOLVIDOS
A distribuição binomial
1. Escrever os desenvolvimentos dos binômios: (o) (q + p)a; (b) (q + p)6.
Solução
(a) (q + p)4 = qa+ tCtq1p + tCzq2p2 + +Csq3p4=
ll
t2l
l33l
14641
15101051
1615201561
2. Se 20Vo dos parafusos produzidos por uma máquina são defeituosos, deter-
minar a probabilidade de, entre 4 parafusos escolhidos ao acaso: (o) 1; (á) O;
(c) no máximo 2 parafusos serem defeituosos.
192 Estatística Cap. 7
Solução
A probabilidade de ocorrer um parafuso defeituoso é de p = 0,2 e um não-defeituoso
édeq=7-p=0,8.
(o) Pr {1 parafuso defeituoso entre 4} = aC{0,2)t(0,8)B = 0,4096.
(ó) Pr {nenhum parafuso defeituoso} = aCs(O,2)0(0,8)4 = 0,4096.
Solução
(a) Pr {nenhum graduar-se} = rCo(0,4)010,6)5 = 0,07776
ou, aproximadamente, 0,08.
(á) Pr {1 graduar-se} = 5C1(0 ,4)r(0,6)4 = 0,2592 ou, aproximadamente, 0,26.
(c) Pr {pelo menos um graduar-se} = 1 - Pr {nenhum graduar-sel = 0,92224
ou, aproximadamente, 0,92.
NN
4. Calcular: (").? (b) onde P(8, = ,arCsp xqN-x .
{r(X); *: d"
Solução
*,.iÍ0,, pxqN x -
=
.iÍr#,o,
px-1qN X -
'",1,o+#5,
^[i= Np(s+p)N-1= NP, visto que q+p = 1.
Cap. 7 As distribuições binomial, ruormal e de Poisson 193
N N ,r
ttlixzplxl= »x2 zt; \z!#-,pxqNx-
r=0 x=l ' zL)'
N
= L tx(x-1)+ Xl fd+ pxqN X -
x=l
N N! v ^r.,,
=
x!(N= !
pnq,v ^ +
,:Í(x_L)
N
+ lvl pxqN x
' Fx x!(N-)0 =
,'=;' !
N
= N(N -DPz ;^,"-;+#;l Px-zqN x* NP =
x=2'
= N(N-t)pz(q+ p)N-2+ Np = N(N- 1)p2+ Np.
Nota: Os resultados dos itens (o) e (ó) sáo as esperanças de X e X2,
representadas por E(X) e E(X\, respectivamente (veja o Capítulo 6).
5. Se uma variável tem distribuição binominal, determinar sua: (o) média p; (ó)
variância o2.
Solução
N
(o) p = esperança da variável 2 Xp (X) = Np, segundo o Problema 4(o) .
x=0
Solução
(a) Média = NP = 400(0,1) = 40, isto é, poode-se esperar que 40 sejam defei-
tuosos.
(b) Variancía=Npq = 400(0,1)(0,9) = 36. Então, o desvio padrãoé = {36 = 6.
Solução
^ 7-6pq =J+
="* . 1-6(0,1)(0,9) =8,01.
Npq 86
A distribuição normal
8. Dois estudantes foram informados de que alcançaram as variáveis reduzidas
de 0,8 e -0,4, respectivamente, em um exame de múltipla escolha de inglês. Se
seus graus foram 88 e 64, respectivamente, determinar a média e o desvio
padrão dos graus do exame.
Cap. 7 As distribuições binomial, normal e de Poisson 195
9. Determinar a área limitada pela curva normal em cada um dos casos, (a) a (g),
apresentados a seguir. Utilizar o Apêndice II.
(o) Entrez=0ez=1,2.
No Apêndice II, percorre-se a coluna z parà baixo, até encontrar a casa 1,2.
Então, segue-se à direita até a coluna que indica o vâIor zero.
O resultado, 0,3849, é a ârea desejada e representa a probabilidade de z
estar compreendida entre 0 e 1,2, representada por Pr l0 < z < 1,2] .
(ó) Entrez=-0,68êz=0.
Área desejada = área entre z = O e z = 0,68 (por simetria).
Para se determinar aáreaz =0 ez = 0,68, percorre-se acolunaz para baixo,
até a casa 0,6. Então, segue-se à direita até a coluna que indica o valor 8.
O resultado,0,2517 é a área pedida e representa a probabilidade de z estar
compreendida entre - 0,68 e 0, representada por: Pr {-0,68 < z < 0} .
(c) Entre z = - 0,46 e z = 2,21.
(área entre z = - 0,46 e z = O)+ (área entre z = 0 e z = 2,21)
Área desejada -
=(áreaentre z =0 ez = 0,46) + (âreaentre z =0 ez =2,21) = 0,1772 + 0,4864 =
0,6636.
z-02=1,2
(a)
Figura 7.2
196 Estatística Cap. 7
Figura 7.2.a
10. Determinar o valor, ou valores, de z em cada um dos casos de (o) a (c), nos quais
as áreas referem-se às limitadas pela curva normal.
(a) A fueaentre 0 e z é 0,3770.
No Apêndice II, a casa 0,3770 está situada à direita da linha designada por
1,1, e sob a coluna encabeçada por 6. Então, o valor desejado é z = L,16.
z -1,5
Figura 7.3
11. Determinar as ordenadas da curva normal para; (o) z = 0,84; (.b) z = - 1,27; (c)
z = - 0,05.
198 Estatística Cap. 7
Solução
(o) No Apêndice I, percorre-se a coluna z para baixo, até encontrar a casa 0,8.
Então, segue-se à direita até a coluna assinaladapor 4. A casa 0,2803 é a
ordenada desejada.
(á) Por simetria: (a ordenada em z = - 1,27) = (ordenada em z = !,27) = 0, 1Tg1.
(c) (Ordenada em z =-0,05) = (ordenadaerrrz = 0,05) = 0,8984.
Solução
(o) Os pesos relacionados entre 60 e 77,5 kg podem ter, na realidade, qualquer
valor compreendido entre 59,75 e 77,75 kg, admitindo-se que foram regis-
trados até centésimos.
59,75 kg em unidades reduzidas = (59,75 - 75,50)17,5 = - 2,10.
77,75 kg em unidades reduzidas = 07,75 - 75,50)17,5 = 0,80.
A proporção desejada de estudanlss = (área entre z = - 2,10 e e = 0,30) =
(área entre z = -2,L0 e z = 0) + (ârea
entre z = 0 e z = 0,S0) = O,4g2l+ 0,1129 =
0,6000. Então, o número de estudantes cujos pesos estão entre 60 e 77,50 kg =
500x(0,6000)=300.
(á) os estudantes com pesos superiores a g2,50 kg devem pesar pelo menos
92,75kg.
92,75 kg em unidades reduzidas = (92,75 - 75,50)17,5 = 2,30.
Aproporção desejada de estudantes = (área à direita de z = 2,30) = (área à
direita - (área entre z = O e z = 2,80)= 0,5 - 0,4gg3 = 0,0107.
de z = 0)
-2,10 0,30
(a)
Figura 7.4
13. A média dos diâmetros internos de uma amostra de 200 arruelas produzidas
por uma certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas.
A finalidade para a qual essas arruelas são fabricadas permite a tolerância
máxima, para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verificar,
as arruelas serão consideradas defeituosas. Determinar a percentagem de
arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros
são distribuídos normalmente.
Solução
0,496 em unidades reduzidas = (0,496 - 0,502)/0,005 = -7,2.
,2
Figura 7.5
Solução
l2)12) 572
99
128 = 0,7734.
(ó) A distribuição de probabilidade para o número de caras em 10 lances da
moeda está indicada graficamente nas Figuras 7 .6(a) e 7 .6(b), sendo que a
Figura 7.6(b) considera os dados como se fossem contínuos. A probabilidade
desejada é a soma das áreas dos retângulos sombreados da Figura 7.6(b) e
pode ser dada, aproximadamente, pela área subtendida pela curva normal
correspondente, representada em linha tracejada.
Considerando-se os dados como contínuos, segue-se que 3 a 6 casos podem
ser considerados como 2,5 a 6,5. Também, a média e a variância para a distribuição
Probabilidade
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10
Número de caras
(a)
Probabilidade
0,3
0,2
0,1
0 1 2 3 4 5 6 7 8 9 10
Número de caras
(ó)
Figura 7.6
-1,58 0,95
Figura 7.7
Estatística Cap. 7
Solução
=25Oeo="lNpq= )í r )
\ ]'l
lL=Np= rsoor[ (soo) = 1 1,18.
-/ [ )1, )
(o) Deseja-se a probabilidade do número de caras ficar entre 240 e 260 ou,
considerando-se os dados como contínuos, entre 239,5 e 260,5.
239,5 em unidades reduzidas = (239,5 -250)l11,l8 = -0,94.
260,5 em unidades reduzidas = 0,94.
Distribuição de Poisson
16. Dez por cento das ferramentas produzidas por um certo processo de fabricaçào
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de
10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas,
mediante o emprego: (o) da distribuição binomial; (ó) da aproximação de
Poisson para essa distribuição.
Cap. 7 As distribuições binomial, normal e de Poisson 203
Solução
Probabilidade de uma ferramenta ser defeituosa = p = 0,1.
(o) Pr {2 ferramentas defeituosas em 10} = 16C2 (0,1;2 (0,9)8 = 0,1937 ou 0,19.
(á) )" = Np = 10(0,1) = 1.
Solução
(0,001)2 (0,999)1'ee8).
A distribuição multinomial
18. Uma caixa contém 5 bolas vermelhas, 4 brancas e 3 azuis. Uma bola é escolhida
ao acaso da caixa, sua cor é observada, e a bola é então recolocada. Determinar
a probabilidade de, entre 6 bolas assim escolhidas, 3 serem vermelhas, 2
brancas e I aatl.
Solução
Pr {vermelha em qualquer retirada} = 5lL2;
Pr {branca em qualquer retirada} = 41721'
Solução
Tem-se Pr {X caras em um lance de 5 moedas} = p(X) = sCxpX Ç5-x, em que p e q
são, respectivamente, as probabilidades de surgir uma cara ou uma coroa em um
só lance de uma moeda. De acordo com o Problema 5(a), o número médio de caras
é yt = Np = $p.
Cap. 7 As distribuições binomial, normal e de Poisson 205
W _ (38) (0) + (144) (1) + (342) (2) + (287) (3) + (164) (4) + (2s) (s) _
»Í - 1.000
2.470
=ffi=2'47'
Igualando-se a média teórica à real, 5p = 2,47 ou p = 0,494. Assim, a
distribuição binomial ajustada é dada por:
p(X) = sCx Q,494)x (0,506)s-x.
Tabela7.4
0 0,0332 33,2 ot 33 38
5 0,0294 29,4 ot 29 25
Solução
Tabela 7.5
99,9
oo
o\
€e5
geo
5ao
rá3
.= 50
(Ú 40
&30
.§ 20
I
<(D
to
:f5
o
I
LL1
0,1
154,5 162,5 170,5 178,5 186,5
Altura (cm)
Figura 7.9
2I. Ajustar uma curva normal aos dados da Tabela 2.1 do Capítulo 2.
Solução
Tabela 7.6
Solução
O número médio de acidentes é:
"
'"
À=L=
».fx (21)(0)+ (18)(1)+ (7)(2)+ (3)(3)+ (l)(4) 45
= 0.90.
2,Í 50
Tabela7.7
Ne de acidentes, X Ne de dias,.f
Total 50
Tabela 7.8
0 o,4066 20,33 ou 2O 2t
1 0,3659 18,30 ou 18 18
2 0,1647 8,24 ou 8 7
3 0,0494 2,47 ou 2 -l
4 0.0111 0,56 ou 1 1
PROBLEMAS SU PLEMENTARES
A distribuição binomial
23. Determinar a probabilidade de: (a) 2 ou mais caras; (á) menos que 4 caras, em
uma jogada única de 6 moedas honestas.
Resp.: (a) 57164; (b) 21132.
24. SeXrepresenta o número de caras em uma jogada única de uma moeda honesta,
determinar: (a) Pr {X = 3}; (á) Pr lX < 2l; (c) Pr {X < 2l; @) Pr {1 < X < 3}.
Resp.: (a) tl4; (b) 5/16; (c) tlll6; (d) 5/8.
25. Entre 800 famílias com 5 crianças cada uma, quantas se esperaria que tives-
sem: (o) 3 meninos; (ó) 5 meninas; (c) 2 ou 3 meninos. Considerar probabilida-
des iguais para meninos e meninas.
27. Calcular, para uma distribuição binomial, com p = 0,7 e N = 60: (o) a média;
(ó) o desvio padrão;(c) o coeficiente do momento de assimetría;(d) o coeficiente
do momento de curtose. Interpretar os resultados.
A distribuição normal
29. Em um exame de estatística, a média foi 78 e o desvio padrão 10. (o) Deter-
minar os escores reduzidos de 2 estudantes cujos graus foram gB e 62, respec-
tivamente. (ó) Determinar os graus de 2 estudantes cujos escores reduzidos
foram respectivamente, -0,6 e 1,2.
Resp.: b) 1,5, -1,6; (á) 72,90.
30. Se z é normalmente distribuída, com média 0 e variância 1, determinar: (o) Pr
=-1,64};(b) Pr {- 1,96 <z í1,96]r; (c) Pr {l z I >1}.
{z
Resp.: (a) 0,9495; (ó) 0,9500; (c) 0,6826.
31. DeterminaÍ zt na expressão Pt Íz > z1l = 0,84, em que z é notmalmente
distribuída, com média 0 e variância l-.
Resp.: -0,995.
32. Determinar as ordenadas da curva normal para: (a) z = 2,25; (b) z = -0,32; (c)
z = - 1,18.
Resp.: (o) 0,0317; (ó) 0,3790; (c) 0,1989.
33. Se as alturas de 300 estudantes são normalmente distribuídas, com média
L72,72 cm e desvio padrão 7,62 crr,, quantos estudantes têm alturas: (o)
superiores a 182,88 cm; (ó) iguais a162,56 ou menores; (c) entre 165,10 cm e
Cap. 7 As distribuições binomial, normal e de Poisson 211
180,34 cm inclusive; (d) iguais a 172,72 cm? Admitir que as medidas foram
registradas até centímetros.
Resp.: (a) 20; (b) 36; (c) 277; (d) 40.
34. Se um conjunto de medidas é normalmente distribuído, qual a percentagem
das que diferem da média de: (o) mais da metade do desvio padrão; (ó) menos
de 314 do desvio padrão?
Resp.: (a) 6I,77o; (b) 54,7Vo.
35. Se X 0 a média e s o desvio padráo de um conjunto de medidas normalmente
distribuídas, que percentagens delas estão: (o) dentro do intervalo tXt 2s);(bl
fora do intervalo çXxl,2s); (c) superiores a (X- 1,5s)?
Resp.: (a) 95,4Vo; (b) 23,07o; k) 93,37o.
A distribuição de Poisson
39. Se 3Vo das iâmpadas elétricas fabricadas por uma companhia são defeituosos,
determinar a probabilidade de, em uma amostra de 100 lâmpadas, serem
defeituosos:'(o) 0; (b) 1; (c) 2; (d) 3; @) a; (fl 5 lâmpadas.
Resp.: (a) 0,04979; (b) O,l4g4; (c) 0,224t; (d.) 0,2241; (e) 0,1680; (/ ) 0,1008.
40. No problema anterior, determinar a probabilidade de serem defeituosos: (o)
mais de 5; (á) entre 1 e 3; (c) 2lâmpadas ou menos'
Resp.: (a) 0,0838; (b) 0,5976; (c) 0,4232.
41. Entre as 14 e 16 horas, o número médio de chamadas telefônicas por minuto,
atendidas pela mesa de ligações de uma companhia, é 2,50. Determinar a
probabilidade de, durante um determinado minuto, haver: (o) 0; (ó) l; (c) 2; (d)
3; (e) 4 ou menos, (l) mais de 6 chamadas telefônicas.
Resp.: (o) 0,08208 (b) 0,2052; (c) 0,2565; (.d) 0,2138; (e) 0,8911; (f ) 0,0142.
A distribuição multinomial
42. Determinar a probabilidade de não se obter 1,2 ou 3, em quatro lances de um
dado honesto.
Resp.: 318.
X 0 1 2 -1 4
f 30 62 46 10 2
Cap. 7 As distribuições binornial, normal e de Poisson 213
44. Ajustar uma distribuição normal aos dados do Problema 36, capítulo 3.
X 0 1 2 1 4
Í 109 65 22 J 1
h
MAKRON
Gapítulo
Teoria da amostragem
A teoria da amostragem é um,estudo das relações existentes entre uma populaçào
e as amostras dela extraídas. E de grande valor em muitas conjeturas. Por exemplo,
é útil para a estimação de grandezas desconhecidas da população (como sua média,
sua variância etc.), freqüentemente denominadas parâmetros populacionols ou,
abreviadamente, parãn1.etros, através de conhecimento das grandezas corres-
pondentes das amostras (como a média da amostra, sua variância etc.), muitas vezes
denominad as estatísticas amostrals ou, abreviadamente, estatísticas. Os problemas
de estimação serão tratados no Capítulo 9.
A teoria da amostragem é também útil para determinar se as diferenças
observadas entre duas amostras são realmente devidas a uma variação casual ou
se são verdadeiramente signiÍicativas. Essas questões surgem, por exemplo, ao se
testar um novo soro para ser empregado no tratamento de uma doença, ou ao
decidir-se se um processo de produção é melhor do que outro. As respostas a essas
questões implicam o uso dos denominados testes de significâ.ncia e hipóteses, que
são importantes nateoria das decisões. Eles serão considerados no Capítulo 10.
214
Cap.8 Teoria elernentar da amostragem 215
Uma população finita, cuja amostragem é feita com reposiçào pode ser
considerada teoricamente, como infinita, visto que qualquer número de amostras
podà ser extraído sem exaurir a população. Para fins práticos, a amostragem de uma
população finita muito grande pode ser considerada como a de uma população
infinita.
216 Estatística Cap.8
pr=peor---
G+ (1)
6
Ur=UeoÍ_-r:.
\N
(2)
VPPeor=\K (3)
p=p eo=
que se pode obter de (2), fazendo
"6í
Para grandes valores de N (N > 30), a distribuição amostral é, muito
aproximadamente, normal. Note-se que a populaçáo é distribuída binomialmente.
As Equações (3) são também válidas para uma população Íinita, cuja
amostragem seja tomada com reposição.
Para populações finitas, cuja amostragem é obtida sem reposição, as
Equações (3) são substituídas pelas Equações (1) com p = p e o = | pq .
Note-se que as Equações (3) são obtidas mais facilmente, dividindo-se por N
a média e o desvio padrão (Np e í-lrrpq I da distribuição binomial (veja o Capítulo 7).
grar,d.ezà estatística 52. Obtém-se uma distribuição amostral dessa grandeza S2,
cuja média e desvio padrão são representados por lrsz osz . De todas as combina-
"
ções possíveis dessas amostras das duas populações, pode-se obter uma distribuição
das diferenças S1 - 52, denominada distribuiçã.o amostral das diferenças das
estatísticas. A média e o desvio padrão dessa distribuição amostral, representados,
respectivamente, por p5l- s2 ôSr- Sr, são dados por:
"
Fs,-s, = [rs,- Fs, e o5,-su = (4)
desde que as amostras escolhidas não dependam de modo algum uma da outra, isto
é, que elas sejam indeperudentes.
or2 o2'
N1-
. (s)
N2
mediante o emprego das Equações (2). O resultado vale, também, para populações
finitas, se a amostragem foi tomada com reposição. Podem ser obtidos resultados
semelhantes para populações Íinitas, cuja amostragem for feita sem reposição,
mediante o emprego das Equações (1).
Resultados correspondentes podem ser obtidos para as distribuições amos-
trais das diferenças de proporções de duas populações distribuídas binominalmente,
com os parâmetros pb qt e p2, e2, respectivamente. Nesse caso, S1 e 52 corres-
pondem às proporções dos sucessos, Py e P2, e as Equações (4) produzem os
resultados:
P1 qt P2 q2
ofi+ ofi * N2
(6)
^,,
Cap. 8 Teoria elementar da amostragem 219
Tabela 8.1
Erros Padrões para Algumas Distribuições Amostrais
Tabela 8.1
(ContinuaÇã,o)
Erros padrões
O desvio padrão da distribuição amostral de uma grandeza estatístíca é freqüen-
temente denominado seu erro padrão. Na Tabela 8.1 estão relacionados os erros
padrões de distribuições amostrais, para várias grandezas estatísticas, sob as
condições de amostragem aleatória de uma população infinita (ou muito grande) ou
de amostragem com reposição de uma população finita. Também estão relacionadas
observações especiais, que indicam as condições, sob as quais os resultados sào
válidos, e outras informações pertinentes.
As quantidades p, o, p, úreX, s, P, mrtepresentam, respectivamente, as
médias, os desvios padrões, as proporções e os momentos de ordem r, centrados na
média, para a população e para a amostra.
Note-se que, se o tamanho da amostra N for suficientemente grande, as
distribuições amostrais serão normais ou aproximadamente normais. Por esta
razáo, os métodos são conhecidos como métodos das grandes amostras. Quando N <
< 30, as amostras são denominadas pequenas. A teoria das pequenas dmostras, ou
das amostras exatas, como algumas yezes é denominada, será tratada no Capítu-
1o 11.
PROBLEMAS RESOLVIDOS
Solução
(o) p= 2+3+6+B+11
=T=o'o'
(b) o2 (2- 6)2+ (3- 6)2+ (6- 6)2+ (8- 6)2+ (11- 6)2
=
Isso ilustra o fato de ser ox2 = o2/N, para populações finitas cuja amos-
tragem seja tomada com reposição (ou para populações infinitas), visto que o
segundo membro dessa expressão tem o valor 10,8/2 = 5,40, que concorda com o
resultado anterior.
Solução
Como nos itens (a) e (ó) do Problema 1, p = 6 e o = 3,29.
(c) Há 5C2 = 10 amostras de 2 elementos dessa população, extraídas sem
reposição, o que signiÍica que é retirado um número e depois outro diferente
do primeiro, a saber:
(2,3), (2,6), (2,8), (2,11), (3,6), (3,8), (3,1 1), (6,8), (6,11), (8,11).
2,5 + 4,0 + 5,0 + 6,5 + 4,5 + 5,5 + 7,0 + 7,0 + 8,5 + 9,5
Fx= l0 = 6,0,
- 2 Q,5-6,q2+(4,0-
6x'= 6,0)2 u'=4.05eoÍ=2.0
+(5,0-6,0)2+...+ (9,5 -6,t')
1.
Solução
O número de amostras de 25 elementos que podem ser obtidas teoricamente de um
grupo de 3.000 estudantes, com e sem reposição, são: (3.000)25 e g000C25, respecti-
vamente, muito maiores do que 80. Por isso não se obtém uma verdadeira distribui-
ção amostral das médias, mas apenas uma experimentol. Apesar disso, visto que o
número de amostras é grande, haverá uma concordância muito estreita entre as
duas distribuições amostrais. Por isso, a média e o desvio padrão esperados esta-
riam muito próximos dos da distribuição teórica. Por conseguinte:
(a) px= p = 172,72cm e ox = od N = 7,62/{25 = 1,524cm.
$) vx= p = t72,72cm e ox =
# {#+ =
W\ffi
que é apenas ligeiramente menor do que 1,524 crn e pode, portanto, para todos os
fins práticos, ser considerado igual ao da amostragem com reposição.
Em conseqüência, poder-se-á esperar que a distribuição amostral experi-
mental das médias seja aproximadamente normal, com a média 172,72 cm e o desvio
padrão 7,62 cm.
4. Em quantas amostras do Problema 3 pode-se esperar que a média se encontre;
(o) entre 169,67 cm e 173,48 cm; (á) abaixo de 169,65 cm?
Solução
A média X de uma amostra, em unidades reduzidas, é dada, neste caso,
por:
x- pt, x - t72,72 .
ot t.524
Cap. 8 Teoria elementar da amostragem
-2,67
Solução
Outro método
(37o de 400) = 12 ferramentas defeituosas. Baseado na continuidade, 12 ou mais
ferramentas significam 11,5 ou mais.
y = (2Vo de 400) = 8 e o =^[Npq = {(400X0,02X0,9S) = 2,8.
Então, 11,5 em unidades reduzidas = (11,5 - 8)/2,8 = 7,25 e, como ante-
riormente, a probabilidade desejada é de 0,1056.
Se não tivesse sido feita a correção, obter-se-ia 0,5000. Pode também ser
usado o segundo método do item (o).
6. Uma prévia eleitoral mostrou que certo candidato recebeu 46Vo dos votos.
Determinar a probabilidade de uma seção eleitoral, constituída de (o) 200 ou
(ó) 1.000 pessoas, selecionadas ao acaso entre a população votante, apresentar
a maioria de votos a favor desse candidato.
Solução
(a) ptp = p = 0,46 e op =:[pr71g =',[0,+a1g,5a)/200 = 0,0352.
Como ll2 N = 11400 = 0,0025, a maioria estará indicada na amostra quando
a proporção a favor do candidato for (0,50 + 0,0025) = 0,5025 ou maior. (Essa
proporção também pode ser obtida, se se recordar que 101 ou mais indicam a maioria
mas, considerando a variável como contínua, o valor a adotar é 100,5 e, desse modo,
a proporção é:100,51200 = 0,5025).
Então, 0,5025 em unidades reduzidas = (0,5025 - 0,46)/0,0352 = 1,21.
Probabilidade desejada - (área subtendida pela curva normal à direita de
z = L,2l) = 0,5000 - 0,3869 = 0,1131.
(b) pp = p = 0,46 e op = {pqlN = {0,+O(O,S+y1.OOO = 0,0158.
0,5025 em unidades reduzidas = (0,5025 - 0,46)/0,0158 = 2,69.
Solução
( loo;2 , (2ooy2
125
T 125 = 20h.
Solução
sejam P4 e Pp as proporções de "caras" obtidas por A e B. Admitindo-se que todas
as moedas são honestas, a probabilidadep de caras é ll2. Entáo:
= 0,10.
Solução
Se as distâncias forem representadas por D1e D2, então:
(a) pnr+ Dz= $or+ Itor= 27,3 + 15,6 = 42,9 metros;
10. Um certo tipo de lâmpada elétrica tem vida média de 1.500 horas, com o desvio
padrão de 150 horas. Três lâmpadas são instaladas de modo que, quando uma
se queima, outra começa a funcionar. Admitindo-se que as vidas médias são
normalmente distribuídas, qual é a probabilidade da iluminação estar assegu-
rada durante: (o) pelo menos 5.000 horas; (à) no máximo 4.200 horas?
Solução
Admita-se que as vidas médias sejam Lt Lz e L3. Então:
FLr+ Lr+ Lj= lLLr* Vrr* Vrr= 1.500 + 1.500 + 1'500 = 4'500 horas;
PROBLEMAS RESOLVIDOS
11. O desvio padráo dos pesos de uma população muito grande de estudantes é
5 kg. Tiram-se, dessa população, amostras de 200 estudantes cada uma e
calculam-se os desvios padrões dos pesos, em cada amostra. Determinar: h) a
média; (ó) o desvio padrão da distribuição amostral dos desvios padrões.
Solução
Pode-se considerar que a amostragem provém de uma população inÍinita ou de uma
finita com reposição. De acordo com o exposto na Tabeia 8.1'
(o) Média da distribuição amostral dos desvios padrões = Fs = o = 5 kg.
230 Estatística Cap. 8
Solução
A distribuição amostral dos desvios padrões é, aproximadamente, normal com a
média 5 kg e o desvio padrão 0,25 kg.
(a) 5,5 kg em unidades reduzidas = (5,5 - 5)/0,25 = 2,0. /*rea subentendida pela
curva normal, à direita d,e z = 2,0 é:
(0,5 - 0,4772) = 0,0228. Então, a percentagem pedida é 2,3Vo.
(b) 4,4 kgem unidades reduzidas - (4,4 - 5,0)10,25 = - 2,4. Área subentendida
pela curva normal, à esquerda de z = - 2,4 é:
(0,5 - 0,4918) = 0,0082. Então, a percentagem pedida é 0,8Vo.
PROBLEMAS SU PLEMENTARES
15. Certas válvulas fabricadas por uma companhia têm uma vida média de 800
horas e desvio padrão de 60 horas. Determinar a probabilidade de uma amostra-
aleatória de 16 válvulas, retiradas do grupo,ter a vida média: (o) entre 700 e
810 horas; (ó) inferior a 785 horas, (c) superior a820 horas; (d) entre 770 e 830
horas.
Resp.: 0,0316.
25. Três pesos são determinados com os valores 10,24, 17,99 e 31,17 kg, com o
desvio padrão de 0,11, 0,23 e 0,27 kg, respectivamente. Determinar: (o) a
média; (ó) o desvio padrão da soma dos pesos.
Resp.: (a) 59,40 kg; (ó) 0,37 kg.
26. A voltagem média de uma bateria é 15 volts e o desvio padrão 0,2 volts. QuaI
é a probabilidade de 4 dessas baterias, ligadas em série, apresentarem uma
voltagem total de 60,8 ou mais volts?
Resp.: 0,0228.
27. Exemplificar o uso da Tabela de Números Aleatórios na seleção dos elementos
de uma amostra.
Cap. 8 Teoria elementar da amostragem
Problemas diversos
28. Uma população de 7 números tem média 40 e desvio padrão 3. Se forem
retiradas dessa população amostras de cinco elementos e for calculada a
variância de cada amostra, determinar a média da distribuição amostral das
variâncias, quando a amostragem for tomada: (o) com reposição; (ó) sem
reposição?
Estimação de parâmetros
No capítulo anterior, viu-se como a teoria da amostragem pode ser empregada para
a obtenção de informação relativa a amostras retiradas ao acaso de uma populaçào
conhecida. Do ponto de vista prático, entretanto, é freqüentemente mais importante
poder deduzir informações relativas a uma população, mediante a utilização de
amostras dela extraídas. Esses problemas dizem respeito à inferência estatística,
que utiliza os princípios da teoria da amostragem.
234
Cap.9 Teoria estatística da estimacã,o 235
Tabela 9.1
Limite
de con- 99,1370 997o 987o 967o 95.45Vo 95Ío 907o 80Vo 68,2770 5O7o
fiança
ZC 3.00 2,58 ? 11 2,05 2,00 1,96 t.645 |.28 1,00 0,6145
P*zcrH\F (4)
quando a amostragem for sem reposição, de uma população finita de tamanho Nr.
Para calcular estes limites de conÍiança pode-se empregar a estimativa da
amostra P, para o valor de p, o que, de modo geral, será satisfatório quando N = 30.
E apresentado, no Problema 7, um método mais exato para a obtenção desses limites
de confrança.
em que P1e P2 são as duas proporções amostrais, N1 e N2 são os tamanhos das duas
-T
amostras retiradas das populações e pte p2 sào as proporções das duas populações
(estimadas por Py e P).
(e)
Erro provável
Os limites de conÍiança de 50Vo dos parâmetros populacionais, correspondentes a
uma estatística S, são dados por S + 0,6745o9. O valor de 0,6745og é conhecido como
o erro prouó,uel da estimativa.
Estatística Cap.9
PROBLEMAS RESOLVIDOS
Solução
(o) A média da amostraE ea variância amostral corrigidaâ 2 = Ne.
dois desses exemplos. N_ 1 s" sao
(á) Amediana e a estatística da amostruf,rqr+ 8s), em que Qr e 8e são os
quartis mais baixo e mais alto da amo"stra, são dois exemplos. Ambas as
estatísticas são estimatívas não-tendenciosas da média populacional, visto
que a média de suas distribuições amostrais é a média populacional.
(c) O desvio padrão da amostra s, o corrigido â, o desvio médio e a amplitude
semi-interquartílica são quatro exemplos.
2. IJma amostra constante de cinco medidas do diâmetro de uma esfera foi
registrada por um cientista com os valores 6,33, 6,37, 6,36, 6,32 e 6,37 cm.
Determinar as estimativas não-tendenciosas e eficientes da: (o) média verda-
deira; (ó) variância verdadeira.
Solução
(o) Estimativa não-tendenciosa e eÍiciente da média verdadeira (isto é, a
média populacional) =
§ Y 6,33+ 6,37 + 6,36+ 6,32+ 6,37 ?
-A- N 5
= o'o5 cm'
Ar N o Z .X-XI2
=s- =N-t"-= N-1 =
Cap. 9 Teoria estatística da estirnaçd,o 241
_ (6,33-6,35)2+(6,37-6,35)2+(6,36-6,35)2+(6,32-6,85)2+(G,BT-6,85)2
5-1
= 0,00055cm2.
Solução
Solução
(o) Admita-se que z = zc seja tal que a área subtendida pela curva normal, à
sua direita, é igual a l7o. Entáo, por simetria, a área à esquerda de z = -zc
é também igual a l7o de modo que a área sombreada é igual ag\Vo da total.
242 Estatística Cap. 9
Comoa área total subtendida pela curva é igual a l, a que está compre-
endida enttez =O ez = zcéig.ual a0,49; em conseqüência, zc=2,33.
Por isso, os limites de confianç a d'e 90Vo são: X + 1,645 oNN = 0,824 +
+ 1,645 (O,O42l{ zrJ0\ = 0,8241 0,0049 pol.
(c) 9s limites de confiança de 99,737o sào: X t 3ol{N = 0,824 t 3
Solução
(a) Os limites de confiança de 95vo são: X t 1,96ozr[ÀI, sendo o erro da
estimativa de 1,96o,2{ N. Tomando-se o = s = 0,05 segundo, vê-se que o
erro será igual a 0,01 segundo, se (1,96) (0,05y{M = 0,01, isto é, {F =
= (1,96) (0,05)/0,01 = 9,8 ou N = 96,04.
Por conseguinte, pode-se estar 957o confiantes de que o erro da estimativa
será menor do que 0,01 quando N for igual a 97 ou maior.
Outro método
-F
(1,eo (0,0,
< o'ol tt ^/lv
(t.s6)(0.0,
) o,
r
ou {t>1t'eo-lQ'o-l=e,s.
0.01
Cap. 9 Teoria estatística da estimaçdo 245
Então,N>96,04ouN>97.
(ó) 9s limites de confiança de ggvo sáo; X + 2,58o/\[i. Entào, e,íg)
(0,05yiN = 0,01 ou N = 166,4. Em conseqüência, poder-se-á estar ggVo
conÍiantes de que o erro da estimativa será menor do que 0,01, somente
quando N for igual a 167 ou maior.
Solução
(o) Os limites de confiança de 95Vo, para a populaçãop, são:
P(l - P) zc-
P+ zr2+ 2, ---M- * 4N,
,*;
(ó) Empregar a fórmula deduzida no item @) para obter os limites de confiança
de 99,73Va, do Problema 6.
(c) Mostrar que, para grande valor de N, a fórmula do item (o) reduz-se a p =
- P * zc ^[P \l - P W , utilizada no Problema 6.
Solução
(o) A proporção da amostra P, em unidades reduzidas =
P- o P- a
op - p1/N
'',1 pç1-
+ zr'*
ZNP -t r2 ^l (2NP + zr2)2- 4(N+
zr")" - 4(N + ,r2
zr' (NP")
p= -h!
çNPz
2lN + zc2)
2NP + zr2 +
21N - zr2\
a2
e+fit2,
p= )
t* ?
(ó) Para os limites de confiança de 99,737o, zc = 3. Então, entrando-se corrr P =
= 0,55 € N = 100, na fórmula deduzida do item (o), encontra-se p = 0,40 e
0,69, que concorda com as soluções do Problema 6(c).
(c) Se ovalor de N for grande, então os valores de z"2l(2N), r"21(4N2) ,"21N
serão todos desprezivelmente pequenos e poderão ser considerados" nulos
e, dessa forma, obter-se-á o resultado desejado.
Solução
Os limites de confiança para diferença entre as médias das marcas A e B são dadas
por:
Solução
Os limites de confiança das diferenças entre as proporções dos dois grupos são dados por:
10. A força eletromotriz média das baterias produzidas por uma companhia é 45,1
volts e o desvio padrão 0,04 volt. Se 4 dessas baterias estão ligadas em série,
determinar os limites de confiança de: (o) 957o; (h) 997o; (c) 99,737o; (d') 50Vo,
para a força eletromotriz total.
Solução
Se -81, Ez, Eg e .84 representam as forças eletromotrizes das 4 baterias, tem-se:
VEr+ Er+ Es+ En = VEr.+ VEz+ lrEs + VEt " o-Er + Er+ Er* Et =
Cap. 9 Teoria estatística da estimaçõ.o 247
l_-..---.-.-
= !"r,' + oE: * ou? + oE?
Então, como
VE, + Ez + E, ', Et= 4(45,1) = 180,4 ê 06r + Er+ Er+ E+={ +(O,O+f = O,Og.
(o) Os limites de confiança de 957o são: 180,4 + 1,96(0,08) = 180,4 + 0,16 volts.
(ó) Os limites de conÍiança de 99Vo são: 180,4 + 2,58(0,08) = 180,4 + 0,2L volts.
(c) Os limites de confiança de 99,73Vo são: 180,4 t 3(0,08) = 180,4 + 0,24 volts.
(d) Os limites de confiança de 50Vo são: 180,4 + 0,6745(0,08) = 139,4 + 0,054
volts.
O valor 0,054 volt é denominado erro prouduel.
Solução
Os limites de confiança para o desvio padrão populacional, o, são dados por s +
tz" o/l 21,{, em que z" índica o nível de confiança. Adota-se o desvio padrão da
amostra como estimativa de o.
(a) Os limites de confiançad.e95Vo são: 100 + 1,96(100)l{ 4OO = 100 + 9,8.
Desse modo, pode-se estar 95Vo confiante de que o desvio padrão da
população está compreendido entre 90,2 e 109,8 horas.
(ó) Os limites de confiançad.e99Vo são: 100 + 2,58(100)l{ 4OO = 100 + 12,g.
Por conseguinte, pode-se estar 99Vo corrfrante de que o desvio padráo da
população está compreendido entre 87,1 e 112,9 horas.
248 Estatística Cap. 9
12. Que dimensáo deverá ser tomada, para a amostra das lâmpadas elétricas do
problema anterior, para que se esteja 99,737o confiante de que o verdadeiro
desvio padráo populacional não diferirá do da amostra de mais de: (a) 57a; (b)
l07o?
Solução
Erro provável
13. As voltagens de 50 baterias do mesmo tipo têm uma média de 18,2 volts e um
desvio médio padrão de 0,5 volt. Determinar: (o) o erro provável da média; (á)
Os limites de confiança de 507o.
Solução
Resp.: (o) pelo menos 96; (á) pelo menos 68; (c) pelo menos 167; (d) pelo-menos
225.
18. Uma companhia tem 500 cabos. Um ensaio de 40 deles, selecionados ao acaso,
apresentou a tensão de ruptura média de 2.400 kg e o desvio padrão de 150 kg;
(o) quais são os limites de confianç a de 95Vo e 997a, para a estimação da tensão
de ruptura média dos 460 cabos remanescentes? (á) com que grau de confiança
se poderia dizer que a tensão de ruptura média dos 460 cabos remanescentes
é de 2.400 t 35 kg?
Decisões estatísticas
Na prática, somos chamados com muita freqüência a tomar decisões acerca de
populações, baseadas nas informações das amostras. Essas decisões são denomina-
das decisões estatísticas. Por exemplo, pode-se desejar decidir, com base em dados
amostrais, se um novo soro é realmente eftcaz na cura de uma doença, se um
processo educacional é melhor do que outro, se uma certa moeda é viciada etc.
252
Cap. 10 Teoria da decisã.o estatística, testes de hipóteses e significância
Erros do Tipo I e ll
Se uma hipótese for rejeitada quando deveria ser aceita, diz-se que foi cometido um
erro do Tipo L Se, por outro lado, for aceita uma hipótese que deveria ser rejeitada,
diz-se que foi cometido umerro do Tipo II. Em ambos os casos ocorreu uma decisão
errada ou um erro de julgamento.
Para que quaisquer testes de hipóteses ou regras de decisão sejam bons,
eles devem ser planejados de modo que os erros de decisão sejam reduzidos ao
mínimo. Isso não é tarefa simples, porquanto para um dado tamanho de alnostra,
a tentativa de diminuir um certo tipo de erro é acompanhada, em geral, pelo
acréscimo de outro tipo. Na prátíca, um tipo de erro pode ser mais importante do
que outro, de modo que se deve procurar uma acomodação que favoreça a limitação
do erro mais sério. O único caminho para a redução de ambos os tipos de erros
consiste em aumentar o tamanho da amostra, o que pode ou não ser possível.
254 Estatística Cap. 10
Nível de signiÍicância
Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual estaremos
dispostos a correr o risco de um erro do Tipo I é denominadaníuel d,e significância
do teste. Essa probabilidade, representada freqüentemente por ü,, é geralmente
especificada antes da extração de quaisquer amostras, de modo que os resultados
obtidos não influenciem a escolha.
Na prática, é usual a adição de um nível de significância 0,05, ou 0,01,
embora possam ser usados outros valores. Se, por exemplo, é escolhido um nível de
significância 0,05 ou57o, no planejamento de um teste de hipótese, há então cerca
de 5 chances em 100, da hipótese ser rejeitada, quando deveria ser aceita, isto é, há
uma confiança de cerca de 95Vo de que se tome uma decisáo acertada. Nesses casos,
diz-se que a hipótese érejeitadano níuel de significâ,ncia 0,05, o que significa que
a probabilidade de erro seria de 0,05.
REGIAO i i REGTAO
-1 ,96 z = 1,96
Figura 10.1
que esse escore z difere de modo significatiuo do que seria esperado daquela
hipótese, e se estaria propenso a rejeitá-la.
A área total sombreada, de 0,05, é o nível de significância do teste. Ela
representa a probabilidade de incorrer-se em erro na rejeição da hipótese, isto é, a
probabilidade de ser cometido um erro do Tipo I. Por essa razão diz-se que a hipótese
é rejeitada no níuel de significâ.ncia 0,05, ou que o escore z da estatística amostral
dada é significatiuo naquele nível.
Tabela 10.1
Testes especiais
Para grandes amostras, as distribuições amostrais de várias estatísticas são nor-
mais (ou pelo menos, aproximadamente normais), com média pg, e desvio padrão
og. Nesses casos, podem ser utilizados os resultados da Tabela 10.1 para formular
regras de decisão ou testes de hipóteses e signifrcância. Os casos especiais seguintes,
tomados da Tabela 8.1, do Capítulo 8, são apenas algumas estatísticas de interesse
prático. Em cada caso, os resultados prevalecem para populações infinitas ou para
amostragem com reposição. Para amostragem sem reposição, extraída de popula-
ções finitas, os resultados devem ser modificados.
X-tt'
p,z! N
Cap. 10 Teoria da decisdo estatística, testes de hipóteses e significô.ncia 257
-=!:P '
^"1 pq/N
--A
,, -
Np
t
",1--N pq
Cartas de controle
Na prática, é muitas vezes importante saber quando um processo se modifica
.orr.ld""urelmente, de maneira que devem ser tomadas algumas medidas para
remediar a situação. Esses problemas surgem, por exemplo, no controle de qualida-
Estatística Cap. 10
, =h:xz _
o
=*r - *_, (2)
oxr-xz oxr-kz
pode-se testar a hipótese nula contra hipóteses alternativas (ou a significância de
uma diferença observada), em um nível apropriado de significância.
2. DiÍerenças de proporções
Sejam P1e P2 as proporções obtidas em duas grandes amostras, de tamanhos N1 e
N2, retiradas das populações respectivas, que apresentam as proporções pr e p2.
Cap. 10 Teoria da decisã.o estatística, testes de hipóteses e significâ.ncia
Considere-se a hipótese nula de que não há. diferença entre os parâmetros das
populações, isto é, pt = p2, e dessa forma as amostras sáo realmente retiradas da
mesma população.
Fazendo-se pL = p2 - p, írà Equação (6) do Capítulo 8, vê-se que a distribui-
ção amostral da diferenças das proporções é aproximadamente normal, com a média
e o desvio padrão dados por:
NrPt+ NtPz
emquep=-ffiéadotadocomoumaestimativadaproporçãopopu1acional
eq=L-p.
Usando-se a variável reduzida
Pt- P2- O Pt- Pz
z= §Pt- Pz
=_6Pr- Pz (4)
PROBLEMAS RESOLVIDOS
Solução
De acordo com a distribuição binomial, a probabilidade desejada é:
roÉ+o
[j ]*[j]uo * roú+r
Ii]- [, ]'n * + roúoo Ij]"[jJ-.
como Np = 100í1)" Nn = .r00[] ambos maiores do que 5, pode-se
l.u"
empregar, para o cálculo J"'*lu ,ornr, o ajustãmento normal à distribuição binomial.
z=-2,10 2=2,10
(39,5 caras) (60,5 caras)
Figura 10.2
Solução
(o) De acordo com o Problema 1, a probabilidade de não se obter entre 40 e 60
caras, inclusive, quando a moeda é honesta, é igual a 1 - 0,9642 = 0,0358.
Então, a probabilidade da hipótese ser rejeitada quando e1a é correta =
= 0'0358.
(ó) A regra de decisão é ilustrada pela Figura 10.2, que mostra a distribuição
de probabilidade das caras em 100 lances de uma moeda honesta.
Solução
(o) Primeiro método: Se o nível de significância é 0,05, cada área sombreada
da Figura 10.3 é de 0,025, por simetria. Então, a área entre 0 e 21 Q,§QQQ
0,0250 = 0,4750 e z1- 1,96.
= -
-
Então, uma regra de decisão possível será:
(1) Aceitar a hipótese de que a moeda é honesta quando e estiver compre-
endido entre - 1,96 e 1,96.
(2) Rejeitá-la no caso contrário.
Figura t0.B
Solução
Comete-se um erro do Tipo II quando se aceita uma hipótese que deveria ser
rejeitada. Para evitá-lo, em vez de aceitar a hipótese, simplesmente não se á rejeita,
o que pode significar que se está evitando qualquer decisão a respeito. :Em conse-
qüência, podemos, por exemplo, redigir a regra de decisão, para o Problema 3(ó), da
seguinte forma:
(1) Nao rejeitar a hipótese, quando o número de caras estiver compre-
endido enfue 22 e 42, inclusive.
(2) No caso contrário, rejeitá-la.
Estatística Cap. 10
Solução
Sep é a probabilidade do sujeito declarar corretamente a cor de uma carta, deve-se
decidir, então, entre as duas hipóteses seguintes:
HO: P = 0,5,
Figura 10.4
6. O fabricante de uma droga medicinal reivindicou que ela era gl%o eficaz em
curar uma alergia, em um período de 8 horas. Em uma amostra de 200 pessoas
que tinham alergia, a droga curou 160 pessoas. Determinar se a pretensão do
fabricante é legítima.
266 Estatística Cap. 10
Solução
Sejap a probabilidade de obter-se a cura da alergia, mediante o uso da droga. Então,
deve-se decidir entre duas hipóteses:
Ho:P = 0,9, e a Pretensão é correta.
Ht:p<0,9, eelaéfalsa.
Escolhe-se um teste unilateral, porque não há interesse em determinar se
a proporção de pessoas curadas pela droga é muito baixa.
Figura 10.5
Se Iís é verdadeira,
Solução
Deve-se decidir entre duas hipóteses:
Í10:p=1.800k9e,
nesse caso, não há realmente modificação da tensão de ruptura.
x- P 1.850- 1.800
-:= o{ru - loo/{ so
- r ii
Solução
A hipótese I/g de que a moeda é honesta, isto é, p = 0,5, é aceita quando o número de
caras em 100 lances está compreendido entre 39,5 e 60,5. A probabilidade de rejeição
de f16, quando deveria ser aceita (isto é, a probabilidade de ser cometido um erro do
Tipo I) é representada pela áreatotal u da região sombreada subentendida pela curva
normal à esquerda da Figura 10.6. Como foi calculada no Problerna2(a), essa área o,,
que representa o níve} de significância do teste de I/s, é igual a 0,0358.
p 0,5 P=0'7
60,5
Figura 10.6
Solução
(o) sep = 0,6, a distribuição das caras tem a média e o desúo padrão dados por:
Solução
ATabela 10.2 apresenta os valores de B correspondentes aos dados dep, obtidos nos
Problemas 8 e 9.
Tabela 10.2
1,0 1,0
0,9 0,9
0,8 0,8
0,7 0,7
0,6 0,6
0,5 0,5
0,4 0,4
0,3 0,3
0,2 0,2
0,1 0,1
0 yP 0 p
o'o o'8 ,0
{r1o'u
Figura 10.7
Em geral, quanto mais agudo for o pique da curva co, mais adequada será
a regra de decisão para a rejeição de hipóteses que não são válidas
(ó) o gráfico de (1 - 0) em função de p, representado na Figura 10.7(b), é
denominado curua de potência da regra de decisão ou do fuúe da hipótese.
Essa curva é obtida simplesmente, med.iante a inversão da co, dã modo
que, na realidade, os dois gráficos são equivalentes.
11. Para testar a hipótese de uma moeda ser honesta (isto é, de p ser igual a 0,5),
por meio de certo número de lances, deseja-se impor as seguinteslestrições:
(Á) a probabilidade de rejeição da hipótese, quando for verdadeira, deve
ser,
Cap. 10 Teoria d.a decisdo estatística, testes de hipóteses e significô'ncia 271
Solução
Neste caso, estabelecem-se limites para os riscos de serem cometidos erros do Tipo
I e do Tipo II. Por exemplo, a restrição imposta em (A) exige que a probabilidade de
um erro do Tipo I seja igual a cr = 0,05, no máximo, enquanto a restrição (B) exige
que a de um ã,ro do Tipo II seja, no máximo, Ê = 0'05' A situação está ilustrada
graficamente na Figura 10.8.
Seja N o tamanho da amostra desejada X o número de caras em N lances,
e
acima do qual será rejeitada a hipótesêp = 0,5' De acordo com a Figura 10'8:
X_ No X-0.5N X-0.5/V !t
tr Npq ! N (0.5) (0.5) 0.5 ! N
Figura 10.8
Cartas de controle
12. Construiu-se uma máquina para produzir mancais de esfera que têm o diâme-
tro médio de 0,574 polegada e o desvio padrão de 0,00g polegada. para
determinar se a máquina está funcionando adequadamente, é retirada uma
amostra de 6 mancais cada 2 horas, por exemplo, e é calculado o diâmetro
médio da amostra.
(a) Planejar uma regra de decisão, por meio da qual se poderá ter suficiente
cetteza de que a qualidade dos produtos está de acordo com as normas
exigidas.
(á) Mostrar como pode ser representada graficamente a regra de decisão do
item (o).
Solução
(a) Com um grau de confianç a de gg,737o, pode-se dizer que a média amostral
X deve estar compreendida no intervalo entre (p X - B o X) e (U.x + B o
76),
ou entre (p- 3 of'[ N ) e (p+ 3 oZr/N ;. Como $ = O,574,o = 0,00g eN=
= 6, segue-se que para aquele grau de confiança, a méd.ia amostral deve
estar compreendida entre (0,524 - 0,024/f-il e (0,574 + 0,024l{ã), ou
entre 0,564 e 0,584 polegada. Portanto, aregra de decisão será a seguinte:
(1) se a média amostral cair no intervalo entre 0,564 e 0,5g4 polegada,
admitir-se-á que a máquina está em funcionamento normal.
(2) No caso contrário, concluir-se-á que seu funcionamento é irregular e
será preciso pesquisar a causa.
Cap. 10 Teoria da decisã,o estatística, testes de hipóteses e significdncia 273
(á) Pode ser mantido um registro das médias amostrais por meio de uma carta
como a apresentada na Figura 10.9, denominada carta de controle de
qualidade. Cada vez que for calculada uma média amostral, ela será
representada por um ponto particular. Enquanto eles caírem entre o limite
inferior, 0,564 polegada, e o superior, 0,584 polegada, o processo está sob
controle. Quando um ponto for para fora desses limites de controle (como
ocorreu com a terceira amostra tomada na quinta-feira), há a possibilidade
de haver alguma coisa errada, o que justifica uma investigação.
Ê o,sa+
l) o
(ú o a
o a o
a a
o
E
(! 0.574 o o
.§ a a
.lf o a O1
.o a o
0,564
a
Figura 10.9
Solução
Suponha-se que as duas classes provêm de populações, cujas médias respectivas são
p1 ep2.Então, deve-se decidir entre as hipóteses:
Estatística Cap. 10
Então,
Visto que os resultados são significativos no nível 0,05, mas não o são no
0,01, conclui-se que os resultados são prouauelmente significatiuos, de acordo com
a terminologia adotada na parte final do Problema 5.
14. Dois grupor, Á, B, são formados, cada um de 100 pessoas que têm a mesma
enfermidade. E"ministrado um soro ao grupo Á, mas não ao B (denominado
grupo de controle); a todos os outros respeitos, os dois grupos são tratados de
modo idêntico. Determinou-se que 75 e 65 pessoas dos grupos A e B, respecti-
vamente, curaram-se da enfermidade. Testar a hipótese do soro auxiliar a cura
da enfermidade, adotando-se os níveis de significância: (o) 0,01; (ó) 0,05;
(c) 0,10.
Solução
Sejam pt e p2, respectivamente, as proporções populacionais curad.as (1) mediante
o uso do soro (2) sem o uso do soro. Deve-se decidir entre as duas hipóteses.
Cap. 10 Teoria da decisã.o estatística, testes d,e hipóteses e significdncia 275
Ho : Pt= P2,
e as diferenças observadas são devidas ao acaso, isto é, o soro náo é eficaz.
15. Resolver o problema anterior quando cada grupo for composto de 300 pessoas
e se forem curadas 225 do grupoA e 105 do B.
276 Estatística Cap. 10
Solução
Note-se que, neste caso, as proporções de pessoas curadas nos dois grupos são
225/300 = 0,750 e 195/300 = 0,650, respectivamente, iguais às do problema prece-
dente. Para a hipótese.F16 :
vp, pr= o
" opr- ,r= Tpq(vt'l
,* vNr) =
Soluçào
Seja p a probabilidade de uma questão ser respondida corretamente. A probabilida-
de da obtenção de X problemas entre 10 corretos é:
Solução
Paraahipótese p =0,7:
Pr{ menosdeT certosi= I - Pr{ 7 oumaiscertos}=
- I - [ roc, (0,7)7(0,3)3 + 16Ca 10,1810,312 +
+ roCs (0,De(0,3) + roCro (0,3)101 = 0,3504.
18. Lança-se uma moeda 6 vezes e aparece cara em todas as 6. Pode-se concluir,
nos níveis de significância: (o) 0,05; (ó) 0,01, que a moeda é viciada? Considerar
ambos os testes, uni e bilateral.
Solução
Sejap a probabilidade de surgir cara em um lance único da moeda. Para a hipótese
Ho: p = 0,5 (isto é, a moeda é honesta):
p(E =Pr{x i 1 f/
= . a[;][
6 lancesl' rf x-=
caras em
]J acx/64
Teste unilateral
Neste caso, deseja-se decidir entre as hipóteses (Hs: p = 0,5) e (H[p > 0,5).
Como Pr {6 caras} = 1164 = 0,01562 e Pr {5 ou 6 caras} =6164 +1164=0,10g4,
pode-se rejeitar Hg,Íro nível 0,05, mas não no 0,01 (isto é, o resultado observado é
significativo no nível 0,05 mas não no 0,01).
p (x)
6t64
Figura 10.10
Teste bilateral
Neste caso, deseja-se decidir entre as hipóteses: (Ho: p = 0,5) e (Hç p * 0,5).
Como Pr {0 ou 6 caras} = L/64 + 7164 = 0,03125, pode-se rejeitarl{6 no nível
0,05 mas não no 0,01.
PROBLEMAS SU PLEMENTARES
Resp.: 0,2606.
ZO. (o) Que regra de decisão adotar-se-ia para o Problema 19, quando se desejasse
que a probabilidade de rejeitar a hipótese, quando ela é realmente correta,
fãsse, no máximo, de 0,01, isto é, se se desejasse o nível de significância 0,01?
(á) Em que nível de conÍiança seria aceita a hipótese? (c) QuaI seria a regra de
decisão se fosse adotado o nível de significância 0,05?
Resp.: (o) Aceitar a hipótese quando forem retiradas 22 a 42 bolas vermelhas;
no caso contrário, rejeitá-la. (á) 0,99. (c) Aceitar a hipótese quando
forem retiradas 24 a 40 bolas vermelhas; no caso contrário, rejeitá-la.
2L. Suponha-se que, no Problema 19, deseja-se testar a hipótese de haver maior
proporçao de bolas vermelhas do que de azuis. (a) Que hipótese nula seria
considerada e qual a alternativa? (b) Usar-se-ia um teste uni ou bilateral? Por
quê? (c) Que regra de decisão se adotaria se o nível de signiÍicância fosse 0,05?
(d) QuaI seria a regra de decisão se o nível de significância fosse 0,01?
Resp.: (a) Ho: p = 0,5; Hl p > 0,5. (ó) Teste unilateral. (c) Rejeitar Iís: quando
fossem retiradas mais de 39 bolas vermelhas e, no caso contrário,
aceítá-La (ou não tomar nenhuma decisão). (d) Rejeitar F10 quando
fossem retiradas mais de 41 bolas vermelhas e, no caso contrário,
aceitá-ia (ou não tomar nenhuma decisão)'
22. Um fabricante garante que, pelo menos 957o do equipamento que forneceu a
uma fábrica está de acordo com as especificações. O exame de uma amostra de
200 peças desse equipamento revelou que 18 estavam defeituosas. Testar a
afirmativa, nos níveis de significância: (o) 0,01; (ó) 0,05'
Resp.: Pode-se rejeitar a aÍirmativa em ambos os níveis de signiÍicância,
mediante o emprego de um teste unilateral'
2g. Verificou-se, por meio de experiências, que a tensão média de ruptura do fro
de uma certa marca é de9,72kg, com o desvio padrão de 1,40 kg. Recentemente,
uma amostra de 36 peças do Íio apresentou a tensão média de ruptura de
8,gB kg. Pode-se concluir, nos níveis de signiÍicância: (o) 0,05; (á) 0,01 que o
fio se tornou de qualidade inferior?
Resp.: Sim, em ambos os níYeis, mediante o emprego de um teste unilateral
em cada caso.
280 Estatística Cap. 10
Pequenas amostras
Em capítulos anteriores lançou-se mão, freqüentemente, do fato de, para amostras
de tamanho N > 30, denominadas grandes anlostras, as distribuições amostrais de
muitas estatísticas serem aproximadamente normais, tornando-se a aproximação
melhor com o crescimento de N. Para as amostras de tamanho N < 30, denominadas
pequenas amostras, essa aproximaçáo não é boa e torna-se pior com o decréscimo
de N, de modo que devem ser introduzidas as modificações convenientes.
Distribuição de "Student" Í
Define-se a estatística
X-V !N-
Í= j t- 1:
X-trt (1)
s t/ií'
283
284 Estatística Cap. 11
,- Yo Yo
-
lr* t" I
/ ) \N/2 / ),rv+lrz2
l'-rl t,
['- '-' ,J ['-
em que Yg é uma constante que depende de N, de modo que a área subtendida pela
curva é igual a 1, e a constante v = (N - 1) é denominada número de graus de
liberdade (v é a letra grega ni). Adefinição de graus de liberdade, será apresentada
mais adiante.
-3
Figura 11.1
lntervalos de conÍiança
Como nas distribuições normais do Capítulo 9, podem ser definidos os intervalos de
confi.ança d.e95Vo,99Vo ou outros, mediante o emprego da tabela da distribuição ú
do Apêndice Dessa maneira, a média da população, p, pode ser estimada dentro
III.
dos limites de confiança especificados.
Í- u
com a confiança d.e 95Vo (isto é, probabilidade de 0,95). Note-se que ú6,975 representa
o valor do percentilgT,S, enquanto to,o25= -.to,glsrepresenta o percentil 2,5'
Em geral, podem-se representar os limites de confiança para as médias
populacionais por:
t r-' -:,s
X (5)
r/,tt_ t
em que os valores * úc são denominados críticos ot coeficientes de confiança, e
dependem do níve1 de confiança desejado e do tamanho da amostra. Eles podem ser
tirados do Apêndice III.
Uma comparação da expressão (5) com a dos limites de confiança
çX z, o/t[N ) mostra que, para pequenas amostras, z" (deduzido da distribuição
+
normal) é substituído po, i" (reiativo-à ái.t.ibrriçao Í) e o valor de o por {N(N- | s =
= â ,qr" é a estimativa amostral de o. Quando N aumenta, ambos os métodos tendem
para a coincidência.
1. Médias
Para testar a hipótese É16 de uma população normal ter a média p, adota-se o escore
t ou a estatística ú.
X*u
t-
,t
iN- =x-1
It ./N , (6)
§
*
Isso é anáIogo ao emprego do escorez = X P'
para os grandes valores de
o/íN
N, exceto quanto ao fato de ser usadoâ = r/.nrr4Lr- r; s em vez de o. Adiferença
consiste em que, ao passo que z tem distribuição normal, ú apresenta uma distribui-
ção de "Student". Quando N aumenta, ambas tendem a coincidir.
2. Diferença de médias
Suponha-se que duas amostras aleatórias de tamanhos N1 e N2 são extraídas de
populações normais cujos desvios padrões são iguais (or = oz). Suponha-se, ainda,
que essas duas amostras têm médias e desvios padrões dados por X1, X2 ê s1, s2,
respectivamente. Para testar a hipótese Ilg de que as amostras provêem da mesma
população (isto é, Vl= V2, bem como o1 = o,2) adota-se o escore ú, dado por:
xr- v,
t - ---'emqueo = (7)
o11,zNl + l/N2
A distribuição de qui-quadrado
Define-se a estatística:
0,5
0,4
0,3
0,2
0,1
15
Figura 11.2
Como foi feito para as distribuições normal e ú, podem ser definidos os limites e
intervalos de confianç a d.e 957o, 99Va e outros pura 72 , mediante o emprego da tabela
da distribuição de 12 do Apêrrdice IV. Dessa maneira, pode-se estimar, dentro dos
Estatística Cap. 11
. Ns2
xolorr'?'xolnrr' (lo)
do qual se deduz que o é estimado para que fique situado dentro do intervalo:
Então, se
$ e zu sáo os percentis de ordemp das distribuições de qui-qua-
drado e normal, respectivamente, tem-se:
Graus de liberdade
Para calcular-se uma estatística como as definidas em (1) ou (8), é necessário usar
as observações obtidas de uma amostra, bem como certos parâmetros populacionais.
Se esses parâmetros são desconhecidos, eles devem ser estimados por meio dos da
amostra.
Cap. 11 Teoria das pequenas amostras
PROBLEMAS RESOLVIDOS
Distribuição de "Student" Í
1. O gráfico da distribuição de "Student" l, com 9 graus de liberdade, está
representado na Figura 11.3. Determinar os valores de ,1 para os quais: (o) a
área sombreada à direita = 0,05; (b) a área sombreada total = 0,05; (c) a área
não-sombreada total (ou em branco) = 0,99; (d) a área sombreada à esquerda =
= 0,01; (e) a área à esquerda de ú1 = Q,$6.
Figura 11.3
Solução
(o) Se a étrea sombreada à direita é 0,05, então a área à esquerda dehé
(1 - 0,05) = 0,95 e út representa o percentil 95q, ú6,95.
Estatística Cap. 11
Solução
Usando a tabela do Apêndice III, encontram-se, na coluna encabeçada por r0,9b, os
valores: (a) 1,75 correspondente a v = 16; (b) L,70 correspondente a v = 27; (c) 7,645
correspondente a v = 200. (O último valor é o que seria obtido mediante o emprego
da curva normal. Na tabela do Apêndice III corresponde à casa da última linha,
assinalada como @, isto é, infinito).
Solução
Para os coeficientes de confiança de 957o ("bilateral"), a área total sombreada da
Figura 11.3 deve ser 0,05. Portanto, a área sombreada da extremidade da direita é
0,025 e o valor crítico correspondente de t étg,g7g. Então, os coeficientes de confiança
desejados são: + to,gts.Para os valores dados de v, eles são: (o) + 2,26; (b) ! 2,09;
(c) t 2,04; (d) ! 2,00.
Cap. 11 Teoria das pequenas amostras 291
Solução
Deve-se decidir entre as hipóteses:
X- t rI 7.750- 8.000
_16_l=_3,96.
,r-
1___________!\/ -
, 145
Solução
Se p1 e p2 representam os QI médios populacionais dos estudantes das duas áreas,
deve-se decidir entre as hipóteses:
Então:
Solução
Sejam p1 e p2 as produções médias populacionais de trigo nos terrenos tratados e
não, respectivamente; deve-se decidir entre as hipóteses:
IlO: pr = Vz, a a diferença é devida ao acaso.
f =
xt- xz ÊITIQUB 6=
N1sl + N2 s22
o! tZl,r, + l/N2 N1+ N2- 2
Então:
--
t2(0,40)2 + DQ,36)2
O=
12+ 12- 2
= 0,39J e t=
A distribuição de qui-quadrado
7. O gráfico da distribuição de qui-quadrado com 5 graus de liberdade está repre-
sentado na Figura 11.4. Determinar os valores críticos d" X2, para os quais:
Estatística Cap. 11
Solução
(o) Se aârea sombreada à direita é 0,05, então a situada à esquerda dey] é
(1 - 0,05) = 0,95, e y] rcpresenta o 95e percentil,X&,rru
x? xl
Figura 11.4
Solução
Solução
(o) 'Os limites de confianç a de 95Vo são dados por e , ffi /Xo,oru.
" ^/-1V210,e25
Para v = 16 - 1 = 15 graus de liberdad", x&,nru= 27,5 o* x0,975-= 5,24 e
Então, os limites de confianç a de 957o sáo 2,40 ",[ tA lS,Z+ e 2,40 ",[ 76 /2,50,
isto é, 1,83 e 3,84 cm. Em conseqüência, pode-se ter 957o de conÍiança de que o desvio
padrão populacional está entre 1,83 e 3,84 cm.
(ó) Os limites de confiança de 997o são dados por:
,fr/xo.nrr. ,fiMxo,oor.
296 Estatística Cap. 11
Solução
^.7 -
I
,-,^[r-
l"p- 2\'p- '" f).r.
11. O desvio padrão das durações para uma amostra de 200 lâmpadas elétricas, é
100 horas. Determinar os limites'de confiança de: (a) 95Vo; (b) 99Vo, para o
desvio padrão de todas as lâmpadas elétricas desse tipo.
Cap. 11 Teoria d,as pequenas amostras
Solução
(o) os hmites de confianç a de gsvo são dados por' , rffi,,
xo,sts , ffi/xo,oru.
"
Para v = 200 - 1 - 199 graus de confiança, determinam-se, como no
Problema 10:
^1
t'o.sls
^,L - lzo,sts+.D(lrr) - 1 r' = + e,s6+ t9,s»2 = 23s;
2
NZ
,1 lzo,ozs+ l' =; (-1,96+ ts,g»2 - t6t,
^0,025 2
,1 N/Xo,rr,
" r1 N/Xo.oor.
Para v = 200 - 1 = 199 graus de liberdade:
Xi.nrr= ) Íro.ror+
^D(lrq - I t' =:t2.58+ ts-e2)2 = 253:
Solução
Os limites de confiança d,e 957o para o desvio padrão populacional, como foram
determinados no Problema 11(a) , foram obtidos escolhendo-se os valores críticos de
X2, de modo que a áreaem cada extremidade era de 2,5Vo.E possível determinarem-
se outros limites de confianç a d,e 957o mediante a escolha de valores críticos de 12
para os quais a soma das áreas das extremidades seja 57o, ou 0,05, mas as áreas de
cada extremidade não serão iguais.
Na Tabela 11.1 foram obtidos esses diversos valores críticos (usando os
métodos do Problema 10) e estão indicados os intervalos de confiança de g57o
correspondentes.
Tabela 11.1
x o.oq = 12'85
' x r,rr = 15 '73 89.9 a I10.0 20,t
13. O desvio padrão dos pesos de certos recipientes de 40 kg, cheios por uma
máquina, era 0,25 kg. Uma amostra aleatória de 20 pacotes apresentou o
desvio padrão de 0,32 kg. O aumento aparente de variação é significativo, nos
níveis de significância: (a) 0,05; (ó) 0,01?
Cap. 11 Teoria das pequenas amostras
Solução
Deve-se decidir entre as hipóteses:
Distribuição f de "Student"
14. os coeficientes de confiança de 9g7a (bilateral), para uma distribuição normal,
são dados por + 2,58. Quais serão os coefrcientes correspondentes para a
distribuição ú, quando i
(o) v = 4; (b) v = t2; (c)v = 2b;(d) v = B0; (e) v = 10?
17. Registraram-se os valores 0,28; 0,30; 0,27; 0,33 e 0,31 segundo, obtidos em
cinco medições do tempo de reação de um indivíduo a certo estímulo. Deter-
minar os limites de confiança de: (o) 957o; (b) 997o, para o tempo real de reação.
Resp.: (o) 0,298 + 0,030; (b) 0,298 + 0,049 segundo.
18. A vida média das lâmpadas elétricas produzidas por uma companhia era,
anteriormente, 1.120 horas, com o desvio padrão de 125 horas. IJma amostra
de 8 lâmpadas, extraída recentemente de uma série há pouco fabricada,
apresentou a vida média de 1.070 horas. Testar a hipótese da vida média das
Iâmpadas não ter se alterado, adotados os níveis de significância: (o) 0,05;
(b) 0,01.
Resp.: Um teste bilateral mostra que não há evidência, tanto no nível 0,05
como no 0,01, que indique que a vida média foi alterada.
19. As especificações para a produção de certa liga exige 23,2Va de cobre. Uma
amostra, constante de 10 análises do produto, apresentou o teor médio de cobre
de 23,\Vo e o desvio padrão de 0,24Va. Pode-se concluir, nos níveis de signiÍi-
cância: (o) 0,01; (ó) 0,05, que o produto satisfaz às especiÍicações exigidas?
Resp.: Um teste bilateral, em ambos os níveis, indica que o produto não
satisfaz às especiÍicações exigidas.
20. Um perito eficiente declara que, mediante a introdução de um novo tipo de
máquina no processo de produção, pode ser substancialmente diminuído o
tempo necessário para a produção. Por causa do custo decorrente da manuten-
ção das máquinas, a administração percebe que, a não ser que o tempo de
produção possa ser reduzido de, pelo menos 9Vo, náo se poderá dispor de
recursos para introduzir o processo. Seis experiências realizadas indicam que
o tempo de produção é reduzido de 8,47o, com o desvio padrão 0,327o. Adotados
os níveis de signiÍicância: (o) 0,01; (á) 0,05, testar a hipótese de que o processo
deveria ser introduzido.
Resp.: Um teste unilateral indica que o processo não deveria ser introduzido,
se o nível de significância adotado fosse 0,01, mas que o seria se fosse
adotado o nível 0,05.
2t. Dois tipos dg solução química, A e B, foram ensaiados para a determinação do
pH (grau de acidez da solução). As análises de 6 amostras de A indicam o pH
médio de 7,52, com o desvio padrão de 0,024. As de 5 amostras de B apre-
sentaram o pH médio d.e7,49, com o desvio padrão 0,032. Adotado o nível de
Cap. 11 Teoria d,as pequenas amostras 301
A distribuição de qui-quadrado
23. O desvio padrão das durações de 10 lâmpadas elétricas produzidas por uma
fábrica é de 120 horas. Determinar os limites de conÍiança de: (o) 95Va; (b) 99Vo,
para o desvio padrão de todas as lâmpadas fabricadas pela companhia.
Resp.: @)87 a230,9;(b)78,1a 288,5 horas.
24. Mostrar que, para grandes valores de v, uma boa aproximação para 12 é dada por
(;v + zolD, ;, em que zo é o percentil de ordemp da distribuição normal reduzida.
25. Resolver o Problema 23, mediante o emprego de uma distribuição 12, quando
uma amostra de 100 lâmpadas elétricas apresentar o mesmo desvio padrão de
120 horas. Comparar os resultados com os obtidos pelos métodos do Capítulo 9.
O teste de qui-quadrado
Tabela 12.1
E1 E2 E3 Ep
Evento
o1 o2 o3 ok
Freqüência observada
e1 ea e3 ek
Freqüência esperada
302
Cap. 12 O teste de qui-quadrado
DeÍiniçã o de y2
Uma medida da discrepância existente entre as freqüências observadas e esperadas
é proporcionada pela estatística 12 {leia-se; qui-quad.rado), expressa por:
, (ot - et)zr--+...
(oz - uz)2 (ot -,t)z "t lO;./ - €;l'.)
x--
- -et e2 ek
s l'
€:J
' (l)
i=\
^o?
X'=2 r - N. (3)
'.t
Testes de signiÍicância
Na prática, as freqüências esperadas são calculadas com base em uma hipótese I1g.
Se, sob essa hipótese, o valor d" X2, calculado por meio de (1) ou de (3), for maior do
que alguns valores críticos (tais como X&'souX&,rr, que são os valores crÍticos para
os níveis de signiÍicância 0,05 e 0,01, respectivamente), concluir-se-á que as fre-
qüências observadas diferem, de modo significatiuo, das esperadas e rejeitar-se-á
Hg ao nível de significância correspondente. No caso contrário, dever-se-á aceitá-la
ou, pelo menos, não a rejeitar. Esse processo é denominado teste de qui-quadrado
da hipótese ou significância.
Deveria ser assinalado que se deve encarar com suspeita as circunstâncias
em que y2 é muito próximo de zero, porque é raro que as freqüências observadas
concordem muito bem com as esperadas. Para examinar essas situações, pode-se
determinar se o valor calculado de X2 é menor do que Xolos oo do que Xo2o, em cujos
casos decidir-se-á que a concordâncía é muito boa aos níveis de significância 0,05 e
0,0 1, respectivamente.
Tabelas de contingência
A Tabela 12.1, na qual as freqüências observadas ocupam uma linha única, é
denominad atabela de simples entrada. Como o número de colunas é k,, ela é também
denominad a tabela de 7 x É (leia-se: "1 por à"). Mediante a ampliação dessas idéias,
Cap. 12 O teste de qui-quad,rado
. (o; - e)2
^,2_s"
L -L (5)
j ej
podem ser deduzidas fórmulas simples para o cáIculo d" X', que envolvem somente
para tabelas de
as freqüências observadas. Apresentam-se, a seguir, os resultados
contingêncta de 2 x 2 e 2 x 3.
Tabelas de2x2
x2=
N (atbz -
{a1 +by1@2+b)(a1 +a)(b1 +b2)
azbt)2
=
NL2
' 0)
^LffiN,
na qual A, = atb2- azbt,N = 01 + a2 + b1+ b2, N1 = d.t + bu Nz = az + bz,
Nl.= al +
N (aft2 - azbtt-l,q'
(corrigido) = (8)
12
@n hi @, + b» @n or) (bn hl
N(r^ I - i*,
NlN2NaNg
I il Totais
A al a2 Na
B b1 b2 N6
Totais N1 N2 N
Tabelasde2xS
. r,rlal. ,?
14'= Nt * ,?j* _l**#*#l_,
rr nr.] rr r, N2 Nrl (e)
Ln, L
em que se adotou o resultado geral, válido para todas as tabelas de contingência:
-2
x2=2!_
ej
N. (10)
I II UI Totais
A al 4.2 a3 N1
B b1 b2 b3 N6
Totais N1 N2 Nr N
c= x2 (11)
x2+N
que é denominado coeficiente de contingência. Quanto maior for o valor de C, tanto
maior é o grau de associação. O número de linhas e colunas da tabela de contingência
determina o valor máximo de C, que nunca é maior do que 1. Se o número de linhas
e colunas de uma tabela de contingência é igual a lz,, o valor máximo de C é dado por
{(k - lW (veja Problemas 17, 34 e 35).
Correlação de atributos
Como as classificações de uma tabela de contingência descrevem, muitas vezes, as
características de indivíduos ou de objetos, elas são freqüentemente referidas como
atributos, e seu grau de dependência, associação ou afinidade é denominado corre-
laçã.o dos atributos. Para uma tabela de É x à, define-se:
( l2)
PROBLEMAS RESOLVIDOS
O teste de qui-quadrado
1. Em 200 lances de uma moeda, observaram-se 115 caras e 85 coroas. Testar a
hipótese da moeda ser honesta, adotados os níveis de significância: (o) 0,05;
(á) 0,01.
Solução
As freqüências observadas de caras e coroas são o1 = 115 e 02= 85, respectivamente.
As freqüências esperadas de caras e coroas, quando a moeda é verdadeira,
são e1 = 100 E e2 = 100, respectivamente.
Então:
Solução
(l ot - et I - 0,5)2 ll oz - ez |- 0,5)2
(corrigido) =
12
er ez
(l 115 - I - 0,5)2 _ (t 85 -
100 100 I - 0,o2
100 - r 100
_
qL4,512
100 * -10õ- = 4,205.
G4,5)2
Visto que 4,205 > 3,84 e 4,205 < 6,63, as conclusões concentradas para o
Problema 1 são válidas.
Para uma comparação com os métodos anteriores, veja o problema B.
Solução
Para a hipótese da moeda ser honesta, a média e o desvio padrão do número de
caras, esperado rnq 200 lances de uma moeda, são: p = Np = (200) (0,5) = 100 e
o = {NpS = \[200) (0*5) (0O =7,07 respectivamente.
Ie Método
115 caras em unidades reduzidss = (115 - LOO)/7,07 = 2,12. Adotado o nível de
significância 0,05 e um teste bilateral, rejeitar-se-ia a hipótese de a moeda ser
honesta se o escore e estiver fora do intervalo de -1,96 a 1B6. Com o nível 0,01, o
intervalo correspondente seria de -2,58 a2,58. Segue-se, como no problema 1, que
se pode rejeitar a hipótese ao nível 0,05, mas não no 0,01.
2e Método
Tabelal2.2
Face I ) 3 4 5 6
Freqüência 20 20 20 20 20 20
esperada
Solução
, (ot
,_=_T_T___=
- eiz (o2 - e2)2 (os - es)2 . (o+ - e+)2
1e2e3e4
(o5 - e5)' @u - edz (25 - 2O)2 , G7 - 2U2
-rr2o2o
e5 e6
. (15 - ?9t,
*-zí:* (23 - 2o)2+ Q4' 2q2,+ Ía -)9: - Ãôô
=o'uu'
zo n 20
Como o número de categorias ou classes (faces l, 2, 3, 4, 5, 6) é h = 6, v =
=h,-l=6-1=5.
O valor crítico du X&,rU, para 5 graus de liberdade, é 11,1. Então, visto que
5 < 11,1, não se pode rejeitar a hipótese do dado ser honesto.
312 Estatística Cap. 12
5. Nas experiências que Mendel realizou com ervilhas, ele observou 315 redond.as
e amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas
e verdes. De acordo com sua teoria de hereditariedade, os números devãriam
estar na proporção 9:3:3:1. Há alguma evidência para se duvidar de sua teoria
aos níveis de significância: (o) 0,01; (ó) 0,05?
Solução
O número total de ervilhas = 315 + 108 + 101 + 32 = 556. Como os números esperados
estão na proporção 9:3:3:1 (e 9 + 3 + 3 + 1= 16), esperaríamos:
q
jA (556) = 312,75 redondas e amarelas.
1
(556) = 34,75 enrugadas e verdes.
16
Então:
,z =
t3t5 :-l,f,T\z * tt08 __f91,zs)2 . .
ff
t32 - 34 75t2
*'"2 =0,470
Tabela 12.3
Solução
Sejap a probabilidade de nascimento de um homem e q = 7 -p a de uma mulher.
Então, as probabilidades de (5 meninos), (4 meninos e l menina), ..., (5 meninas),
são dadas pelos termos do desenvolvimento binomial:
(p + q)2 = p5 + 5p2q * lopsq2 + lop2q3 + Spqa + q5'
Sep= s=+,tem-se:
1 \5 I
Pr {5 meninos e 0 menina } = 2) \)
r \at r ) 5
Pr {4 meninos e 1 menina} - 5
zl./ lzl 7)
\ ) "-
Pr {3 meninos e 2 meninas} - 10
1 \3 / 1 rz - 1o
o
')
I I r I 2')
JL
\-/
I \2 / I \l - 10
Pr {2 meninos e 3 meninas} - 10 tl,/ lzl
\ ) "'7)
314 Estatística Cap. 12
Pr {1 meninoe4meninas} - si jlt
\ ./\llo=+
) -'
Pr {0meninoe5 meninas} = l1 Js=+.
[ 32
',]
Então, os números esperados de famílias com 5, 4, 3,2, 1 e 0 menino, são
obtidos, respectivamente, multiplicando-se as probabilidades obtidas por 320 e os
resultados são 10, 50, 100, 100, 50, 10. Por isso:
r
w-_-I
(18 - 10) 2 (56 - 50) 2 ttto - 100) 2
^ 10 50 100
2 2 2
*' r!A-i99) (40-f\ - *T (8 -10
-I
1oo *
501 10)
50 =
-r 12,0.
Como X&,nu*11,1 e X&,ss, 15, 1, para v = 6 - 1=5 graus de liberdade, pode-se
rejeitar a hipótese ao nível de signifrcância 0,05, mas não ao de 0,01. Em conseqüên-
cia, conclui-se que os resultados são provavelmente significativos e que os nasci-
mentos de homens e de mulheres não são igualmente prováveis.
Solução
Se P é a proporção da amostra para a categoria,I, p a proporção populacional e N a
freqüência total, pode-se descrever a situação por meio da tabela anexa.
Então, por deÍinição:
I II Total'
Freqüência observada NP N(1 -P) N
Freqüência esperada Np N(l-p)=Nq
^.2 WP -Np)2 . tN(1 -P) - N(l -à12 _ N2(p -p)2 N2(p -p)2
nNpNq Np Nq
-=
Cap. 12 O teste de qui-quadrado 315
8. (o) Provar que a fórmula (1) na definição do 12 no Capítulo 12 pode ser escrita
sob a forma:
^ ():/
Xt=L
2
ej
-N.
(á) Usar o resultado do item (o) para verifrcar o valor d" X2, calculado no
Problema 5.
Solução
- 2
(a) Por definiçào, X" =
(o; - e,\2=, ( o? - 2o,e, + e?\
T l---;Í' )=
09,
oi oj' _ N.
-2zo;+Le; = ,.9j -2N+N = z
- L ejrrejej
em que se usam os resultados (2) na definição d'o y2 no Capítulo 12.
th\ !2
oi' * (315)2
+ (10812 (101)2
\ut - L ej - /Y
L =, = +
^/ - 312,75 - 104,25' 104,25'
Prova de aderência
9. Usar o teste de qui-quadrado para efetuar â prova de aderência dos dados do
Problema 19 do Capítulo 7.
Solução
r
n'l-=+
(38 - 33.2) 2 tt++ - 161,9)', t3+2 - 316,à2 t281 - 308,12
33,2 ,9
16l 326.2 308.7
316 Estatística Cap. 12
+, (164 - 150,7)2
'---T50-J '', + '--
ç25 - 29,412
2sA = 7'54.
Como o número de parâmetros usados para a estimação das freqüências
esperadas ém = 1(a saber, o parâmetrop da distribuição binomial),\ = k -l -m =
- 6-7-L=4.
Parav = ,yl,nr= 9,49. Então, o ajustamento dos dados é bom.
Solução
..2
í- - ç5 - 4,7372+ (18 - 20,68) 2 + é2 - 38,92t2 *
4,rB 20^6g Bg,n
27,71t2
*, \27
T
- , rB - 7,43't2
=0,959.
Para v = 2,Xi,ou= 0,103. Entào, como y2 = 0,959 > 0,103, o ajustamento não
é "demasiadamente bom".
Tabelas de contingência
11. Resolver o Problema 14 do Capítulo 10, mediante o emprego do teste de
qui-quadrado.
Cap. 12 O teste de qui-quad.rad,o 317
Solução
As condições do problema estão apresentadas na Tabela 12.4(a). Para a hipótese
nula, -FIg, do soro não produzir efeito, esperar-se-ia que 70 pessoas de cada grupo
ficassem curadas e que 30 não, como está indicado na Tabela 12.4(b). Note-se que
Ilg é equivalente a estabelecer-se que a cura é independente do uso do soro, isto é,
que as classificações são independentes.
Tabela 12.4(a)
Freqüências observadas
Grupo A 15 25 100
(usando o soro)
Grupo B 65 35 100
(não usando o soro)
Total 140 60 200
Tabela 12.4(b)
Freqüências esperadas sob flo
Grupo A 70 30 100
(usando o soro)
Grupo B 10 30 100
(não usando o soro)
Total 140 60 200
t 05 - l\z 2
-' * (25 2
a.Í- * ''- :o
(65 - 70) 30) (35 - 30)2
x'=ff +'"- 70
= 2'38'
quatro células yazías, visto que, feito isso, os números das céIulas remanescentes
são determinados dos totais indicados. Em conseqüência, há um grau de liberdade.
Tabela 12.5
Grupo A 100
Grupo B 100
Outro método
PeIa fórmula (veja o Problema 13, v = h- D (k - I) = (2 - t) (2 -1) = 1.)
Como x},ss = 3,84, para 1 grau de liberdade, e que X2 = 2,88 < 8,84,
conclui-se que os resultados nã,o sõ,o significatiuos ao nível 0,05. Portanto, não se
está habilitado a rejeitarFlg nesse nÍvel, e conclui-se que o soro éineficaz ou, então,
deixa-se a decisão pendente de testes ulteriores.
Note-se também que um teste unilateral, com o emprego d" Xr, é equiva-
lente a um bilateral que emprega apenas X, por exemplo, X2 , Xi.gscorresponde a
(X>Xo,s) ou a (I. -Xo,ss).Como, para as tabelas de2x2,X2 é o quadrado d.o escore
z, segue-se que X, é, nesse caso, igual a z. Por isso, a rejeição de uma hipótese ao
nível de 0,05, utilizando-se y2, é eqtivalente à rejeição, em um teste unilateral, no
nível 0,10, usando-se z.
Solução
13. Mostrar que, para uma tabela de contingência de hxh o número de graus de
liberdade é (h - 7) (lt - 1), em que á > 7, k > l.
Solução
Em uma tabela corn h linhas e à colunas, pode-se deixar de lado um único número
de cada linha e coluna, visto que ele pode ser facilmente deduzido dos totais
conhecidos de cada coluna e linha. Segue-se que se tem a liberdade de colocar apenas
(h - 7) (k - 7) número da tabela, sendo os outros automaticamente determinados de
uma só maneira. Portanto, o número de graus de liberdade é (h - l) (k - 1). Note-se
que esse resultado prevalece, contanto que sejam conhecidos os parâmetros popu-
lacionais necessários para a obtenção das freqüências esperadas.
14. (o) Provar que, para a tabela de contingência de 2x2, apresentada na Tabela
12.6@).
) N(aft2-a2b)2
^ NrNzNeNa
(á) Iiustrar o resultado obtido no item (o), com referência aos dados do Pro-
blema 11.
320 Estatística Cap. 12
Tabela 12.6
Resultados observados
I II Totais
A a1 Aa Na
B b, b2 Ns
Totais N1 N2 N
(a)
I il Totais
A NrNelN N2NAIN N1
B NrNn/N NzNnlN N6
Totais N1 Nt N
(b)
Solução
Como no Problema 11, os resultados esperados, para uma hipótese nula, estão
indicados na Tabela 12.6(b).
Então:
L
t (at - N1N/t\,t)'
_II
(o, - N2N/N)2
Nüs/N N2Na/N
* - NtNa/N)2n -
(bt (bz N2NB/Nt2
_
r*yr N2NilN
Mas,
Nrl/a @1 + b) (ay + a2) a1b2 - a2b1
at--N -ol a1 +b1 +a2+b2= N
Semelhantemente,
( NzNa) (, NrNa) í,- NzNa)
lo'-, ,J'l'- r-J"["- r.J
Cap. 12 O teste de qui-quadrado 321
N(1aft2-azbt, -**r'
1(corrigidol = ffi=
200t | (75)(35) - (25)(65) r- 10012
(140) (60) (100) (100) = 1,93 .
15. Mostrar que um teste de qui-quadrado, que envolve duas proporções amostrais,
éequivalente a um de signifrcância da diferença das proporções com o emprego
do ajustamento normal (veja a página 258).
Solução
Sejam P1 e P2 as proporções amostrais e p a populacional. Com referência ao
Problema 14, tem-se:
(1) P1 = ar/Nb P2 = a2lNz, I - Pt = btlNt 1 - Pz= bzlNz
(2) p=N4/N,I-p=e=NalN
Estatística Cap. 12
de modo que
(3) ar = N1P1, a2 = NzP2, ót = Nr(1 - P), bz = Nz(L - Pz)
(a) Na = Np, NB = Nq.
CoeÍiciente de contingência
16. Determinar o coeficiente de contingência para os dados da tabela de contin-
gência do Problema 11.
Solução
0,1094.
Solução
O valor máximo de C ocorre quando as duas classiÍicações são perfeitamente
dependentes ou associadas. Nesse caso, todos os que tomaram o soro foram curados
e todos os que não o tomaram não o foram. A tabela de contingência aparece, entào,
como a Tabela 12.7.
Cap. 12 O teste de qui-quadrado
Tabela 12.7
oq
Então, o valor máximo de C = x'/w' = {loo,z(2õo * 2oo) =
= 0,7071.
Em geral, para a dependência perfeita, em uma tabela de contingência
cujos números de linhas e colunas são, ambos iguais a h,, as únicas céIulas de
freqüências não-nulas aparecem na diagonal que vai da casa superior esquerda à
inferior direita da tabela.
Para esses casos, C,,r, = 1n
^[ - gtn (veja os Problemas 34 e 35).
Correlação de atributos
18' Para a tabela do Problema 11, determinar o coeficiente de correlação: (o) sem;
(ó) com a correção de Yates.
Solução
Solução
y2
x2< & - l)N. N(; _ ri < I e r =
Propriedade aditiva de y2
20. Para testar uma hipótese Hg, ufià experiência foi realizada três vezes. Os
valores resultantes d.e X2 foram2,37,l,86 e 3,54, cada um dos quais corres-
ponde ao grau de liberdade um. Mostrar que, apesar de 1{g não poder ser
rejeitado no nível 0,05, com base em cada experiência individual, ela poderá
sê-lo quando as três experiências forem associadas.
Solução
O valor d" X2, obtido mediante a associação dos resultados d.as três experiências é,
de acordo com a propriedade aditiua:
O teste de qui-quadrado
21. Em 60 lances de uma moeda, observaram-se 37 caras e 23 coroas. Testar a
hipótese da moeda ser honesta, adotados os níveis de significância: (a) 0,05;
(á) 0,01.
Resp.: O novo instrutor não está seguindo o padrão de graus dos outros. (O
fato dos graus serem melhor do que a médía, pode ser atribuído à maior
habilidade de ensino ou a padrões de julgamento inferiores ou a ambos
os casos).
24. O número de livros emprestados por uma biblioteca pública, durante uma
determinada semana, está indicado na Tabela 12.8. Testar a hipótese do
número de livros emprestados não depender do dia da semana, adotados os
níveis de significância: (o) 0,05; (ó) 0,01.
Resp.: Não há razáo para rejeitar a hipótese em qualquer dos níveis.
326 Estatística Cap. 12
Tabela 12.8
Prova de aderência
26. (o) Usar o teste de qui-quadrado para determinar a prova de aderência dos
dados do Problema 43, Capítulo 7. (á) E o ajustamento "muito bom"? Adotar o
nível de signiÍicância 0,05.
Resp.: (o) O ajustamento é bom. (ó) Não.
Tabelas de contingência
27. A Tabela 12.9 indica os resultados de uma experiência para investigar os
efeitos da vacinação de animais de laboratório contra uma enfermidade parti-
cular. Adotados os níveis de significância: (o) 0,01; (á) 0,05, testar a hipótese
de não haver diferença entre os grupos de vacinados e não-vacinados, isto é,
de serem independentes a vacinaçáo e a enfermidade.
Resp.: A hipótese pode ser rejeitada no nível 0,05, mas não no 0,01.
Tabela 12.9
Vacinados 9 42
Náo vacinados t1 28
Cap. 12 O teste de qui-quadrado 327
Tabela 12.10
Matemática
Graus altos 56 11 t2
Física Graus médios 4't t63 38
Graus baixos I4 42 85
29. (a) Provar qrref2 = » @:ej ) - N, para todas as tabelas de contingência, sendo
N a freqüência total de" todas as células. (á) Utilizando o resultado obtido no
item (o), resolver o Problema 28.
30. Se N; e N; representam, respectivamente, a soma das freqüências da linha de
ordem I e da coluna de ordem 7 de uma tabela de contingêncía (freqüências
marginais), mostrar que a freqüência esperada para a célula pertencente a
essa linha e coluna é NiNi lN, sendo N a freqüência total das células.
CoeÍiciente de contingência
33. Determinar o coeficiente de contingência para os dados do Problema 28.
Resp.: 0,4651.
Estatística Cap. 12
aProximadamente'
! ã = 0,8165,
35. Pfg"gl_q"qo coeficiente máximo de contingência, para uma tabela de k x k, é
^t(tr- rW
Correlação de atributos
36. Determinar o coeficiente de correlação entre os graus de matemática e física
da tabela do Problema 28.
Resp.: 0,3715.
37. SeCé ocoeÍiciente decontingência, paraumatabeladele x k,eréocoeficiente
de correlação correspondente, provar eüê r = Cl{ G -e) @ - l)
Ajustamento de curvas e o
método dos mínimos quadrados
Ajustamento de curvas
Para auxiliar a determinação de uma equação que relacione as variáveis, um
primeiro passo consiste em colecionar dados que indiquem os valores correspon-
dentes das variáveis consideradas.
329
330 Estatística Cap. 13
Figura 13.1
Figura 13.2
(6)Y= 11
^--.oui=ao+o1X Hipérbole
ao+ovr I
(7) Y =abX oulogY= loga + (1og b)X=as+a1X Curva exponencial
(8) y=aXb oulogY=loga+blogX Curvageométrica
(9)Y=abx+g Curvaexponencial
modificada
(10)Y=o**g Curva geométrica
modificada
(lz)Y=pqb* +h
35A*".iompertz
(13)Y=+ o,r|=abx+g Curva logístiea
af+g
(14)Y = do + or (log X) + a2(logJí)2.
Para decidir qual a curva a adotar, é conveniente a obtenção de diagramas
de dispersão das variáveis transformadas. Por exemplo, se o diagrama de dispersão
de log Yem função deXapresentar uma relação linear, a equação teráo aspecto da
(7), enquanto, se o de log Yem função do logXindicar relação daquele tipo, a equação
terá a forma da (8). Para facilitar esse processo, emprega-se, freqüentemente, papel
especial para gráficos, no qual uma ou ambas as escalas são logarítmicas. São
denominados papéis semilog ot log-log, respectivamente.
Estatístíca Cap. 13
A linha reta
O tipo mais simples de curva de ajustamento é a linha reta, cuja equação pode ser
escrita:
Y = ao + a1X. (15)
Dados dois pontos quaisquer (X1,Y) e (Xz, Y2) dessa reta, as constantes
ao e ar podem ser determinadas. A equação resultante da reta pode ser escrita:
( Y,- Y,\
Y-Y1=[rr-J6-xt) ( 16)
ou
Y-Yr-m(X-X),
Yz- Y,
em que
' m = # Át é denominado coeficiente angular (ou decliuidade d.a reta) e
^z- Y, dividida pela correspondente de X.
representa a variação
YN)
Figura 13.3
Diz-se que uma curva, que apresenta essa propriedade, ajusta os dados no
sentido dos mínimos quadrados e é denominada curua de mínimos quadrados. Em
conseqüência, uma reta que apresenta essa propriedade é denominada reta de
mínimos quadrados, uma parábola é paró,bola de mínimos quadrados etc.
334 Estatística Cap. 13
2Y=aN+a12Y
( l9)
2XY = asLX + a1 2X2
que são denominadas equações normais da reta de mínimos quadrados (18).
a0=
(rR(rx')- (»x)(»xy)
N»x2 - en2 .:
a
(20)
N »x Y - Qn §rGMAn
ul =-
N>.X"- (Zn'
As Equações normais (19) são facilmente lembradas, quando se observa
que a primeira pode ser obtida, formalmente, mediante a soma, membro a membro
da Equação (18), isto é,2Y = I(do + a1X): aoN + a1ZX, enquanto a segunda
é obtida, na realidade, multiplicando-se, primeiramente, ambos os membros de (18)
por X e depois somando-as, isto é, Z,XY = 2X(ag + atx) = aoZX + ayLXz.
Note-se que não é feita dessa forma a dedução das equações normais, mas que esse
Cap. 13 Ajustamento de curuas e o método dos mínimos quadrados
y=Í + /»xv)
l:j-: lX. (22t
l>x')
Nessas equações, é imediatamente evidente que a reta de mínimos quadra-
dos passa pelo ponto ((X, D, denominado centróide ott centro de grauidade dos
dados.
Relações não-lineares
As relações não-lineares podem, às vezes, ser transformadas em lineares, mediante
a transformação adequada das variáveis (veja o Problema 11)'
Estatística Cap. 13
| ,, = aoN + a1 2X + a22X2
1 Z.XY = asZX + a12X2 + a2ZX3
I
(24)
| »x2v = asZX2 + a1ZX3 + a2ZX4
denominadas equações normais da pardbora de mínimos quadrad,os (28).
As Equações (24) são facilmente relembradas, quando se observar que elas
ser obtidas, formalmente, mediante a multiplicaçao da expressã o rzil por 1,
l_od"_g
z\ e x', respectrvamente, e a soma membro a membro das equações resultántes.
Essa técnica pode ser estendida, para a obtenção das equações normais das
curvas
de 3 grau de mínimos quadrados, das de 4 graue, em geral, de quarquer das
curvas
de mínimos quadrados que corresponda à Equação (5i.
x=X-X,y=Y-Y.
Regressão
Deseja-se, freqüentemente, com base em dados amostrais, estimar o valor de
uma
variável Y, correspondente ao conhecido de uma variável X. Isso pod.e ser alcançado
mediante a estimação do valor de y, a partir d.e uma curva de mínimos quadràdos
que se ajuste aos dados amostrais. A curva resultante é denominada de regressã,o
de Y para X, visto que Y é estimado a partir de X.
PROBLEMAS RESOLVIDOS
Linhas retas
1. Mostrar que a equação de uma linha reta que passa pelos pontos (Xr, Yr) e (Xz,
Y2) é dada por:
Yt-Y,
Y-Y1=a ,,'(X-Xg.
^2-^t
Solução
A equação da linha reta é (1) Y = d,s + a1X.
Como (Xy Yi pertence à reta, (2) Yt = ao + atxr
Como (X2, Y) pertence à reta, (3) Y2 = a0 * aLXz.
YZ- Yt = at (XZ-X1) ou o, = Y
xz-xt
Substituindo-se esse valor de o1 em (4), obtém-se:
Yt-Yr (X
Y - Y1 = ;---'
A2 - 1r1 - X t). como se desejava.
Solução
(a) (Xt = l, Yt = 5) e (Xz = 4, Yz = -l). Então:
Yz - Yt -1 - 5
ru = declivid
aoe=yr_ x1= 4-r= =-!z=-'
= -z
Cap. 13 Ajustamento de curuas e o rnétodo dos mínimos quadrad.os 339
Figura 13.4
Y -5 =-2X +2 ou I= 7 -2X.
(c) Aordenada àorigem, que éo valor de Ycorrespondente aX=0, é dada por
Y = 7 - 2(0) = 7. Esse valor pode também ser obtido diretamente no gráÍico.
(d) A abscissa à origem é o valor deXcorrespondente a Y = 0. Substituindo-se
Y= 0 na Equação Y = 7 *2X, tem-se 0 = 7 - 2X ot2){ ='7,X= 3,5. Esse
valor pode também ser tirado diretamente do gráÍico.
Solução
Na equação Y = a0 + a1X,oO = 16 é a ordenada à origem ê a1 = - 4 é adeclividade.
Então, Y = 76 - 4X é a equação desejada.
(c) Determinar a equação da reta traçada no item (b). (d) Estimar a altura de
um estudante, cujo peso conhecido é de 63kg. (e) Estimar o peso de um
estudante, cuja altura conhecida é de 168 cm.
Tabela 13.1
Peso X 10 63 72 60 66 10 14 65 62 67 65 68
(ks)
Altura Y 155 150 180 135 156 168 178 160 t32 145 139 152
(cm)
Solução
(a) O diagrama de dispersão, representado na Figura 13.5, é obtido mediante
a locação dos pontos (70, 155); (63, 150), ... (68, 152).
(á) Em linha tracejada está representada, na figura, uma reta que se ajusta
aos dados. Ela é uma das muitas possíveis que poderiam ser construídas.
190
180 a a..
170 o.e u/
n
E 160 o ut
(J oza
(ú 150 o zC,'o
=
f
140 /a
130
/P3.4
120
74
Figura 13.5
(c) Escolhem-se dois pontos quaisquer da reta traçada no item (ó), tais como
P e Q, por exemplo. As coordenadas destes pontos, tiradas do gráfico, são,
aproximadamente, (60, 130) e (72,770). Então:
Yt-Y,
Y-Yt- v 6-Xt\
^2-^t
-u
Cap. 13 Ajustamento de curuas e o método dos mínimos quadrados 341
Y-r3o=ff-#(x-60)
y=+ x-10.
(d) Se X = 63,então y=
+ (63) - 70 = 140 cm.
(e) SeY= 168,então 168=+ X- 70,f X= 238eX=7!,4ou71kg.
Solução
Caso 1. X é avaiável independente.
A equação da reta de mínimos quadrados é (l) Y = ao + atX.
(5)x- X = blY-h.
que indica que ela passa pelo ponto É, D.
Note-se que (4) e (5) não sáo coincidentes, mas se interceptam em (X, D .
)=l.J
í:rv)J"t ou )=l lrxr, )
lx,
\ȃ ) [r|
emquex=X-X. y=Y-V.
(á) Se X = 0, mostrar que a reta de mínimos quadrados do item (a) pode ser
escrita sob a forma:
-. = (zxv\
Y=Y+l:lX.
\»x'
)
(c) Escrever a equação da reta de mínimos quadrados, correspondente à do
item (a), se Yfor a variável independente.
(d) Verificar que as retas dos itens (a) e (c) não são, necessariamente, coinci-
dentes.
Solução
(o) A Equação (4) do Problema 5 pode ser escrita sob a forma
! = dlx, €rn eüê tr =
=X -X ey =Y -V. Também, da resolução simultânea das equações normais
tem-se:
_
Nxxy + NPtr + NxIy + lr2Xy- {r, * Nr}{:r + lrrl}
ttLf + ZN
íI*y)
,=[r;.,J, or í>rr)
r=[rl ].
(ó) Se X = 0, x = X -X = X. Então, de
2Y=osN e »XY=atLX2,
donde »Y -- r e ot=
LXY
ao= =
N »x2
Então, a equação desejada da reta de mínimos quadrados é:
í >^'r, )
*r=ljl=
l;r' /lY'
(d) De acordo com o item (o), a reta de mínimos quadrados é:
(lty= í:xv )
" l-" lr. ) I,z*"
De acordo com o item (c), a reta de mínimos quadrados é:
(»xy\ (»t'\
Í=[;p)t ou (2) Y=[L.y).'
344 Estatística Cap. 13
Uomo
Zxy * Zy2
--: ;1,em
Zxz Lxy
geral, as retas de mínimos quadrados (1) e (2)são
diferentes.
Note-se, entretanto, que elas se interceptam em r =0 e ! = O, isto é, no
ponto 6, h.
7. SeX = X + AeY=Y +8, em queA eB são duas constantes quaisquer, provar
que:
Solução
8' Ajustar uma reta de mínimos quadrados aos dados do Problema 4 adotando:
(o) x como variável independente (b) x como variável dependente.
Soluçào
(o) De acordo com o Problema 6(a), areta deseja da é y =('+lr, "- Í
eue =
=X-XeJ=Y-Y. [t*" )
As operações necessárias para o cálculo das somas podem ser dispostas
como na Tabela 13.2. Nas duas primeiras colunas determinam-se X = BO2l12 66,8
=
e 7= 1.359/12 = 154,2.
cap. 13 Ajustamento d.e curuas e o método dos mínimos quadrados 345
Tabela 13.2
f
10 155 7) 0,8 2,56 10,24 0,64
Solução
(o) As duas retas estão representadas na Figura 18.6, juntamente com os
pontos originais dados. Note-se que elas se interceptam no ponto (X, D ou
(66,8; 1,54,2).
(ó) Para estimar Ya partir deX, usa-se a linha de regressão de YparaX, obtida
no Problema 8,Y = 3,22X - 60,9.
Então, paraX = 63,Y = 3,22(63) - 60,9 = !42 cm.
(c) Para estimarXa partir de Y, usa-se a linha de regressão deXpara Y, obtida
no Problema 8, X = 31 + 0,232Y.
Então, para Y = 168, X = 31 + 0,232 (168) = 70 kg.
os resultados dos itens (ó) e (c) poderiam ser comparados com os do
Problema 4(d)e4(e).
60 62 64 66 68 70 72 74
Peso (kg)
Figura 13.6
Cap. 13 Ajustamento de curua,s e o método dos mínirnos quadradns 347
Tabela 13.3
1946 66,6
1941 84,9
t948 88,6
1949 78,0
1950 96,8
195 1 t05,2
t952 93,2
t953 1il,6
t954 88,3
1 955 rt7,0
r 956 t15,2
(Fonte: Instituto Americano de Ferro e Aço)
Solução
f 120
u]
o
o
100
o§
!Iõ
-. 0)
u.O 80
oF r(ú
()r -
J
'1, 60
o
ÍL
te46 1e4/ ]948 1949 1950 1951 1952 1953 1954 1955 1
Ano
Figura 13.7
Tabela 13.4
Anos X Y x=X-X Y =Y -Y t xy
Segundo método
Atribuindo-se os valores de X correspondentes aos anos de 1946 a 1956, de modo
que LX = 0, a equação da reta de mínimos quadrados pode ser escrita da seguinte
forma:
í:xr\Ix.
y=y +l_ ^
\r* )
Como os dados se referem a um número ímpar de anos, pode-se atribuir X = 0
ao ano mediano, 1951, e X = 7,2,3, 4,5 aos anos seguintes e X = -1, -2, -3, -4, -5,
aos precedentes. O resultado está indicado na coluna 2 da Tabela 13.5 e é equiva-
Ientã ao emprego da coluna 4 da tabela do primeiro método'
Tabela 13.5
Anos X Y x2 XY
o ano mediano, 1951, é denominado origem. A não ser que haja especi-
ficação ao contrário, admitir-se-á que os valores de Y são referidos aos dã meio do
ano, isto é, a 1de julho. Em conseqüência,x= 0 correspondente a 1de julho de 1951:
X = -l a 1 de julho de 1950 etc. Os cálculos necessários podem ser dispostos como
na Tabela 13.5.
Tabela 13.6
Pressão P em libras por polegada 61,2 49,5 31.6 28.4 19.2 10,1
quadrada
Solução
Como PW =C, tem-se:
log P + ylog V= log C ou log P = 1og C - ylogV.
Fazendo logV = X elogP = Y, a última equação pode ser escrita sob a forma:
(1) f =as+a1X,
em que o6 + Iog C e a1= -Y
A Tabela 13.7 relaciona X = Iog V e Y = log P, correspondentes aos valores
de V e P da Tabela 13.6 e indica, também, os cálculos necessários para determinação
da reta de mínimos quadrados (1).
As equações normais correspondentes àquela reta (1) são:
Tabela 13.7
X=logV Y=logP x2 XY
Solução
100
90
80
70
60
50
\
o- 40 \,
o
r(d
\
3so
E
L25 \
20
I
I \c
A
15
10r I r i L ll
10 20 30 40 50 60708090100 150 200 25o3oo
Volume V
Figura 13.8
Cap. 13 Ajustamento de curuas e o método dos mínimos quadrad.os
de modo que:
logP + 1,4logV = 4,2;log PVr'a = 4,2 e PVr'a = 16.
Tabela 13.8
Anos l 850 l 860 1 870 1 880 1 890 I 900 19 10 t920 1 930 t940 I 950
População dos
Estados Uni- )\) 3r.4 39,8 50,2 62,9 76,0 92,0 t05,1 122,8 t3r,7 151 I
dos (milhões)
Fonte: Bureau of the Census.
354 Estatística Cap. 13
Solução
(o) Sejam X e Y as variáveis que representam, respectivamente, o ano e a
população que the corresponde. A equação de uma parábola de mínimos
quadrados que se ajusta aos dados é:
(1) Y= ao+atx+a2X2,
em que ao, at e a2 sáo determinados por meio das equações normais'
Tabela 13.9
Anos X v x2 x3 x4 XY X2Y
(b) Os valores de tendência, obtidos quando se faz X = -5, -4, -3, -2, -1,0, 1,
2,3, 4,5 na Equaç áo (4), estão indicados na Tabela 13.10, juntamente com
os valores reais. Vê-se que a concordância é boa.
Tabela 13.10
Anos X=-5 X=-4 X=-3 X=-2 X=-l X=0 X=l X=2 X=3 X=4 X=5
1 850 I 860 1 870 r 880 1890 1900 19 10 1920 1930 t940 1950
Vqlor
da 21.6 31,0 41,2 \)) 64,0 16.6 90.0 104.2 119,2 135,0 151,6
lendên.
Val. )7) 105,7 122.8 t3t,l l5
31,4 39,8 50,2 62,9 16,0 92.0 1,1
real
(c) 1945 corresponde aX= 4,5 para o qual Y =76,64 + 13(4,5) +0,3974(4,5)2 =
= 1-43,2.
356 Estatística Cap. 13
PROBLEMAS SUPLEMENTARES
Linhas retas
L4. (o) Determinar o coeficiente angular e a ordenada à origem da linha, cuja
equação é3x -5Y=20. (ó) Qual é a equação da reta que é paralela à doitem
(a) e que passa pelo ponto (2, - l)?
Resp.: (o) Coeficiente angular = 3151' ordenada à origem = -4. (b) BX- 5Y = 11.
15. Determinar: (.a) a declividade;(b) a ordenada à origem; (c) a equação da reta
que passa pelos pontos (5,4) e (2,8).
X 3 5 6 8 9 ll
Y 2 J 4 6 5 8
Álgebra (X) 15 80 93 65 81 11 98 68 84
Física (Y) 82 78 86 72 91 80 95 72 89 74
Resp.: (b) Y = 29,!3 + 0,661X. (c) X = -L4,39 + 1,15Y. (.d) 79.(e) 95.
X 0 1 2 J 4 5 6
Teoria da correlação
Correlação e regressão
No ú1timo capítulo, considerou-se o problema da regressão ou estimaçdo de uma
variável (a dependente) a partir de uma ou mais variáveis correlatas (as inde-
pendentes). Neste capítulo, considerar-se-á o problema estritamente relacionado, o
dacorrelação,ortdo grau de relação entre as variáveis, que procura determinar quão
bem uma equação linear, ou de outra espécie, descreve ou explica a relação entre as
variáveis.
Se todos os valores das variáveis satisfazem exatamente uma equação,
diz-se que elas esLáo perfeitamente correlacionadas ou que há correlação perfeita
entre elas. Assim, as circunferências C e os raios r de todos os círculos estão
perfeitamente correlacionados, porque C = 2 x r. Se 2 dados são lançados simulta-
neamente 100 vezes, não há relação entre os pontos correspondentes a cada um
deles (a não ser que os dados sejam viciados), isto é, eles são nã.o correlacionqdos.
As variáveis altura e peso de indivíduos revelariam alguma correlação.
Correlação linear
SeX e Y representam as duas variáveis consideradas, um diagrama de dispersão
mostra alocalízaçáo dos pontos (X, D em um sistema de coordenadas retangulares.
359
360 Estatística Cap. 14
Se todos os pontos desse diagrama parecem cair nas proximidades de uma reta,
como nas partes (a) e (ó) da
Figura 14.1, a correlação é denominada linear. Nesses
casos, como se viu no Capítulo 13, uma equação linear é apropriada aos Íins de
regressão ou estimação.
ta:\
(a) Correlaçáo Linear Positiva (b ) Corr elação Li near Negativa (c/ Nenhuma CorrelaÇão
Figura 14.1
Medidas de correlação
Pode-se determinar, de modo qualitatiuo, quão bem uma certa reta ou curva
representa a relação entre as variáveis, mediante a observação direta do próprio
diagrama de dispersão. Por exemplo, vê-se que uma linha reta é muito mais
conveniente para representar a relação éntreXe Y,paraos dados da Figura 14.l(a),
do que para os da Figura 14.1(b), graças ao fato de haver menor dispersão em torno
da reta da Figura l(.I(a).
SY.X= (8)
X
sx.Y= ""r)2 (e)
Em geral, sy . X+ sx . y
? tY2-roZY-atzxY
sy-.x= ' (10)
N
que pode ser mais conveniente para o cá1ôulo (veja o Problema 2). Uma expressão
semelhante existe para a Equação (9).
O erro padrão da estimativa tem propriedades análogas às do desvio
padrão. Por exemplo, se se construírem retas paralelas à de regressão de Y paraX,
com as respectivas distâncias verticais sy x, 2sy .71 e Ssy . x entre elas, veri-
Íicar-se-á, se N for suficientemente grande, que estarão incluídos, entre essas retas,
cerca de 68Vo,95Vo e 99,7%o'dos pontos amostrais.
N
Da mesma forma que o desvio padrão corrigido, dado porâ = sré
N-1
conveniente para as pequenas amostras, também o é o erro padrão corrigido, dado por
Cap. 14 Teoria da correlaçdo 363
N
sY x= N-2 sy.x.Por essa razáo, alguns estatísticos preferem deÍinir as
CoeÍiciente de correlação
O quociente da variação explicada pela variação total é denominado coeficiente de
determinaçõo. Se a variação explicada for nula, isto é, se a variação total for toda
não-explicada, esse quociente será igual a zero. Se a variaçáo não-explicada for nula,
isto é, se a variação total for toda explicada, o quociente será igual a 1. Nos outros
casos, o quociente terá valor compreendido entre zeto e um. Como a relação é não
negativa, ela será representada por r2. A quantidade r, denominada coeficiente d.e
correlaçã,o, é dada por:
variação explicada
(12)
variação total
e varia entre -1 e +1. Os sinais + são usados para a correlação linear positiva e para
a negativa, respectivamente. Note-se que r é uma quantidade sem dimensões, isto
é, independente das unidades adotadas.
Mediante o emprego das expressões (8) e (11) e pelo fato de o desvio padrão
de Y ser
364 Estatística Cap. 14
( 13)
verifrca-se que a Equação (12) pode ser escrita, desprezando o sinal, sob a forma:
OU Sy.X = Sy (14)
sY.x =
rx)
sxy= N ,sX= Zx2 ( 18)
N
SXY
(le)
sx sy
Estatística Cap. 14
,=
' t2lt
./ tu
Veja o Problema L2.Por conveniência, nos cálculos em que se emprega essa fórmula,
usa-se lrma tabela de correlaçã.o (veja o problema 1B).
(23)
,F
sY=cYf/
+ efl (:24)
em que cxe cy são as amplitudes dos intervalos de classe (admitidas como constan-
tes) correspondentes às variáveisXe Y, respectivamente. Note-se que as expressões
(23) e (24) são equivalentes à fórmula (11) do Capítulo 4.
Correlação ordinal
Em vez de utilizar valores precisos das variáveis, ou quando essa precisão for inúti1,
os dados poderão ser d.ispostos em ordem de tamanho, importância etc., mediante
o emprego dos número s l, 2, ..., N. Se duas variáveis X e Y estão ordenadas dessa
maneira, o coeficiente de correlação ordinal é dado por:
6» D2
_-
,ordinal _t r- (27)
-
N(N2 - 1)
Correlação de atributos
Os métodos descritos neste capítulo não nos capacitam a considerar a correlação
de
variáveis que, por sua natureza, náo são numéricas, como os atributos individuais
(exemplo: cor dos cabelos, dos olhos etc.). Para um estudo da correlação de
atributos,
veja o Capítulo 12.
1. Teste da hipótesê p 0
=
Aplica-se, neste caso, o fato da estatística:
Cap. 14 Teoria da cotelaçã.o
(28)
t=
2. Teste da hiPótesê P = Po É 0
(2e)
z = r,"r.
[=- . )=
,.,5r3rog,. (]-=)
emquee=2,71828...,terdistribuiçáoaproximadamentenormal,comamédiaeo
desvio padrão dados Por:
_ í r * po)=r.r5r3rog í,t *_
r, po). (30)
tr= iros"Ir _ oo
)=,.rJrlusro[, * ]
I
"
6z=
xN -3
Esses fatos também podem servir para determinar
limites de conÍiança
os
dos coeficientes de correlaçáo (veja os Problema 23 e 24).
A expressão (29) é
denominad a transformaçã.o Z de Fisher'
em que
ctt - At r-
l= sY
--.. y'/ sy IN-2 = íN-2 (32)
X\2t(tttrx2)
Yo -lp af1'1j=
sy .x 1 + (Xo _ Í)2tti
yo-yp (34)
PROBLEMAS RESOLVIDOS
Tabela 14.1
61 64 68 62 10 66 68 67 69 71
Peso X dos Pais (kg) 65 63
71 67 68 '70
66 68 65 69 66 68 65
Peso Y ilos filhos (kg) 68
Solução
(o)odiagramadedispersáoéobtidomediantealocaçãodospontos(X,Y)em
indicado na Figura
um sistema de coôrdenadas retangulares, como está
1,4.2.
372 Estatística Cap. 14
72
670
5
E68
LL
o
:66
íl)
o
ÍL 64
62 64 66 68 70 72
Peso do Pai (kg)
Figura 14.2
I tZas + 800a1 = 8l I
Tabela 14.2
x Y x2 XY Y2
63 66 3969 41 58 4356
69 68 47 6t 4692 4624
Outro método
on=W=35.82.
" NLX, _ (x).
N»XY-(:X)(tn
u,=-- --=*_ (zX),
' NLX, =0.416.
l rr = àoN + btzY
+
| :xr = boLxY brzY2
Usando as somas da Tabela 14'2, essas expressões tornam-se:
Outro método
br=
N»xY - (ry) (ID
= l'036'
í»yTi»n2
^2 Zy2-açZy-a1ZXy
§1.-.)r= __
N
Solução
os valores de Y, estimados por meio da reta de regressão, são
dados por rest = clo +
+ a1X. Então:
2X=00N+a12X
ZXY= asZX+ a1ZX2
Cap. 14 Teoria da correlaçdo 375
Então:
2
2Y (Y - ao - atX) »Y2-asZY-a12XY
SY.X= N
Este resultado pode ser estendido às equações de regressão não-Iineares'
B. Ser X-Xey =T -Y,mostrarque o resultado do Problema 2 pode ser escrito
=
sob a forma:
2
SY.X=
Zy2 - alLxy
Solução
N ri. x =Z Y
2
- asL Y - a 1L XY =I g + h' - oo' » 6' + h - 4l: (r +X) ty + 4 =
=2(y2+2y?+Y2)-ao(rv+ND-arLlxy+Xv+xÍ+xh=
- Zy2 + zy») + N Y'-ooNl-apry-a1xLy - aiÍLt'_ a1"1XY =
= >Y2+ - al rr) - aINXV
N7' - ooNY =
do Problema 1'
4. Calcular o erro padrão da estimativa sy71 para os dados
medianteo"*p,"go.(o)dadefrnição;(b)doresultadodoProblema.s.
Solução
(o) No Problema 1(ó), a reta de regressão de Ypara X é Y = 35,82 + 0,476X.
(da tabela do
Na Tabela 14.3 estão relacionados os valores reais de Y
de Y, representados Por Y".1, obtidos
Problema 1) e os valores estimados
da reta de regressão. Por exemplo, em correspondência
a X = 65, tem-se
Yest = 35,82 + 0,476(65) = 66,7 6'
376 Estatística Cap. 14
Tabela 14.3
x 65 63 67 64 68 62 70 66 68 67 69 7t
Y 68 66 68 65 69 66 68 65 71 67 68 70
I".t 66.76 65,81 67 ,71 66,28 68,19 65,33 69,14 67,24 68.19
67 .71 68,66 69,62
I'- I est 1.24 0,19 0.29 -1,28 0,81 0,67 -1,14 -) )a 2.81
-0,71 -0,66 0.38
^
sy.x= ,(y -\i: _0,24)2 + (o,te)2 +... + (0,38)2
N = = 1,642
^2
rl'.x= Ly2 - alZxy=-----2
38.92 - 0,476(40,341
N =1.643
sy x = {r,o+s = 1,2gkg.
Solução
I(r - y )2
=z(y - r.r,)2 + !(resr - y l2 + 2z(yx- r.r,)(re.r _ r)
O resultado desejado será obtido imediatamente, se se conseguir
que a última soma é nula. No caso da regressão linear isso
mostrar
'
se verifica'porque:
I(f - ys51)(Ig51
- 7) = Z(y - as - a1X) = (ao + a1X_Í) =
Solução
(a) Variação total = I (Y Y)2 =Zy2 = 38,92
-
(ó) Variação não-explicada = , (y - Y"rt)2 = Ns] . ,= 19,70, do Problema 4.
(c) variação explicada = I(Yest - Y)2 = 38,92 - 19,70 = 79,22, utilizando o
Problema 5.
Outro método
- y ou ]-o,sz -1,773 0,13 -1,30 0,61 -2,25 1,56 -0,34 0,61 0'13 1,08
2,04
e"t
esr - 67,58
CoeÍiciente de correlação
7. Determinar: (o) o coeÍiciente de determinaçáo; (ó) o de correlação, para os
dados do Problema 1. Usar os resultados do Problema 6'
378 Estatística Cap. 14
Solução
Solução
A linha de regressão de mínimo quadrado de Y para
x pode ser escrita sob a forma
Yest = + a'lX,oulest = dtx,em que o,
ctg
=
#ê Jest = Yest - Y lveja o problema
6(o) do Capítulo 1Bl. Então:
variaçãoexplicada_ X(I"rt
,z _ -Í), _Zyr?,
variação total - ,(y _ nf ,r,
_zaÍx2 alZx2 (»*r\2
-))l
Zx2 (X xy) 2
Iry
",1 o*21(»y2)
Cap. 14 Teoria da correlaçã,o 379
(ou de
Esta é denominada, freqüentemente, fórmula do produto montento
covariância), para o coeficiente de correlação linear'
Tabela 14.4
Solução
na Tabela 14.5.
As operações necessárias ao cálculo podem ser dispostas como
Tabela 14.5
X Y x=(x-x) y=Y-T ,2 xy f
36 24 16
1 1 -6 -4
t6 12 9
J 2 -4 -J
9 J 1
4 4 -J -1
6 4 -1 -l 1 1 1
I 0 1 0 0
8 5
2 4 4 4
9 7 2
11 8 4 '3 I6 t2 9
14 7 4 49 28 l6
9
rx) _ __:y-=o.9il.
-
r' =
{(: * t: y
2) 2)= r/ t t:z) lsot
-i--;__=-_-;-
380 Estatística Cap. 14
Solução
Fazendo-se x = X -X, ! =Y -Y no resultado do problema B, tem_se:
=zXy-(:x)(rY)
N
porque X = q»fyN eY = ç2y1171J.
De modo análogo,
, »x2_ztZt)2
NNN
* (!-&' = y vz _ ên2
r(Y - 42 = ê!)2
e »Yz - .Então, a expressão (1) torna-se:
»,xY_GX)(rY)/N
I
=
Cap. 14 Teoría da correlaçã.o 381
Tabela 14.6
Graus em Matemâtica
o 2 4 4 l0
90-99
tr. 16
1 4 6 5
80-89
o
5 l0 8 I 24
70-79
rl 9 5 2 21
60-69 1 4
J 6 6 6 t7
50-59
40-49 3 5 4 l2
25 23 20 10 100
Totais 7 15
Solução
(o)Percorre-separabaixoacolunaencimadaporT0-79(grausemmate-
(graus em física)' O valor
mática), até a linha correspondente a 80-89
encontrado ,4, dâ o número desejado de estudantes'
70-79 5 10
Solução
valores das variáveis, x
Para os dados agrupados podem-se considerar os diversos
ã ?,'.ot"o coirrciãerries com os pontos médios, enquanto f4 " f'
são as-freqüências
indicadas nas últimas linha
classe de correspondentes, ou as freqüências marginais
Se /representar as várias freqüên-
e coluna da tabela a" fr"qtiO""ia bidimensional'
pontos médios (x, Y pode-se, então'
cias das células .orr".porrdentes aos pares de
substituir a fórmula do Problema 10 por:
NLf XY - (t fxX)(»fvY\
(1) , =
Solução
pode ser disposto como na
Emprega-se a fórmula (2) do Problema 12. o trabalho
Tabela 14.9, que é denominada quad.ro d'e correlação. As somas Lfv, Lfvuv,
o emprego do método abreviado'
L fxul,Zfy,Z fy uveL fv u2 vsão obtidas mediante
como nos caPítulos anteriores'
onúmerodocantodecadacélularepresentaoprodutofuxuY,emquefé
em cada linha, está indicada na
a freqüência dessa célula. A soma desses números,
indicada na última linha
última coluna da mesma. sua soma, em cada coluna, está
coluna, são iguais e repre-
da mesma. os totais finais, da ú1tima linha e da última
sentam Lfuxuy.
384 Estatística Cap. 14
Tabela 14.9
Graus em Matêmática. X
94,5 2 2 4 4 10 20 40 44
n k
84,5 4 6 5 16 16 tb 31
d ls ,4
.9
.9
I
74,5
E
o
0 10 I 1 24 0 0 0
d
t, m to to
64,5 4 I 5 2 -21
l7 ,i lo= 5 li
21 21
54.5 2 3 6 6 2 17 -34 68 20
w fr t,
44,5 3 5 4 12 108
1Í 4
íx ux -14 -15 0 40 30 L* ux
=64
;o
uí 2Í, ul ^§'"í"*
f* 28 0 80 90 Cr"
= 236
_
N Zfux uv - (Zfx uil (ZÍy uv)
r/ 1nt:6 ,2 x - (zÍx uil2ltN zyr7 , _ 1yr;7, -
(100) (12s) _ (64) (_ss)
! lrrooi e36t - (64)21 t(100) (2s3) - (-ss)21
16,020
-_F-=u./uôo.
li (19.504) 122.215)
Cap. 14 Teoria da correlaçõ,o Sg5
Solução
(o) De acordo com o Problema G(o) do Capítulo 18, a reta de regressão de y
paraXtemaequação:
Solução
e l1(b),
r!
De acordo com os Problemas l4(a) a1 =
"
b., = "4
Correlação ordinal
16. A tabeia seguinte indica de que modo 10 estudantes, dispostos em ordem
nas aulas
alfabética, foram classiÍicados àe acordo com seus aproveitamentos
de laboratório e de exposiçáo de um curso de biologia.
Determinar o coeficiente
de correlação ordinal.
Lsboratório 8 3 9 2 7 10 4 6 i 5
10 I 8 1 3 4 2 6
Exposição 9 -5
Solução
A diferença das classes, D, em laboratório e exposição' para cada estudante'
é
e ZD2'
apresentada na talãia seguinte. Dela constu-, iu"'úém'-D2
2
Diferenças de -1
a
-1 1 -l 3 -1 -1
classes, D
4 I 9 1 4 1 I ZD2 = 24
D2 1
1
Então:
6LD 6(2-41
rordinal = 1 -
lf 1lf, _ fy =' -1O(10;,_ 1)
=0,g545,
aulas de
o que indica que há uma relação acentuada entre os aproveitamentos nas
Iaboratório e de exPosição.
1e
17. calcular o coeÍiciente de correlação ordinal para os dados do Problema
compará-lo com os resultados obtidos por outros métodos'
Solução
pais são:
Dispostos em ordem crescente de grandeza os pesos dos
(1) 62,63,64,65,66,67,67,68,68,69, 70,71'
Comoosextoeosétimolugaresdesserolapresentamosmesmospesos
(67 kg), atribuem-se-lhes a ordem méd,ia 6,5. De modo semelhante, atribui-se a
Cap. 14 Teoria da correlaçã,o
(4) 1,5, r,5, 3,5, 3,5, 5, 7,5, 7,5, 7,5, 7,5, 10, 11, t2.
Usando-se as correspondências entre (1) e (2) e entre (B) (4),
e aTabela 14.1
do Problema 1 torna-se:
D _1 §
t,5 ?5 35 -1 5 1,5 )\ ,0
-1,5 -1.0 -l,5 -)5
D. 12,25 ))\ 1,00 ) )\ ') )\ 6,25 t2,25 1) )< 12,25 ) )< 6,25 1.00 LD2 72.50
=
Então:
Correlação não-linear
18' §ustar uma parábola-de mínimos quadrados da forma y
seguinte conjunto de dados.
- oo + a1x + a2x2 ao
388 Estatística CaP. 14
Tabela l4.LO
Solução
As equações normais são (veja o Capítulo 13):
Asoperaçõesnecessáriasaocálculodassomaspodemserdispostascomo
na Tabela 14.71.
Tabela L4.ll
porque N = 8:
Então, as equações normais (1) tornam-se,
Solução
Para X = 1,2, Yest = 2,588 + 2,065(L,2) 0,2110(1
- ,2)2 = 4,762. Obtém_se, de modo
semelhante, outros valores estimados. Os resultados estão indicados
na Tabela
l4.L2,juntamente com os valores reais de y.
Tabela 14.12
I.rt 4,762 s,621 6,962 7.640 7,503 6,613 4.74t ), 2,561
Y 4,5 5,9 7,0 '7
7,8 '.' 6.8 4,5 )7
Solução
(o) Mediante a utilização dos cálculos anteriormente obtidos
na Tabela 14.11
do Problema 18, tendo-se ainda em vista que X y2 2g0,52, encontra_se:
=
Nr,xY_(rDGr4
=
DeacordocomaTabelaL4.L2d'oProblemalg,avariaçãoexplicada=
= X(Yest -Y2 = 21,02'
Portanto:
',z _
variaEão-explic4da
=
W*= 0,9g22 e, r = 0,9911 ou 0,99.
variaçào total 21 '4O
Solução
Desejamos decidir entre as hipóteses: Ho : P = 0 e Íít
: p > 0'
r_,.^[N-2=@=
Í= r.35.
ú_7=filrr_,..
(o) com base em um teste unilateral da distribuição de student, no nível
0,05,
(18 - 2) = 16 graus de
rejeitar-se-ia Hs quando t > to,s1.=.1,75, para
liúerdade. portanto, não se pode rejeitar Hs no nível0,05'
(ó) Como não se pode rejeit at Hg, no nível 0,05' certamente não se
pode
rejeitá-lo no nível 0,01.
Cap. 14 Teoria da corcelaçdo Sg1
22' Qual é o tamanho mínimo de amostra necessário para que se possa concluir
que um coeficiente de correlação de 0,32 difere significaiiv"-"r,t"
de zero no
nível de 0,05?
Solução
No nível 0,05, mediante o emprego de um teste unilateral da distribuição
de
Student, o valor mínimo de N deve ser tal que:
oJ2.íN-2
-r: to,g1, paraN-2 graus de liberdade.
\ I - (0.32) ,=
Para um número infinito de graus de liberdade, to,g5 1,64 e, portanto,
N = 25,6. =
Solução
NoníveldesigniÍicância0,0S,medianteoempregodeumtesteunilateral
,ro*rri.i-rã:àitrr-r"-ia a hipótere ,orrrerrt" q*ando z fosse
maior do
da distribuiçao
que 1,64. Dessa for*á t" pode re;eitar a hipótese de que o coeÍiciente de
"áo quanto 0'60'
áo.""fâçao populacional seja tão pequeno
(b)Parav=0,50,*z=L,L513Iog3=0'5493e2=(0'9730-0'5493y0'2182=7'94'
Entáo,pode-serejeitarahipótesedequeocoefrcientedecorrelaçãopopula-
nível de signiÍicância 0'05'
cional seja táo p"qo""o q"u'to p = 0'50' no
em física e matemática, de
24. O coeÍiciente de correlação entre os graus finais,
0,80. Determinar os limites de
como
um grupo ae Ziestuduriu., foi calcuiãdo
conÍiança de 957o desse coeficiente'
Solução
Como r = 0,80 e N = 21, os limites de confianç a de 957o de p7 são dados por:
(t+r\r .^.f I )
r,oolffi,)= r.0e86 +0.4620.
Z+ t.e6.,z= r.r5r3 roc[fr_
Jt
Entáo,lt1lemointervalodeconÍiançade957ode0'5366a1'5606'
de tamanhos N1 -- 28 e N2 =
25. Dois coeficientes de correlação, obtidos de amostras
0,30, respectivamente' Haverá
= 85, foram calculados coÍro 11 = 0,50 ê 12 =
umadiferençasignificativaentreosdoiscoeÍicientes,nonível0,05?
Solução
/t+rr) 0.S+gr. Zz t,l5 l3 log /l+r2) l= 0'3095-
Zr = t.t5 l3''"'['_
log I l= = I('-")
-' ")- -
Cap. 14 Teoria d,a correlaçã,o 393
ozt-Zz = = 0,2669
Solução
at-At .'lU-Z 0.476-
/=--sy y/sy
. 0. I 80
vll-2=l'95'
-
=
128/23,6 ^fl,
porque sy.x = L,2B (calculado do problema4) e rx=rf(íi2VN =.,[Eí,6g/12 =
= 2,66.
Com base em um teste unilateral da distribuição de Student, no
nÍvel 0,05,
rejeitar-se-ia a hipótese de que o coeficiente de regreÁsão é inferior a
0,1g0 se ú >
> .to,gs = 1,81, para (72 - 2) = 10 graus dê liberdade. por conseguinte, não pode
se
rejeitar a hipótese.
Solução
istoé,seestágsvoconftantedequeAlestácompreendidoentre0,136e0,816.
2g.NoProblemal,determinaroslimitesdeconfiançadegSToparaospesosdos
(b) 70 kg'
filhos, cujos pais pesam: (o) 65 kg;
Solução
ComoÍ0.95=2,23,paraer2-2)=l0grausdeliberdade'oslimitesdeconÍiançade
957o para Y, são dados Por:
(xo - X)2
YoÍí-r"'
2.23
N + 1+ SX2
Solução
!-omo
to-,ss-ls = 2,23, para 10 graus de liberdade, os limites de confian gSVo
Y, ça d,e para
são dados por:
em que Yo = 35,82 + 0,476Xs (problema l), sy. x = L,2g, sX = 2,66 (problema 26).
(a) ParuXo = 65, encontram_se [comparar com o problema
2g(a))os limites de
conÍiança de gívo, (66,76 + r,o7) kg, isto é, pode-se estar gSvo
conÍiante de
que o peso médio de todos os filhos, cujos pais pesam
65 kg, estará com_
preendido entre 65,7 e 6T,g kg.
(á) ParaXo = 70, encontram-se lcomparar com o problema
Zg(b)los limites de
confiança de gSVo (69,14 + 1,45) kg, isto é, pode_se estar gSVo
confiante de
que o peso médio de todos os- filhos, cujos pais pesam
70 kg, estará
compreendido entre 67,7 e 70,6 kg.
(b)DeterminararetaderegressáodemínimosquadradosdeYparaX.
(c) Determinar a linha de regressão de mínimos quadrados de X para Y'
(d) Representar graÍicamente as duas retas dos itens (á) e (c) no diagrama de
dispersão do item (o).
Resp.: (ó) Y= 4 + 0,5X. (c) X = 2,408 + 0,612Y'
8 '7 6 10 4 9 7
Grau do primeiro 6 5 8
teste (X)
1 1 10 5 8 10 6 8 6,
Grqu do segundo 8
teste (Y)
Y, de 12 mulheres
31. A tabela seguinte indica as idades, X, e as pressões arteriais, '
(á)DeterminaraequaçãoderegressãodemínimosquadradosdeYparaX.
(c) Estimar a pressão arterial de uma mulher de 45 anos'
72 36 63 41 55 49 38 42 68 60
Idade (X) 56 42
t25 160 118 t49 128 150 145 115 140 152 155
Pressão arteriql 141
(Y)
x 2 4 5 6 8 l1
v 18 t2 10 8 1 5
Alturas X(metros)
45- 54,5 2 1
8 4 2
55- 64,5 1
15 22 7 1
t>.
bo
65- 75,5 5
t2 63 r9 5
75- 84,5 2
0 12
7 28 32
0
0,)
85- 94,5 ,7
2 10 20
95-104,5
4 2
105-114,5
Resp.: 0,5402.
quadrados de Y para X'
40. (o) Determinar a equação de regressão de mínimos
pesos de dois homens, cujas
fár" o. dados protlema anterúr. (ó) Estimar os
do
àItrrtu. são 1,63 e 1,83 metros, respectivamente'
Resp.'. @)Y = 0,0846X - 1,626, (b) 73'35 e 86'67 '
Correlação ordinal
8 candidatos
41. Dois juízes de uma disputa, em que foram solicitados a classificar
indicadas na tabela
na ordem de suas pre-ferências, propuseram as escolhas
ordinal e decidir se os juízes
seguinte. Determinar o coeficiente de correlação
bem concordantes em suas escolhas'
".fir"ru*
pTilnsiyo Juiz
Resp.: (o) - 1.
Cap. 14 Teoria da correlaçao
Correlação múltiPla
O grau de relação existente entre três ou mais
variáveis é denominado correlaçdo
da correlação
múltipla. Os prircifio.-i""au-entais implicados nos -problemas
no Capítulo 14'
*Uttiptu ,ao trratogás aos da correlação simples' estudados
400
Cap. 15 Corelaçdo parcial e múltipla 401
em que btz. I e árg 2 são obtidos mediante a resolução simultânea das equações
Xt )2
§1 23= "r, (6)
em que X1 est indica os valores estimados de X1, calculados por meio das equações
de regressão (1) ou (5).
-2 .
Rt.23= 1--,rl 2.1
(8)
§i1
§1-
Rr z:=\@
y | - rzt
(e)
[ )', )',
obtidas da Equação (5), usando os resultados r32 = r2g; r1t = rr1; r2t - rt2.
vamente, para a determinação de ó1 . %4; bn 84; btg. 24e bt4. 28 Que, substituídos
em (11), dá a equaçõ,o de regressã.o de mínimos quadrados d,e X1 para X2, X3 e Xa.
Ela pode ser escrita sob forma semelhante à da Equação (5) (veja o Problema 33).
Correlação parcial
É importante, freqüentemente, medir a correlação entre uma variável dependente
e uma independente particular, quando todas as outras implicadas se conservam
constantes, isto é, quando se removem os efeitos de todas as outras variáveis
(situação freqüentemente enunciada pela frase: "todas as outras coisas sendo
iguais"). Isso pode ser obtido pela deÍinição de um coeficiente de correlação parcial,
como o da Equação (12), do Capítulo 14, exceto que se devem considerar as variações
explicadas e não-explicadas que surgem, tanto com a particular variável inde-
pendente como sem ela.
Representando-se rL2. a o coeficiente de correlação parcial entre Xy e X2,
conservando-se X3 constante, verifica-se que:
rt2- rBr23
'f - J -
(12)
\(l-r13t(l
-l
-
)
-,'2zt)
De modo semelhante, se r12.g4 é o coeficiente de correlação parcial entre
X1 e X2, conservando-se Xg e X4 constantes, então:
rD.4 - rn.4123.4 r12.3 - r11.3124.3
( 13)
e -r1+ 3)(t - 1L+.2)
Esses resultados são úteis porque, por meio deles, qualquer coeficiente de
correlação parcial pode ser, finalmente representado em termos dos valores de r12,
r2B etc. (isto é, d.os coeficientes de correlaçõ,o de ordem zero).
são as equações de regressão linear de X1 para X2, XB, Xa e de X4pata X1, X2 e Xg,
respectivamente, então
(veja o Problema 15). Isso pode ser tomado como ponto de partida para uma definição
de coeficientes lineares de correlação parcial.
PROBLEMAS RESOLVIDOS
Tabela 15.1
(xr) 64 11 53 61 55 58 51 56 51 76 68
(xz) 51 59 49 62 51 50 55 48 52 42 6l 51
(x:) 8 10 6 11 8 7 10 9 10 6 l2 9
Solução
(o) A equação de regressão linear de x1 para x2 e x3 pode ser escrita sob a
forma
Xt = bt .zz + bo.lXz + bn'zXz
As equações normais de mínimos quadrados são
í sv- 4 ztN + b12 ' 3ZX2 + b3 ' 2LX3
(l)],xtxz- bt.zzLX2+ bn.3»x? + bn'z»x2x3
|t' »X' X, = bt zz»X3 + bo.tLX2X3 + bB. 2»,X?
As operações necessárias para o cálculo das somas podem ser dispostas
como na Tabela 15.2. Embora a coluna encabeçad.a por Xl não seja presentemente
necessária, ela foi acrescentadapara emprego futuro.
Tabela 15.2
Como referência a outro método que evita a resolução das equações simul-
tâneas, veja o Problema 4.
(á) Por meio da equação de regressão (3), obtém-se os valores estimados de X1,
designados porXl mediante a substituição dos valores correspondentes
""1,
de X2 eX3. Por exemplo, fazendo-se em (3), Xz = 57 ê X3 = 8, determina-se
Xt est = 64,4L4'
De modo semelhante obtém-se os outros valores estimados deXl que estão
relacionados na Tabela 15.3, juntamente com os valores amostrais de X1.
Tabela 15.3
X1"., 54.414 59,13( 54.564 73.206 59,28( 56,92: 55,117 i8.229 53,153 48.582 73.851 55,92C
X1 64 71 53 67 55 58 77 57 56 51 76 68
2. Calcular os desvios padrões (o) s1; @) s2 e (c) s3, para os dados do Problema 1.
Solução
(o) A quantidade s1 é o desvio padrão d.a variável X1. Então, usando-se a
Tabela 15.2 do Problema 1(o), determinam-se, pelos métodos do Capí-
tulo 4.
Cap. 15 Correlaçõ.o parcial e múltipla 409
= 8,6035 ou 8,6
(b)",=!-tf'-[,
1,";
)=
I ,n*, (un \'
^y'-i#-IHJ =
= 5,6930 ou 5,7
3. Calcular: (a) rn; (ó) rrs e (c) r2g, para os dados do Problema 1.
Solução
(o) A quantidade r12 é o coeficiente de correlação linear entre as variáveis X1
e X2, e sendo ignorada a variável Xg. Então, pelos métodos do Capítulo 14,
tem-se
= 0,8196 ou 0,82
(á), (c). Usando-se as fórmulas correspondentes, obtém-se r1g = 0,7698 ou 0,77
Q r2g = 0,7984 ou 0,80'
Solução
A equação de regressão de X1 para X2 e Xg é, multiplicando-se ambos os membros
da Equação (5), por s1
.1,,
(r) xy = ('tz- t] +( -
rtt'zt'lI
*2
rtt rt2::l1.',
I l-,Í, )\'z) l. t-,h .,J Ir:J
em que xt = Xt -Xl, x2 = X2 -Xz, xg = Xs -Xt. Usando os resultados dos Problemas
2 e 3, a Equação (1) torna-se
.rr = 0,8546x2+ 1.5063x3
ComoX, =
# =E = 62,750,Xr=*= 5B,58B,Xs = 8,888 (da Tabela
15.2 do Problema 1), a equação desejada pode ser escrita sob a forma
Solução
Na equação de regressão, obtida nos Problemas 1(o) ou 4, vê-se que a resposta para
@) é0,8546 ou, aproximadamente,0,9 e para (ó) é 1,5063, ou cerca de 1,5.
6. Mostrar que as Equações (3) e (a) provêm das expressões (1) e (2) deste capítulo.
Solução
Na primeira das Equações (2) obtém-se, mêdiante a divisão de ambos os membros porN.
(l) Xt = br.23 + bn tXz * brt zXt.
Subtraindo-se esta equação da (1) obtém-se:
(3) Irl xz= brz 3:.r22 +brt zLx24+N X2lbt zt+ brz tXzlbt3.2X3-Xtl
Solução:
Na Tabela 15.3, do Problema 1(ó), tem-se
= 4,6447 ou 4,6.
Solução
Primeiro método: De acordo com os resultados dos Problemas 2@) e 8 tem-se
Rt.23= , - g,a++t 12
' (81035 É
Segundo método: De acordo com os resultados do Problema B.
Cap. 15 Conelaçã.o parcial e múltipla 413
Rt.23= - ZrtZr13r23
Solução
O coeficiente de determinação múltipla de X1 por meio de X2 e de X3 é
R? zs = (0,8418)2 = 0,7086,
utilizando o resultado do Problema 9. Em conseqüência, cerca d.eTLVo da variação
total de X1 são explicados pelo emprego da equação de regressão.
Solução
- ZrLZrtyr2g
(a) R2. 1s =
qo
rlB+rZZ-Zr12r1Zr2B
(ó) ,Es t2 =
T
(0,7698)2 + (0,7984)2-2(0,8196) (0,7698) (0,7984)^ ^^
= 0,8234.
Solução
2rprp r23
(l)Rr.zr=
)) rn-
t'p* Zrnt'13r23
(2) R2.B=
Solução
Pela Equação (1) do Problema 12, R1 . 2s será' nulo se e somente se
22 rta
Rz.te= =
r2B - o
1 - ris
Correlação parcial
14. Calcular os coeficientes de correlação parcial linear (a) ru a; (ó) rts . z; k)
r2B r, para os dados do Problema 1.
Solução
rD - rBr23 rl3 - rnr23
it2 . 3 =,t.:::-:::::T-' . ; rs . 2 =
\ (l rr:)(l - - r23') {tr - ,?z)0 - rr2z)
r23 - rtzrn
'/\ ' !tl - riz)(l - r'Í:)
L-------------
'
Solução
Aequação de regressão deXl paraX2eX3pode ser escrita sob a forma [veja a Equação
(5)t.
.}
il) xr - x, =f'tz-'t1'ztl f: 62 - x2y +
[ ' -'i, )\'z )
( ,'rJ - rt2rB ) í ,, \
+l ll_ l(1.j-xj).
[ .'-"''z J(.':/
Aequação de regressão deX3 paraX2 eX1 pode ser escrita sob a forma [veja
a Equação (10)1.
rryrnl
ot x3 - x, =frn.- l: I (xz -*z) +
[ '-'í' J[",/
--'71i"
.1
. (xr - Xr).
["',
( "i [:: ]
De acordo com as expressões (1) e (2), os coeficientes de X3 e X1 são,
respectivamente,
. z=l(rt1-rt2rzs)ísr'\
bn
rl} - r2\rl .J í'e )
- 2 ll^- Ieb1t.2=
I t-';' ,["3,/
o
L - r72 [" ]
Então, brc.zbs .z
( rre - rnrzy)2 rt1 2. = y2t z
=
(1 -r\ilG-,?z)
16. Se r12 . g = 0, Provar que
(a) rn
(b) rzs
Cap. 15 Correlaçdo parcial e múltipla 417
Solução
r12 rt\rz\
^
se r12 3 = ^m= - 0, tem-se rl2= rl3r23,
\(I-r13)(I-r2s)
rt} - rt2 r2g rr3 - (rrg rzz) rzg
(a) rts.2=
ffi= {tr - rlilG - rzze)
.)
r13\L - r23)
!tt - r1ilG - ríe)
(ó) Alternam-se os índices 1 e 2, no resultado do item (a).
Solução
Generalizando-se o resultado do Problema 6, pode-se escrever a equação de regres-
são de mínimos quadrados de X1 para Xz, Xa e X4 sob a forma
418 Estatística Cap. 15
(1) rr = bt1t . g4fr2 + bfi ZqilS + bu . ZBx4, emqlue b9 . 54, bt1 Z+e bU . zz
podem ser obtidos das equações normais
Zx22 = Ns22 = 5.000 zx1x2- Nsr s2rt2= 9.000 Zx2xs- Nsz sBr2B - 2.100
2x32 =Nsf = 1.800, xyx,g=Ns1s3rre = 4.500 Lx2x4-Nsz s4124= 4.200
4
Uma solução exata do sistema (2) conduz a bB sa, --
ã
, bt} 24= 0e
5
bu.zz = g , de modo que a equação de regressão pode também SE r escrita sob a
forma
(5) Xr =23 +
45
,Xz+ ,X+'
É inte.essante notar que a equação de regressão não inclui o escore em
português, isto é, X3. Isso não significa que os conhecimentos de alguém em
português não tenham importância sobre o aproveitamento em estatística. Ao
contrário, isso significa que a necessidade de português, no que diz respeito à
previsão do grau de estatística, está amplamente evidenciada pelos escores alcan-
çados nos outros testes.
Cap. 15 Corcelaçd.o parcial e múltipla 419
Solução
rt2 - rt4r24 rtg * rL4rB4
h), (b) rtz . 4 = 'r73 4=
{ rt - r1+)G - rà+) r/tt-r?àÍ-rlq)
r24r34
t'23.4=ffir2B -
Introduzindo-se os valores do Problema 17, obtém-se
rt2 4 = 0,7935, rtl +=0,2215,r28. 4=0,2797. Então,
rtz. 4 - r1B. 4r2A 4
rt2.84=
1(1 - ris. +)(l- rí . +)
rt} 4-r12.
r].s.24= = = 0,0000
(1 -r"rz.à(l- rZs a,)
rt4.2B=#=0,4193
\(1 -r?.ilO-rZ s)
Solução
h) O primeiro membro de (1) foi calculado no Problema 18(o), tendo-se obtido
o resultado 0,7874. Para calcular o segundo membro de (1), usam-se os
resultados do Problema 18(c) e obtém-se, ainda, 0,78L4. Dessa forma, a
igualdade prevalece neste caso especial. Pode ser demonstrado direta-
mente, por meio de processos algébricos, que a igualdade prevalece, de
modo geral.
(ó) O primeiro membro de (1) é rtz g4 e o segundo é rp 4. Como ry2 . 34é a
correlação entre as variáveis X1 e X2, quando Xg e Xa são mantidas
constantes enquanto rtz . 48é a correlação entre XyeX2quando X4 e são
mantidas constantes, é evidente, imediatamente, a razáo pela qual a
igualdade permanece válida.
20. Determinar (o) o coeÍiciente de correlação múltipla, Rt . 2B4e (ó) o erro padrão
da estimativa s1 . 2s4, para os dados do Problema 17.
Solução
(a') 7-R?.zsa,= (1- 1212)(l-r2LB.2 )(1- r? ze)ou.Br .284= 0,9310
como r12 = 0,90, de acordo com o Problema 17, ry4 . zs = 0,4193, de acordo com o
Problema 18(c), e
Outro método -
PROBLEMAS SU PLEMENTARES
X1 J 5 6 8 t2 t4
X2 l6 l0 7 4 3 2
Xj 90 72 54 42 30 t2
Discutirocâsor=l. \1+r
28. Se,R1 .28=0, provarquelr23 l> lrpl e lr2gl> lr13 le interpretar.
Correlação parcial
29. Calcular os coeficientes de cor:relação parcial linear (a) rn s, (ó) rrz . 2 e (c) rzs . t,
para os dados do Problema22 e interpretar as respostas.
32. Ser12.B = l,mostrarque(o) lr..e z I ; (ó) I rn. t | ; (c)Er zs=L; (d)sr.28 =0.
Cap. 15 Cotelaçdo parcial e ntúltipla 423
Séries temporais
Uma série temporal é um conjunto de observações tomadas em tempos deter-
minados, comumente em intervalos iguais.
Exemplos de séries temporais são a produção total anual de aço no Brasil,
durante um certo número de anos, o valor diário de fechamento de uma determinada
ação na Bolsa de Valores, as temperaturas horárias anunciadas pelo serviço meteo-
rológico de uma cidade e o total mensal das notas de venda de uma loja de depar-
tamentos.
Matematicamente, uma série temporal é definida pelos valores Y1, Y2, ...
de uma variável Y (temperatura, valor de fechamento de uma ação etc.), nos tempos
tt, t2, ... Portanto, Y é uma função de ú simbolízada por Y = F(t).
424
Cap. 16 Aná,lise das séries temporais 425
100
90
80
at
E70
(D^
fi,H
v-c
uo
o=
9E 50
EE
CV
40
REBANHO ANIMAL
.=
z 30 dos ESTADOS UNIDOS
1870-1960
20
10
(Fonte: Ministério da Agricultura)
1 870 1 880 1 890 1900 1910 1920 1930 1940 1950 1960
Ano
Figura 16.1
t
(a) Tendência a Longo (b) Tendência a Longo Prazo e (c) Tendência a Longo Prazo,
Movimento Cíclico Movimentos Cíclicos e
Estacionais
Figura 16.2
defi.ne-se uma média móuel de ordem N, a que é obtida pela seqüência das médias
aritméticas
Y1+ Y2+...+ Í,n7 Y2+ Y3 +...+ Í1u' * 1
NN
Y3+ Ya+...+ Y7'1 a2 (3)
Exemplo 1. Dados os números 2, 6, 1, 5, 3,7 ,2, urna média móvel de ordem 3 será
dada pela seqüência
2+6+ 1 6+1+5 1+5+3 5+3+7
B'B'B'B
,+t , isto é, g,4,8,5, 4.
cada número da média móvel sendo a média dos 3 números imediatamente acima
dele.
Estimação da tendência
A estimação da tendência pode ser obtida de várias maneiras possíveis.
1. O método dos mínimos quadrados do Capítulo 13 pode ser usado para
determinar a equação de uma reta ou curva de tendência apropriada. Pode-se
calcular, por meio dessa equação os valores 7 da tendência.
2. O método a sentimento, que consiste no ajustamento de uma reta ou
curva de tendência, mediante a simples inspeção do gráfico, pode ser adotado para
a estimação de 7. Entretanto, ele apresenta a desvantagem evidente de depender
consideravelmente do critério individual.
3. O método das médias móveis. Mediante o emprego de médias móveis
de ordens apropriadas, podem ser eliminadas as variações cíclicas, estacionais e
irregulares, conservando-se, dessa forma, apenas o movimento de tendência.
Uma desvantagem desse método é que desaparecem os dados do começo e
do fim da série. Dessa forma, no Exemplo 1 parte-se de 7 números e, tomando-se
uma média móvel de ordem 3, chega-se a 5 números. Outra desvantagem é que as
médias móveis podem gerar movimentos cíclicos, ou de outra natureza, que não
existem nos dados originais. Uma terceira desvantagem é que as médias móveis sáo
fortemente afetadas pelos valores extremos. Para superar de certo modo essa
desvantagem, usa-se, às vezes, uma média móvel ponderada, com pesos apropria-
dos. Nesses casos, ao item central (ou itens) é atribuído o maior peso e aos valores
extremos os menores.
4. O método das semimédias consiste em separar os dados em duas
partes (de preferência iguais) e determinar a média de cada uma, obtendo-se, dessa
forma, dois pontos do gráfico d.as séries temporais. É desenhada, então, uma reta
Estatística Cap. 16
de tendência entre esses dois pontos e os valores da tendência podem ser deter-
minados. Os valores da tendência podem também ser determinados diretamente,
sem o emprego de um gráÍico (veja o Problema 5).
Embora este método seja de aplicação simples, ele pode conduzir a resul-
tados medíocres, quando usado indiscriminadamente. Também somente é aplicável
quando a tendência é linear ou aproximadamente linear, embora possa ser estendido
aos casos nos quais os dados são fragmentados em várias partes, em cada uma das
quais a tendência é linear.
cíclicas e irregulares, especialmente quando elas são grandes. Esse fato pode
representar uma desvantagem importante deste método.
3. Método da média móvel percentual ou da relação entre as médias
móveis. Neste método, calcula-se uma média móvel de 12 meses. Como os resulta-
dos assim obtidos caem entre meses sucessivos, em vez de no meio de um deles,
como ocorre com os dados originais, calcula-se a média móvel de 2 meses daquela
de 12 meses. O resultado é freqüentemente denominado média móuel centrada de
72 meses.
Previsão
As idéias apresentadas podem ser usadas como auxílio no importante problema da
preuisã,o de séries temporais. Entretanto, deve-se compreender que o tratamento
matemático dos dados não resolve, isoladamente, todos os problemas. Conjugada ao
bom senso, à experiência, à habilidade e ao bom julgamento do investigador, essa
análise matemática pode, não obstante, ser valiosa para a previsão tanto a longo
como a curto prazo.
PROBLEMAS RESOLVIDOS
Resp.: estacional.
(d) A necessidade de aumentar a produção de trigo devido ao acréscimo
constante da população.
Resp.: a longo prazo.
(e) Número mensal de cm da precipitação da chuva, em uma cidade, durante
um período de 5 anos.
Resp.: estacional.
Médias móveis
2. Para os dados da Tabela 16.1, construir uma (o) média móvel de 5 anos; (ó)
média móvel de 4 anos; (c) média móve1 centrada de 4 anos'
Tabela 16.1
Anos 1968 t969 t910 t97 I 1912 r913 191 4 r91 5 t9'7 6 1917 t918
Varidvel 50,0 36,5 43,0 44,5 38,9 38.1 32.6 3 8,7 41,'l 41,t 33,8
Cap. 16 And.lise das séries temporais 435
Solução
(a) Recorra-se à Tabela 16.2.
Tabela 16.2
1968 50,0
t969 36,5
tgt0 43,0 2t2,9 42,6
191 1 44,5 201,0 40,2
t972 38,9 t91,1 39,4
1973 38,1 t92,8 39,6
t91 4 32,6 190,0 38,0
191 5 38,7 192,2 38,4
197 6 4t,1 181.9 37,6
t917 4t,t
tgt8 33.8
Os totais móveis de 4 anos são obtidos como no item (o), exceto que são
somadas 4 casas da coluna 2, em vez de 5. Note-se que os totais móveis estão
centrados entre os anos sucessivos de modo diferente ao do item (o). Este será
sempre o caso quando um número par de anos for tomado para a média móvel.
Considerando-se que 1969, por exemplo, começa em 1e de julho, o primeiro total
móvel de 4 anos é centrado em 1e dejaneiro de 1970 ou em 31 de dezembro de 19Gg,
436 Estatística Cap. 16
Tabela 16.3
1968 50,0
t969 36,5
114,0 43,5
t970 43,0
162,9 40.1
197 I 44,5
164,5 4l I
r972 38,9
t54,1 38,s
1913 3 8,1
148,3 31 1
191 4 32,6
15 1,1 31,8
197 5 38,1
154,1 38,5
1916 41,7
155,3 3 8.8
1977 4l,l
t918 33,8
Se, agora, se calcular o total móve1 de 2 anos das médias móveis de 4 anos,
os resultados estarão centrados nos anos desejados.
Cap. 16 And.lise das séries temporais 437
Se, agora, se calcular um total móvel de 2 anos dos totais móveis de 4 anos,
os resultados estarão centrados nos anos desejados.
Tabela 16.4
1968 50,0
1969 36,5
43,5
1970 43,0 84.2 42
40,1
191 I 44,5 8l 8 40,9
41 ,1
Tabela 16.5
1968 50,0
t969 36,5
t74,0
1910 43,0 336,9 42,1
162,9
191 I 44,5 321,4 40,9
164,5
t912 38,9 318,6 39,8
154,1
1973 38,1 302,4 37,8
r48,3
197 4 7)6 )qa 4 31,4
151,1
197 5 38,7 305 2 38,2
154,1
1916 41,1 309.4 38.7
155,3
r977 4l,t
1918 33.8
Solução
Sejam YbY2,...,Ytt os valores correspondentes aos anos 1968, 1969,..., 1978,
respectivamente. Então, procedendo-se como no segundo método do Problema2(c),
obtém-se a Tabela 16.6.
Cap. 16 Andlise das séries temporais 439
Tabela 16.6
1968 Y1
1969 Y2
Y1+Y2+Y3+Ya
t91 t Ya Y2+2Y3+ZYq+2Y5+2Y6
I fr, * 2Y3 + 2Ya + 2Y5 + Y6)
Y3+Ya+Y5+Y6
t912 Y5 Y3+2Ya+2Y5+2Y6+Y7
I tr, * 2Ya+ 2Y5 + 2Y6 + Y7)
Y4+Y5+Y6+Y7
t913 Y6
t978 Ytt
Esse método pode ser usado para obter os resultados do Problema 2(c). Por
exemplo, a primeira casa (correspondente a 1970) é:
(1) (50) + (2) (36.5) + Q) @3) + (2) (44,5) + (1) (38,9)
= 42,1
Solução
O gráfico dos dados originais está representado na Figura 16.3, por meio de uma
Iinha cheia. O da média móvel está representado pela linha tracejada.
360
o
o
P,
'F(Ú
so
CE
Fã
-C
+o
oo
r(§ P
o330
I
o-
(x)C'roN(f)SIr)(Or\@
(o (c| N N l'- l'-
ó o) o) o) o, o) F-
o) I'-
o) l'=
o) F*
o) l]-
o)
Ano
Figura 16.3
Note-se como a média móvel suavizou o gráfico dos dados originais, indi-
cando claramente a linha de tendência.
Uma desvantagem da média móvel é que são perdidos os dados do início e
dofim da série temporal. Isso pode ser sério, quando a quantidade de dados não for
muito grande.
Estimação da tendência
5. Obter os valores da tendência, para os dados do Problema 2, emptegando o
método das semi-médias, em que os valores médios adotados forem (a) a média,
(ô) a mediana.
Cap. 16 Andlise das séries temporais 441
Tahela 16.7
Tabela 16.8
Anos 1968 1969 1910 t97r 1972 1973 1914 1915 1916 t911 1978
Valor da
tendêncis
44,3 43,4 42,6 41,8 40,9 40,t 39.3 38,5 37,6 36,8 36,0
Tabela 16.9
Anos 1 968 1969 1970 t91 1 1912 1973 191 4 t91 5 t97 6 t911 t978
Valor da 44,4 43,1 43,0 42,3 4\,6 40,8 40,t 39,4 38,7 38,0 ?'7 )
tendência
Solução
(o) Neste método, simplesmente construir-se-ia, no gráfico do Problema 4,
uma reta ou curva que se aproximasse estreitamente dos dados fornecidos.
Nesse gráfico seriam lidos, então, os valores da tendência.
(ó) Mediante o uso de uma média móvel de 5 anos, viu-se (Problema 4) que os
dados da série temporal foram consideravelmente suavizados. Podem ser
usadas as médias obtidas como os valores da tendência, para os anos de
l97O a 1976. Em conseqüência, de acordo com o Problema 2(o), viu-se que
os valores da tendência, correspondentes a 1970, 7971,1972 etc., sáo 42,6;
40,2;39,4 etc. ... Por meio deste método, entretanto, não se dispõe dos
valores da tendência para os anos de 1968, 7969, L977 e 1978. Se eles são
desejados, podem ser obtidos, por extrapolação, no gráÍico do Problema 4.
7 . (o) Usar o método dos mínimos quadrados para ajustar uma reta aos dados do
Problema 2.
(ó) A partir do resultado do item (a), determinar os valores da tendência.
Solução
(o) Emprega-se o método do Problema 10 do Capítulo 13.
Cap. 16 Anó.lise das séries temporais 443
Tabela 16.10
Anos X Y x2 XY
Tabela 16.11
Anos l 968 1969 t910 t9l 1 1972 t973 t97 4 191 5 t9t6 tgll t918
Valor da
43.7 43,0 4)) 4t,4 40,1 39,9 39.1 38,4 37,6 36,8 36. l
tendência
Tabela 16.12
lan. Fev. Mar. Abr. Mai. Jun. lul. Ago. Set. 0ut. Nov. Dez,
191 5 318 28t 278 250 23t 2t6 223 245 269 302 325 347
t91 6 342 309 299 268 249 236 242 262 288 32t 342 364
1971 361 328 320 287 269 251 259 284 309 345 361 394
tgl8 392 349 342 311 290 273 282 305 328 364 389 411
t979 420 378 370 334 314 296 305 330 3s6 396 422 452
1 980 453 4t2 398 362 341 322 335 359 392 421 454 483
198 1 487 440 429 393 370 341 351 388 4t5 457 49t 516
t982 529 477 463 423 398 380 389 419 448 493 526 560
(á) As médias totais e mensais (média aritmética), para os anos de 1975 a7982,
são as que se seguem.
(ú
o 600
c
tt 500
E
(ú
E 400
o
-Y 300
(I)
E 200 ENERGIA ELETRICA PARA ILUMINACÃO DE
a RUAS E ESTBADAS NOS ESTADOS ÜNIDOS
o
rO 100 NOS ANOS DE 1975 A 1982
:
Ano
Figura 16.4
Cap. 16 Andlise das séries temporais 445
Tabela 16.13
Tabela 16.14
lan. F ev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez..
191 5 116,2 102,1 101,6 91,3 84,4 18,9 81,5 89,5 98,3 110,3 1 18,7 t26,8
t916 116,5 105,3 101,9 91,3 84,8 80,4 82,5 89,3 98,1 t09,4 1 16,5 t24,0
1977 116,5 104,1 101,6 9t,t 85,4 19,7 82,2 90,2 98,1 109,5 1 16,5 t25,1
1918 t16,4 103,6 101,5 9)7 86,1 8 t,1 83,7 90,6 97,4 108,1 115,5 r23,8
t919 115,3 t03,1 101,5 91,7 86,2 81,2 83,1 90,6 91,7 108,7 115,8 t24,0
1980 114,7 t04,4 100,8 91,7 86,4 81,6 84,9 90,9 99,3 108,2 115,0 1)) 7
r981 114,8 t03,7 101,1 92,6 87,2 81,8 84,2 91,5 91,8 t07,7 t15,1 t2t,6
t982 115,3 104,0 100,9 q)) 86,8 82.8 84.8 91,3 97,7 107.5 t14.7 t22,t
Total a)\ 1 831,5 810,9 734,2 687.3 641,5 661,5 723,9 784,4 869,4 928.4 989.1
Média 1t5,1 103,9 101,4 91,8 85,9 80,9 83,4 90,5 98,1 108,7 116,1 t23,7
Solução
De acordo com os dados do Problema 8(o), parece que a tendência a longo prazo pode
ser convenientemente ajustada, por meio de uma linha reta. Em vez de obter essa
446 Estatística Cap. 16
reta por meio dos dados mensais fornecidos, o faremos por meio das médias mensais
dos anos de 1975 a 1982, apresentadas na Tabela 16.15 e reproduzidas na Tabela
16.13 do Problema 8(ó).
Tabela 16.15
Tabela 16.16
Anos x Y x2 XY
Y=Y .
( »xv ) z.sor.r.
=';'-
( z.zts,s\ *
tx=357'6+ 13'188x'
[;;; ). [-É
em que X é medido em meios anos, com origem em 31 de dezembro de 1978 ou le de
janeiro de 1979.
Em vista dessa equação, conclui-se que os valores de Y aumentam de
13,188, depois de cada meio ano, ou de 13,18816 =2,20 cada mês. Portanto, para
X = 0 (1e de janeiro de 1979, Y = 357 ,6. Meio mês depois (15 de janeiro de 1979,
o valor de Yé 357,6 +f,rZ,ZOl = 358,7,que é o valor da tendência correspondente
Cap. 16 Andlise das séries temporais 447
Tabela 16.17
Jan. Fev. Mur. Abr. Mai. .Iun. lul. Ago. Set. Out. Nov. Dez.
197 5 253,1 255,3 257,5 )\a 7 261,9 264,t 266,3 268,5 270,1 275,1 )'71 ? )1) q
1916 219,5 28t,7 283,9 286,t 288,3 290,5 )Q)'7 294,9 291,1 299,3 301,5 303,1
1977 105 g 308,1 310,3 312,5 314,1 316,9 319,1 321,3 ??? 5 32s,7 327,9 330, l
1918 334,5 336,7 338,9 341,t 343,3 345,5 347,7 349,9 352,1 354,3 3s6,5
1979 358,7 360,9 363,1 365,3 361 ,5 369,7 371,9 37 4,t 376,3 378,5 380,7 382,9
1980 385, I 381,3 389,5 391,1 393,9 396,1 398,3 400,5 402,1 404,9 407,1 409,3
198 I 4tt,5 413,1 415,9 418,1 420,3 422,5 424,7 426,9 429,t 431,3 433,5 435,1
1982 437,9 440,1 442,3 444,5 446,1 448,9 451.1 451 1 4s5.5 451,7 4s9,9 462,r
Tabela 16.18
Jan. F ev. Mar. Abr. Mai. Jun. .lul. ago. Set. Out. Nov. Dez.
975 t25,6 110,1 108,0 96,3 88,2 8l,8 83,1 91,2 99,4 110,7 118,1 125,1
976 t22,4 110,0 105,3 93,7 86,4 8t,2 82,1 88,8 96,9 r07,3 tt3,4 llg,g
977 120,0 106,5 103,1 9l,8 85,5 79,2 8t,2 88,4 95,5 105,9 111,9 1t9,4
978 I18,0 t04,3 101,6 9l,8 85,0 19,s 81,6 81,1 q1 7 t03,4 109,8 lI7,O
979 117,1 t04,7 101,9 9l ,4 85,4 80,1 82,0 88,2 94,6 t04,6 110,8 118,0
980 117,6 106,4 102,2 q)4 86,6 81,3 84, l 89,6 q7 1 105,5 111,5 118,0
981 118,3 106,4 103,1 94,0 88,0 82,1 84,1 90,9 96,1 106,0 1 13,3 118,4
982 120,8 108,4 104.7 q5? 89.1 84.7 86.2 92.4 98,4 107.7 tt4,4 121.2
Mediana tt9.2 106.4 103. l 93.0 86.5 8t.2 83.2 89.2 96,8 106,0 1 2.6 l 18,9
448 Estatística Cap. 16
Para obter a percentagem média de cada mês dos vários anos, foram
adotadas as medianas, que estão indicadas na última linha da tabela, por causa da
presença de valores extremos. Como a Soma dessas medianas é 1.196,1, elas sào
ajustadas, por meio da multiplicação por 1.20017.196,1-, de modo que sua soma seja
1.200. Dessa maneira, são obtidos os índices de estacionalidade desejados, apre-
sentados na Tabela 16.19.
Tabela 16.19
Jan. F ev. Mar. Abr. Mai. Jun. lul. Ago. Set. Out. Nov. Dez.
Indices 119,6 to6,l 103.4 93,3 86,8 81,5 83,5 Rq5 97,t 106,3 1 13,0 119,3
Solução
Obtém-se, primeiramente, uma média móve1 centrada d,e 12 meses, mediante o
emprego do segundo método do Problema 2(c), que está apresentada na Tabela
16.20.
Divide-se, agora, cada um dos valores reais mensais pela média móvel
centrada de 12 meses correspondente e exprime-se cada resultado em percentagem.
Cap. 16 Andlise das séries temporais 449
Tabela 16.20
Ano e Dados Total Total Média 4no e Dados Totql Total Média
mês móvel de móvel de móvel mês móvel de móvel de móvel
72 meses 2 meses centrada 12 meses 2 meses centradq
da de 12 da de 12
coluna 3 MESES coluna 3 MESCS
(col. (col.
4+24) 4+24)
t975 1976
Jan. 318 Jan. 342 6841 285,3
J+JJ
Fev. 281 Fev. 309 6883 286,8
3450
Mar. 278 Mar. 299 6919 288,3
3469
Abr. 250 Abr. 268 6957 289,9
3488
Mai. 231 Mai. 249 6993 291,4
3505
Jun. 2t6 Jun. 236 702',7 292,8
3285 3522
Jul. 223 6594 214,7 Jul. 242 1069 294,5
3309 3547
Ago. 245 6645 276,9 Ago. 262 7 113 296,4
JJJ / 3566
Set. 269 6695 279.0 Set. 288 '7 t53 298,0
3358 35 87
3376 3606
Nov. 325 6710 282,1 Nov. 342 1232 310,3
3394 3626
Dez. 347 6808 283.7 Dez. 364 '7267 302,8
3414
450 Estatística Cap. 16
Ano e Dados Total Totsl Média 4no e Dados Totul Total Média
mês móvel de móvel de móvel mês móvel de móvel de móvel
12 meses 2 meses centradu 12 meses 2 meses centrada
ds de 12 da de 12
coluna 3 MESCS coluna 3 MCSCS
(col. (col.
4+24) 4+24)
1977 1978
3641
Jan. 367 7299 304,1 Jan. .392 7853 ?)1 )
365 8 3938
Fev. 328 1338 305,1 Fev. 349 7891 329,0
3680 3959
Mar. 320 1381 301 ,5 Mar. 342 7931 330,1
310t 3918
Abr. 287 7 426 309,4 Abr. 311 191 5 11' I
3125 3997
Mai. 269 1415 31 1,5 Mai. 290 8016 334,0
3150 4019
Jun. 251 '7530 313,7 Jun. 213 8061 115 q
3780 4042
Jul. 259 7585 316,0 Jul. 282 8i12 338,0
3805 4010
Ago. 284 7 631 318,0 Ago. 305 8169 340,4
3826 4099
Set. 309 1614 319,7 Set. 328 8226 342,7
3 848 4t27
Out. 345 1120 321,7 Out. 364 8271 344,9
3812 4150
Nov. 367 1165 323,s Nov. 389 8324 346,8
3893 417 4
Ano e Dados Total Total Méilis 4no e Dados Total Total Média
môs móvel de móvel de móvel mês móvel de móvel de móvel
I2 meses 2 meses centrada 72 meses 2 meses centrqda
da de 12 da de 12
coluna 3 MCSCS coluna 3 MESES
(col. (col.
4+24) 4+24)
t979 1980
4t91
Jan. 420 8411 350,7 Jan. 453 9r28 380,3
4245 4519
Fev. 310 8518 354,9 Fev. 412 9181 382,3
4273 4608
Mar. 310 8518 354,9 Mar. 398 9252 385,5
4213 4644
Abr. 334 8578 351,4 Abr. 362 93t9 388,3
4305 461 5
4496 4862
Nov 422 9019 3',75,8 Nov, 454 9753 406,4
4523 489 I
Ano e Dados Total Total Médiq 4no e Dados Total Total Média
mês móvel de móvel de móvel mês môvel de móvel de móvel
12 meses 2 meses centrada 72 meses 2 meses centrada
dq de 12 da de 12
coluna 3 MESES coluna i MCSES
(col. (col.
4+24) 4+24)
1981 1982
4916
Jan. 481 9854 4t0,6 Jan. 529 r0620 442,5
4938 5326
Fev. 440 9905 4t2,7 Fev. 477 10683 445,1
4967 5351
Mar. 429 9957 414,9 Mar. 463 t074'7 447,8
4990 5390
Abr. 393 100r0 4ll,l Abr. 423 10816 450,7
5020 5426
Mai. 310 10077 419,9 Mai. 398 I 0887 453,6
5051 5461
Jun. 347 10t41 422,08 Jun. 380 10966 456,9
5090 5505
Jul. 357 t0222 425,9 Jul. 389
5132
Ago 388 10301 429,2 Ago. 419
5169
Set. 415 t0372 432,2 Set. 448
5203
Out. 457 t0436 434,8 Out. 493
5233
Nov. 49t 10494 437,2 Nov. 526
5261
Dez. 516 10555 439,8 Dez. 560
5294
Cap. 16 Andlise das séries temporais 453
Para obter a percentagem média de cada mês dos vários anos, foram
adotadas as medianas que estão indicadas na Tabela 16.2L, por causa da presença
de valores extremos em alguns casos (exemplo: novembro, dezembro). Poderiam,
também, ter sido usadas as médias, mas, nesse caso, oS valores extremos de cada
coluna seriam eliminados.
Tabela 16.21
Jan. F ev. Mar. Abr. Mai. lun. Jul. Ago. Set. Out. Nov. Dez.
197 6 119,9 t07,1 r03,7 92,4 85,4 80,6 82,2 88,4 96,6 to1 ,t 113,5 t20,2
1911 t20,7 t07,3 104,t 92,8 86,4 80,0 82,0 89,3 96,7 107,2 1t3,4 tzt,t
t918 119,8 1 06,1 103,4 93,6 86,8 81,3 83,4 89,6 95,1 105,5 t12,2 tt9,6
1979 1 19,8 to1,2 104,3 q1 5 87,2 81,5 83,4 89,5 95,9 106,0 112,3 119,6
1980 tt9,t 107,6 103,2 q7) 87,2 81,8 84,6 90,0 97,7 105,7 ttt,l tt9,2
1981 118,6 106,6 t03,4 94,2 88,1 82,1 83,8 90,4 96,0 105,1 t12,3 ttt.3
1982 119,5 r07,2 t03,4 q1q 81 .1 83.2
Mediana 119,8 101,2 103.4 93,5 87.2 81.5 83.4 89,5 96,4 r06,0 t12,3 tt9,6
A soma das medianas, 1.199,8 , é táo próxima da desejada, L.200, que não
é necessário nenhum ajustamento. Os índices por estação desejados são, portanto,
os apresentados na última linha da Tabela 16.21.
Solução
Primeiramente, exprimem-Se os dados de cada mês em percentagem dos do mês
anterior, como está indicado na Tabela 1,6.22. Cada uma dessas percentagens é
denominada um elo relativo. Por exemplo, para obter as casas correspondentes a
fevereiro e março de 1975, tem-se, a partir dos dados do Problema 8,
valor de fev.1915
elo relativo de fevereiro de 1975 =
valor de jan. 1975 = ar14
= 88'47o;
454 Estatística Cap. 16
Tabela 16.22
Jan. F ev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
t97 5 88,4 98,9 89,9 92,4 93,s 103,2 109,9 109,8 112,3 t07,6 106,8
1976 98,6 90,4 96,8 89,6 92,9 94,8 102,5 108,3 109,9 111,5 r06,5 106,4
t971 100,8 89,4 91,6 89,1 q7'7 q?1 103,2 109,1 108,9 ttt,7 t06,4 107,4
t918 qq5 89,0 98,0 90,9 o?, 94,1 103,3 r08,2 107,5 111,0 r06,9 101,2
1979 100,7 90,0 97,9 90,3 94,0 94,3 103,0 108,2 101,9 ttl,2 r 06,6 r01,t
1980 t00,2 90,9 96,6 9 r,0 94,2 94,4 104,0 107,2 109,2 108,9 r06,3 106,4
1981 100,8 90,3 97,5 91,6 94,1 93,8 102,9 108,7 107,0 110,1 t07,4 105,1
1982 t02,5 90,2 91,r 9r,4 94,1 q55 t02,4 101,1 106,9 110,0 t06,7 106,5
Mediana 100,7 90,1 91,6 90,6 93,8 94,2 103,1 108,2 108,4 ll1 I 106.6 106,6
Os valores médios dos elos relativos de vários meses (no caso, as meridia-
nas) estão representados na última linha da Tabela L6.22. Pode-se, também, usar
a média (veja o Problema 12).
Considera-se que janeiro tem o valor 1007o (veja a Tabela 16.23). Como a
média dos elos relativos de fevereiro é 90,1 (da Tabela 16.22), os dados referentes a
fevereiro são, em média, 90,l%o dos de janeiro, isto é, 90,tVo de 100 = 90,1. De modo
semelhante, a média dos elos relativos de março é 97,6Vo da de fevereiro, isto é,
97,67o de 90,1 = 87,9 etc. Desse modo, obtém-se a Tabela 16.23, cujas casas são
freqüentemente denominadas relatiuas em cadeia.
Tabela 16.23
Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. OuÍ. Nov. Dez. Jqn.
100,0 90,1 87.9 79,6 7 4,1 70,4 72,6 18,6 85,2 94,7 101,0 t01,7 108,5
(L2112) (8,5) = 8,5 da casa da última coluna (fazendo, portanto, o valor do último
janeiro igual a 100), (11/12) (8,5) = 7,8 do valor de dezembro (10172) (8,5) = 7,1 do
valor de novembro etc. Os valores ajustados à tendência estão lançados na Tabela
16.24.
Tabela \6.24
Jqn. Fev. Mar. Abr. Mai. Jan. Jul. ago. Set. Out. Nov. Dez.
'7'7 5
100,0 89.4 86,5 1t,9 66,9 68,4 73.6 79.5 88,3 93.9 99.9
Como o total dessas percentagens é 995,8, elas sáo ajustadas mediante sua
multiplicação por 1.2001995,8, para a obtenção dos índices de estacionalidade da
Tabela 16.25.
Tabela L6.25
Jan. Fev. Mar. Abr. Mui. Jun. Jul. ago. Set. Out. Nov. Dez.
Índices t20,5 r07.7 to4,2 93.4 86,6 80,6 82,4 88,7 95,8 106.4 t13,2 120,4
12. Resolver o Problema 11, adotando a média dos elos relativos, em vez da
mediana.
Solução
A média dos elos relativos está indicada na Tabela 16.26.
Tabela 16.26
Jan. F ev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Média 100.4 89,8 97.6 90,5 93,6 94,2 103,1 108,5 108,4 110,8 106.8 r06,6
456 Estatística Cap. 16
Tabela 16.27
Jan. Fev. Mar. Abr. Mai. Jan. Jul. Ago. Set. Out. Nov. Dez. Jan.
100,0 89,8 8'7,6 19.3 14.2 69.9 12,7 18,2 84,8 94.0 100,4 t01,0 t07,4
Neste caso, o resultado para o último janeiro é de 107 ,4, com um aumento,
devido à tendência , de 7 ,4 sobre o do primeiro. Para fazer o ajustamento, subtrai-se
(121t2) (7,4) = 7,4 da casa da última coluna, (11172) (7,4) = 6,8 da de dezembro,
(LO/tz) (7,4) = 6,2 da de novembro etc., de modo que os valores são os apresentados
na Tabela 16.28.
Tabela 16.28
lan. Fev. Mar. Ahn Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
100,0 89,2 86,4 77,5 71.1 66,8 68.4 73.9 19.9 88,4 94.2 100,2
Como a soma das casas da última linha da Tabela 76.28 é 996,6, elas são
ajustadas mediante sua multiplicação por 1.200/996,6 e obtém-se os índices de
estacionalidade, apresentados na Tabela 76.29.
Tabela 16.29
Jan. Fev. Mar. Abr. Mai. Jun. Jul. ago. Set. Out. Nov. Dez.
Indices r20,4 107,4 104,0 93,3 86,3 80,4 82,4 89,0 96.2 106,4 113,4 t20,1
Solução
Para ajustar os dados à variação estacional, deve-se dividir cada casa dos dados
originais do Problema 8 pelo índice de estacionalidade do mês correspondente,
determinado por qualquer um dos métodos anteriores.
Se, por exemplo, forem usados os índices de estacionalidade do Problema
10, dividir-se-ão todos os valores de janeiro por ll9,87o (isto é, 1,198), todos os de
fevereiro por 107 ,2Vo (isto é, 1,072) etc. Então, os dados desestacionalizados são os
apresentados na Tabela 16.30.
Tabela 16.30
Jan. Fev. Mar. Abr. Mqi. Jun. Jul. Ago. Set. Out. Nov. Dez.
t975 265 262 269 267 265 265 261 214 279 285 289 290
t916 285 288 289 281 286 290 290 293 299 303 305 304
1971 306 306 309 307 308 308 311 311 321 325 327 329
1978 327 326 331 JJJ JJJ 335 338 341 340 343 346 349
1919 351 353 358 357 360 363 366 369 369 314 376 378
1980 378 384 385 381 391 395 402 40t 407 403 404 404
1981 401 410 415 420 424 426 428 434 430 431 437 43t
t982 442 445 448 452 456 466 466 468 465 46s 468 468
Solução
Ano
Figura 16.5
(á) O gráfico dos dados ajustados por estação indica claramente a tendência a
longo ptazo que, desprezad.as as flutuações secundárias, aproxima-se
estreitamente de uma linha reta, embora haja uma ligeira tendência para
cima.
Solução
Para tornar os dados do Problema 13 independentes da tendência, divide-se cada
casa pelo valor da tendência mensal correspondente, calculado por qualquer dos
métodos considerados. IJsar-se-ão, neste caso, os valores mensais de tendência
obtidos, no Problema 10, pelo método das médias móveis. Os resultados estão
indicados na Tabela 16.31. Para obter a casa correspondente a julho de 1975, por
exemplo, divide-se a casa correspondente,26T, da Tabela 16.30 do Problema 13, pelo
valor 274,7 (veja o Problema 10, primeira casa da coluna 5 da Tabela 16.20), o que
dâ2671274,7 =97,27o. As outras casas são obtidas de maneira semelhante. Uma
desvantagem deste método, como de todos os que envolvem as médias móveis, é que
se perdem os dados de ambas as extremidades das séries temporais.
Tabela 16.31
Jan. Fev. Mar. Abr. Mai. Jun. Jul. ago. Set. Out. Nov. Dez.
t9'78 99,9 99,1 100,1 100,2 99,1 99,7 100,0 too,2 99,2 99,4 99,8 100,1
19't9 100,1 100,1 100,9 100,0 100,0 100,0 100,1 100,1 99,4 100, l 100,1 100,0
1980 ooá 100,3 99,9 99,1 100,0 100,4 101,5 100,6 t01,4 99,8 99,4 98,9
198 1 99,1 99,3 100,0 100,7 101,0 100,8 100,5 101,1 qq5 99,t 100,0 98,0
1982 99,9 100,0 r00,0 100,3 100,5 102,0
Solução
(o) Convém subtrair 1007o dos dados do problema anterior e representar,
graficamente, os desvios resultantes. O gráfico obtido, mediante a adoção
de uma escala vertical grandemente ampliada, está representado na Fi-
gura 16.6.
Estatística Cap. 16
Figura 16.6
17. (o) Obter as médias móveis de 3 e de 7 meses, para os dados do Problema 15.
Solução
(o) As médias móveis desejadas estão lançadas na Tabela 16.32.
Tabela 16.32
Ano e Dados Total móvel Média móvel Total móvel Média móvel
mês de 3 meses de 3 meses de 7 meses de 7 meses
t975
Jul. 91,2
1976
Jan. 99,9 302,5 100,8 105,7 100,8
Fev. 100,4 300,5 t00,2 102,2 r00,3
Mar. t00,2 299,6 99,9 698,8 qq5
Abr. 99,0 297,3 99,1 695,r qql
Mai. 98,1 296,1 98,1 693,0 99,0
Jun. 99,0 295,6 98,5 692,9 99,0
Jul. 98,5 295,3 98,4 693,8 99,1
Ago. 97,8 296,6 98,9 696,0 99,4
Set. 100,3 )qq ) 99,1 698,3 99,8
Out. 101,1 302,6 100,9 699,9 100,0
Nov. 101,2 302,7 100,9 7 01,5 r00,2
Dez. 100,4 302,2 100,7 104,2 100,6
462 Estatística Cap. 16
Ano e Dados Total móvel Média móvel Total móvel Média móvel
mês de 3 meses de 3 meses de 7 meses de 7 meses
t977
Jan. 100,6 301,1 100,4 103,t 100,4
Fev. 100,1 30t,2 100,4 100,9 100,1
Mar. 100,5 299,8 99,9 691,9 99,7
Abr. 99,2 298,6 99,5 695,9 99,4
Mai. 98,9 296,3 98,8 695,0 qq1
Jun. 98,2 ,o< < 98,5 695,3 qq?
Ju1. 98,4 296,3 98,8 695,8 99,4
Ago. 99,7 298,5 99,s 697,7 99,7
Set. 100,4 301,1 100,4 699,9 100,0
Out. 101,0 302,5 100,8 101,6 100,2
Nov. 101,1 303,2 101,1 702,3 100,3
Dez. 101,1 302.r 100,7 102,7 100,4
978
Jan. 99,9 300,9 r 00,3 102,5 r00,4
Fev. 99,1 299,1 99,7 701,2 t00,2
Mar. 100,1 299,4 99,8 699,8 r00,0
Abr. 100,2 300,0 100,0 698,7 99,8
Mai. 99,1 299,6 99,9 699,0 99,9
Jun. qq7 299,4 99,8 699,t 99,9
Jul. 100,0 ,qq q 100,0 698,4 99,8
Ago. 100,2 299,4 99,8 698,0 99,7
Set. 99,2 298,8 99,6 698,4 99,8
Out. 99,4 298,4 99,s 698,8 99,8
Nov. 99,8 ,qq ? 99,8 698,9 99,8
Dez. 100,1 300,0 100,0 699,6 100,0
Cap. 16 Anó.lise das séries temporais 463
Ano e Dados Total móvel Média móvel Total móvel Média móvel
mês de 3 meses de 3 meses de 7 meses de 7 meses
t979
Jan. 100,1 300,3 100,1 100,4 100,1
r980
Jan. 99,4 299,7 99,9 699,5 100,0
Fev. 100,3 299,6 99,9 699,4 100,0
,qq q 699,7 100,0
Mar. 99,9 100,0
Abr. 99,1 299,6 99,9 70t,2 100,2
Mai. 100,0 300,1 100,0 702,4 100,3
Jun. 100,4 301,9 i00,6 703,5 100,s
Jul. 101,5 302,5 100,8 703,4 100,5
Ago. 100,6 302,5 100,8 703,1 100,4
Ano e Dados Total móvel Média móvel Total móvel Média móvel
mês de 3 meses de 3 meses de 7 meses de 7 meses
1981
Jan. 99,t 297,3 99,1 691,2 99,6
Fev. 99,3 298,4 99,5 698,4 99,8
Mar. 100,0 300,0 100,0 699,8 100,0
Abr. 100,7 30t,1 100,6 701,4 r00,2
Mai. 101,0 302,5 100,8 103,4 100,5
Jun. 100,8 302,3 100,8 103,6 100,5
Jul. 100,5 302,4 100,8 702,7 100,4
Ago. 101,1 301,1 100,4 102,0 100,3
Set. 99,s )qq 1 99,9 699,0 99,9
Out. 99,1 298,6 99,5 698,1 99,7
Nov. 100,0 291,1 99,0 691,6 qq'7
t982
Jan. 99,9 297,9 qql 697,3 99,6
Fev. 100,0 299,9 100,0 698,',l 99,8
Mar. 100,0 300,3 100,1 100,1 100.1
Abr. 100,3 300,8 100,2
Mai. 100,5 302,8 r00,9
Jun. 102.0
E
'§
(dA +2
MEDIA MÓVEL DE 3 MESES
CF f I
9lo
5,e
rL'ü
o
o(§ -1
ã8
a-z
o 1975 -f 1976 + 1977 -f 1978 -l 1979 + 1980 -]_ 1981 + 1982 -.1
Figura 16.7
E
o§ +2
:9ô MEDIA MOVEL DE 7 MESES
É9
(l)-
+1
g,ú
6cú -1
ã8
ôa-z
F 1975 + 1976 -l 1977 -l- 1978 -f 1979 -f 1980 +- 1981 + 1982 -.1
Ano
Figura 16.8
ridades e revelar o padrão cíclico, quando existir. Para esse fim, talvez seja melhor
uma média móvel centrada de 12 meses, porque elimina as variações estacionais
residuais, bem como as irregularidades.
No problema presente, nenhum efeito cíclico parece presente ou, se estiver,
é desprezível. Na teoria econômica, são necessários, freqüentemente, dados de 20
anos de duração, pelo menos,pàÍa que os ciclos apareçam (veja a Figura 16.1).
Comparabilidade de dados
18. Como seriam modificados os dados do Problema 8, de modo que sejam levados
em consideração os anos bissextos 1976 e 1980?
Solução
Em um ano bissexto, fevereiro tem 29 dias em vez de 28. Para conseguir a
comparabilidade dos dados, multiplicam-se os dados correspondentes ao mês de
fevereiro de um ano bissexto por 28129. Então, na Tabela 16.12 do Problema 8:
O valor de fevereiro de 1976 é substituído por (28129) (309) = 298.
Previsão
19. Utilizando-se os dados da Tabela 16.12 do Problema 8, prever o valor da
variável para 1983, mês a mês.
Solução
Os futuros valores mensais são dados por Y = TCSI, em que se pode estimar t Q
Se1.
Para estimar a tendência T, podem ser empregados vários métodos pos-
síveis. De acordo com o gráfico do Problema 14 (veja a Figura 16.5), parece que se
Cap. 16 Aná.lise das séries temporais
Tabela 16.33
Jul. r 980 396,2 Jul. 198 1 425,9
Ago. 1980 398,8 Ago. 1981 429,2
Set. 1980 401,3 Set. 198 1 432,2
Out. 1980 403,9 Out. 1981 434,8
Nov. 1980 406,4 Nov. 1981 437,2
Dez. 1980 408,6 Dez. 198 l 439,8
Jan. 1981 410,6 Jan. t982 442,5
Fev. r 981 412,7 Fev. 1982 445,1
Mar. 198 I 414,9 Mar. 1982 447,8
Abr. 198 I 4r7,1 Abr. 1982 450,1
Mai. 1981 4t9,9 Mai. 1982 453,6
Jun. 198 1 422.8 Jun. 1982 4s6.9
Total 4.913.2 Total 5.295,1
Média 409,4 Média 441,3
De acordo com as médias dos dados de cada parte, conclui-se que houve um
acréscimo de 44I,3 - 409,4 = 31,9, em 12 meses, ou de 31,9/12 = 2,66, por mês.
Mediante a adição, sucessivamente, de 2,66 a 456,g,úItimo valor disponí-
vel, correspondente ajunho de 1982, podem ser obtidos os valores da tendência para
1983, como estão indicados na terceira linha da Tabela 16.34(a).
Tabela 16.34(o)
Jqn. F ev. Mar. Abr. Mai. Jun, Jul. Ago. Set. Out. Nov. Dez.
De acordo com a Figura 16.6 do Problema 16, vê-se que a estimativa dos
fatores cíclicos e irregulares, CI , diferem de 1007o de menos de 2,57o. Portanto,
admitindo-se que CI = lOOTo- 1, isto é,Y - T x C xS x1 = (7x S) (C x1) = 7x S, o
desvio de Ynão seria superior a2,5Va.
Multiplicando-se os valores de 7 em 1983 pelos correspondentes de S
(recordando-se que S está em percentagem), obtém-se os valores mensais previstos
ouprojeções para 1983, apresentados na última linha da Tabela 16.34(a), na página
anterior. Por exemplo, o valor previsto para janeiro de 1983 é (475,5) (1,198) = 570
etc.
Resp.: (o) cíclicos; (ó) estacional; (c) tendência a longo prazo; (d) irregular; (e)
tendência a longo prazo.
Médias móveis
27. Dados os números 1; 0; - 1; 0; 1; 0; - 1; 0; 1, determinar uma média móvel de
ordem (o) dois, (á) três, (c) quatro, (d) cinco.
Resp.: (o) 0,5; - 0,5; - 0,5; 0,5; 0,5; - 0,5; -0,5; 0,5.
1
(ó) 0; - g; o; 1..r. 1.^
[; u; -ã; 0.
(c) 0; 0; 0; 0; 0; 0.
tdrl:o:--1,0,
bb'5
1'
22. Provar que, se uma seqüência de números tem período N (isto é, a seqüência
se repete depois de N termos), cada média móvel de ordem inferior a N tem,
então, período igual aN. Ilustrar com referência ao Problema 21.
(o) No Problema 22, o que acontecerá no caso da média móvel de ordem N? (ó)
Que acontecerá se a ordem for superior a N? Ilustrar com referência ao
Problema 21.
24. Provar que, se cada número de uma seqüência for aumentado (ou diminuído)
de uma constante, a média móvel será também aumentada (ou diminuída)
dessa constante.
25. Provar que se cada número de uma seqüência for multiplicado (ou dividido)
por uma constante diferente de zero, a média móvel será também multiplicada
ou dividida por essa constante.
26. Determinar a média móvel ponderâda dos números do Problema 21(ó), (c) e
l; 2; l; (c) I; 2;2; l; (d) 1;2; 2;2; l.
(d), para os pesos respectivos de: (ó)
Comparar com os resultados do Problema 21.
29. Uma seqüência tem M números. (a) Provar que, em uma média móvel de ordem
N,haveráM -N + 1 números. Ilustrar por meio de diversos exemplos, adotando
valores diferentes de M e N. (á) Discutir o caso em que M = N.
30. A Tabela 16.35 apresenta a produção de açúcar cristal, no Brasil, em mil
toneladas, no período de 1972 a 1981. Calcular as médias móveis (o) de 2 anos;
(ó) centradade2 anos; (c) de 3 anos; (d) centradade 4 anos; (e) centrada de 6
anos.
Tabela 16.35
Ano Produção de
açúcar cristal
(1.000 t)
1972 4.0t1
r973 4.583
197 4 4.593
t97 5 4.855
1976 5.461
t9'77 6.220
t978 6.009
t919 5.349
1980 5.807
198 l 6.385
Fonte: Anuário Estatístico do IBGE.
Cap. 16 Andlise das séries temporais 471
Estimação da tendência
31. (o) Ajustar uma parábola da forma Y = ao + a1X + a2N2 aos dados do Problema
8, adotando as médias mensais da Tabela 16.13 do Problema 9. (á) Compa-
rar o resultado do item (o) com a reta de mínimos quadrados do Probiema
9 e calcular os valores da tendência.
Resp.: (a) Y = 351,1 + 13,188X + 0,311X 2, em que X é mantido em unidades
de meio-ano, com a origem correspondente a 1e de janeiro de 1979.
Tabela 16.36
Jqn. Fev. Mar. Abr. Msi. Jun. .Iul. Ago. Set. Out. Nov. Dez,
191 5 934 941 944 963 t.014 t.029 r.029 r.065 1.043 1.096 1. 139 1.030
197 6 1.032 1.026 1.088 t.061 1.131 1.138 t.161 1.t94 1.204 1.200 1.2t1 1.158
r917 t.t27 1.163 1.125 t.235 1.2t3 1.250 t.250 t.237 1.313 1.313 1.306 r.289
t918 t.242 t.301 1.211 1.323 r.331 1.385 t.376 t.4t1 t.47 5 t.424 t.451 1.402
1979 1.338 1.409 t.431 1.415 1.494 1.523 1.529 1.533 1.6t6 1.51 1 1.583 1.555
1980 t.461 t.516 1.506 1.544 1.540 1.617 t.534 t.125 1.662 1.697 1.148 1.577
Fonte: Boletim Banco Central do Brasil.
472 Estatística Cap. 16
34. Obter um índice por estação para os dados do Problema 33, mediante o emprego
do método da tendência percentual ou da relação da tendência. Para obter os
valores da tendência, ajustar uma curva de mínimos quadrados, apropriada às
médias mensais dos anos dados.
35. Obter um índice por estação para os dados do Problema 33, mediante o emprego
do método da média móvel percentual ou de relação das médias móveis.
36. Obter um índice por estaçáo para os dados do Problema 33, mediante o emprego
do método dos elos relativos.
37. A Tabela 16.37 apresenta o saldo mensal dos meios de pagamentos no Brasil,
em bilhões de cruzeiros, para o período 7976-1982. Obter os índices de estacio-
nalidade mediante o emprego (o) das percentagens médias; (ó) da relação à
tendência; (c) dos elos relativos.
Tabela 16.37
.lan. F ev. Mqr, Abr. Mai. .Iun. .Iul. Ago. Set. Out. Nov. Dez.
1976 161 t64 166 170 t77 t93 t92 192 r97 205 214 237
1977 216 219 226 242 245 261 262 266 277 287 294 325
1978 303 310 320 334 338 360 362 374 392 405 42t 463
t919 436 466 464 476 492 538 547 559 603 628 675 803
1980 738 767 79t 866 910 988 967 1.015 1.052 1.100 l.198 t.367
l98l t.233 t.290 1.256 1.363 1.424 1.550 1.549 1.6t7 1.687 r.892 2.063 2.388
1982 2.204 2.253 2.2t6 2.377 2.491 2.706 2.739 2.846 2.971 3.214 3.511 4.053
Fonte: Boletim do Banco Central do Brasil.
Tabela 16.38
1946 84,48
1947 87,30
t948 93,16
1949 100.00
Fonte: Cláudio R. Contador, Ciclos econômicos e indicadores de
atividade no Brasil.
Previsão
43. Utilizando os dados do Problema 33 e qualquer dos resultados dos Problemas
94, 35, 36, 39 e 41, fazer a previsão, mês a mês, para 1981, do consumo
industrial de energia elétrica para a área de São Paulo.
h
MAKRON
Capítulo
17
Números índices
Número índice
Um número índice é uma medida estatística idealizada para mostrar as variações
de uma variável, ou de um grupo de variáveis, correlacionadas ao tempo, à locali-
zaçã.o geogtáfíca, ou a outras características como rendimento, profissão etc. Uma
coleção de números índices de diversos anos, localidades etc., é freqüentemente
denominada série de índices.
475
476 Estatística Cap. 17
Preços relativos
Um dos exemplos mais simples de número índice é o preço relatiuo, que é a relação
entre o preço de uma única utilidade, em um período determinado, e o de outro
período, denominado bd.sico ou de referência. Para simplificar, admite-se que os
preços mantêm-se constantes em algum período. Se eles não o são, pode-se tomar
uma média adequada desse período, para que essa hipótese seja válida.
Sep6 ep, representam utilidades durante o período básico
os preços das e
o considerado, respectivamente, então, por definição
Pn (1)
Preço relativo
p0
aa z'
Preço rerativo = p1sto/1s7'=
flffij* 1#ã = # = i = ]-
Cap. 17 Números índices 477
Qn
Quantidade ou volume relativo = (2)
q0
Como no caso dos preços relativos, emprega-se a notação Qa/b = q6lqo, para
representar a quantidade relativa do período ó, referida ao período o. As mesmas
observações e propriedades pertinentes aos preços relativos são aplicáveis às quan-
tidades relativas.
Valores relativos
Se p é o preço de uma utilidade, durante um período, e q é aquantidade ou volume
produzido, vendido etc., durante esse período, pq é, entáo, denominado ualor
iotal. Em conseqüência, se 1.000 litros de leite são vendidos a Cr$ g0 o litro, o valor
total é Cr$ 30 x 1.000 = Cr$ 30.000.
Se p6 e q0 representam o preço e a quantidade de uma utilidade, durante
um período básico, enquanto Pn e Qn representam aquelas grandezas, durante um
determinado período, os valores totais, durante estes períodos são dados por v0 e
vr., respectivamente, e definidos por
12.t5.18_18_rr,
p tgi 3/ 197 6 = p 197 3/ I 9i 4 p 191 4/ t9i 5 p 19 65/ 197 6 = g 12.JS= g =zz5(Vo).
Os preços relativos, referidos a um período básico fixo que, como foi visto,
pode ser obtido mediante o emprego de elos relativos, são denominados, às vezes,
relatiuos em cadeia referidos a essa base, ou relativos encadeados à base Íixa.
Exemplo 3. Nos exemplos 7 e 2, a coleção dos relativos em cadeia dos anos
1974,1975 e 1976, referidos ao ano base de 1973, é dada por
t2
P t9'73/ tgi 4 =
8
= 150(7o) .
L2 15
PtgTg/tgl; = Pr97 s/tgl 4 Ptg74/1975 =
812 187 ,5 (Vo)
12.L5 1g_or^
zzo (Vo)
PtgTB/t}7 6 = Pt97 s/t97 4 Prc7aw75 Prg75/r976 = A LZ .
propriedade, que ele satisfaz ao teste associado a essa propriedade. Dessa forma,
por^ hiz-se que os números índices que apresentam a propriedade da
"""*pIo,
ieversibilidade do tempo satisfazem ao teste da reuersibilidade do tem.po etc.
Nenhum número índice já descoberto satisfaz a todos os testes, embora em
alguns casos eles sejam aproximadamente satisfeitos. O índice ideal de Fisher, que
.""rá ui.to mais adiânte, iatisfaz, particularmente, ao teste da reuersibilidade do
tempo e o da reuersibilid,ad,e d.os fatores, e satisfaz, mais_aproximadamente do que
qrulq,r", outro índice numérico conveniente, as propriedades consideradas impor-
tantes, donde seu nome de ideal.
Do ponto de vista prático, entretanto, outros números índices também são
úteis e alguns deles serão examinados.
Notação
Costuma-se representar por pn(t), pr('2), pn(3),.", os preços de uma primeira,
segunda, terceira,..., utilidade durante um certo período n. Os ?,rPç".,r.,"r"i3;
pondentes, durante um período básico, são representados Por P0''', Po'o', po'"'
ãt". O. números 1,2,3... são sobrescritos e não devem ser confundidos com os
expoentes. Por meio dessa notaçào,.o preço de uma utilidadeT, durante o período
n, pode, então, ser indicado Pot Pr'J'.
Como nos capítulos anteriores, pode-se usar a notação de somatório, para
representar a adição ãm relação ao índice j. Por exemplo, admitindo-se que há um
toial de N utilidades, a soma de seus preços durante o período ru poderia ser indicada
N
porL p§), ou X pP .Ét mais simples, contudo, omitir inteiramente o sobrescrito e
j=1
escrever Zpr, o que será feito quando disso não possa resultar nenhuma confusão.
Deve-se entretanto, ter em mente que Íica subtendido o simbolismo mais
completo. Por meio dessa notação, Ipg representaria a soma dos preços de todas as
utilidades, durante o período básico'
Usa-se uma notação semelhante para as quantidades e os valores.
2p,
Indice de preço agregado simples = _ (4)
Lpo
em que Zpo= soma de todos os preços das utilidades, no ano básico, 2pr= soma dos
preços das utilidades correspondentes, no ano dado, e cujo resultado é expresso em
percentagem, como todos os números índices em geral.
Embora este método tenha a vantagem de ser fácil de aplicar, apresenta
duas grandes desvantagens, que o tornam pouco satisfatório.
1. Não se toma em consideração a importância relativa das várias utilidades.
Portanto, de acordo com este método, o mesmo peso, ou importância, seria
atribuído ao leite e ao creme de barbear, no cálculo do índice do custo de vida.
2. As unidades particulares, adotadas para a fixação dos preços, como litros,
metros cúbicos, quilos etc., afetam o valor do Índice.
zprqo (6.)
do ano-básico =
Lpoqo
zPnq, (8)
2poq,
i-
L p_yqo
= l( ) íe.g. ) (e)
\" [i'^'o )l»Poq' )
Este índice é a média geométrica dos números índices de Laspeyres e
Paasche, dados pelas Equações (6) e (7). Como se observou anteriormente, o índice
ideal de Fischer satisfaz tanto o teste da reuersibilidade do tempo como ao da
reuersibilid,ad,e d,os fatores, o que lhe confere certa vantagem teórica sobre os outros
números índices.
484 Estatística Cap. 17
O índice de Marshall-Edgeworth
o índice de Marshall-Edgeworth emprega o método agregado ponderado do ano
típico, sendo o peso a média aritmética das quantidades do ano básico e do deter-
minado, isto é, n, = qnr. Levando esse valor de q; na Equação (8), tem-se:
*(qo +
Índice de preço de Marshall-Edgeworth =
2pn(qo + qn)
= (10)
»roq^ *
^
Método da média ponderada de relativos
Para superar as desvantagens do método da média simples de reiativos, pode-se
empregar uma média ponderada de relatiuos. A média ponderada mais freqüen-
temente usada para esse fim é a aritmética, embora possam também ser emprega-
das outras, como a geométrica (Capítuto 3).
Média aritmética ponderada dos preços relativos, usando os valores do ano base
como pesos
Média aritmética ponderada dos preços relativos, usando os valores do ano dado
como pesos
Média aritmética ponderada dos preços relativos, usando os valores do ano típico
como pesos =
L qnpo ( 1s)
2qopo
2 qnp, (16)
=-:Lqopn ,
PROBLEMAS RESOLVIDOS
Preços relativos
1. Os preços médios, no varejo, de uma produção, por unidade, durante os anos
de 1973 a 1978, estão apresentados na Tabela L7.1. (a) Adotado o ano de 1973
como base, determinar os preços relativos correspondentes aos anos de 1976 e
1978. (á) Adotado o ano de 1976 como base, determinar os preços relativos
correspondentes a todos os anos dados. (c) Adotado o período de 1973 a lg75
como base, determinar os preços relativos correspondentes a todos os anos
dados.
Tabela 17.1
Solução
(o) Preço relativo de 1976, adotado o ano de 1973 como base =
t.
Estatística Cap. 17
Tabela 17.2
L4.95+19.94+15 10
= 15,00.
Divide-se cada preço no varejo, da Tabera 12.1, por esse preço médio do
período-base, 15,00. Então, os preços relativos desejados, expressos em percen-
tagem, são os indicados na Tabela 17.8.
Tabela 17.3
Solução
Pa Pb
3. Usando a Tabela 17.3 do Problema 1(c), com o período de 1973 a 1975 como
base, obter os preços relativos referente ao ano de 1976 como base.
Solução
Divide-se cada preço relativo da Tabela 17.3 por 104,3, preço relativo corres-
pondente aL976. Os números resultantes, expressos em percentagem, são os preços
relativos desejados e estão apresentados, desprezados os erros de arredondamento,
na Tabela 17 .2 do Problema 1(ó).
Este exemplo mostra que, dada uma série de índices correspondente a um
período-base, pode-se obter a série correspondente a outro período-base sem usar
os dados referentes aos preços originais. O processo adotado é conhecido como
mudança do período-base ou deslocamento da base.
Solução
(a) Tomando-se o ano de 1975 como base, o preço relativo (ou número índice)
que lhe correspondê é 100. (Simbolicamente, 1975 = 100 ou 1007o).
Estatística Cap. 17
Como o preço em 1976 é 207o inferior ao de 1974, ele deve ser 100 - 20 =
= 80Vo do preço eml974. Então, o preço em1974 é 1/0,80 = 514 = 725Vo do preço em
1976, isto é, o preço relativo em 1974 é 1257o do de 1976, isto é, 1257o de 120 = 159.
Como o preço em 1976 é 507o superior ao de L977, ele deve ser 100 + 50 =
= 150 do de 1977. Então, o preço em 7977 é tlL,50 = 213 do preço de 1976, isto é, o
preço relativo em L977 é 2/3 d,o de 1976, isto é, 213 de 120 = 80. Por conseguinte, os
preços relativos desejados são os apresentados na Tabela 17.4.
Tabela 17.4
Tabela 17.5
Tabela 17.6
Preço relativo
120 80 96 64
(1974-1975 = 100)
Tabela 17.7
Solução
Dividindo-se a produção de cada ano por 64.511, que é a produção do ano-base,
encontram-se as quantidades relativas desejadas e que estão apreseútadas, em
forma de percentagem, na Tabela 17.8.
Tabela 17.8
Valores relativos
6. Em janeiro de 1980, uma fábrica pagou um total de Cr$ 4.000.000 a I20
empregados incluídos na folha de pagamento. Em julho do mesmo ano, a
fábrica tinha mais 30 empregados e pagou mais Cr$ 600.000 do que em janeiro.
Adotado janeiro de 1980 como base, determinar (a) o número índice de emprego
(quantidade relativa) em julho; (ó) o número índice da despesa com a mão-de-
obra (valor relativo) em julho. (c) De acordo com o resultado da expressão
"Preço relativo" x "Quantidade relativa" = "Valor relativo", que interpretaçào
pode ser dada ao preço relativo, neste caso?
Solução
(o) Número índice de emprego = Quantidade relativa =
120 + 30
= -ff = l'25 = l25Vo ou 125'
Solução
Preço relativo x quantidade relativa = valor relativo
ou
Solução
= 2,43 : 243Vo
Tabela 17.9
Solução
Note-se que este método náo faz uso das quantidades produzidas mas,
somente, dos preços das utilidades.
Para as finalidades da exemplifrcaçáo, utilizaram-se apenas 3 bens para o
cálculo de um número índice. Realmente, na prática, muitos outros bens seriam
incluídos.
10. Explicar por que os números índices obtidos no Problema 9 podem ser inade-
q,rádo. para medir as alterações de preços de uma dada utilidade.
Solução
O índice calculado no Problema 9 não leva em consideração a importância relativa
das utilidades, que seria determinada, por exemplo, pela indicação de quanto é
usado pelo consumidor, ou quanto é produzido para os Íins de consumo. Essas
considerações serão feitas em problemas subseqüentes.
Solução
(o) os preços relativosdo leite, manteiga e queijo em 1978, com o ano de 1969
como base, são os seguintes:
preço do leite em 19ZQ
preço relativo do lei+^
" - = ++
preço do leite em 1969 3,95
= 104,6 (7o:);
38'9
Preço relativo do queijo - #preço do queijo
'LrJv =
em 1969- 34,8
= 117,8(7o)'
496 Estatística Cap. 17
(á) Com referência ao Problema 9(á), os preços relativos de 1978, com o período
de 1969 a 1970 como básico, são:
Preço relativo do leite =
= =
#= lo''4(vo):
= =#ã1 =e6'5(7o);
= =H =n0,8(vo).
Média (aritmética) dos preços relativos =
2pr/p0.105,4 + 96,5 + 110,g
=N=B =t04,2(vo).
L2. Resolver o Problema 11, quando for usada a mediana em yez da média
aritmética.
Solução
(a) Número índice desejado = mediana dos preços relativos
104,6,97,1e 111,8 = t04,6.
(ó) Número índice desejado = mediana dos preços relativos
105,4, 96,5 e 110,8 = 105,4.
Cap. 17 Números índices
13. Resolver o Problema 11, quando for usada a média geométrica em lugar da
aritmética.
Solução
(o) Número índice desejado = média geométrica dos preços relativos 704,6,
g7,L e111,8 = ffi = 104,s, mediante o emprego de
logaritmos.
(ó) Número índice desejado = média geométrica dos preços relativos 105,4,
96,5 e 110,8 = ffi = 104,1, mediante o emprego de
Iogaritmos.
Solução
(o) Índice de Laspeyres = índice agregado ponderado dos preços, com as
P'
2 qo
Índice de Laspeyres = zpoqo =
Solução
(o) Índice de Paasche = índice agregad.o dos preços com as quantidades do
período-base como pêsos =
2-!'st
ró) Índice de Paasche =
LPoQn
-
_ X (preços em 1978 ) (quantidades em 1978 ) _
- X(preços em 1969-1970)(quantidadesem 1978,1 -
16. Apresentar uma interpretação dos números índices de preço de (o) Laspeyres
e (ó) Paasche, com referência ao valor total (ou custo total) das utilidades.
Solução
(o) Ao calcular um índice de preço de Laspeyres, Ipg q0 representa o valor
total (ou custo total) de um conjunto de bens, serviços ou utilidades (às
vezes denominado cesta de mercadorias), no ano ou período-base. A quan-
tidade Zpn qo representa o valor total dessa n'tesnl.a. cesta, no ano ou
Cap. L7 Números índices 499
período dado. Por isso, um índice de preço de Laspeyres serve para medir
o custo total, em qualquer ano dado, de uma cesta de mercadorias adqui-
ridas no ano-base.
(ó) Ao calcular um índice de preço de Paasche,Zpoq, é o valor total (ou custo
total) das utilidades adquiridas, no ano dado, admitidos os preços do
ano-base, enquanto 2prqré o valor total das utilidades adquiridas, no ano
dado, aos preços desse ano. Portanto, um índice de preços de Paasche serve
para medir o custo total de :uma cesta de mercadorlos referido ao valor que
teria, se a compra tivesse sido efetuada no ano-base.
Solução
De acordo com a lei econômica da oferta e da procurd, as pessoas tendem a comprar
menos quando os preços sáo altos e mais quando eles são baixos. Esta é a denomi-
nada demanda eld,stico, que é válida quando a necessidade das utilidades náo é
absolutamente es sencial.
No caso do índice de Laspeyres,Z pn Çg será algo maior do que deveria ser
porque de acordo com a lei da oferta e da procura, as pessoas tendem a comprar
menor quantidade de utilidades de alto preço e maior quantidade das de menor
preço, de modo que o custo total seria menor do que o previsto por meio deZp, q6.
Portanto, o índice de Laspeyr ur,*#, tende a ser maior do que d.everia ser.
18. Provar que os números índices agregados ponderados de preços, com pesos
fixos (quantidades), satisfazem ao teste circular.
500 Estatística Cap. 17
Solução
Se qg representa os pesos fixos, tem-se, para quaisquer períodos a, b e c, os números
índices
,
ta/b =
zpo qo 167,
. zp" qo
Zp, qoe = Zpt qo'
Então,
po qo 2p" qo Zp.. qo Í
IaftIb^=ffi Z
ffi=ffi=Ia/c,
o que mostra que o teste circular é satisfeito.
Os números índices de Laspeyres e Paasche não satisfazem ao teste
circular.
Solução
Se F, L e P representam os números índices de Fisher, Laspeyres e Paasche,
respectivamente, tem-se
- Yltrosor[Zqoqn) -'
"=1@=",[Lp,
adotadas as definições de Z e P. Como t p ea média geométrica de 1, e P, conclui-se
^[
pelo resultado desejado.
20. Provar que o índice ideal de Fisher está compreendido entre os números índices
de Laspeyres e de Paasche.
Cap. 17 Números índices 501
Solução
Essa proposição decorre imediatamente do fato de que F, por ser igual tp , está
"{
situado entreL eP, porque L eP sáo números positivos. Note-se que, se L = P, então
F-L_P.
Como, de acordo com o Problema t7, L tem uma tendência de superestimar
as variações dos preços, enquanto P tem uma tendência de subestimó,-las, segtte-se que
F, que está situado entre L e P, proporcionará melhor estimativa do que L ou P.
Solução
(a) F = { LP = \,I1ffi§4) (10er0 - 103,9, de acord.o com os Problemas l4(a) e
15(o).
Solução
SejaFgTro número índice ideal de Fisher para um ano dado, referido a um ano-base,
e Fn/o o índice ideal de Fisher, quando o ano-base e o ano dado são permutados.
Então, o teste da reversibilidade do tempo será satisfeito se
Fo/r= l/Fn|gou FgTrFn/o= l.
Por definição,
Fo/n=W'Então Fn/o=
502 Estatística Cap. 17
Fo/rFn/o: =,
Solução
(o) Se X, Y.
Xr. yr, então (1) X{2 < XzYr
^ Xy+Y1 Y1
$) x2 + Y2' rr'
mediante a divisão de ambos os membros por Y1(X1 + Yr).
De (2) e (3) decorre o resultado desejado.
(á) Caso 1. O índice de Laspeyres é menor do que o de Paasche.
X.'( Y,
Então, -,' liY2
z\2
de modo que, de acordo com (o),
Cap. 17 Números índices 503
Lpoqo'z^1n*
^'L-Psq, Paasche'
ou índices de Laspeyres < índice de Marshall-Edgeworth < índice de
Caso2.oíndiced.ePaascheémenordoqueodeLaspeyres.
Sejam Xt=» Pn Qn,Xz=Z P0 Qn,Yt=» Pn Q0'Yz=2 po qo'
Solução
que: (índice
o teste de reversibilidade dos fatores será satisfeito se o índice for ta1
de preço) (índice de quantidade) = índice de valor'
FpFq=m@=r##=índicede
valor, de modo que o índice ideal de Fisher satisfaz ao teste de reversibilidade dos
fatores.
Solução
Admita-se que os períodos são numerados consecutivamente, de 1 a N, como na
primeira linha da Tabela 17.10, e sejam pb p2, -..pN os preços desses períodos,
constantes da segunda linha da tabela.
Tabela 17.10
Período I 2 -l j k N
Preços P1 p2 p3 pi Pk PN
Preços relativos pj/1 Pj/2 P j/3 1007o P j/k Pj/N
correspondentes ao
período primitivo j
Preços relativos P k/l Pk/z Pk/i Pk/3 pk/j Pk/j lOOTo Pk/N
correspondentes ao
período novo k
É claro que a quarta linha pode ser obtida da terceira, mediante a divisão
de cada casa por pj/4, isto é, preço relativo do período É referido ao período7 tomado
como base.
Cap. 17 Números índices 505
Por exemplo:
pi!!=Upi _4 p*rretc.
P1t* P*/Pi Pk'
Solução
Se representarmos os números índices para os vários períodos com o de ordem 7
tomado como base por
(l) Iity lyz, ..., IltN
e os números índices correspondentes com o período á como base por
obteremos a seqüência (2) dividindo-se cada termo da seqüência (1) pot lj/k se e
somente se
L,,
-!: = Iptr I;,o
t.i ,k
!' k = Ih z, ...
tj.
ou:
Tabela 17.11
Anos 191 5 1976 1911 t91 8 1919 1980
Indice (1975=100) 100,0 t12,5 115,1 t23,8 132.8 142,4
F onte : Conjuntura Econômica
Solução
(a) Divide-se cada Índice da tabela por 115,1 (correspondente ao novo ano-
base) e exprime-se o resultado em percentagem, tal como indicado na
Tabela 17.12.
Tabela 17.12
Anos t975 1976 1917 1978 1919 1980
Índice (1977 = 1gg7 86,9 97,1 100,0 t07,6 115,4 123,7
(ó) Calcula-se a média dos índices referentes ao novo período-base, isto é,
referente aos anos de Lg77 e 1978:
l12 (ll5,l + 123,8) = 119,45
Tabela 17.13
Anos t9'7 5 r916 r917 r978 r979 1980
Indice (77-78 = 100) 83,1 94.2 96.4 103,6 111.2 t19,2
Tabela 17.14
Solução
Calcula-se, primeiramente, a nova série do índice de preços com base no ano de
referência, isto é, l975.Paratanto, divide-se cada índice pelo valor de 1975, ou seja,
por 55,4, expressando-se o resultado em percentagem. Tais valores estão na Tabela
17.15. Divide-se, agora, o valor do salário mínimo pelo respectivo índice de preços
da Tabela 17.15, multiplicando o resultado por 100. Esta é a série dos salários
mínimos reais referida a 1975 e que também se encontra na Tabela 17.15.
Tabela 17.15
Solução
Dividindo-se Cr$ 1,00 pelo índice de preço da Tabela 17.15 obtém-se os valores da
Tabela 17.16, que mostram o poder aquisitivo do cruzeiro de 1975 em cada um dos
anos dados. A casa 0,48, por exemplo, significa que um cruzeiro em 7977 poderia
comprar apenas 487o do que comprava em 1975.
508 Estatística Cap. 17
Tabela 17.16
PROBLEMAS SUPLEMENTARES
Preços relativos
30. A Tabela 17.17 apresenta o preço médio anual do quilo do açúcar reÍinado no
município de São Paulo para vários anos. Determinar os preços relativos (o)
em 1977, adotando 1975 como base; (ó) para o período 1979-1982, adotando
1976 como base; (c) para toda a série, adotando como base o período 1977-1978.
Tabela 17.17
t97 5 1,84
t916 2,98
t911 4,51
1978 6,00
t979 8,93
l 980 18,55
1981 41,25
1982 84,00
Fonte:Anuário Estatístico do IBGE
31. Provar que (o) pa/b pb/c pc/a = 1, (.b) pon pbtc pctd = pa/d,.
Cap. 17 Números índices
33. O preço relativo do ano de 1976, com o de 1978 como base, é 62+, enquanto o
Tabela 17.18
Consumo de energia
1970 66.699
t91 1 69.892
1972 71.682
t913 86.163
197 4 93.349
t91 5 99.722
t91 6 t09.491
t911 116.501
1978 125.469
t979 t33.666
1980 t39.041
Fonte: Anuário Estatístico IBGE,
510 Estatística Cap. 17
Valores relativos
36. Em 1980, o preço de uma utilidade aumentou de Sovo sobre a de Lg72, enquanto
a quantidade produzida diminuiu de 30vo. De que percentagem o valor total,
em cruzeiros, da utilidade, em 1980, aumentou ou diminuiu em relação ao valor
de 1972?
Resp.: (o) Aumentou de 57o.
ô/. A Tabela 17.19 apresenta os preços e os valores relativos de uma utilidade nos
anos de 7976 a 1980, admitidos os períodos básicos indicados. Determinar as
quantidades relativas da utilidade, adotados como básicos, (o) o ano de Lg76 e
(á) o período de 1976 a 1978. Interpretar os resultados.
Tabela 17.19
Anos t9'7 6 1917 1918 1979 1980
Preços relativos
100 125 150 115 200
(1976 = 100)
Valores relativos
150 180 201 231 252
(1967-1969 = 100)
Tabela 17.20
Preços Quantidades
41. Provar que um número índice agregado simples satisfaz aos testes de reversi-
bilidade do tempo e circular, mas náo satisfaz ao de reversibilidade dos fatores.
Resp.: (a) 221,6; 171,7; (b) 226,8; 196,3. Os valores verdadeiros sáo 224,2 e
183,6, respectivamente.
57. Provar que os números índices agregados simples de valores satisfazem aos
testes de reversibilidade do tempo e o circular.
514 Estatística Cap. 17
PROBLEMAS DIVERSOS
60. Provar que, se os números índices de Laspeyres e Paasche forem iguais, eles
serão também iguais aos números índices de Marshall-Edgeworth e ideal de
Fisher.
61. Organizar uma tabela dos vários tipos de números índices, especificando, em
cada caso, se eles satisfazem ou não aos testes de reversibilidade do tempo, de
reversibilidade dos fatores e circular.
h
MÀKRON
Gapítulo
18
Análise da variância
515
516 Estatística Cap. 18
Tabela 18.1
Escrevendo-se a identidade
O segundo somatório à direita das equações (5) e (6) denomin a-se uariações
erutre os tratamentos, pois envolve os quadrados dos desvios das várias médias X;.
dos tratamentos em relação à média geral X, e simboliza-se por Vg. Assim,
-2
v=Lrxir-f, (10)
Vw=V-Vn (12)
518 Estatística Cap. 18
onde I %= 0 (ver Problema 18.9). Da equação (15) e na suposição de que os sJà são
J
normalmente distribuídos com média 0 e variância o2, conclui-se que os Xin podem
ser considerados variáveis aleatórias normalmente distribuídas com média p e
variância o2.
A hipótese nula de que todos os tratamentos possuem as mesmas médias
édadapor116 : CLj = 0,j =1,2,...,d, ou, equivalentemente, HO : Vj = V,j =1,2,
..., d.. Se Ilg é verdadeira as populações de tratamento terão todas a mesma
distribuição normal, isto é, as mesmas médias e variância. Há, portanto, uma única
população, ou seja, todos os tratamentos são estatisticamente idênticos: em outras
palavras, não há diferença signifrcante entre os tratamentos.
Cap. 18 Aná,lise da uariô,ncia 519
E(Vil=a(b-l)o2 (16)
Ella(hv* l=o,
- t) ) ( 1e)
de modo que
Az =o1a-t,
rw VY
(20)
E('u.)=o, , e( J )=o,
-l.ab-t)- (2r)
[o-lJ
de modo que somente neste caso
produzirá estimativas não tendenciosas de o2. Se, todavia, Ilg não for verdadeira,
teremos da equação (16)
b
E(§;) = o2 + a-l »,ú (23)
520 Estatística Cap. 18
são iguais, observamos, da Equa çáo (23), que se pode esperar que ôg2 ,"iu maior
que 02, com o efeito tornando-se mais acentuado quanto maior for a discrepância
entre as médias. Por outro lado, das Equações (19) e (20) pode-se esperar que
Âo
Sfi seja igual a o', indiferentemente iguais ou não. Conclui-se
se as médias sejam
que uma boa estatística para testar a hipótese -ÉIs proporcionada por,§r' I §fi, . Se
esta estatística for signiÍicantemente grande, pode-se concluir que há uma diferença
significante entre as médias dos tratamentos e assim rejeitar 116; por outro lado,
pode-se aceitar Ilg ou reservar o julgamento após uma análise posterior.
Tabela 18.2
Quadrado
Médio
Entre os tratamentos, /Y
Vs=b » (xt -Yf Az Vs .
Jr= sá
a- | Ã-
.t s;,
Dentro dos tratamentos, coma-lea(b-l)
V*=V-Vn graus de liberdade
Total,
V=Vn-lVw
=Z(Xir-D2
-)
l,' =L(Xjt
j,k
- xt2 = ?,r ,i
j,k
- '* (24)
^)
l;-
r' 'fL
t
Va =2 (Xj. - nz =»Ni(Íi - X\z=Z - N (2s)
j,k j iNi
Vw=V-Vn (26)
Estatística Cap. 18
Tabela 18.3
Graus de Quadrado
I.iherdade Médio
Entre os tratamentos, ^,
Sí
va=\ \(\ - x)' s;
^t
Tabela 18.4
Bloco
1 2 b
v =Z (X.ft - D2 (28)
j,k
Escrevendo-se a identidade
T2
V=2X2- ab
(3 1)
j,k
v*=i,i,t -# (32)
Í,
nC -r3+
- -T2 (33)
,,*.- ab
o 11
Vr,=V-Vn-Vc (34)
onde j,
Q. é o total dos valores das células correspondentes à linha de ord,em T.p é
o total dos valores das células correspondentes à coluna de ordem k e T é o total de
todos os valores das células.
Cap. 18 Andlise da uariô,ncia 525
onde I g, = 0 e x Êa = 0.Aquipéamédiageraldapopulação,cr;éapartedeXin
devida aos diferentes tratamentos, algumas vezes denominada efeito dos tratamen-
tos,$7ré a parte deXia devida aos diferentes blocos, algumas vezes denominadaefeito
dos blocos, e eipé a parte deXin devida ao erro ou ao acaso. Como anteriormente,
supõe-se que os s;t são normalmente distribuídos com média 0 e variância o2, de
modo que, os Xin são também normalmente distribuídos com média p e variância
I
6".
De acordo com os resultados (16), (17) e (18), pode-se provar que as
esperanças matemáticas das variações sejam dadas por
NVpAIVç42V sl=,it
sÃ=o_-r s'=,o'_, (41\
serão estimadores não tendenciosos de o2. Todavia, se 170(1) e HoQ) não forem
verdadeiras, então, das Equações (36) e (37), respectivamente, ter-se-á
Ersol
^1 =d+;:1Z0J2
^h (42)
Tabela 18.5
/\1 /\a
Entre tratamentos, sh/s-E
A, Vp
vn=b»(x1 --Dz a-7 JR_
a-l coma-le(a-l)lb-
l 1) graus de liberdade
,^1 /\a
Entre blocos. S'c/Sí
b-l 4) Vç
Je=1r-l
Vc=o»(Ír-X)2 comá-le(a-l)(à-
k
- 1) graus de liberdade
Residual ou aleatória,
Vn=V-Vn-Vc
(a-t)(b-t) A)
o'-
Vp
l, - lxb - 1)
Total,
V=VR+Vç+Vg =
ab-l
=»qxy,_ V)2
j,k
(4s)
jkjk
e os Xinl são supostos serem normalmente distribuídos com média p e variância o2.
onde
v =L (Xjrrr - D2 \41)
j,k,t
a
Vn=bcZ (Xi..-x)' (48)
j=r
h
Vc=ac» (x.t _ x)2 (4e)
k=l
VI= cL (Íir,.- Xj - X.r. + h2 (s0)
j,k
X,..
r" !, r,o,
= brk.t = lzx;1,.
'"' b J"' A
ó2)
I/o(11 ' Todas as médias dos tratamentos (Iinhas) são iguais, isto é, % = 0.
Ho(2) ' Todas as médias dos blocos (colunas) são iguais, isto é, 0r = 0.
Tabela 18.6
/\a /\a
st/
Entre blocos.
Vç
b-l st=;=
zr1 Vr-
comá-leab(c-1)
s'E
graus de liberdade
,^, ,/\f
s; /sí
lnteração, /\) vt
\a - l)tb - 1) sí= (a-1Xb-1) com(a-1Xá-1)e
vt ab(c - 1) graus de
liberdade
Residual ou aleatória, /Y Vç
V6
ab(c' - l) "E-ab(c-l)
Total,
V
abc-l
não são demasiad.amente grandes. Podemos, então, testar HoQ) s IIr(2) usando-
2. fí0(3) Pode SerRejeitada. Neste caso podemos concluir que as interações são
significativamente grandes. Diferenças nos fatores seriam, então, importantes
somente se elas fossem grandes quando comparadas com tais interações. Por
Estatística Cap. 18
esta razáo, muitos estatísticos recomendam que F10(1) e H0(2) sejam testadas
F equivalentes a §fu§? §31§? no lugar das apre-
usand.o-se as razões
" este procedimento alter-
sentadas na Tabela 18.6. Utilizaremos, também,
nativo.
A análise da variância com repetição é realízada mais facilmente totalizan-
do-se, inicialmente, os valores de repetição que correspondem a tratamentos
(linhas) e blocos (colunas) particulares. Isto produz uma tabela de dois fatores com
células individuais, que pode ser analisada como na Tabela 18.5. Este procedimento
está ilustrado no Problema 16.
D A C C I C B A D D B C A By 4g D5 Da
B D B A il A B D C B D A C A6 Ba cy Dr,
D C B D il1 B C D A C A D B Du C6 Bg A!
A B C A IV A D C B A C B D Cn Dy Aa B5
Aleatorização Blocos Quadrado Quadrado
Completa Aleatorizados Latino Greco-Latino
Figura 16.1 Figura 16.2 Figura 16.3 Figura 16.4
na Figura L8.2 e por esta razáo os blocos são apresentados corno blocos
aleatorizados. Este tipo de planejamento é usado quando se deseja controlar
uma fonte de erro ou uariabilidade, a saber, a diferença nos blocos.
t). Quadrados Latinos. Para algumas finalidades é necessário controlar duas
fontes de erro ou uariabilidade ao mesmo tempo, tais como as diferenças nas
Iinhas e nas colunas. No experimento como no Exemplo 1, os erros em diferen-
tes linhas e colunas poderiam ser devidos às alterações na fertiiidade do solo
em diferentes partes da terra. Neste caso é desajável que cada tratamento
ocorra uma vez em cada linha e uma vez em cada coluna, como na Figura 18.3.
O arranjo denomina-se quadrado latino, pelo fato de serem usadas as letras
latinas A, B, C e D.
4. Quadrados Greo-Latinos. Se for necessário controlar três fontes de erro ou
uariabilidade, usa-se rm quadrado greco-latino, como na Figura 18.4. Tal
quadrado consiste essencialmente de dois quadrados latinos superpostos, com
as letras latinas A, B, C e D usadas para um quadrado e as letras gregas cx, B,
y e ô usadas para o outro. A condição adicional que deve ser satisfeita é que
cada letra latina deve ser usada uma e somente uma vez com cada letra grega;
quando esta condição for satisfeita, diz-se que o quadrado é ortogonal.
PROBLEMAS RESOLVIDOS
2(X1r<
j,k
- X)'=2j,k(Xir, - X1)2 +» (Xi
j,k
- h'
Solução
z(x1r<-x;(x1
j,k -h=íaxi
j=t
; w1',-x1.t)
-D[Lt=1 l
-l(a ) -ll=s
=Z(Xi-fiI1ZXpl-oxt
j=r L(r=r ) )
pois Xi=*
w
!*,u
k=l
Solução
Solução
= » 4n
j,k
- zx(au-n + abx2 =
Cap. 18 Arudlise da uariô,ncia 533
=»1r, - abX2 =
j,k
= 21r -tbT2
j.k
=24.-zx
j,k
»X1.+ abx2 =
i,k
..2
(7,\ T,
- 2X » 1' + abx' =
,11.;] .j.k D
rí ! tl - zxtabxl + abx2 =
* 11tr1-r
1í - aa-f =
u 1'=t fi.
1í ^
TZ
-)
t:J:
-
b i"=, 'j'-ab-
A 48 49 50 49 3454
B 47 49 48 48 2433
C 49 51 50 50 46s5
Solução
Para simplificar os cálculos, podemos subtrair um número adequado, por exemplo
45, d.e todas as observações sem afetar os valores das variações, obtendo-se, assim,
os dados da Tabela 18.8.
:4
1
Xy=](3+4+5+41
4'
I
X. =1e+4+
4' 3+3.y =3
1
Xt.=)ê+6+5+5)=5
4
I
X =i(3 + 4+ 5+4+2+4+3+3+4 +6 + 5 + 5) = 4
Por conseguinte, a média geral para o conjunto de yalores originais é 45 +
+4=49ton.
(c) A variação total é
+ (5 _ 4)2+(5-4)2=14
Cap. 18 Andlise da uariô.ncia 535
VW=V-VB=14-8=6
Outro método
Tabela 18.9
Entre tratamento A) 8
Vn=8
a-l=2 SÉ=,=4 ôr'4-
= L/3
- =
O
^l
Sú
Dentro tratamentos
a(b-l)=(3)(3)=9
A)62
5ú=9=J com2e9
VW=V-Vn graus de liberdade
=14-8=6
Total, ab-t=(3)(4)-1
V=14 = 11
Solução
,^, ê-2 = va I
(0) DB - - | == B _ 1 =- tL
"
536 Estatística Cap. 18
Solução
TemosF=ú__=íh=6
§r'4^
2i §w
Solução
É conveniente organizar os dados como na Tabela 18.10.
Tabela 18.10
T, 7,2
A 3454 t6 256
B 2433 t2 t44
C 4655 20 400
Assim
-2 ,
^nr2
v --» xfi -; = 206 - ffi = 206 - te2 = t4
j,k
T=16+12+20=48
Usando-se a fórmula (11) temos
VW=V-Vs-14-8=6
Os resultados estão de acordo com os obtidos no Problema 4, e a partir deste
ponto a análise prossegue como anteriormente.
Solução
Subtraindo-se um número apropriado, como 60, de todos os dados obtemos a Tabela
18.12. Então
538 Estatística Cap. 18
Tabela 18.11
11
A 68 12 42 53
B 72 53 63 53 48
C 60 82 64 75 72
D 48 61 57 64 50
E 64 65 70 68 53
Tabela 18.12
T, rl
A 8 t2 t7 -18 -7 t2 144
B t2 -1 3 -1 -12 -l I t2t
C 0 22 4 15 t2 53 2809
E 4 5 10 8 -7 20 400
ZXfi,=2659 54 3814
Cap. 18 Andlise da uariô,ncia 539
Tabela 18.13
^,
F Entre tratamentos
VB = 629.0
a- I -4 ff=ry=Éi,25 * = 1,67
sú
Dentro tratamentos
VIV = 1883,8
a(b-l)=(5X4)=20 §,7=lffi =e4,t6
Total
ah-l=24
V = 2512.2
Tabela 18.14
Solução
É conveniente subtrair um número apropriado dos dados, por exemplo 400, obten-
do-se a Tabela 18.15, que apresenta os totais das linhas, as médias das amostras
(ou dos grupos) e a média geral. Assim, temos
vB »(x, _Íy2 : »r'r14.-x)' = 3(9 - 7)2 + 5(7 -5)2 + 4(8 - t)2 =36
= j.k j
Vw = V -Va=J2-36=36
Tabela 18.15
Total Média
Amostra I 'l 11 9 27 9
Amostra 2 4 6 8 5 2 25 5
Amostra 3 10 8 6 8 32 8
84
X = média geral
" = Lz
,1 = 7
Podemos também obter Vgz diretamente, observando-se que tal variação é igual a
Tabela 18.16
Va=36 a-l=2 §3 =! = rc Js 18
6--=4,5
Vw=36 N-a=9 §fr=+=o s'ú/ +
Cap. 18 Andlise da uaridncia 541
Solução
Da Tabela 18.15 temos Nr - 3, N2 = 5,Ns - 4, N = 12,7,1.= 27, T2.= 25, 73. = 32,
eT=84.
Conseqüentemente, temos
v = z,xi-',i ="+l12+'"+62+"-tW=tz
l.K
Tabela 18.17
1a 6.7
Fertilizante A 4,5 6.4
Solução
Calculam-se os totais das linhas, as médias das linhas, os totais das colunas, as
médias das colunas, o total geral e a média geral como está apresentado na Tabela
18.18.
Tabela 18.18
Vc= 3[(6,4 - 6,8)2 + Q,O - 6,8)2 + (1,5 -6,U2 + (6,3 - 6,8;21= 2,92
A variação total é
Tabela 18.19
§Ãt§3 = 6.24
Vn = 13,68 2 §n2 = 6,s4
com2 e 6 graus
de liberdade
§Ãt§3 = 0,86
Vc = 2,82 J §.2=o,gq
com3e6graus
de liberdade
vt, = 6,58 6
/\,
S É= 1,091
V = 23.08 t1
Solução
Da Tabela 18.18 temos
')
», X fr = (4,5)2 + (6,4)2 + ...+ (5,2)2 = 511,96
i,k
Então
_s ?
xi7 577,96 - 554,88 = 23,O8
j,k ah
Vp
b
1
,Tf = ){rrro,r4) - ss4,88 = r3,68
Vç
a
1
,T? -rbT, I
= 1t 1673.10) - 554.88 = 2.82
Solução
Os dados podem ser dispostos como na Tabela 18.21 na qual estão indicados os dois
fatores principais: máquina e turno. Note-se que estão indicados os dois turnos para
cada máquina. Os dias da semana podem ser considerados como repetições do
desempenho de cada máquina para os dois turnos. A variação total para todos os
dados da Tabela 18.21é
Tabela 18.20
A 6 4 5 5 4 5 7 4 6 8
B 10 8 7 1 9 7 9 t2 8 8
C 1 5 6 5 9 9 7 5 4 6
D 8 4 6 5 5 5 7 9 7 10
Tabela 18.21
4 5 5 4 24
A Ir 6
30
5 7 4 6 8
12
B Ir 108119 4l
[2 191288 44
C 7 5 6 5 9 32
4 6 31
{t 9 1 5
D 8 4 6 55 28
{; 5 7 9 110 38
Tabela 18.22
A 24 30 54
B 4t 44 85
C 32 31 63
D 28 38 66
Total t2s t43 268
Tabela 18.23
Linhas (máqu^inas)
VR = 51,0
3
ffi = rz,o ffi:0,0,
Colunas (turnos)
VC =8,1
I
,/s
Só = 8,t fj =:'oo
Interação
VI = 6,5 fr = 2,t6t ffi = r,r,,
Subtotal
I/S = 65,6
Aleatória ou residual
VE = 84,8
32 fi = 2,6s
Solução
Ao nível 0,01 ainda não há interação apreciável, de modo que podemos prosseguir
um pouco mais além.
Como F0,99 = 4,47 para 3 e 32 graus de liberdade, e como o valor calculado
de F para as linhas é 6,42, podemos concluir que, mesmo ao nível 0,01, as máquinas
não possuem a mesma eficiência.
Quadrados Latinos
15. Um fazendeiro deseja testar os efeitos de quatro fertilizantes diferentes,A, B,
C e D, sobre a produção de trigo. A fim de eliminar as fontes de erro devido à
variabilidade da fertilidade do solo, ele usa os fertilizantes em um quadrado
latino como representado na Tabela 18.24, onde os números indicam as produ-
ções em toneladas. Realizar uma anáIise da variância para determinar se
existe diferença entre os fertilizantes aos níveis de significância de (o) 0,05 e
(ó) 0,01.
Cap. 18 And,lise da uariâ.ncia 549
Solução
Inicialmente obtemos os totais de linhas e colunas como está indicado na Tabela
L8.25. Podemos também obter as produções totais para cada fertilizante, como na
Tabela 18.26. Avariação total e as variações das linhas, colunas e tratamentos são
obtidas como de costume.
A variação total é:
Tabela 18.24
Tabela 18.25
Total
A18 c21 D25 B 11 t5
D22 Bt2 At5 C19 68
Tabela 18.26
A B C D
Total 70 48 85 92 295
_ (ll-\2 *- e4\2 n
V'c='i o3)2 - o l)2 e9»2 _ <,1A1 1\
+ - + +
t/^
4'-'-iO'=5443.15-5439.06=4.69
A variação entre os tratamentos é
Tabela 18.27
Linhas,29,l9 -1
q 71 4.92
Colunas, 4,69 3 1,563 0,19
Tratamentos ,284,19 3 94.73 41,9
Residuais, 11,87 6 1,978
Total,329,94 t5
(a) Como Fo,gs;s;o = 4,76 podemos rejeitar, ao nÍvel 0,05, a hipótese da igual-
dade das médias de linhas. Segue-se que, ao nível 0,05, existe diferença na
fertilidade do solo de uma linha para outra.
Como o valor de tr, para as colunas é menor que 1, concluímos náo haver
diferença na fertilidade do solo nas colunas.
Como o valor de F para os tratamentos é 47,9 > 4,76, podemos concluir na
existência de diferença entre os fertilizantes.
(ó) Como F0,99;B;6= 9,78, não podemos aceitar a hipótese de não haver diferen-
ça na fertilidade do solo nas linhas (ou colunas) ao nível 0,01. Contudo,
ainda devemos concluir que existe diferença entre os fertilizantes ao nível
0,01.
Cap. 18 And.lise da uariôncia 551
Solução
Como o número de tipos de gasolinas, de motoristas, de carros e de estradas é o
mesmo (quatro), podemos usar um quadrado greco-latino. Suponha-se que os dife-
rentes carros são representados pelas linhas e os diferentes motoristas pelas
colunas, como na Tabela 18.18. Atribuamos, agora, os diferentes tipos de gasolinas
(A, B, C e D) às linhas e colunas de modo aleatório sujeitos somente à condição de
que cada letra apareça uma única vez em cada linha e em cada coluna. Assim, cada
motorista terá oportunidade única para dirigir cada carro e utilizar cada tipo de
gasolina, e nenhum carro será dirigido duas vezes com o mesmo tipo de gasolina.
Atribuem-se, agora, ao acaso, as quatro estradas a serem utilizadas,
representando-as por o, Ê, T e ô, sujeitando-se à mesma condição imposta aos
quadrados latinos. Conseqüentemente, cada motorista terá também a oportunidade
para dirigir ao longo de cada uma das estradas. A Tabela 18.28 apresenta um
possível arranjo.
Tabela 18.28
Motorista
I 2 J 4
Carro I By ÁB D6 ca
Carro 2 Á6 Ba cy DB
Carro 3 Da Ca Bg Ay
Tabela 18.29
Motorista
I 2 3 4
Carro I By 19 Ap 16 D6 16 ca 14
Carro 2 A6 15 Ba l8 cy tt Ds 15
Carro 3 Dd 14 C6 ll Bg 21 Ay t6
Caro 4 Cs 16 Dy t6 Aa 15 86 23
Solução
Inicialmente determinamos os totais das linhas e das colunas, como na Tabela 18.30.
A seguir obtemos os totais para cada letra latina e cada letra grega, como se segue:
Total
By t9 Ag 16 D6 16 cd 14 6-5
Á5 15 Ba 18 cT 1l DB 15 59
Da 14 C5 11 Bg 2t Ay t6 62
CB t6 Dy t6 Ad 15 B6 23 70
Total 64 61 63 68 256
Cap. 18 Anó,lise d,a uariô,ncia 553
^-1
Colunas: '"; +. §! *
$4)2 t63)2 * (6812
_ (2562 = a1o,
4 4 4---={=4LU2,50-4096=6,50
Gasotinas (L B, c, e ot,ff . ry .%-.ry ry = 4207,50 - 4osl= 111,50
A variação total é
PROBLEMAS VARIADOS
Solução
As médias populacionais dos tratamentos py e a média total da população p estão
relacionadas por
554 Estatística Cap. 18
1_
F=;'v, (s3)
Tabela 18.31
6.50
-) 2,167
ffi= r,os
Gasolinas (A, B, C ,
D), 111,50
J 37,167
T# = 18,6
19. Deduzir (o) a Equação (16) e (b) a Equação (17) deste capítulo.
Solução
(o) Por definição temos
. o [' h
vw = 2 61r, - 4 )2 = b 2 | i » gr< - Vi )' =b»S?
i.k l=1lot,=t" j=1
var(Xi )= t
(s 8)
_2
var 1)q = Il
an
r5q\
E(X) = tL (61)
=(a-t)yt2+b»S
556 Estatística Cap. 18
Solução
Como se mostrou no problema anterior,
vw=bísl o, \=íut]
j=t j=to' o-
onde Sr2 é a variância amostral para amostras de tamanh o b extraídas da
população de tratamento 7. Sabe-se que bsjz/o2 tem uma distribuição qui-qua-
drado com ó - 1 graus de liberdade. Deste modo, como as variâncias Sr2 são
independentes, concluimos que V1ry/oz é qui-quadrado com a$ - 1) graus de
liberdade.
Tabela 18.32
A 20 t2 15 t9
B t1 t4 t2 15
C 23 16 18 14
D 15 t7 20 t2
E 21 t4 I1 l8
22. Uma empresa deseja testar quatro tipos diferentes de pneus: A, B, C e D. Suas
durações, determinadas pelas suas bandas de rodagem, estão na Tabela 18.33
(em milhares de quilômetros), onde cada tipo foi testado, aleatoriamente, em
seis automóveis semelhantes. Determinar se existe diferença significante
entre os pneus aos níveis (o) 0,05 e (á) 0,01.
Tabela 18.33
A JJ 38 36 40 31 35
B 32 40 42 38 30 34
C 3l 31 JI 35 -t -) 30
D 29 34 32 30 JJ 31
Resp.: Não há diferença significativa entre os pneus para cada um dos níveis.
23. Um professor deseja testar três métodos diferentes de ensino: I, II, III. Para
isso, são escolhidos, de modo aleatório, três grupos de cinco estudantes, e cada
grupo é instruído por um método diferente. E dada então a mesma prova a
todos os estudantes e os graus obtidos constam da Tabela 18.34. Determinar
se existe diferença entre os métodos de ensino aos níveis de significância (o)
0,05 e (ó) 0,01.
Tabela 18.34
Método I 15 62 '7t 58 73
Método II 8l 85 68 92 90
Método III 73 79 60 75 81
Tabela 18.35
Qualidade A t2 15 t4 11 15
Qualidade B l4 t2 15
Qualidade C ll t2 10 t4
Qualidade D 15 18 l6 t7 14
Qualidade E 10 t2 14 t2
Tabela 18.36
Matemáticas 72 80 83 75
Ciências 81 14 11
Inglês 88 82 90 87 80
Economia 14 1t 1'7 10
Tabela 18.37
Operdrio
1 2 3
Máquina Á 23 27 24
Máquina B 34 30 28
Máquina C 28 25 27
Tabela 18.38
Tipo de Milho
III N
Bloco A 15
Bloco B t9
Bloco C 14 18 15 t2
Bloco D 1l 16 t2 16
Bloco E 16 11 11 14
Resp.: Há uma diferença signiÍicativa quanto ao tipo de milho, mas não quanto
ao tipo de solo.
30, Suponha-se que no Problema 22 a primeíra observação para cada tipo de pneu
é feita usando-se um tipo particular de automóvel, a segunda observação em
outro tipo de automóvel, e assim por diante. Determinar, ao nível de signifr-
cância 0,05, se existe diferença (o) entre os tipos de pneus e (ó) entre os tipos
de automóveis.
Tabela 18.39
Alta 75 78 80
Média 81 76 19
Baixa t-t 15 79
Tabela 18.40
A 16 18 20 23
B 15 t7 t6 t9
C 2t t9 18 21
D 18 22 21 23
E 17 18 24 20
Resp.: No nível de 0,05, existe uma diferença significativa devido ao local, mas
não com relação aos fertilizantes.
Tabela 18.41
Mdquina I Máquina II
Seg. Ter. Qua. Qui. Sex. Seg. Ter. Qua. Qui. Sex.
Operador Á 15 18 l7 20 12 t4 16 18 17 15
Operador B t2 16 14 18 11 11 15 12 16 12
Operador C 14 11 18 16 13 t2 14 16 t4 11
Operador D t9 16 21 23 18 17 15 18 20 11
Resp.: Há uma diferença significativa entre os operários, mas não entre as máquinas.
Estatística Cap. 18
Quadrados Latinos
38. Realiza-se um experimento para testar o efeito sobre a produção de milho de
quatro fertilizantes diferentes (A, B, C, e D) e das variações do solo em duas
direções perpendiculares. Obtêm-se o quadrado iatino da Tabela 18.42, onde
os números representam a produção de milho em toneladas. Testar, ao nível
de significância 0,01, a hipótese da não existência de diferença (a) entre os
fertilizantes e (ó) nas variações do solo.
Tabela 18.42
C8 410 Dt2 B 11
At4 c12 B tl D15
D10 Bt4 ct6 410
B1 D16 At4 c12
Resp.: Não há diferença significativa entre fertilizante ou solo.
39. Resolver o problema anterior ao nível de signiÍicância 0,05.
Resp. Não há diferença significativa entre fertilizante ou solo.
40. Referindo-se ao Problema 33, suponha-se que introduzimos um fator adicional
indicando a região E, M ou W onde um estudante nasceu, como mostra a Tabela
18.43. Determinar, ao nível 0,05, se existe diferença significante nos resultados
escolares das estudantes femininas devida (o) à altura, (á) à cor do cabelo e (c)
à região de nascimento.
Tabela 18.43
8151W78M80
M8lE761Wt9
w13lM75lE11
Resp.: Não há diferença signiÍicativa nos resultados escolares devido à dife-
rença de altura, à cor do cabelo e região de nascimento.
Cap. 18 Aná.lise da uariô'ncia 563
Tabela 18.44
W1 W2 W3 Wa
S1 cy 8 Bp 6 A(\ 5 D5 6
S2 A6 4 Dcx 3 CB 1 By J
S3 DB 5 A"t 6 B5 5 ca 6
Sa Ba 6 C6 l0 D"t t0 AB 8
42. Quatro tipos diferentes (Tt, Tz, Ts e Tq) são fabricados por cada uma
de cabos
das quatro companhias (cr, cz, cz u c+). Quatro operários (A, B, c e D)
utilizando quatrà máquinas diferentes (cr, 0, Y e ô) medem as resistências dos
cabos. As resistências médias obtidas são apresentadas no quadrado greco-1a-
tino da Tabela t8.45. Realizar uma análise da variância ao níve1 de significân-
cia 0,05, relatando quaisquer conclusões que possam ser extraídas.
Tabela 18.45
Ct C2 Cz Ct +
PROBLEMAS DIVERSOS
43. A Tabela 18.46 fornece os dados sobre a ferrugem acumulada sobre o ferro, que
foi tratado quimicamente com os produtos A, B ou C. Determinar se existe
diferença significante nos tratamentos aos níveis (o) 0,05 e (á) 0,01.
Tabela 18.46
A ..) 5 4 4
B 4 2 J 3
C 6 4 5 5
Tabela 18.47
Tabela 18.48
Contagem
Veterano 90 81 74
Não Veterano 85 78 10
Tabela 18.49
Contagem
Leste 88 80 72
Centro-Oeste 84 18 75
Sudeste 86 82 10
Norte e Nordeste 80 75 79
Qr.
Estatística Cap. 18
Tabela 18.50
A 5 4 6 3
B J 4 2 3
C 5 1 4 6
Tabela 18.51
A l7 t4 18 12
B 20 10 20 15
C 18 l5 t6 17
D t2 l1 t4 t1
E 15 t2 t9 14
56. Efetuar uma anáIise da variância sobre o quadrado latino da Tabela 18.52 ao
nível de significância 0,05 e relatar as conclusões'
Resp.: Não há diferença signÍicativa devido aos fatos 7 e 2, ou tratamentos A,
BeC.
57. Elaborar um experimento que conduza ao quadrado latino da Tabela 18.52.
Tabela L8.52
Fator 1
B t6 C 21 A 15
Fator 2 A 18 B 23 C l4
C 15 A l8 B t2
Tabela 18.53
Futor I
Ay 6 Bp l2 C6 4 Dd 18
ca 16 D5 6 Ag t1 B^,t 7
Testes não-paramétricos
lntrodução
A maioria dos testes de hipótese e significância (ou regras de decisão) considerados
nos capítulos anteriores necessitam de várias suposições sobre a distribuição da
população da qual as amostras são extraídas. Por exemplo, no estudo da distribuição
amostral das médias admitiu-se que as amostras foram extraídas de populações
normais ou aproximadamente normais.
Na prática surgem situações nas quais tais suposições não se justificam ou
nas quais surgem dúvidas quanto às suas aplicações, como no caso em que a
população pode ser altamente assimétrica. Por isso, os estatísticos imaginaram
vários testes e métodos que independem das distribuições populacionais e dos
parâmetros associados, que são denominados testes ndo-paramétricos.
Os testes não-paramétricos podem ser utilizados como substitutos abrevia-
dos dos testes mais complicados. São de valor especialmente no processamento de
dados não numéricos, como os que surgem quando consumidores classificam, em
ordem de preferência, cereais ou outros produtos.
Teste do sinal
Considere-se a Tabela 19.1, que apresenta os números de parafusos defeituosos
produzidos por duas máquinas de tipos diferentes em 12 dias consecutivos e que
supõe que as máquinas têm a mesma produção total por dia. Desejamos testar a
568
Cap. 19 Testes não-paramétricos
hipótese Ifg de que não existe diferença entre as máquinas: as diferenças observa-
das, em teimos àe parafusos defeituosos produzidos, são meramente resultado do
acaso, o que significa dizer que aS amostras provêm da mesma população.
Tabela 19.1
Dia I 2 3 4 5 6 7 8 9 10 11 12
MdquinaI 41 56 54 49 36 48 51 38 61 49 56 52
Mdquina Il 7t 63 45 64 50 55 42 46 53 51 15 60
Teste U de Mann-WhitneY
Considere-se a Tabela 19.2, que apresenta as resistências de cabos produzidos de
duas ligas diferentes. Nesta tabela temos duas amostras: uma de 8 cabos da liga I
e a outra de 10 cabos da liga II. Gostaríamos de decidir se existe ou não diferença
570 Estatística Cap. 19
Tabela 19.2
Liga I Liga II
18,3 16,4 22,7 t],8 12,6 t4,t 705 10,7 15,9
18,9 25,3 16,1 24,2 19,6 12,9 t5,2 1 1,8 14.7
e tem a mesma distribuição amostral que a estatística (2), com média e variância
iguais às da fórmulas (3). Aestatística (5) está relacionada à estatística (2), pois se
U1e U2 são os valores correspondentes às estatísticas (2) e (5), respectivamente,
temos
U1+U2=ly'tly'2 (6)
Temos também
R1 +R2-1v@t!
2
Q)
Teste H de Kruskal-Wallis
O teste (J é tm teste não-paramétrico para decidir se duas amostras se originam da
mesma população. Uma generalização para le amostras é proporcionada pelo teste
H de Krusleal-Wallis, owteste H.
Este teste pode ser descrito deste modo: Suponha-se que possuímos à
amostras de tamanhos N1, N2, ..., Nk, com o tamanho total referente ao conjunto de
todas as amostras dado porN = Nr + N2 +...+ N7r. Suponha-se, além disso, que os
dados do conjunto de todas as amostras são contados (são atribuídos postos) e que
as Somas dos postos para as À amostras são.81, R2,..., -R6, respectivamente. Se
definirmos a estatística
k
a=*t'fe sL R,2 3(l/ + 1) (8)
572 Estatística Cap. 19
'-t'1i'-n-' (e)
rsJ = , - 6ZD2
-| ..
N(N2-1)
(15)
PROBLEMAS RESOLVIDOS
Teste do sinal
Baseando-se na Tabela 19.1, testar a hipótese l7s d9 Uu-e não
há diferença entre
1. de haver diferença a um
as máquinas I e II, contra a hipótese alternativa.Frl
nível de signiÍicância de 0,05'
Pr (X)
0123456789101112
Figura 19.1
Solução
normal para
AFigura 19.1 é um gráfico da distribuição binomial e uma aproximaçáo
2, ...,72 corres-
ela,lue fornece as probabilidades deX assumir os valores 0, 1,honesta L2vezes.
pond.entes .o ,prru.i-ento de cara no lançamento de uma moeda
bo Capítulo 7, a probabilidade de X caras é
f u )f L l'
(tz\(t Írt )''-' :=[,J[
Pr {X} =
[,J[: ]i)l ,l
pelo que Pr {0} = 0,00024, Pr {1} = 0,00293, Pt {21 = 0,01611 e Pr {3} =
0,05371.
Solução
A aproximação normal para a distribuição binomial utiliza o fato de que o escore z
correspondente ao número de caras é
,=x-lt -^rw
o =x-ryp
Devido ao fato de que a variável X para a distribuição binomial ser discreta,
enquanto a distribuição normal é contínua, efetua-se vrrla correçã,o para continui-
dade (por exemplo, 3 caras representam um valor entre 2,5 e 3,5 caras). Isto importa
diminuir 0,5 de X,seX >Np e aumentar 0,5 se X<Np. Ora,N, - 12, lL =Np =
= (12X0,5)=6eo =^[Npq = \,tf2x0ó)(0"5) = l,TS,demodoque
(3+0.s)-6
t.13 -1.45
Como este valor é maior que -1,96 (valor de z para o qual a área da cauda
esquerda é 0,025), chegamos à mesma conclusão do Problema 1.
Note-se que Pr {z A - 1,45} = 0,0735, que está bem de acord.o com Pr {X < 3
caras) = 0,07299 do problema anterior.
3. A Companhia PQR afirma que a duração de um tipo de bateria que ela fabrica
é maior do que 250 horas. IJm consumidor desejando determinar se a aÍirmação
é justa mede a duração de 24 baterias; os resultados estão na Tabela 19.3.
Supondo que a amostra seja aleatóría, determinar se a afirmativa da Compa-
nhia é justa ao nível de significância 0,05.
Cap. 19 Testes nõo-paramétricos 577
Solução
Seja I/6 a hipótese de que as baterias possuem uma duração igual a Z5O h, e H1 a
de que ela seja menor do que 250 h. Para testar Ho cortraIll, podemos usâr o teste
do sinal. Para isto, subtraimos 250 de cada valor da Tabela 19.3 e registramos os
sinais das diferenças como mostra a Tabela 19.4. Vemos que existem 15 sinais
positivos (+) e 9 negativos (-).
Tabela 19.3
Tabela 19.4
21t 230 198 215 282 225 284 219 +- ++-+-
253 216 262 288 236 291 253 224 +- I +-++-
264 295 2tt 252 294 243 212 268 ++ ++++
z = 1,645
Figura 19.2
Solução
(o) Subtraindo-se 66 de todos os valores da Tabela 19.5 e mantendo-se somente
os sinais associados obtemos a Tabela 19.6, na qual existem 23 sinais
positivos, 15 negativos e 2 zeros. Excluindo-se os 2 zetos, nossa amostra
consiste agora de 38 sinais: 23 positivos e 15 negativos. Usando-se um teste
bilateral da distribuição normal com probabilidaa", ]2 (0,05) = 0,025 em
cada cauda (Figura 19.3), adotamos a seguinte regra de decisão:
Tabela 19.5
11 62 55 64 82 66 74 58 79 61
18 46 84 93 12 54 ',78 86 48 52
61 95 70 43 ',70 13 51 64 60 83
'73 40 18 70 64 86 76 62 95 66
Tabela 19.6
Tabela 19.7
Cap. 19 Testes ndo-paramétricos 579
z=1,96 z=1,96
Figura 19.3
Teste U de Mann-Whitney
Recorrendo-se à Tabela L9.2, determinar se existe diferença, ao nível
significância 0,05, entre os cabos produzidos pela liga I e pela liga II.
580 Estatística Cap. 19
Solução
Organizemos o trabalho de acordo com as etapas 1,2 e3, descritas anteriormente
neste capítulo.
Etapa 1. Combinando-se todos os 18 valores amostrais e ordenando-os do
menor para o maior obtêm-se a primeira linha da Tabela 19.8. Estes valores estão
numerados de 1 a 18 na segunda linha, os quais nos fornecem os postos.
Etapa 2. Para encontrar-se a soma dos postos de cada amostra, refaçamos
a Tabela 19.2 usando-se os postos associados da Tabela 19.8; isto nos fornece a
Tabela 19.9. As somas dos postos são 106 para liga I e 65 para liga II.
Tabela 19.8
10,7 11,8 12,6 12,9 l4,l 14,1 15,2 15,9 16,1 16,4 17,8 18,3 18,9 19,6 20,5 22,1 24,225,3
| 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 11 18
, =4=-. orr=w#fl=@-r,1E12)
NrNz
ttu= =126,6i
Por conseguinte,
oij = ll'25e
:= u-lru lo-40
- oy 11.25
Como a hipótese É16 eue estamos testando supõe não haver diferença entre
as ligas, é necessário um teste bilateral. Para o nível de significância 0,05, temos a
seguinte regra de decisáo:
Aceitar Ifg se -1,96 < z < 1,96.
Tabela 19.9
Liga I Liga II
18,3 t2 12,6 3
16,4 10 t4,t 5
)) '7
16 20,5 t5
17,8 ll 10,1 1
18,9 13 r5,9 8
,5 1 18 t9,6 t4
16,1 9 t2,9 4
)Á-') t7 1 1,8 7
Soma 65
Solução
(o) Como as amostras 1 e 2 produzem valores para U dados por
Solução
Para a amostra da liga II,
N'(Ll ('q1-L'-
u = NrNz* " - *, = (8)rr0) + 65 = 70
8. Um professor ministra aulas a duas classes de psicologia: uma pela manhã com
9 estudantes e uma à tarde com 12 estudantes. No exame final, estabelecido
para a mesma hora para todos os estudantes, as classes receberam os graus
apresentados na Tabela 19.10. Pode-se concluir, ao nível de significância 0,05,
que a classe da manhã teve pior desempenho que à da tarde?
Tabela 19.10
86 81 84 88 90 8s 84 92 83 9t s3 84
Solução
Etapa 7. ATabela 19.11 apresenta a ordem dos graus e postos. Note-se que o posto para
11
os graus 75 é;r5 + 6) = 5,5, enquanto o posto para os três graus é;(L1+ 12 + 13) = 12.
Tabela 19.11
53 66 t0 73 75 75 19 81 82 83 84 84 84 85 86 81 88 90 91 92 95
1 2 -1 4 5§ 1 8 9 l0 t2 14 15 t6 11 l8 t9 20 2t
Tabela 19.L2
Soma dos
postos
Etapa 3.
80-54
-=u-v'
og = 14.0i = l'65
Como queremos testar a hipótese iI1 que a classe da manhã teve pior
desempenho que a classe da tarde, contra a hipótese flg eue não há diferença, ao
nível 0,05, necessita-se de um teste unilateral. Recorrendo-se à Figura 19.2, temos
a seguinte regra de decisão:
Aceitar I/s se z < 1,645.
9. Determinar U para os dados da Tabela 19.13 usando-se (o) a fórmula (2) deste
capÍtulo e (ó) o método de contagem descrito na observação 4 deste capítulo.
Estatística Cap. 19
Solução
(o) Ordenando-se os dados de ambas as amostras crescentemente e atribuin-
do-se postos de 1a 5 obtemos a Tabela 79.14. Substituindo-se os dados da
Tabela 19.13 pelos respectivos postos obtemos a Tabela 19.15, que nos
fornece as somas dos postos,Ãr = 5 e Rz- 10' Como Nt= 2eN2 = 3, o valor
de Upara a amostra 1é
Amostral122 10 Dados 10 14 11 22 25
Amostra 2 l7 25 14 Posto lt 2 3 4 5
Tabela 19.15
Soma dos
Postos
Amostra 7 4 1 5
Amostra 2 ., 5 2 t0
Dados I II II I II
Tofal = 2
10. Uma população consiste dos valores 7, L2 e 15. São extraídas duas amostras
sem reposição: amostra 1, consistindo de um único valor, e amostra 2, con-
sistindo de dois valores (as duas amostras esgotam a população).
(o) Determinar a distribuição amostral de U e construir seu gráÍico.
(ó) Determinar a média e a variância da distribuição do item anterior.
(c) Verificar os resultados obtidos no item (á) utilizando as fórmulas (3) deste
capítulo.
Solução
(o) Adotamos amostragem sem reposição para evitar empates que poderiam
ocorrer se, por exemplo, o valor 12 aparecesse em ambas as amostras.
Existem 3 ' 2 = 6 possibilidades de escolher as amostras, como mostrad.o
na Tabela 19.16. Notar-se-á que poderíamos facilmente ter usado os postos 1,2 e 3
ao invés de7, L2 e 15. o valor de Una Tabela 19.16 é o que foi encontrado para a
amostra 1, mas, se [/ correspondesse à amostra 2, a distribuição seria a mesma.
Um gráfico desta distribuição está representado na Figura L9.4, ond,e f é a
freqüência. A distribuição de probabilidade de U pode também ser diagramada;
neste caso Pr {tl- 0} = Pr {u- 1} = Pr Íu - 2l =}. o srafico pedido é o mesmo que
o apresentado na Figura 19.4, com as ordenadas 1e2 substituídas, respectivamen-
te, respectivamente, p".
á" *
586 Estatística CaP. 19
Tabela 19.16
Amostra I Amostra 2 a
7 12 15 2
7 15 12 2
12 115 1
l2 157 I
15 7t2 0
15 12 1 0
012
Figura 19.4
Solução
(o) Aqui existem 5' 4'3 '2 = 120 possibilidades para escolher os valores para
as duas amostras e o método empregado no Problema 9 é laborioso demais.
Para simplificá-lo, concentremo-nos na amostra menor, de tamanho Nr -
= 2, e nas possíveis somas dos postos, Êr.A soma dos postos para a amostra
I é amenor quando ela consistir dos menores números ordenados (1,2); por
conseguintê, 81 = 1 + 2 = 3. Analogamente, a soma dos postos para a
amostra I é a maior quando ela consistir dos maiores números ordÃnados
(4,5); conseqüentemente, R1= 4 + 5 = 9. Portanto, E1 varia de B a g.
Tabela 19.17
3 (r,2) 1 6 0,1
4 (1,3) I 5 0,1
5 (1,4) (2,3) 2 4 o)
6 (1, s) (2, 4) 2 3 0,2
7 (2, s) (3,4) 2 2 0,2
8 (3, 5) I I 0,1
9 (4, s) I 0 0.1
Estatística Cap. 19
0123456
Figura 19.5
P(U}
Figura 19.6
_ 2Í(u - o2
o2rl sr
-.1
Outro método
+ (2téf
o2u = -2 -2- = (t)(6)2 + 11.y15)2
u--u l0 r
(2)(3)2 + (2X2)2 + (1X1)2 + (lX0)2
+
10
-(3)2 = 3
Solução
Seja,E a soma dos postos. Então temos
R= 1+ 2+3+...+ (N- 1) +N (16)
13. Se R1 e .82 são as respectivas somas dos postos das amostras 1 e 2 no teste [/,
-
provar eue.R1 + Rz tN (N + 1)112.
Solução
Suponhamos que não existam empates nos dados amostrais. Então -81 deve ser a
soma de alguns dos postos (números) do conjunto 1,2,3,..., N, enquanto.B2 deve
ser a soma dos postos restantes. Assim, a soma R1+ R2 deve ser a de todos os postos
do conjunto, isto é, R1 + R2 = I + 2 + 3 +...+ N = [N (N + l)112, de acordo com o
problema anterior.
Teste H de Kruskal-Wallis
14. Uma companhia deseja comprar uma das cinco máquinas diferentes A, B, C,
D ou E. Em um experimento projetado para determinar se existe diferença de
desempenho entre as máquinas, cada um de cinco operários experientes tra-
balharam com as máquinas por períodos de tempo iguais. A Tabela 19.18
apresenta o número de unidades produzidas por cada máquina. Testar a
hipótese de que não existe diferença entre as máquinas aos níveis de signifr-
cância (o) 0,05 e (ó) 0,01.
Tabela 19.18
A 68 72 77 42 53
B '/2 53 63 53 48
C 60 82 64 15 72
D 48 6t 57 64 50
E 64 65 70 68 53
Solução
Como existem cinco amostras (Á, B, C, D e E), k = 5, e como cada amostra consiste
de cinco valores temos Nr = Nz - N3 = Na = Ns = 5, resulta queN = N1 + N2 + N3 +
+ N4 + Ns = 25. Ordenando-se todos os valores crescentemente e atribuindo-se postos
apropriados aos empates, substituímos a Tabeia 19.18 pela Tabela 19.19, onde a
coluna à direita mostra a soma dos postos. Da Tabela 19.19 vemos que E1 = 70, Rz =
= 48,5, E3 = 93, R+ = 40,5 e Es - 73.Assim
Cap. 19 Testes nd.o-paramétricos 591
1)
'-
Á'
R?
Ll-
N (N + l)'
§
f - 3tlr + ty
i=l
t2 I tzor' (48.5)2 s3f (40.r2 Q121
5.5 +-+ --_t-
5l 3(26) = 6,44
(2s)(26) Ls -)
Tabela 19.19
Soma dos
Postos
A tl.5 2t 24 6,5 10
B 2t 6,5 12 6.5 )\ 48,5
C 10 25 t4 23 21 93
D )5 l1 9 t4 4 40,5
E 14 t6 t9 17,5 6,5 13
15. Resolver o problema anterior se for feita uma correção para os empates.
Solução
A Tabela 19.20 apresenta o número de empates correspondentes a cada uma das
observações empatadas. Por exemplo, 48 ocorre duas vezes, pelo que ? = 2, e 58
ocorre quatro vezes, pelo que T = 4. Calculando-se ?3 - T para ãada um áestes
valoresdeTe somando-seosmesmos,encontramosque ,(?3 -T)= 6+ 60 +24+
+ 6 + 24 = 120, como está apresentado na Tabela L9.20. Então, como N = 25, o fator
de correção é
592 Estatística Cap. 19
:(r3-n '_ t_
.I __. Do
=0,9923
Nr N - Q5f"-- 25
eo valor corrigido de H é
" ( o.992:
u,=^6:11.=6.4e
Tabela 19.20
Observação 48 53 64 68 72
Número de empates 2 4 3 2 3
(r)
13 -r 6 60 24 6 24 ,(73-T)=l2o
Solução
Temos k = 3, Nt= 4,N2= 3,N3 = §,N=Nt + N2 + Ng = 12,
Rt=7 + 4+ 6+ 10= 27,R2= 11 + 9 + 12=32eRs=5 + 1+ 3+ 8+2 = 19'
Assim
k R,2
H=-N(Nr)+ .I+-31N+l;=
l)i:r Nr
,,
_l !27)2 -- eZ,, r*!:),.l _ J\rJ'-v'vJ
(l2ll3) I + +
3(13) = 6,83
5 .]
(o) Para lt, - | =3 -
1 = 2 graus de liberdade XZ,ss= 5,99. Por conseguinte,
como 6,83 > 5,99, podemos concluir que existe diferença significante entre
as arnostras ao nível 0,05.
(á) Para 2 graus de liberdade Xl,ss = 9,27. Como 6,83 < 9,21, náo podemos
concluir que existe diferença entre as amostras ao nível 0,01.
Cap. 19 Testes não-paramétricos 593
Tabela 19.21
Amostra I '7
4 6 t0
Amostra 2 11 9 t2
Amostra 3 5 I 3 8 2
THHTHTTHTHHTH
(a) Determinar o número de séries, V.
Solução
(a) Utilizando-se uma barra vertical para indicar uma série, vemos de
2(t6)(t4L*
[' = t6 + 14 I = r5.93
J"J oi
vv =
2U!-X1qp!!!)(!4 - t6- t4l = 7,1.5
(16. 14Ê16. 14 - l)
ouou = 2,679. Oescorezcorrespondente aV=22 sériesé
v - v, 22 - 15.93
L--t
oy 2.679
=
,=@-%W=2,08
alcançando-se a mesma conclusão.
-1,96 1,96
Figura 19.7
Solução
Os números de D's e G's são Nr = 10 e N2 = 38, respectivamente, e o número de
séries 5y = ll. Por conseguinte, a média e a variância são dadas por
2(lo)(38)
Ir,,= 10 + l1 = ro,õr oi = 2W
16,83 ot = 4,99i
1to *:aftto *:s_t;
de modo eue Fu = 2,235.
_
=
v - fr, _ Il - 16,83 = _2.61
oy 2.235
Cap. 19 Testes ndo-paramétricos
19. (a) Formar todas as seqüências possíveis consistindo de três o's e dois ó's e
determinar o número de séries correspondente a cada seqüência.
(ó) Obter a distribuição de amostragem de V e seu gráfrco.
(c) Obter a distribuição de probabilidade de V e seu gráfico.
Solução
(o) O número de seqüências possíveis consistindo de três o's e dois ó's é
Seqüência V Í
aaabb 2 2 2
aabab 4 J J
aabba 3 4 4
ababa 5 5 1
abbaa 3
ab(tab 4
bbqaa 2
babaa 4
baaqb J
baaha 4
596 Estatística Cap. 19
Figura 19.8
P( v]
0,4
0,3
0,2
0,1
Figura 19.9
Solução
(o) Da Tabela 19.22 temos
2+4+3+5+3+4+2+4+3+4 tl
t0 5
Cap. 19 Testes nd.o-paramétricos 597
Outro método
Da Tabela 19.22 o método dos dados grupados fornece
(á) Usando-se o método dos dados grupados para calcular a variância, temos
da Tabela 19.23
-2- zÍ(v-v\2
tJ1. - s/
_
2 2 2 )-
17) I
I
_t\ + r+t - 17
17 ) 17 ) . (1)[5- zt
= *[ ,',(' -5 I
+ r:r(:- 5) _l
5) slltt-- 2s
[+
Outro método
Como no Capítulo 3, a variância é dada por
2 _ v2 n2 - Q)Q)2 +
6rt=V/-V
(3)(3)2 + t4)\4)2 + 11)r5)Z rnl 2t
10 ls l 2s
Solução
Como existem três a's e dois ó's, temos N1 =3eNz=2.Assim,
2l'ltNz
(a) g, =
'- -r N2
rv1
+l=2(3!-2r+z
3
+t=! 5
@oZ
2I'{tNz(21{tNz - Nr - Nz) _ 2(3)(:2i)12(3)(:2) - 3 - 2) _ 21
(1ür+Nz)2(Nr+N2-1) (3 +21213+2-lt 25
Estatística Cap. 19
Solução
ATabela 19.24 apresenta o tempo de duração das baterias em ordem crescente.
Como existem 24 valores na tabela, obtêm-se a mediana por intermédio da média
dos valores 253 e262,isto e,Iese + 262) = 257,5' Refazendo-se a Tabela 19'3
usando-se um d se o valor for superior à mediana e ó se for inferior, obtemos a
Tabela 19.25, na qual temos 12 a's, 12 b's e 15 séries. Assim, Nl = 12, N2 = 12,
N = 24, V -- 15, temos
zNN-L+
tl': Nr +N2
+ 1I =
2(r41t2)
D - + t2 ol == a!N!e§!l = 5,139
rr ot
tz++ 1t = 13
e4re3)
de modo que
V-F,=15-13=oR1s
--
z=- oy 2.396
Solução
A combinação de todos os valores de ambas as amostras já aparece na linha 1 da
Tabela 19.8. Utilizando-se os símbolos a e b para os dados das amostras I e II,
respectivamente, a combinação passa a ser
bbbbbbbbaaQaabbaaa
2N1N2
ll,,= .,
lvl
* N" *
+l\2+l | _= 2(8X10)
lg
+ 1 = 9,889
., 2N fi - N t - Nz) 2(8X10)(142),,^.
2QNfi z
o,;= " =+.r-J
(Nr + N2)21N1 + N2 - l) 11312117)
de modo que
, =Y--!t= a ?:989
or, -
2.031
= -2.90
- _v - P, _ (4 + 0,5) - 9,889
- _., (;\
oy 2,03r
Correlação de posto
24. A Tabela 19.26 apresenta como 10 estudantes organizados em ordem alfabética
foram ordenados de acordo com suas realizações no laboratório e nas conferên-
cias de um curso de biologia. Determinar o coeÍiciente de correlação de posto.
600 Estatística Cap. 19
Tabela 19.26
Laboratório 83927t04615
Conferência 951018735426
Solução
Adiferença dos postos, D,no laboratório e nas conferências para cada estudante é
fornecida pela Tabela 19.27, que também fornece D2 e ZD 2. Assim
indicando que existe uma marcada relação entre as realizações no laboratório e nas
conferências.
Tabela 19.27
25. A Tabela 19.28 apresenta as alturas de uma amostra de 12 pais e de seus filhos
mais velhos. Determinar o coeficiente de correlação de posto.
Tabela 19.28
Altura do pai (cm) 165 163 167 164 168 t62 170 166 168 t67 169 tlt
Altura do filho (cm) 168 166 168 165 169 166 168 16s 111 t67 168 t70
Solução
Colocando-se as alturas dos pais em ordem crescente temos
t62 163 164 165 166 t67 167 168 168 t69 t7t (18)
Cap. 19 Testes nd.o-paramétricos 601
165 165 166 t66 167 168 168 168 168 169 110 rlt (20)
e como os sexto, sétimo, oitavo e nono lugares representam a mesma altura (173
cm), atribuímos o posto médio ]4 iO + 7 + 8 + 9) = 7,5 a estes lugares. Assim, aos
filhos são atribuídos os postos
Este resultado está bem de acordo com o coeficiente obtido por outros
métodos (ver Problemas 9, L4, 1,6 e 23 do Capítulo 14).
Tabela 19.29
Tabela 19.30
D -3,5 -1,5 -1,0 1,5 -1,5 -2,5 3,5 3,5 -3,5 1,5 2,5 1,0
D2 t2,25 2,25 1,00 2,25 2,25 6,2512,25 12,25 12,25 2,25 6,25 1,0C Z D2 ='72,50
Estatística Cap. 19
Problemas Su plementares
Teste do sinal
26. Uma companhia divulga que se seu produto for adicionado a um tanque de
automóvel à gasolina, a quilometragem por litro melhorará. Para testar tal
afirmação, são escolhidos 15 automóveis diferentes e mede-se a quilometragem
por litro com e sem uso do aditivo; os resultados estão apresentados na Tabela
19.31. Supondo-se que as condições para dirigir sejam as mesmas, determinar
se existe diferença devido ao uso do aditivo aos níveis de significância (o) 0,05
e (á) 0,01.
Tabela 19.31
Com aditivo 34.7 28.3 19.6 25.r 15,7 24,5 28,7 23,5 21,7 32,1 29,6 22,4 25,7 28,1 24,3
Sem aditivo 31,4 21,2 20,4 24,6 14,9 22,3 26,8 24,1 26,2 31,4 28,8 23,1 24,0 21,3 22,9
Tabela 19.32
4t 28 35 38 23
37 32 24 46 30
25 36 22 4t 31
43 21 34 27 36
42 33 28 31 24
32. Mostrar como obter os limites de conÍiança de 957o para os dados do Problema 4.
Teste U de Mann-Whitney
34. Dois instrutores, A e B, ministram um curso de química em uma escola. Em
um exame final comum, seus estudantes obtiveram os graus constantes da
Tabela 19.33. Testar, ao nível de significância 0,05, a hipótese de que não existe
diferença entre os graus dos dois instrutores.
Tabela 19.33
A 88 15 92 11 63 84 55 64 82 96
B 12 65 84 53 76 80 51 60 51 85 94 81 13 61
Tabela 19.34
Trigo I 15,9 15,3 t6,4 t4,9 15,3 16,0 14.6 15,3 14,5 16,6 16,0
Tabela 19.35
A 30,4 28,7 29,2 32,5 31,1 29,5 30,8 31,1 30,7 31,8
B 33,5 29,8 30,1 3t,4 33,8 30,9 3t,3 29,6 32,8 33,0
39. Pode-se usar o teste U para determinar se existe diferença entre as duas
máquinas da Tabela 19.1? Explicar.
40. Montar e resolver um problema usando o teste [.I.
41. Determinar (I para os dados da Tabela 19.36 usando (o) o método da fórmula
e (ó) o método da contagem.
Cap. 19 Testes ndo-paramétricos 605
Tabela 19.36
Amostrq I t5 25
Amostra 2 20 32
Resp.: 3.
Tabela 19.37
Amostra I 40 27 30 56
Amostra 2 l0 35
Resp.:6.
43. Uma população compõe-se dos valores 2,5,9 e 12. Duas amostras são retiradas
desta população, sendo a primeira composta de um destes valores, e a segunda
dos outros três valores.
(a) Obter a distribuição amostral de U e seu gráfrco.
(á) Obter a média e a variância desta distribuição, diretamente e pela fórmula.
44. Provar que U1 * U2= NrNz.
45. Provar que -R1 + Rz- [N(N + l)ll2 para o caso em que o número de empates for
(a) l, (b) 2 e (c) qualquer número.
46. Se N1 = 14, N2 = 12 e Ãr = 105, determinar (a) Rz, (b) Ut e (c) Uz.
47 . Se N1 = 10, N2 = 16 e U2 = 60, determinar (a) Rt @) R2 e (c) Uy
48. Qual é o maior número entre os valores NL, Nz, RL, R2, U1 e U2 que pode ser
determinado dos remanescentes? Provar a resposta.
Teste H de Kruskal-Wallis
49. Realiza-se um experimento para determinar-se os rendimentos de cinco varie-
dades diferentes de trigo. Quatro lotes de terra são atribuídos a cada variedade
e os rendimentos estão apresentados na Tabela 19.38. Supondo-se que os lotes
possuem fertilidade semelhante e que as variedades são atribuídas aos lotes
aleatoriamente, determinar se existe diferença significante entre os rendimen-
tos aos níveis (o) 0,05 e (ó) 0,01.
Estatística Cap. 19
Tabela 19.38
A 20 12 l-5 19
B t1 t4 t2 1.5
C 23 16 t7 t4
D l5 t7 20 L2
E 2t t4 t7 18
50. Uma companhia deseja testar quatro tipos diferentes de pneus. A duração dos
pneus, determinada de suas bandas de rodagem, consta, em milhares de
quilômetros, da Tabela 19.39; cada tipo foi testado, aleatoriamente, em seis
automóveis semelhantes. Determinar se existe diferença significante entre os
pneus aos níveis (a) 0,05 e (ó) 0,01.
Tabela 19.39
A 1..' 38 36 40 31 35
B 32 40 42 38 30 34
C 31 JI 35 11 34 30
D 27 JJ 32 29 3l 28
Tabela 19.40
Método I 18 62 11 58 13
Método II 76 85 90 81
Método III 74 79 60 15 80
Tabela 19.41
Matemática 72 80 83 75
Ciências 8l 14 11
Inslês 88 82 90 87 80
Economia 14 1l 77 70
53. Usando-se o teste 11, resolver os Problemas (o) 9, (b) 2l e (c) 22 do CapÍtulo 16.
54. Usando-se o teste I/, resolver os Problemas (a) 23, (b) 24 e (c) 25 do Capítulo 16.
58. (o) Formar todas as seqüências possíveis consistindo de dois o's e um ó, e dar
o número,de séries, V, correspondente a cada seqüência.
60. Resolver os Problemas 58 e 59 para os casos em que existem (o) dois o's e dois
á's, (b) um o e três ó's e (c) um o e quatro b's.
61. Resolver os Problemas 58 e 59 para os casos em que existem (a) dois o's e quatro
ó's e (ó) três a's e três b's.
Tabela 19.42
10,315 t1,125 10,875 10,625 I 1,500
tt,625 lt,250 |t,375 10,750 11,000
10,875 10,750 11,500 11,250 12,125
1 1,875 t1,37 5 1 1,875 ll,l25 ll,l50
Correlação de posto
69. Em uma competição, pediu-se a dois juízes ordenar oito candidatos, numerados
de 1 a 8, em ordem de preferência. Os juízes submeteram as escolhas apre-
sentadas na Tabela 19.43.
(o) Determinar o coeficiente de correlação de posto.
Tabela L9.43
Primeiro juiz 5 2 8 4 6 3 7
Segundo juiz 4 5 7 3 2 8 I 6
Resp.: a) 0,67;
ó) Os juízes não concordaram muito bem com suas escolhas'
70. Usar a correlação de posto para resolver os Problemas (a) 26, (b) 42, (c) 46 e
(d) 63 do CaPítulo 14.
72. O coeficiente correlação de posto pode ser determinado para d.ados agrupa-
d.e
dos? Explicar isto, e ilustrar a resposta com um exemplo.
Apêndice I
z 0 I 2 3 4 5 6 7 I 9
0,0 0,3989 0,3989 0,3989 0,3988 0,3986 0,3984 0,3982 0,3980 0,3917 0,3913
0,1 3910 3965 3961 3956 395 1 3945 3939 3932 392s 3918
0,2 3910 3902 3894 3885 3876 3867 3857 3847 3 836 3825
0,3 38 14 3802 3190 3718 3765 3152 3739 3125 37 t2 3691
0,4 3683 3668 3653 3637 3621 3605 3589 3572 3555 3538
0,5 3521 3503 3485 3461 3448 3429 3410 3391 3312 3352
0,6 3332 3312 3292 321 1 3251 3230 3209 3187 3166 3t44
0,7 3123 3101 3019 3056 3034 301 I 2989 2966 2943 2920
0,8 2891 2814 2850 2821 2803 2780 2156 2132 2',709 2685
0,9 2661 2637 2613 2589 2565 2541 2516 2492 2468 2444
610
Apêndice I 611
z 0 I 2 3 4 5 6 7 I 9
1,0 2420\ 23e6 2311 2347 2323 2299 2215 22st | 2221 2203
1,1 2179 2155 2lll I 2101 2083 ,ntn\ 2036 zonJ rsss 1 re6s
',"rà1,i;;;
t,2
I
2,t o44o oor,1 0422 041 l 0404 0396 0387 0379 o37t 0363
')) ] ü4il
L
)5 orzs 1 0r7l 0167 0163 I 0158 01s4 I 01s1 01411 01431 013e
2,6 0r361 01321 0t2e nrr.ul 0122 n, r,I or 16 ott3 orroI oloT
)1 oro+l ototl ooee nnru I ooe3 nnrr I oo88 nnru] ootol oo8l
2,8 oozo] oo77l ooTs nor, I oo,l nru, I 0067 oourl oourl 006r
,o ooool ooss] oos6 0055 0053 oor, ] ooso oo+sl oo+zl 0046
3,0
tl
0044 0043
L
I OO42 oo+o I
l
15
IL
oooel oooal ooos 0008
I
I
0008 0007
I
0007 ooo;
I
I oooT
I
0006
ooos I ooos ooo, I
3,6 0006
ooo+] ooo+l
oooo I 0006
ooo4 nooo I
ooo5
ooo4
ooot
0004
I ooos
0003 ooor] ooorl
ooo4
ooo3
5, t 1
0002 0002 r 0002
3,8 ooo:l 00031 0003 0003 0003 0002 0002
3g o 0002 0.0002 l 0.0002 o.ooo2I o.ooo, o.ooo21 o.ooo, o.ooo2 o,ooor 1o,or,o,
Apêndice ll
z 0 1 ) 3 4 5 6 7 8 9
0,0 0,000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0398 0438 0478 05t'7 0557 0596 0636 0675 07 t4 0754
0,2 0793 0832 087 1 0910 0948 0987 1026 1064 I 103 tt4t
0,3 t179 t2t7 1255 1293 t33t 1 368 1406 t443 1480 l5J1
0,4 1554 1591 t628 1664 1700 t'736 t772 1 808 1844 1819
0,5 1915 1950 1985 20t9 2054 2088 2123 2t57 2t90 2224
0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,8 288 I 2910 2939 296'7 2996 3023 305 1 3078 3 106 3 133
0,9 3r59 3186 3212 3238 3264 3289 33 15 3340 3365 3389
612
Apêndice II 613
z 0 I 2 j 4 5 6 7 I 9
1,3 4032\ 4o4s 4066 4082 onrrl or,tl 4.*r ororJ 4162 orr, I
t,4 4rs2\ 42oj orr.r\ 4236 ortrl orutl 42.,s ornr.\ 4306 43re I
)o 4172 41181 41831 4188 orrr\ orrrl o*n.l o*nrl 4B', 4817
I | 4842 oroul orro I
I
lt
2,4 +sra
I 4e4el
)\ 4e38 4e4o 494t1 4943 +sqsl 4s46 4e481 4e5t 4952
L qssel 4ss7 o*, | 4s6o |
+sot +sezl
4963 4964
2,6
)'7
] 4ess
4es3
4e65\ 4e66 onurl 4s6B 4969 4910 orrrl orrrl 4si3 4914
2,8 49741 4e7s orru\ 4s71 orrrl 4s7B onrrl onrnJ 4e8o 498t
or*l orsrl 4ss(
2,9 +ssr 4sB2
|
I
4e821
I
4e83 4e84J
4988
I
4e84
4989
tl
+osel +essl 4ss(
4986
4990
3,0
3,t
| 4e81 4e87 \ 4e88
4e87
4990 4991 4991 4991 onrrl 4es2 4ee2l 4ee2l 4ee: 4993
1) onnrl 4ss3 onnol 4ss4 4994\ 4994 4ee41 4ees 4ee:
] 4995
J,J ornt\ 4sss onnt\ 4ss6 orrul 4ss6 4e961 4996\ 499( 4997
3.6 \+ossl +soa onnn\ 4sss 49991 4999 +soel 4ess 4se( 4999
3.i | +sss 4sse ornnl 4sse +oool 4sss 49991 4999 499\ 4999
3.8 1 +sss\ +sss orrrl 4sss 49991 4999 onnr\ orrrl 4ss( 4999
is ln.tooolo.sooo o,sooo l o,tooo o,5ooo l o,tooo o.sooolo.soooLo.soor 0,5000
h
*s5*P*
Apêndice lll
to,ggs to,cs to,czs to,cs to,so Ío,so to,z s to,ro to,60 to,s s
l 63.66 3 r .82
] e.92 6.e6 4.30
12.7 | 6.3 I 3.08 1.316 I.000 0,721 0,325 0,1 58
2
i 2.92 1.89 1.061 0.816 611 289 142
3 s.84 ', +.s+ | :.la ] z.:s 1.64 0.978 0t.765 584 271 t37
4 4.60 3.75 2.78 2.13 l ,53 0,941 0,141
i
569 27t t34
5 4.03 3.36 2.57 2.02 l,48 0.920 0.121 0,559 0,267 0,132
6t 3,11 3,14',, 2,45 t,94 t.44 906 718 553 265 l3l
1 3,50 3,00 2,36 1,90 896 7tt 549 263 130
8 3,36 2,90 2,31 l,86 889 106 546 262 130
9 3.25 2,82 2,26 r,83 883 703 543 261 t29
614
Apêndice III 615
to,cgs to,g9 to,gzs to,g s to,co to,ao to,7 s to,7o to,60 to,s s
10 3,11 2,16 ))\ 1,8 I 1,37 819 700 542 260 t29
11 3,1 1 )1) 2,20 1,80 1,36 816 691 540 260 t29
t2 3,06 2,68 2,18 1,78 t,36 813 695 539 259 128
13 3,01 2,65 2,16 t,1'7 1,35 870 694 538 259 128
14 2,98 2,62 2,14 t,16 t,34 868 692 531 258 t28
15 ,q5 2,60 2,t3 t,7 5 1,34 866 69t 536 258 128
t6 )q) 2,58 2,12 I,15 t,34 865 690 53s 258 t28
t7 2,90 1<1 2,tt 1,14 1,33 863 689 534 257 128
18 2,88 7 55 2,t0 1,13 1,33 862 688 534 251 r21
t9 2,86 2,54 2,09 1,13 1,33 861 688 533 257 t21
24 2,80 2.49 2,06 1,11 1,32 851 68.5 -531 256 127
25 2,19 2,48 2,06 t,1r t,32 856 684 531 256 t21
26 2,18 2,48 2,06 t,7 t r,32 856 684 531 256 t27
21 ) 7'7 2,41 2,05 1,70 r,31 855 684 531 256 t21
28 2,76 2,41 2,05 t,70 t,31 855 683 s30 256 t2'7
29 2,16 2,46 2,04 1.10 1,31 854 683 530 256 121
30 )'75 2,46 2,04 1,70 1,31 854 683 530 256 121
40 2,10 )L) 2,02 1,68 1,30 851 681 529 255 t26
60 2,66 ?1q 2,00 1,61 1,30 848 619 527 254 t26
,: )6) 2,36 1,98 1,66 1,29 845 671 526 254 126
2,58 )17 r.96 t,645 t,28 842 614 524 253 t26
Fonte: R. A. Fisher e F. Yates, Statistical Tables for Biological, Agricultural and Medical
Research (51 edição), Table III, Oliver and Boyd Ltd., Edinburgh, com permissão dos autores
e editores.
Apêndice lV
n
x6,r* x3,rn Y"o.rrt xE.rt x3,no x?,.rt xà,to xà,rt xE,ro x3,ot x8,ort xô,or x3.oos
1 7,88 6,63 5,02 3,84 2,71 1,32 0,455 0,t02 0,0158 ),0039 0,0010 0,0002 0,0000
2 10,6 9,21 7,38 5,99 4,61 ) 1'7 1,39 0,575 0,21t 0,103 0,0506 0,0201 0,0100
J t2,8 1 1,3 9,35 7,81 6,25 4,11 2,3 I 1,21 0,584 0,352 0,216 0,115 0,072
4 14,9 13,3 11,1 9,49 "1,78 5]q 3,36 1,92 1,06 0,711 0,484 0,297 0,207
5 16,7 15,1 t2,8 11,1 9,24 6,63 4 15 2,67 1,61 1,15 0,831 0,554 0,4t2
6 18,5 16,8 t4,4 12,6 10,6 7,84 5 t5 3,45 ))o 1,64 t,z4 0,8'72 0,676
7 20,3 18,5 16,0 14,1 12,0 9,04 6,35 4,25 2,83 2,17 1,69 1,24 0,989
8 ))o 20,t 17,5 15,5 13,4 10,2 7,34 5,07 3,49 2,'73 2,t8 1,65 1,34
9 23.6 21,7 r 9,0 16,9 t4.7 11.4 8.34 5.90 4.17 t_ I 1 2.70 2,09 t,73
616
Apêndice IV 617
n xà:r ^.2
v3.nrt xE,ss x8,qs x6,ss xà,so xô,ts xE,so xE.zs xà.os l(0.025 x6,ot xô.oos
10 )5) )7 ) )n5 I 8,3 16,0 12,5 9,34 6,74 4,87 3,94 I ?5 2,56 2,16
1i 26,8 24,7 21,9 t9;7 17,3 13,'7 10,3 7,58 5,5 8 4,57 3,82 105 2,60
t2 28,3 )6) 2t,0 18,5 t4,8 1 1,3 8,44 6,30 5 rl 4,40 157 3,07
13 29,8 27,7 24,'7 1)t 19,8 16,0 1)\ 9,30 7,04 5,89 5,01 4,tl 157
14 31,3 29,1 26,t 23;/ 21,1 t't,1 13,3 10,2 7,'79 6,57 5,63 4,66 4,07
15 32,8 30,6 27,5 25,O ))7 18,2 t4,3 11,0 8,55 7,26 6,26 § r1 4,60
16 34,3 l?o 28,8 26,3 ?t 5 19,4 1 5,3 11,9 9,31 7,96 6,91 5,81 5,14
17 35,7 33,4 30,2 27,6 24,8 20,5 16,3 t2,8 10,1 8,67 7,56 6,41 5,70
18 37,2 34,8 3l ,5 28,9 26,0 2t,6 1',7,3 13,7 10,9 9,39 8,23 7,01 6,26
t9 38,6 36,2 32,9 30,1 )T ') ))7 18,3 14,6 tl,7 10,1 8,91 7,63 6,84
20 40,0 37,6 34,2 31,4 28,4 23,8 19,3 15,5 12,4 10,9 g5q 8,26 7,43
21 41,4 3 8,9 35,5 32,7 29,6 24,9 20,3 16,3 13,2 11,6 10,3 8,90 8,03
22 42,8 40,3 36,8 33,9 30,8 26,0 21,3 17,2 14,0 t2,3 1 1,0 9,54 8,64
23 44,2 4t,6 3 8,1 35,2 t?o )'7 1 ))\ 18,1 14,8 13,1 11,7 10,2 9,26
24 45,6 43,0 39,4 36,4 3),t 28,2 19,0 15,7 13,8 12,4 10,9 9,89
25 46,9 44,3 40,6 1'7 7 34,4 ,q1 24,3 19,9 16,5 14,6 1 3,1 1 1,5 10,5
26 48,3 45,6 41,9 38,9 35,6 30,4 75 l 20,8 17,3 t5,4 1 3,8 12,2 1t,2
27 49,6 47,0 43,2 40,1 36,7 31,5 26,3 21,7 18,1 16,2 t4,6 12,9 1 1,8
28 51,0 48,3 44,5 4t,3 37,9 32,6 )7\ ))'7 18,9 16,9 15,3 t3,6 12,5
29 5' 1 49,6 45,'7 42,6 39,1 )),t 28,3 23,6 19,8 t7,7 16,0 14,3 13,1
30 <? 7 50q 47,0 43,8 40,3 34,8 ?9 1 24,5 20,6 18,5 16,8 15,0 13,8
40 66,8 63,7 5ql 5 5,8 51,8 45,6 39,3 33,'7 29,1 26,5 24,4 )) ', 20,7
50 79,5 76,2 7 t,4 6'1,5 63,2 56,3 49,3 42,9 37,7 34,8 32,4 )o'7 28,0
60 92,0 88,4 83,3 79,1 74,4 67,0 59,3 52,3 46,5 43,2 40,5 37,5 i5 §
70 r04,2 100,4 95,0 90,5 8 5,5 77,6 69,3 61,'7 55,3 51,7 48,8 45,4 43,3
80 1 16,3 t12,3 106,6 101,9 96,6 88,1 79,3 71,1 64,3 60,4 57) 5l 5 51,2
t28,3 113,1 t0'7,6 98,6 89,3 80,6 '73,3 69,t 65,6 61 ,8 59,2
90 124,1 118,1
82,4 '77 q '74,2 70,1 67,3
100 140.2 135.8 129.6 124,3 118,5 109.1 99.3 90,1
N 0 1 2 3 4 5 6 7 8 I Partes Proporcionais
t23456789
rol 0000 0086 0128 0170
0043 02t2 0253 0294 0334 0374 4 8 t2 t7 21 2s 29 33 37
,t 04r4 0453 0492 0531 0569 0607 0645 0682 0719 0755 4 8 11151923263034
l
12 0792 0828 0864 0899 0934 0969 1004 1038 1072 1106 3 7 10 14 11 21 24 28 31
13 1139 tt'73 1206 1239 1271 1 303 1335 1367 1399 1430 3 6 10 13 16 t9 23 26 29
14 t46t 1492 1523 1553 1584 t614 1644 1673 i703 1732 6 9 121518212427
15 t161 1790 1818 t847 1875 1903 t931 1959 1987 2014 -1 6 8 tl 14 t7 20 22 25
t6 2041 2068 2095 2122 2148 2t'75 2201 2227 2253 22'79 3 5 8 11 13 16 t82124
17 2304 2330 2355 2380 2405 2430 2455 2480 2504 2529 2 5 7 10 12 15 17 20 22
18 2553 2577 2601 2625 2648 2672 2695 2718 2742 2165 2 5 7 9 1214161921
t9 2788 2810 2833 2856 2878 2900 2923 2945 2967 2989 2 4 7 9 11i3161820
21 7))) 7)4\ 3263 3284 3304 3324 3345 3365 3385 3404 2 4 6 8 10 12 14 16 18
22 3424 3444 3464 3483 3502 3522 3541 3560 3579 3598 2 4 6 8 t0 t2 14 15 l7
23 3617 3636 3655 3674 3692 3711 3729 374'7 3'766 3784 2 4 6 7 9 11131517
24 3802 3820 3838 3856 3874 3892 3909 3927 3945 3962 2 4 5 7 9 ltt21416
618
ApêndiceV 619
N 0 I ) 3 4 5 6 7 8 9 Partes Proporcionais
25 3979 3997 4014 4031 4048 4065 4082 4099 4tt6 4133 23 57 9 10121415
26 4150 4166 4183 4200 4216 4232 4249 4265 4281 4298 23 5'7 810 1113 15
2'7 4314 4330 4346 4362 4378 4393 4409 4425 4440 4456 23 56 8 9 111314
28 4472 4487 4502 4518 4533 4548 4564 45'79 4594 4609 23 56 8 9 t11214
29 4624 4639 4654 4669 4683 4698 4113 4728 4'742 475'.7 13 46 7 9 t012t3
30 4771 4786 4800 4814 4829 4843 4857 487t 4886 4900 134679101113
31 4914 4928 4942 4955 4969 4983 4997 5011 5024 5038 1 3 4 6 7 8 1011t2
32 s05 1 5065 5079 5092 s105 5119 5132 5145 5159 5t'/2 1 3 4 s 7 8 91112
-1 -' s185 5 198 521t 5224 5237 5250 5263 5276 5289 5302 1 3 4 5 6 8 9 1012
-)+ 5315 5328 5340 5353 5366 5378 s39r 5403 54t6 5428 1 3 4 5 6 8 910 11
35 5441 5453 546s 54'78 5490 5502 5514 5527 5539 555 1 12456791011
36 5563 5575 5587 5599 561 1 5623 5635 564',7 5658 5670 1 2 4 5 6 7 81011
3'7 5682 s694 5705 57t7 5729 5740 5752 s763 5775 5786 1235678910
38 5798 5809 5821 5832 5843 5855 5866 s877 5888 5899 r235678910
39 591 1 5922 5933 5944 5955 s966 5977 5988 5999 6010 t 2 3 4 5 7 8 9 l0
40 6021 6031 6042 6053 6064 6075 6085 6096 6107 6t17 1234s68910
4l 6t28 6138 6149 6160 6170 6i80 6191 6201 6212 6222 123456789
42 6232 6243 6253 6263 6274 6284 6294 6304 63t4 6325 123456"789
43 6335 6345 63s5 6365 6375 6385 6395 6405 6415 6425 123456'.789
44 6435 6444 6454 6464 6474 6484 6493 6s03 6513 6422 123456789
45 6s32 6542 6551 6561 6571 6580 6590 6599 6609 6618 123456'.789
46 6628 6637 6646 66s6 6665 6675 6684 6693 6702 6712 123 4 5 67 7 8
47 6721 6730 6'.739 6749 6758 6'76'7 67'76 6785 6794 6803 12345s6'/8
48 6812 682t 6830 6839 6848 68s7 6866 6875 6884 6893 123445678
49 6902 6911 6920 6928 6937 6946 6955 6964 69'.72 6981 123445678
50 6990 6998 '/00'7 7016 7024 7033 7042 7050 7059 7067 123345678
51 7076 7084 7093 7101 7110 7118 '7126 7t35'/143 7152 123345678
52 7t60 7168 7177 71 85 7 193 7202 '.7210 7218 7226 7235 122345677
53 7243 '7251 7259 7267 72'7s 7284 7292 7300 7308 73t6 122345667
54 7324 7332 7340 7348 7356 7364 73'72 7380 7388 7396 122345667
620 Estatística
N 0 I 2 3 4 5 6 7 8 9 Partes Proporcionais
60 7782 7789 "t796 7803 7810 7818 7825 7832 7839 7846 112344566
61 78-53 7860 7868 7875 7882 7889 '7896 7903 7910 7917 112344566
62 7924 7931 '7938 7945 7952 7959 '7966 7973 7980 '.7987 112334566
63 7993 8000 8007 8014 8021 8028 8035 8041 8048 8055 112334556
64 8062 8069 8075 8082 8089 8096 8102 8109 8116 8122 r12334556
80 9031 9036 9042 9047 9053 9058 9063 9069 9074 9079 112233445
81 9085 9090 9096 9101 9106 9112 91t'7 9t22 9128 9133 112233445
82 9138 9t43 9149 9154 9r59 9165 9170 9175 9180 9186 112233445
83 9r9t 9t96 9201 9206 9212 921'1 9222 9227 9232 9238 112233445
84 9243 9248 92s3 9258 9263 9269 92'74 9279 9284 9289 r1223344s
Apêndice V 621
N 0 I 2 3 4 5 6 7 I 9 Partes Proporcionais
85 9294 9299 9304 9309 9315 9320 9325 9330 9335 9340 ll 2233445
86 9345 9350 9355 9360 9365 9370 9375 9380 9385 9390 11 2233445
87 9395 9400 9405 9410 9415 g42o 9425 9430 943s 9440 0l 1223344
88 9445 9450 9455 9460 9465 9469 9474 9479 9484 9489 01 1223344
89 9494 9499 9504 9509 9513 9518 9523 9528 9533 9s38 0l 1223344
90 9542 9547 9552 9557 9562 9566 95'7 t 95'76 9s81 9586 011223344
91 9590 9595 9600 9605 9609 9614 9619 9624 9628 9633 0rt223344
92 6638 9643 964"1 9652 9657 966t 9666 9671 9675 9680 01t223344
93 9685 9689 9694 9699 9703 9708 9713 97t'.7 9722 972'l 01t223344
94 9731 9736 974t 9745 9750 9754 9759 9'763 9'768 9773 011223344
95 9777 9782 9786 979t 9795 9800 9805 9809 9814 9818 01 1223344
96 9823 9827 9832 9836 9841 9845 9850 9854 9859 9863 01 t223344
9'.7 9868 9872 9817 9881 9886 9890 9894 9899 9903 9908 01 1223344
98 9912 9917 9921 9926 9930 9934 9939 9943 9948 9952 01 1223344
99 9956 9961 9965 9969 9974 9978 9983 9987 9991 9996 0l 1223334
N 0 2 ., 4 5 6 7 8 9 123456789
h
MAKRON
Apêndice Vl
Valores de e i
(0<1.<1)
À 0 1 2 3 4 5 6 7 8 9
0,0 1,0000 0,9900 0,9802 0,9704 0,9608 0,9512 0,9418 0,9324 0,9231 0,9139
0,1 0,9048 8958 8869 878 1 8694 8607 852t 8437 835 3 8270
7866 7788 '7'711 '7634 7558 7483
0,2 8 187 8106 8025 7945
0,3 7408 '7334 7261 7189 71 18 7047 6977 6907 6839 677 t
0,4 6'l03 6636 6570 6505 6440 6376 6313 6250 6188 6126
0,5 6065 600s 5945 5886 5827 5770 5'112 5655 5599 5543
0,6 5488 5434 5379 5326 5273 5220 s 169 5tt'7 5066 5016
0,7 4966 4916 4868 4819 477 1 4'124 4677 4630 4584 4538
0,8 4493 4449 4404 4360 4317 42'14 4232 4190 4148 4107
0.9 4066 4025 3985 3946 3906 3867 3829 379r 3'753 37 16
(À = 1, 2, 3, ..., 10)
T 2 3 5 6 7 8 9 10
1 ^
-À 0,36788 0,13534 0,04979 0,01832 ),006738 ).002479 ),000912 ),000335 ),000123 1,000045
622
h
MAKRON
Apêndice Vll
Números Aleatórios
51772 74640 42331 29044 4662t 62898 93582 04186 19640 87056
24033 23491 83587 06568 21960 21381 16105 10863 9'.7 453 90581
45939 60t73 52078 25424 1t645 55870 56914 31428 93507 942',71
30586 02133 75197 45406 31041 86107 t2973 11169 88116 41287
03585 79353 81938 82322 96799 85659 36081 50884 t4010 14950
64931 03355 95863 20790 65304 55189 00145 65253 11822 15804
15630 64159 5l 135 9852',7 62586 41889 25439 88036 24034 61283
09448 s6301 57683 30217 94623 8541 8 68829 06652 41982 49159
2t631 9t151 7733t 60710 52290 r 683s 48653 1t590 16159 t4676
91097 t1480 29414 06829 81843 28195 21219 47152 35683 41280
50532 25496 95652 42451 73547 76552 50020 248t9 52984 76168
07136 40876 '79971 54195 25708 51817 36732 72484 94923 75936
27989 64728 r0'7 44 08396 56242 90985 28868 99431 50995 20507
85184 13949 36601 46253 00417 25234 09908 365',7 4 72139 70185
s4398 2t154 97810 36764 32869 1 1785 5526t 59009 381t4 38723
65544 34371 0959 1 01839 58892 92843 12828 9134r 84821 63886
08263 65952 85762 64236 39238 18116 84303 99241 46149 03229
398t1 67906 48236 t6051 81812 15 815 63100 85915 t9219 45943
62251 04077 79443 9s203 024'.79 30763 92486 54083 23631 05825
62545 21 03878 075 7 l
623
Apêndice Vlll
é um mínimo.
AS ^t.
= 2[{as+ arxt-Y)x1+ (as+ a1x2-Y)xz+... + (as+ alxN)xn} = o
fr
e essas expressões fornecem as equações normais desejadas
Nas+a12X-XI=0
aszx+a1ZX2-xXY=0.
624
Apêndice lX
\, 1 2 3 4 5 6 7 8 9 l0 12 15 20 24 30 40 60 120
vz\
1 161 200 2t6 225 230 234 237 239 241 aÁa 244 246 248 249 250 25r 252 253 254
2 18,5 19,0 t9,2 t9,2 19,3 19,3 t9,4 19,4 19,4 19,4 t9,4 t9,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5
-l 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,8 I 8,'79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 R S1
4 7 7t 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,'71 5,'7 5 \'7) 5,69 5,66 5,63
5 6,61 §7q 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,'74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,31
6 5qg 5,14 4,76 4,53 4lq 4,28 4,2t 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 777 7, t4 3;to 3,67
7 55q 4,74 4,35 /1 1a tq7 3,87 17q 3,t) 3,68 3,64 157 3,51 3,++ 3,41 3,38 3,34 1?O 3,27 3,23
8 5 1' 4,46 4,07 3,84 3,69 3,58 150 3,44 1?q 1 l5 3,28 7)) 3, 15 3,12 3,08 3,04 3,01 )01 , q1
9 5,12 4,26 3,86 161 3,48 1?q 3,18 3,t4 3,07 3,01 2,94 2,90 2,86 2,83 )70 )'7\ 2,11
l0 4,96 4,10 3,71 3,48 3,14 3,07 3,02 2,98 2,91 2,85 )71 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 1§q 3,36 3,20 3,09 3,01 ?q5 2,90 2,85 110 "t 1) 2,65 2,61 )\7 , <1 2,49 2,45 2,40
12 4,7 5 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 )7\ 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,6'7 3,81 3,41 3,18 3,03 )o) 2,83 )11 2,"71 2,67 2,60 ? 51 2,46 2,42 2,38 2,34 2,30 , r< 2,2t
, .) ,,,,
t4 4.60 3,74 3.34 3,11 2.96 2,85 2,76 2,70 2,65 2,60 ? §1 2.46 ?1q 15 2.31 ))1 2,18 2.t3
625
626 Estatística
2 7 4 6 7 10 t2 l5 20 24 t20
\,
V2\
1 5 8 9 30 40 60
15 4,54 3,68 t?q 3,06 2,90 1?ô 2,7 t 2,64 )5q 2,54 2,48 2,40 2 t1 ))g ? )5 2,20 2,t6 111 2,07
t6 4,49 3,63 3,01 2,85 )'74 2,66 ,5q 2,54 )4q )4) ? ?5 2,28 ))4 2,19 2,15 2,t1 2,06 2,Ot
t7 4,45 ?5q 3,20 2,96 2,81 )'70, 2,6t ?55 2,49 )4< 2,38 ? ]t ) )1 2,19 2,t5 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 I 01 ) '77 2,66 2,58 2,51 2,46 2,41 z,)+ ))1 2,19 ) 1< 2,tt 2,06 )n) 1,97 1,92
t9 4,38 1 5? 3,13 2,90 2,'74 2,63 2,54 2,48 )l) 2,38 2,31 ) )7 2,16 2,11 2,07 , ol 1,98 1,93 1,88
20 4,35 3,49 3,10 2,8'7 2,71 2,60 2,5t 2,45 ?tq 7 t5 2,28 2,20 2,12 2,08 2,04 r,99 1,95 1,90 1,84
21 47? 3,47 3,07 2,84 2,68 )\7 2,49 z,+/. )71 )1) , ,< 2,t8 2,10 2,05 2,0t t,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 )46 )ao 2,34 2,30 ))1 ,l§ 2,07 2,03 1,98 t,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 ? 51 2,44 2,37 )\) )11 ))o 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
aÁ 4,26 3,40 3,01 2,78 2,62 )51 )4) 2,36 7lo ))< 2,18 2,11 2,03 1,98 1,94 1,89 1,84 t,79 1,73
25 4,24 11q ,oo 2,76 2,60 2,49 2,40 )74 2,28
-')')Á
2,t6 ?oq
I,87 t,82 1,77 1 ,71
2,01 1,96 1,92
26 4,23 3,) I 2,98 2,74 ?5q ) ,14 )11 )11 aaa 2,15 2,07 loo 1,95 1,90 1,85 1,80 1,7 5 t,69
a'7
60 4,00 3,1 5 2,76 ?51 )77 ?)\ 2,1't 2,10 2,04 1,99 t,92 1,84 1,75 1,70 1,65 1,59 1,53 1,4'.7 1,39
t20 1q? 3,07 2,68 )4\ ))o 2,18 2,49 2,02 1,96 1,9t 1,83 t,7 5 t,66 I ,61 1,55 1,50 1,43 1,35 I ?§
3,84 3,00 2,60 ) 1'7 ) )1 2.10 2.01 1.94 1.88 1.83 1.75 1.67 1,5'7 1,52 1,46 1.39 1,32 1.22 1,00
I 2 1 4 5 6 7 8 9 t0 12 15 20 30 40 60 t20
,\
1 4052 5000 5403 5625 57 64 5 859 5928 598 I 6023 5056 6106 6151 5ZO9 5235 626 1 6 287 5313 6339
2 98,5 99,0 99,2 99,2 gql 99,3 99,4 99,4 99,4 99,4 99,4 99,4 qq4 qq5
qq5 gq5 qq5 gq5 99 ,5
3 34,1 30.8 )q5 28,7 )?, ) )'7 A )1 1 )75 )'t 1 )'7 ) 21 ,1 26,9 26,7 26,6 )6\ 26,4 )67 )6) 26,1
t^ a
4 21,2 16,1 16,0 15,5 15,2 r 5,0 14,8 14,7 14,5 t4,4 14,O 13,9 13,8 13,'7 t3,'7 13,6 13,5
l'8.0
5 16,3 13.3 t2,1 tl,4 11,0 t0,7 10,5 10,3 to,2 10,1 9,89 o1) q §5 9,47 9,38 olq 9,20 9,11 qo?
]
6 13,7 r 0.9 9,78 9, 15 8,75 8,41 8,26 8,10 7,98 7,87 7,12 7,56 7,40 /,Jr 7,14 7,06 6,97 6,88
'7 1l a rq 55 8,45 7,8s 7,46 '7,t9 6qq 6,84 á1) 6,62 6,4'7 6,31 6,t6 6,01 5gq 5,91 5,82 5,7 4 5,65
t' '-'
8 1 1,3 7<O 7,0r 6,63 6,37 6,1 8 6,03 5,91 5,81 5.67 5 52 5,36 5,2 8 5,20 5,12 5,03 4,95 4,86
]s.os
9 10,6 6,99 6,42 6,06 5,80 5,61 5,47 5 ?5 \ )(\ 5.1 I 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
18.02
10 10,0 6 55 5qq 5,64 519 §rn 5,06 4,94 4,85 i4.7 t 4,56 4,41 4,33 4)\ 4,17 4,08 4,00 3,9r
i7.s6
5 12 4,89 4,14 4,63 4,54 ]o.oo 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
11 9,65 '21 6,22 5,67 5,0"1
17 I
12 q t1 5,95 5,41 5,06 4,82 4,64 4,50 4lq 4,30 4,Ot 3,86 3,7 8 3,70 3,62 154 3,45 3,36
l6.el 14.16
13 9,01 5,7 4 5,21 4,86 4,62 4,44 4,30 4,t9 4,t0 I :.eo 3,82 3,66 159 3,5 1 3,43 3,34 1r§ 3,17
]6.70
14 8,8 6 6.5 r 5,5 6 5,04 4,70 4,46 4,28 4,14 14.03 3,94 3,66 J,) r J,+J 3,3s 3,18 3,09 3,00
13,80
15 8,68 16.36 5.42 4.89 4,56 4.32 4,14 4,00 13,8e 3.80 \z.at 3,37 i?q 3,21 3,13 3.05 2,96 2,8'1
627
628 Estatística
\v, I 2 3 4 5 6 '7
8 9 10 1Z 15 20 24 30 40 60 120
ur\
16 8,5 3 6,23 <)o 4,77 4,41 4,20 4,03 3,89 3,78 3,69 ?, << 3,4t 3,26 3,18 3,10 3,02 ) o? 2,84 ) 1<
t7 8,40 6,11 519 4,6-7 4,34 4,10 1ql 3,79 3,68 1§q 3,46 3,3t 3,16 3,08 3,00 )q) 2,83 ) 1\ 2,65
18 8,29 6,01 5,09 4,58 4,25 4,0t 3,84 3,1r 3,60 3,51 5,J t 3,08 3,00 )g) 2,84 ) 1\ 2,66 )\1
t9 8,18 5,93 5,01 4,50 4,t'7 3,94 3,63 1 5? 5,+3 3,30 I l5 3,00 ,o, 2,84 2,76 2,67 ) 5R 2,49
20 8,10 5R5 4,94 4,43 4,10 3,87 3,70 156 3,46 3,23 109 )q4 2,86 2,78 2,69 2,61 ') \) 2,42
2t 8,02 5,78 4,81 4,3'7 4,04 3,81 3,64 3,51 140, 3,31 3,1'7 3,03 2,88 2,80 )'1'.) )64 7 55 2,46 2,36
22 '7,95 \1) 4,82 4,31 3,99 3,76 15q 3,45 1 15 3,26 3,12 2,98 2,83 2,7 5 2,6'7 2,58 2,50 2,40 2,31
23 7,88 5,66 4,7 6 4,26 3,94 3,7 t 3,54 3,41 3,30 3,2r 3,O7 ) q? 2,78 )10 2,62 )\4 2,45 , 15 2,26
24 1 R'.) 5,61 À a) 4,22 3,90 3,67 3,5 0 3,36 \)6 3,t7 101 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,2t
.r1
25 7,77 <57 4,68 4,1 8 3,86 3,63 3,46 j,tz 3,13 7qg 2,85 111 2,62 2,54 2,45 2,36 1 2,t7
26 11) 5 51 4,64 4,14 3,82 159 3,42 1?q 3,18 3,09 )96 ) 9,) 2,66 2,5 8 ?5(] ) a') ) ?,1 ') )\ 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 11q 3,26 3,15 3,06 , q? 2,18 2,63 , << 2,47 2,38 ))o 2,20 2,10
28 7,64 5,45 4,57 4,07 ?7§ 3 5l J,J O 3,12 3,03 2,90 11< 2,60 )<) 2,44 2,35 ))6 2,17 2,06
29 1,60 5,42 4,54 4,04 3,73 3,50 J,J.1 3,20 3,09 3,00 2,81 z-,t3 ) <-1 2,49 2,41 ) 11 1)1 2,14 2,O3
30 '7,56 í1q 4,51 4,O2 3,70 3,47 110 3,17 3,07 ,OR 2,84 )10 ? 55 2,47 )79 )ln ) )1 2,tt z,0t
40 7 ,31 5,18 4,31 3,83 3,5 1 t)o 3,t2 ?qq 2,89 2,80 2,66 1<) ))q ))n 2,t1 )o) t,92 1,80
60 7,08 4,98 4,t3 3,65 3,34 11) ?q5 )R) ) 1) )Á1 2,50 ?15 2,20 2,12 2,03 1,94 1,84 t,73 1,60
t20 6,85 4,79 3,95 3,48 3,t7 )§6 2,79 2,66 2,56 2,47 )14 2,19 2,03 t,95 1,86 t,76 1,66 1,53 1,38
6,63 4.61 3.78 11? 3,O2 2,80 2,64 ,51 2,41 ) 1') 2,18 2,04 1,88 |.79 |.70 1.59 t.47 t.32 1.00
629
630 Estatística
Curva agrupados, 46
de freqüência multimodal, 47 ajustados por estação, 456
de Gompertz, 331 arredondamento de (ueja
de potência (ueja Ctrvas Características Arredondamento de Dados)
de Operação), 270 brutos, 39
do enésimo grau,762 comparabilidade de, 432-466
exponencial, 331 desestacionalizaç áo, 456
geométrica, 331 dispersão ou variação de, (ueja
normal (ueja tambérn Distribuição também Dispersão e Variação)
Normal), 38 discretos, 58
área limitada pela, 187, 194,221 representação gráfica de, 59, 60
ordenada pela, 196, 610 Decis, 75-76 , 96, 97
papel de, 190 Decisão,
ou reta de tendência,336, 425 estatística,252
simétrica ou em forma de sino, 46 hipóteses (ueja Hipóteses)
Curvas,
inferência, 2,214,234
características de operaç áo, 211, 219, 223
Dedução,
de freqüênci a, 46, 47, 67
das equações normais, 624
assimétrica, 47
pâra a reta de mínimos quadrados, 336,
em forma de J,47 624
em forma de J invertido, 47 Deflação de séries temporais, 486, 506
em forma de U, 47 Demanda elástica, 499
relativa, 45 Desenvolvimento,
tipos de, 46 do polinômio, 190
do 3" grau, 444 ou fórmula binomial, 185-190
finçáo,444 Desestacionalizaçáo de dados, 437, 456
quadráticas, 444
Desigualdade, 8, 28
funçáo,444
Desvio,
médio, 104-105, 113-115
D
da distribuição normal, 187
Fator de ponderação, 68
Fatorial,160 G
Fidedignidade, 236
Gráficos, 7,17,23
Fórmula, da co-variância para a
correlação, coeficiente, 365, 379, 380 circulares ou em setores, 7, 20
de juros compostos, 75 de linhas, L9,20,29,34
de Spearman para correlação ordinal, 305 em barras, 7 , 20, 23
Freqüência, complement ares, 22
acumulada,44 partes componentes, 18
636 Estatística
Período,
básico dos números índices, 397
o mudança de,486,489
Permutações, 160, 182
Ogiva, 43,45,46
PES (ueja Percepção extra-sensorial)
"abaixo de",45
Planej amento experimental, 530-53 1
"acima de", 45, 46, 47
Plano,
decis, percentis e quartis obtidos da, 98
de mínimos quadrados, 279,302
mediana deduzida da, 68-69
XeY,5
percentual, 45
Platicúrtica, 140
regularizada, 45, 67-63
Poder aquisiLivo, 426, 486
Ordenadas, 6
Polígonos de freqüênci a, 45-47
da curva normal, 196
percentual ou relativa, 45
Origem,6
regularizada, 46, 49, 50
nas séries temporais, 349
Polinômios,273
num sistema de coordenadas
retangulares, 6 Ponderada,
média aritmética, 62-63, 67
geoméfuica,7 4
P harmônica, 75
móvel, 429,438
Papel,
Ponderado, método,
de gráficos, log-1og, 331, 350
agregativo, 476, 417, 430-437, 482
de probabilidade, 190, 205
das médias de relativos, 430, 484
semi-log, 331
População, 1,214
ParáboIa,20,272
finita ou inftnita, 7, 214
de mínimos quadrados, 275,353-355
parâmetros (ue7'a Parâmetros)
Partes proporcionais para logaritmos,
tabela de,439,440 Potência de um teste, 211
Pequenas amostras, teoria, 221, 233-248 Preços relativos, 398, 471, 487
Previsão, 278,389,433 a
probabilidade, 68, 153, t2G,74B
euadrados,
análise combinatória e' 132' 143
greco-latinos, 581
axiomática, 154
latinos, 581
cíclica ou circular de preços relativos, 399 euadrantes, 6
155
condicional, euadrática, média, TB, Z6
curvas,63 Quadrático, desvio, 67
definição, clássica de,153 Quartis, 73-75
de freqüência relativa, 154 erros-padrões para, 219-220
S
Tabelas,
de contingência, 261, 265, 304, 306
Semi-interquartÍlico, intervalo, 84 para coeficientes de correlação, 265,
Semi-log, papel de grâfico,274 306
pequenasouexatas,227,283-307 TYansposição,
estimaçã,o,2\2
uso na nas equações, 26
e
uso nos testes de hipótese nas desigualdades, 28
significância'253'287 Tliângulo de pascar, 191
Teóricas, freqüências, 302
Teste,
das séries para aleatoriedade, 572-573 U
aplicações adicionais do, 57 4
do sinal,568-569 União de conjuntos, 162
F para a hipótese nula de médias iguais, IJniverso, (ueja também Populaçáo), 1
520 lJnívoca, função, 5, 1G
H corrigido para empates, 572
H de Kruskal-Wallis, 571-572
U de Mann-Whitney, 569-571 V
Testes,
bilaterais ou dos dois lados, 255 Valor absoluto, 104
de hipótese e signiÍicância,285,286, Valores
292,325 de números índices, 407, 427
para diferenças de médias e proporções, relativos,39g,472
256-257 vantagem, 154
para médias , 254, 273, 27 6
Variação, (ueja também Dispersão), 68
para proporçóes,257,273' 276
aleatória, 427, 433
que envolvem a distribuiçáo binomial,
cíclica, 384, 389, 427, 431
25g, ZB2
coeficiente de' 90' 106
a distribuição normal, 254,218-2tg,
254,259-267 coeficiente quartílico de, 106
que se referem à correlaçáo e dentro dos tratamentos, 517
regressão, 305-308 entre os tratamentos, 517
do
que usam a distribuição explicada e não-explicada, 801, B1B,
qui-quadrado,251 A25_826
a distribuição t,2B5,2BB, Z4l por estações, 427
254
estatÍsticos, secular, B5g
não paramétricos,574 total,301-802,8r4,825,846
unilaterais ou de um lado só, 255 total, 516_517
Tetracórica, correlaçáo,2í4 variações ou movimentos aleatórios ou
Tipo I e Tipo II, erros,267,268-271 irregulares, 425,458,460
curvascaracterísticasdeoperaçáo,257 Variações,
Totais móveis, 360 distribuição das, 520
Índ.ice analítico 643
domínio da,2,'J-l
Z
estocástica (uej a Yaríâvel aleatória)
independente, 5, 17 Zero,
normalmente distribuída, 154 coeficiente de correlação de ordem, 337, 339
reduzida, 111, 131, 132 exclusão da divisão por, 7
Irnpressào e Acabamento
Oesp Gráfica S.A ( Corr Filmes Fomecidos Pelo Editor )
Dept' Cornercial Alanreda Aragtraia, I 90 I - Barueri - Tarnboré
Tel. :1 195- I 805 Fax .1 195 - l-184
lr ![
r! E
II tÕ
õc
o
o
! --*rr
o LO
-X- oo
i
rE ü!.r
-t
i.-l rl
L loLl
o
L,-l
^.9
ux
!o
o UX\
'ouo
9^T
O-.Yoo
:.Y9ro
oO.iiu
ci
!' -r !l
lri
FYO=C
vY ã.;udi-É
4õ:
:N€o á4
t- q .! r
f
l Itr[]Iu
!'oO--N
dJ
qi
'z
ft-i
q
!l
! i--
E -itl E
o
OO
õ.9
';c,^ o
C,?;J
" ,;-
It
ltIE
rl -l
I
E
i
f,v,ô
* Y*
\.=cE^.9
õ 6
oaf
ià
.o
a
o-
ur,..=
=:: r
ür
-.1 ! LtI! _l o
lo E n -Y O u =
ã=ooX
iúi
ü>
d.\ti.
cÍ
9Ll !!! io 5:,5eÕ
>U
.-66
ü
^o
,- ! _l OU oN---
- PO
ft
I ! It- t--l
; lrf-flI_ l -õE
o<
llJ ar
E ! -lç+
rl..otI--l
o
É. l z -C
q tl lol
o
Z- E:: 'g^Ê
o
t_
_]
-i
I
Il
o
C
o
o
9OOH
EUYL
+.Txl -9rc
!!rl o
q q-l 9q*Jrõo:Ê;
.Ef*óà2.rpÊ9EE
i \ óõ õ = q p b E; C
l l r F-l t-'
oõ
iJúJ,:õ â8É,9r"1
I
EI
cl
+.. 1
N2
:.o§@NÕN
N.o--FNN.t€o--
-l u L-- + E!-
l
, lLl l
u. ,
E
o --l ..u o <o
c..-l oEl
E
ET-
o- c:-
o
o
o
d o_
o E;--
-o
(,!
o
El- l
c
o!tl
c
F-l o
c :U c
'Y.9o.9 ..
+ O
a
d 3. =
É. o+ 6
-[
'-*g "'B
o o
{, t-
(r, 'E
El
Ei
dL l t
ol l
o
.9
--
:;: n: Br - E t a ü
C
ô
(,
oL
f
q, o! + l- 0,
a,
.o
Ê: = ifl õ E E :€ ; ü P E É :
o.+ ='E E
o
ô oi .l
c
g!
arl o
of-- arl
E
.-l af
o
ô
o
§E iI €LI
.. tr
t o,k
õY à o iÉ.q.?3::,g§ÊEs"3Í:
of
:-
(roN-ô
:r
l
l o+ c É- 6 ô N E- o n N 6
- - - -
E .fEL ] u._-
o
z zll E r§LlE-l -L G
l
-l
DOBRE AOUI E COLE
tsR-40 -124818s
UP - AC - ITAIM BIBI
DR/Sáo Pauto
rsBN 85:qE!tr4! ê
88534