Testes de significância
Testes de significância (também conhecidos como Testes de Hipóteses) correspondem a uma regra
decisória que nos permite rejeitar ou não rejeitar uma hipótese estatística com base nos resultados de
uma amostra.
Obs.: essas hipóteses são, em geral, sobre parâmetros populacionais e a realização do teste se baseia
na distribuição amostral dos respectivos estimadores.
Exemplos: Foi discutido em aula: Parâmetro vs estimador. Hipótese Estatística
É uma suposição quanto ao valor de um parâmetro populacional, ou uma afirmação quanto à
natureza da população.
Exemplos: discutido em aula
Hipótese de Nulidade e Hipótese Alternativa
Hipótese de Nulidade ( H o ) É a hipótese a ser testada.
Hipótese Alternativa ( H a )
É uma hipótese que contraria Ho . É formulada com base no conhecimento prévio do
problema, informações de pesquisa, etc.
Ex: Ho : = 6.000 horas (durabilidade de lâmpadas)
H a : > 6000 ; ou H a : < 6000 ; ou Ha : 6000
hipóteses unilaterais hipótese bilateral
Após a realização do teste concluimos por uma das hipóteses dadas acima.
Qualquer decisão tomada implica na possibilidade de cometer basicamente dois tipos de erros: Erro
tipo I e Erro tipo II.
Obs: P (erro tipo I) = ou nível de significância do teste.
P (erro tipo II) =
O quadro abaixo facilita o entendimento
Realidade
Decisão Ho é verdadeiraHo é falsa
Rejeitar Ho 1
Aceitar Ho 1
então:
P(rej. Ho / Ho é verd.)
P(aceitar Ho / Ho é falsa)
Procedimentos para a realização de um Teste de Hipótese
Enunciar as hipóteses H o e H a ;
Fixar o nível de significância e identificar a estatística do teste;
Determinar a região crítica (faixa de valores que nos levam à rejeição da hipótese H o ) e a região
de aceitação em função do nível pelas tabelas estatísticas apropriadas;
Baseado na amostra, calcular o valor da estatística do teste;
Concluir: Se estatística do teste região crítica rej. H o caso contrário não rej.
Ho .
Na INF 162 veremos apenas:
Teste z
Teste t
Teste de Qui-quadrado (teste 2 )
Teste F
Teste z
Teste z (veremos apenas o teste para uma média populacional)
Obs: assume-se que a variável em estudo tenha distribuição normal com variância populacional
conhecida.
a) Teste z para 1 média
A estatística do teste é baseada na média amostral X . Pode ser demonstrado que a média amostral
tem distribuição aproximadamente normal com média e variância
2/n, onde n é o tamanho da amostra.
Testamos as hipóteses: H o : 0 versus Ha : uma alternativa conveniente.
zcal
A estatística do teste z para 1 média é: c
X
De acordo com o nível de significância e a hipótese alternativa definidas obtemos o valor tabelado
de z na tabela apropriada.
A regra de decisão será:
Se zcalc ztab rejeitamos H0;
caso contrário não rejeitamos H0.
Exercício:
Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal,
com média e variância 400 g2. O valor de pode ser fixado num mostrador situado numa
posição um pouco inacessível dessa máquina. A máquina foi regulada para = 500 g. Desejamos,
de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob controle,
isto é, se = 500 g ou não. Se uma dessas amostra apresentasse uma média x = 492 g, você pararia
ou não a produção para verificar se o mostrador está na posição correta? Usar = 1%.
Problema proposto:
Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica
apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises desse índice, obtendo:
27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se distribui normalmente, com variância
igual a 4,86 mg2. Pode-se considerar a afirmativa do fabricante verdadeira, ao nível de 10% de
probabilidade?
Teste t
Teste t (p/ 1 média populacional ou p/ entre médias populacionais)
Obs: assume-se que a variável em estudo tenha distribuição normal com variância desconhecida.
Teste t para 1 média Exemplo:
Determinada firma desejava comprar cabos tendo recebido do fabricante a informação de que a
tensão média de ruptura é 8000 kgf. Para analisar se a afirmação do fabricante é verdadeira,
efetuou-se um teste de hipótese unilateral. Se um ensaio com 6
cabos forneceu uma tensão média de ruptura de 7750 kgf, com desvio padrão de 145 kgf , a qual
conclusão chegar, usando um nível de significância de 5%?
Resposta:
H o : 8000 kgf
H a : 8000 kgf X
tcalc
A estatística do teste t para 1 média é:
s
7750 8000 n
4,22
No exemplo teríamos: tcalc
145
6
A conclusão será:
Teste t para duas médias (2 amostras independentes)
Obs: Pressupõe-se normalidade dos dados.
Sejam X e Y normalmente distribuídos com variâncias desconhecidas. Desejamos testar:
Ho : X Y contra
X Y ou
ou
H:
a X Y
X Y
Exemplo: dois métodos de execução de determinada tarefa. X e Y seriam os tempos gastos com cada
método.
Outra pressuposição (apenas para efeito de nosso curso de INF 162) seria a
homogeneidade das variâncias populacionais 2 eX 2 (desconhecidas).
Y
Portanto assumimos: 2 2 2 , sissoe quer
s dizer que
X
2 2
são estimativas
Y X
de um mesmo valor 2 .
Portanto podemos combinar 2
s X e s a fim de obter um melhor estimador para
2
2.
SQD SQD(n 1)s 2 (n 1)s 2
Então: s 2 X Y X X Y Y
(nX 1) (nY nX nY 2
1)
Utilizamos para o teste, a variável aleatória:
X Y
t
(ou tcalc)
11
s 2
nX nY
que tem distribuição t de Student com nX nY 2 graus de liberdade.
Decisão:
Se tcalc ttab rej. Ho
Exercício:
Suponhamos que duas técnicas de memorização X e Y deverão ser comparadas medindo-se a
eficiência pelo tempo exigido para decorar certo tipo de material. O mesmo
material foi apresentado a n X 18 e nY 13 pessoas que o decoraram usando as
técnicas X e Y respectivamente. Verificar se há diferença significativa entre as duas técnicas de
memorização, adotando 5% . Os resultados foram:
X 20 min Y 17min
2
12min 2 s 2 15min 2
sX Y
n X 18 nY 13
Resposta: H o : X Y
H a : X Y
Teste t para 2 médias; = 5%
2 (18 1).12 (13 1).15
s 13,24
18 13 2
tcalc 20 17 2,27
13,241813
1 1
t5% 2,045
(2
9)
| tcalc | ttab rej. ao nível de significância de 5%.
Ho
Teste de Qui-quadrado ( 2 )
Os dois últimos testes a serem apresentados a seguir (Teste F e teste t) são usados para testar
hipóteses referentes a um parâmetro populacional ou mesmo à comparação de dois parâmetros. O
teste de Qui-quadrado faz parte dos chamados “testes não- paramétricos”, ou seja, que não
dependem dos parâmetros populacionais, nem de suas respectivas estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
Teste de aderência
Teste de independência
Teste de homogeneidade
Veremos, a princípio, apenas o teste de aderência, sendo os demais testes filosoficamente (e até
mesmo “mecanicamente”) similares, mas aplicáveis quando queremos estudar a relação entre duas
ou mais variáveis de classificação. Se o tempo permitir será apresentado também pelo menos mais
um dos outros testes de qui-quadrado.
Teste de Aderência
Existe apenas uma variável e o que se testa é o padrão hipotético de frequências ou a distribuição da
variável.
A estatística do teste é dada por: 2 (O i E ) , onde
2
i
cal Ei
c
Oi frequência observada da categoria (evento) i ; frequência esperada da categoria (evento) i .
Ei
Obs: A expressão acima nos dá um valor sempre positivo e tanto menor quanto maior for o acordo
entre as frequências observadas e as frequências esperadas, calculadas com base
em Ho .
Obs: A hipótese Ho afirmará não haver discrepâncias entre as frequências observadas e
as frequências esperadas, ou H o será colocada em termos de distribuição de
probabilidade que vamos por à prova.
O valor de 2 é comparado com o 2 .
cal tabelado
2 Se 2 c
rejeita-se Ho .
calc tab
Obs: Para obter o precisamos conhecer o nível de significância ( ) do teste e o
2
tab
número de graus de liberdade v, onde v = k – 1 – r, onde k é o número de categorias em
que foi dividida a amostra; e r é o número de parâmetros estimados para o cálculo das
Ei . Exemplo:
Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda ser
honesta, adotando-se 5% .
Solução: (passo a passo)
H o : A moeda é honesta (ou, H o : proporção cara:coroa = 1:1)
H a : não Ho
= 5%. Verifica-se que existem 2 categorias (cara e coroa). Então k = 2. Nenhum parâmetro foi
calculado, então r = 0. Logo v = 2 – 1 – 0 = 1.
3)
4)
Categorias Cara Coroa
freq. observadas 35 65
freq. esperadas 50 50
logo 2 (35 50)2 (65 50) ..... 9
calc 50 2
50
5) Como 2 2 , rejeita-se Ho , concluindo-se, com risco de 5%, que a moeda não é
cal tab
honesta.
Teste F c
Teste F (teste para comparação de variâncias)
Exemplo: Na aplicação de dois métodos A e B, obteve-se os resultados abaixo. Testar a hipótese de
igualdade das variâncias ao nível de 5% de probabilidade.
Método 2 n
s
A 40 11
B 16 19
Resposta: Ho : 2 2
A B
Ha : B
2
2
A
F5%(10; 18) = 2,41
maior s 2 2
40
Fcalc menor s 2 2,50
sA
2 s 16
B
Conclusão: Fcal rej:Ho ao nível de 5% de significância.
c Ftab
para = 5% as variâncias não seriam consideradas iguais.
LISTA DE EXERCÍCIOS
INF 161 – Iniciação à Estatística e INF 162 – Estatística I Testes de Hipóteses
OBS.: Como o teste z para duas médias e o teste de Qui-quadrado para independência não foram
apresentados formalmente nesse período, os exercícios de número 9, 11 e 12 não precisam ser
resolvidos. No entanto a existência desses exercícios é importante pois os mesmos poderão ser
discutidos em sala de aula pelo professor caso necessário.
Sabe-se que o consumo mensal per capita de um determinado produto tem distribuição normal, com
desvio padrão 2 kg. A diretoria de uma firma que fabrica esse produto resolveu que retiraria o
produto da linha de produção se a média de consumo per capita fosse menor que 8 kg. Caso
contrário, continuaria a fabricá-lo. Foi realizada uma pesquisa de mercado, tomando-se uma amostra
de 25 indivíduos, e verificou-se que a soma dos valores coletados foi de 180 kg.
Utilizando um nível de significância de 5%, e com base na amostra colhida determine a decisão a
ser tomada pela diretoria.
Utilizando um nível de significância de 1 %, a decisão seria a mesma? ( Justifique a sua resposta.)
Estamos desconfiados de que a média das receitas municipais per capita das cidades pequenas (0 -
20.000 habitantes) é maior do que a das receitas do estado, que é de 1229 unidades monetárias. Para
comprovar ou não esta hipótese, sorteamos dez cidades pequenas, e obtivemos os seguintes
resultados: 1230; 582; 576; 2093; 2621; 1045; 1439; 717; 1838; 1359. A que conclusão chegar a um
nível de 5% de probabilidade?
Uma grande cadeia de magazines está interessada em saber se o valor médio das compras é maior
em suas lojas do centro da cidade do que no "Shopping center" de certa localidade. O desvio padrão
populacional para ambos os casos é de $10,00. Teste a afirmação de que ambas são iguais, contra a
alternativa de que ambas não são iguais, ao nível de 0,01. Uma amostra aleatória das transações nos
dois locais deu os seguintes dados:
Centro "Shopping center"
média $45,00 $43,50 Tamanho da amostra 100 100
Uma fábrica de embalagens para produtos químicos está estudando dois processos para combater a
corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras
cujos resultados estão no quadro abaixo. Qual seria a conclusão sobre os dois tratamentos, ao nível
de 5% de significância ?
Método Amostra Média Desvio padrão
A 15 48 10
B 12 52 15
Suponhamos que um pesquisador, desejando colocar à prova a hipótese de que a idade da mãe tem
certa influência sobre o nascimento de criança prematura, verificou que, dentre 90 casos de
prematuridade, 40 envolviam mães com idade inferior a 18 anos; 15 envolviam mães de 18 a 35
anos e 35 mães com idade acima de 35 anos. Isto leva o pesquisador a manter sua hipótese? Use
nível de significância de 0,01.
No decurso de um ano, determinada firma teve 50 acidentes. Um dos aspectos de uma investigação
levada a efeito pelo engenheiro de segurança diz respeito ao dia de ocorrência do acidente. Pelos
dados que seguem abaixo, pode-se dizer que o dia da semana tenha alguma influência? Teste a
hipótese nula, de que os dias são igualmente prováveis, ao nível de 10% de probabilidade.
DIA Segunda Terça Quarta Quinta Sexta
Nº de acidentes 15 6 4 9 16
A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo
perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60
horas/homem por ano e desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de
acidentes, após o mesmo, tomou-se uma amostra de 9 indústrias e mediu-se o número médio de
horas/homem perdidas por acidente, que foi 50 horas. Você diria, ao nível de 5%, que há evidência
de melhoria?
Uma firma de produtos farmacêuticos afirma que o tempo médio para certo remédio fazer efeito é
de 24 minutos. Numa amostra de 19 casos, o tempo médio foi de 25 minutos, com desvio padrão de
2 minutos. Teste a alegação, contra a alternativa de que o tempo médio é superior a 24 minutos, a
um nível de significância de 1%.
Uma máquina automática enche latas com base no peso líquido, com variabilidade praticamente
constante e independente dos ajustes, dada por um desvio padrão de 5 g. Duas amostras retiradas em
dois períodos de trabalho consecutivos, de 10 e de 20 latas, forneceram pesos líquidos médios de,
respectivamente, 184,6 e 188,9 gramas. Desconfia- se que a regulagem da máquina quanto ao peso
médio fornecido possa ter sido modificada no período entre a coleta das duas amostras. Qual a
conclusão ?
ao nível de 5% de significância ?
ao nível de 1% de significância ?
Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 50 homens e 50
mulheres de um grande complexo industrial, produziu os seguintes resultados:
Estatísticas Homens Mulheres Médias 3,2 anos 3,7 anos
Desvios padrões 0,8 anos 0,9 anos
Que conclusões você poderia tirar para a população de homens e mulheres desta indústria, ao nível
de 5% de significância ?
125 proprietários de certa marca de automóvel foram entrevistados acerca do desempenho e do
consumo de combustível de seus carros. O resultado da pesquisa de opiniões é resumido na seguinte
tabela:
DESEMPENHO
CONSUMO PÉSSIMO REGULAR BOM
ALTO 29 27 42
BAIXO 4 6 17
Verificar, ao nível de 5% de significância, se devemos considerar que, no consenso geral,
desempenho e consumo não guardam relação entre si.
Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionários a donas-
de-casa através do correio. Suspeitando-se que os respondentes voluntários tenham um particular
vício de respostas, fizeram-se mais duas tentativas com os não respondentes. Os resultados estão
indicados abaixo. Você acha que existe relação entre a opinião e o número de tentativas? (Utilize o
nível de significância de 5 %)
NÚMERO DE RESPONDENTES (Donas-de-casas) OPINIÃO TENTATIVAS
1ª 2ª 3ª
EXCELENTE 62 36 12
SATISFATÓRIO 84 42 14
INSATISFATÓRIO 24 22 24
Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma categoria quanto à
política salarial é através do desvio padrão de seus salários. A fábrica A diz ser mais coerente na
política salarial do que a fábrica B. Para verificar essa afirmação, sorteou-se uma amostra de 10
funcionários não especializados de A, e 15 de B, obtendo-se os desvios padrões sA = 1,0 SM e sB =
1,6 SM. Qual seria a sua conclusão, ao nível de 1% ?
RESPOSTAS
1. zc = -2,00 Ho : = 8 vs Ha : < 8
z5% -1,64 , Rejeita-se Ho
z1% -2,33 , Não se rejeita Ho
2. Ho : = 1229 vs Ha : > 1229
tc = 0,566 ; t5%(9)=1,833 ; Não se rejeita Ho
3. Ho : 1 = 2 vs Ha : 1 > 2
zc = 1,06 ; z1% = 2,33 ; Não se rejeita Ho
Ho : A = B vs Ha : A B
|tc| = 0,829 ; t2,5%(25) = 2,060 ; Não se rejeita Ho
Ho : Proporção = [Link] vs Ha : Proporção [Link]
2c = 11,667 ; 21%(2) = 9,210 ; Rejeita-se Ho
Ho : Proporção = [Link] vs Ha : Proporção [Link]
2c = 11,400 ; 210%(4) = 7,779 ; Rejeita-se Ho
7. Ho : = 60 vs Ha : < 60
zc = -1,5 z5% = -1,64 , Não se rejeita Ho
8. Ho : = 24 vs Ha : > 24
tc = 2,179 ; t1%(18)=2,552; Não se rejeita Ho
9. Ho : 1 = 2 vs Ha : 1 2
zc = -2,22
z2,5% = 1,96 ; Rejeita-se Ho
z0,5% 2,57 ; Não se rejeita Ho
Ho : M = H vs Ha : M H
|tc| = 2,926 ; 1,98 < t2,5%(98) < 2,00 ; Rejeita- se Ho
Ho: Desempenho e consumo são independentes vs Ha: "não Ho"
2c = 3,791 ; 25%(2) = 5,991 ; Não se rejeita Ho
Ho:Opinião e número de tentativas são independentes vs Ha:"não Ho"
2c = 26,2 ; 25%(4) = 9,488 ; Rejeita-se Ho
13. a) Ho : 2B = 2A vs Ha : 2B > 2A
Fc = 2,56 ; F1% (14,9) = 5,00 ; Não se rejeita Ho