0% acharam este documento útil (0 voto)
192 visualizações22 páginas

Documentario

Testes de significância permitem rejeitar ou não rejeitar hipóteses estatísticas sobre parâmetros populacionais com base nos resultados de uma amostra. Exemplos incluem testes z, t, qui-quadrado e F, que comparam estatísticas amostrais a valores críticos para tomar decisões sobre hipóteses nulas e alternativas.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
192 visualizações22 páginas

Documentario

Testes de significância permitem rejeitar ou não rejeitar hipóteses estatísticas sobre parâmetros populacionais com base nos resultados de uma amostra. Exemplos incluem testes z, t, qui-quadrado e F, que comparam estatísticas amostrais a valores críticos para tomar decisões sobre hipóteses nulas e alternativas.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd

Testes de significância

Testes de significância (também conhecidos como Testes de Hipóteses) correspondem a uma regra
decisória que nos permite rejeitar ou não rejeitar uma hipótese estatística com base nos resultados de
uma amostra.

Obs.: essas hipóteses são, em geral, sobre parâmetros populacionais e a realização do teste se baseia
na distribuição amostral dos respectivos estimadores.

Exemplos: Foi discutido em aula: Parâmetro vs estimador. Hipótese Estatística


É uma suposição quanto ao valor de um parâmetro populacional, ou uma afirmação quanto à
natureza da população.

Exemplos: discutido em aula

Hipótese de Nulidade e Hipótese Alternativa

Hipótese de Nulidade ( H o ) É a hipótese a ser testada.

Hipótese Alternativa ( H a )

É uma hipótese que contraria Ho . É formulada com base no conhecimento prévio do

problema, informações de pesquisa, etc.

Ex: Ho :  = 6.000 horas (durabilidade de lâmpadas)


H a :  > 6000 ; ou H a :  < 6000 ; ou Ha :   6000

hipóteses unilaterais hipótese bilateral


Após a realização do teste concluimos por uma das hipóteses dadas acima.
Qualquer decisão tomada implica na possibilidade de cometer basicamente dois tipos de erros: Erro
tipo I e Erro tipo II.

Obs: P (erro tipo I) =  ou nível de significância do teste.


P (erro tipo II) = 
O quadro abaixo facilita o entendimento
Realidade
Decisão Ho é verdadeiraHo é falsa
Rejeitar Ho 1  
Aceitar Ho 1  

então:
  P(rej. Ho / Ho é verd.)

  P(aceitar Ho / Ho é falsa)

Procedimentos para a realização de um Teste de Hipótese

Enunciar as hipóteses H o e H a ;

Fixar o nível de significância  e identificar a estatística do teste;


Determinar a região crítica (faixa de valores que nos levam à rejeição da hipótese H o ) e a região
de aceitação em função do nível  pelas tabelas estatísticas apropriadas;
Baseado na amostra, calcular o valor da estatística do teste;
Concluir: Se estatística do teste  região crítica  rej. H o caso contrário não rej.

Ho .

Na INF 162 veremos apenas:

Teste z
Teste t
Teste de Qui-quadrado (teste  2 )
Teste F

Teste z
Teste z (veremos apenas o teste para uma média populacional)

Obs: assume-se que a variável em estudo tenha distribuição normal com variância populacional
conhecida.

a) Teste z para 1 média


A estatística do teste é baseada na média amostral X . Pode ser demonstrado que a média amostral
tem distribuição aproximadamente normal com média  e variância
2/n, onde n é o tamanho da amostra.
Testamos as hipóteses: H o :   0 versus Ha : uma alternativa conveniente.

zcal
A estatística do teste z para 1 média é: c
X

De acordo com o nível de significância e a hipótese alternativa definidas obtemos o valor tabelado
de z na tabela apropriada.

A regra de decisão será:


Se zcalc  ztab  rejeitamos H0;

caso contrário não rejeitamos H0.


Exercício:
Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal,
com média  e variância 400 g2. O valor de  pode ser fixado num mostrador situado numa
posição um pouco inacessível dessa máquina. A máquina foi regulada para  = 500 g. Desejamos,
de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob controle,
isto é, se  = 500 g ou não. Se uma dessas amostra apresentasse uma média x = 492 g, você pararia
ou não a produção para verificar se o mostrador está na posição correta? Usar  = 1%.

Problema proposto:
Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica
apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises desse índice, obtendo:
27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se distribui normalmente, com variância
igual a 4,86 mg2. Pode-se considerar a afirmativa do fabricante verdadeira, ao nível de 10% de
probabilidade?
Teste t

Teste t (p/ 1 média populacional ou p/  entre médias populacionais)

Obs: assume-se que a variável em estudo tenha distribuição normal com variância desconhecida.

Teste t para 1 média Exemplo:


Determinada firma desejava comprar cabos tendo recebido do fabricante a informação de que a
tensão média de ruptura é 8000 kgf. Para analisar se a afirmação do fabricante é verdadeira,
efetuou-se um teste de hipótese unilateral. Se um ensaio com 6
cabos forneceu uma tensão média de ruptura de 7750 kgf, com desvio padrão de 145 kgf , a qual
conclusão chegar, usando um nível de significância de 5%?
Resposta:
H o :   8000 kgf

H a :   8000 kgf X



tcalc
A estatística do teste t para 1 média é:
s
7750  8000 n
   4,22
No exemplo teríamos: tcalc
145
6

A conclusão será:

Teste t para duas médias (2 amostras independentes)

Obs: Pressupõe-se normalidade dos dados.


Sejam X e Y normalmente distribuídos com variâncias desconhecidas. Desejamos testar:

Ho :  X  Y contra

 X  Y ou
  ou
H: 
a  X Y
  
X Y 
Exemplo: dois métodos de execução de determinada tarefa. X e Y seriam os tempos gastos com cada
método.

Outra pressuposição (apenas para efeito de nosso curso de INF 162) seria a
homogeneidade das variâncias populacionais  2 eX  2 (desconhecidas).
Y

Portanto assumimos:  2 2 2 , sissoe quer


s dizer que
X
2 2
são estimativas
Y X
de um mesmo valor  2 .
Portanto podemos combinar 2
s X e s a fim de obter um melhor estimador para
2

2.
SQD  SQD(n  1)s 2  (n  1)s 2
Então: s 2 X Y X X Y Y

(nX  1)  (nY nX  nY  2
 1)

Utilizamos para o teste, a variável aleatória:


X  Y
t
(ou tcalc)

 11 
s 2  
 nX nY 

que tem distribuição t de Student com nX  nY  2 graus de liberdade.

Decisão:
Se tcalc  ttab  rej. Ho

Exercício:

Suponhamos que duas técnicas de memorização X e Y deverão ser comparadas medindo-se a


eficiência pelo tempo exigido para decorar certo tipo de material. O mesmo
material foi apresentado a n X  18 e nY  13 pessoas que o decoraram usando as
técnicas X e Y respectivamente. Verificar se há diferença significativa entre as duas técnicas de
memorização, adotando   5% . Os resultados foram:
X  20 min Y  17min
2
 12min 2 s 2  15min 2
sX Y
n X  18 nY  13

Resposta: H o :  X  Y

H a :  X  Y

Teste t para 2 médias;  = 5%

2 (18  1).12  (13  1).15


s   13,24

18  13  2

tcalc  20  17  2,27

13,241813
1  1
 
t5%  2,045
(2
9)

| tcalc |  ttab  rej. ao nível de significância de 5%.

Ho
Teste de Qui-quadrado (  2 )

Os dois últimos testes a serem apresentados a seguir (Teste F e teste t) são usados para testar
hipóteses referentes a um parâmetro populacional ou mesmo à comparação de dois parâmetros. O
teste de Qui-quadrado faz parte dos chamados “testes não- paramétricos”, ou seja, que não
dependem dos parâmetros populacionais, nem de suas respectivas estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
Teste de aderência
Teste de independência
Teste de homogeneidade

Veremos, a princípio, apenas o teste de aderência, sendo os demais testes filosoficamente (e até
mesmo “mecanicamente”) similares, mas aplicáveis quando queremos estudar a relação entre duas
ou mais variáveis de classificação. Se o tempo permitir será apresentado também pelo menos mais
um dos outros testes de qui-quadrado.

Teste de Aderência

Existe apenas uma variável e o que se testa é o padrão hipotético de frequências ou a distribuição da
variável.
A estatística do teste é dada por: 2 (O i  E ) , onde

2

i
cal Ei
c

Oi  frequência observada da categoria (evento) i ; frequência esperada da categoria (evento) i .

Ei 

Obs: A expressão acima nos dá um valor sempre positivo e tanto menor quanto maior for o acordo
entre as frequências observadas e as frequências esperadas, calculadas com base
em Ho .
Obs: A hipótese Ho afirmará não haver discrepâncias entre as frequências observadas e

as frequências esperadas, ou H o será colocada em termos de distribuição de

probabilidade que vamos por à prova.

O valor de  2 é comparado com o  2 .


cal tabelado
2 Se  2 c
rejeita-se Ho .
 
calc tab

Obs: Para obter o precisamos conhecer o nível de significância ( ) do teste e o


2

tab
número de graus de liberdade v, onde v = k – 1 – r, onde k é o número de categorias em
que foi dividida a amostra; e r é o número de parâmetros estimados para o cálculo das
Ei . Exemplo:

Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda ser
honesta, adotando-se   5% .
Solução: (passo a passo)
H o : A moeda é honesta (ou, H o : proporção cara:coroa = 1:1)

H a : não Ho

 = 5%. Verifica-se que existem 2 categorias (cara e coroa). Então k = 2. Nenhum parâmetro foi
calculado, então r = 0. Logo v = 2 – 1 – 0 = 1.

3)
4)
Categorias Cara Coroa
freq. observadas 35 65
freq. esperadas 50 50
logo 2 (35  50)2 (65  50)  .....  9

 
calc 50 2

50
5) Como 2 2 , rejeita-se Ho , concluindo-se, com risco de 5%, que a moeda não é
 
cal tab
honesta.
Teste F c
Teste F (teste para comparação de variâncias)
Exemplo: Na aplicação de dois métodos A e B, obteve-se os resultados abaixo. Testar a hipótese de
igualdade das variâncias ao nível de 5% de probabilidade.

Método 2 n
s
A 40 11
B 16 19
Resposta: Ho :  2   2
A B
Ha :    B
2
2
A

F5%(10; 18) = 2,41

maior s 2 2
40
Fcalc  menor s 2  2,50
sA
 
2 s 16
B

Conclusão: Fcal  rej:Ho ao nível de 5% de significância.

c Ftab

 para  = 5% as variâncias não seriam consideradas iguais.


LISTA DE EXERCÍCIOS

INF 161 – Iniciação à Estatística e INF 162 – Estatística I Testes de Hipóteses

OBS.: Como o teste z para duas médias e o teste de Qui-quadrado para independência não foram
apresentados formalmente nesse período, os exercícios de número 9, 11 e 12 não precisam ser
resolvidos. No entanto a existência desses exercícios é importante pois os mesmos poderão ser
discutidos em sala de aula pelo professor caso necessário.

Sabe-se que o consumo mensal per capita de um determinado produto tem distribuição normal, com
desvio padrão 2 kg. A diretoria de uma firma que fabrica esse produto resolveu que retiraria o
produto da linha de produção se a média de consumo per capita fosse menor que 8 kg. Caso
contrário, continuaria a fabricá-lo. Foi realizada uma pesquisa de mercado, tomando-se uma amostra
de 25 indivíduos, e verificou-se que a soma dos valores coletados foi de 180 kg.
Utilizando um nível de significância de 5%, e com base na amostra colhida determine a decisão a
ser tomada pela diretoria.
Utilizando um nível de significância de 1 %, a decisão seria a mesma? ( Justifique a sua resposta.)

Estamos desconfiados de que a média das receitas municipais per capita das cidades pequenas (0 -
20.000 habitantes) é maior do que a das receitas do estado, que é de 1229 unidades monetárias. Para
comprovar ou não esta hipótese, sorteamos dez cidades pequenas, e obtivemos os seguintes
resultados: 1230; 582; 576; 2093; 2621; 1045; 1439; 717; 1838; 1359. A que conclusão chegar a um
nível de 5% de probabilidade?

Uma grande cadeia de magazines está interessada em saber se o valor médio das compras é maior
em suas lojas do centro da cidade do que no "Shopping center" de certa localidade. O desvio padrão
populacional para ambos os casos é de $10,00. Teste a afirmação de que ambas são iguais, contra a
alternativa de que ambas não são iguais, ao nível de 0,01. Uma amostra aleatória das transações nos
dois locais deu os seguintes dados:

Centro "Shopping center"


média $45,00 $43,50 Tamanho da amostra 100 100
Uma fábrica de embalagens para produtos químicos está estudando dois processos para combater a
corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras
cujos resultados estão no quadro abaixo. Qual seria a conclusão sobre os dois tratamentos, ao nível
de 5% de significância ?

Método Amostra Média Desvio padrão


A 15 48 10
B 12 52 15
Suponhamos que um pesquisador, desejando colocar à prova a hipótese de que a idade da mãe tem
certa influência sobre o nascimento de criança prematura, verificou que, dentre 90 casos de
prematuridade, 40 envolviam mães com idade inferior a 18 anos; 15 envolviam mães de 18 a 35
anos e 35 mães com idade acima de 35 anos. Isto leva o pesquisador a manter sua hipótese? Use
nível de significância de 0,01.

No decurso de um ano, determinada firma teve 50 acidentes. Um dos aspectos de uma investigação
levada a efeito pelo engenheiro de segurança diz respeito ao dia de ocorrência do acidente. Pelos
dados que seguem abaixo, pode-se dizer que o dia da semana tenha alguma influência? Teste a
hipótese nula, de que os dias são igualmente prováveis, ao nível de 10% de probabilidade.
DIA Segunda Terça Quarta Quinta Sexta
Nº de acidentes 15 6 4 9 16

A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo
perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60
horas/homem por ano e desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de
acidentes, após o mesmo, tomou-se uma amostra de 9 indústrias e mediu-se o número médio de
horas/homem perdidas por acidente, que foi 50 horas. Você diria, ao nível de 5%, que há evidência
de melhoria?

Uma firma de produtos farmacêuticos afirma que o tempo médio para certo remédio fazer efeito é
de 24 minutos. Numa amostra de 19 casos, o tempo médio foi de 25 minutos, com desvio padrão de
2 minutos. Teste a alegação, contra a alternativa de que o tempo médio é superior a 24 minutos, a
um nível de significância de 1%.

Uma máquina automática enche latas com base no peso líquido, com variabilidade praticamente
constante e independente dos ajustes, dada por um desvio padrão de 5 g. Duas amostras retiradas em
dois períodos de trabalho consecutivos, de 10 e de 20 latas, forneceram pesos líquidos médios de,
respectivamente, 184,6 e 188,9 gramas. Desconfia- se que a regulagem da máquina quanto ao peso
médio fornecido possa ter sido modificada no período entre a coleta das duas amostras. Qual a
conclusão ?
ao nível de 5% de significância ?
ao nível de 1% de significância ?

Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 50 homens e 50
mulheres de um grande complexo industrial, produziu os seguintes resultados:

Estatísticas Homens Mulheres Médias 3,2 anos 3,7 anos


Desvios padrões 0,8 anos 0,9 anos

Que conclusões você poderia tirar para a população de homens e mulheres desta indústria, ao nível
de 5% de significância ?
125 proprietários de certa marca de automóvel foram entrevistados acerca do desempenho e do
consumo de combustível de seus carros. O resultado da pesquisa de opiniões é resumido na seguinte
tabela:
DESEMPENHO
CONSUMO PÉSSIMO REGULAR BOM
ALTO 29 27 42
BAIXO 4 6 17
Verificar, ao nível de 5% de significância, se devemos considerar que, no consenso geral,
desempenho e consumo não guardam relação entre si.

Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionários a donas-
de-casa através do correio. Suspeitando-se que os respondentes voluntários tenham um particular
vício de respostas, fizeram-se mais duas tentativas com os não respondentes. Os resultados estão
indicados abaixo. Você acha que existe relação entre a opinião e o número de tentativas? (Utilize o
nível de significância de 5 %)

NÚMERO DE RESPONDENTES (Donas-de-casas) OPINIÃO TENTATIVAS


1ª 2ª 3ª
EXCELENTE 62 36 12
SATISFATÓRIO 84 42 14
INSATISFATÓRIO 24 22 24

Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma categoria quanto à
política salarial é através do desvio padrão de seus salários. A fábrica A diz ser mais coerente na
política salarial do que a fábrica B. Para verificar essa afirmação, sorteou-se uma amostra de 10
funcionários não especializados de A, e 15 de B, obtendo-se os desvios padrões sA = 1,0 SM e sB =
1,6 SM. Qual seria a sua conclusão, ao nível de 1% ?

RESPOSTAS
1. zc = -2,00 Ho :  = 8 vs Ha :  < 8

z5%  -1,64 , Rejeita-se Ho

z1%  -2,33 , Não se rejeita Ho

2. Ho : = 1229 vs Ha :  > 1229

tc = 0,566 ; t5%(9)=1,833 ; Não se rejeita Ho

3. Ho :  1 =  2 vs Ha :  1 >  2

zc = 1,06 ; z1% = 2,33 ; Não se rejeita Ho


Ho :  A =  B vs Ha :  A   B

|tc| = 0,829 ; t2,5%(25) = 2,060 ; Não se rejeita Ho

Ho : Proporção = [Link] vs Ha : Proporção  [Link]

 2c = 11,667 ;  21%(2) = 9,210 ; Rejeita-se Ho

Ho : Proporção = [Link] vs Ha : Proporção  [Link]

 2c = 11,400 ;  210%(4) = 7,779 ; Rejeita-se Ho

7. Ho :  = 60 vs Ha :  < 60

zc = -1,5 z5% = -1,64 , Não se rejeita Ho

8. Ho :  = 24 vs Ha :  > 24

tc = 2,179 ; t1%(18)=2,552; Não se rejeita Ho

9. Ho :  1 =  2 vs Ha :  1   2

zc = -2,22

z2,5% = 1,96 ; Rejeita-se Ho

z0,5%  2,57 ; Não se rejeita Ho

Ho :  M =  H vs Ha :  M   H

|tc| = 2,926 ; 1,98 < t2,5%(98) < 2,00 ; Rejeita- se Ho

Ho: Desempenho e consumo são independentes vs Ha: "não Ho"

 2c = 3,791 ;  25%(2) = 5,991 ; Não se rejeita Ho

Ho:Opinião e número de tentativas são independentes vs Ha:"não Ho"

 2c = 26,2 ;  25%(4) = 9,488 ; Rejeita-se Ho

13. a) Ho :  2B =  2A vs Ha :  2B >  2A

Fc = 2,56 ; F1% (14,9) = 5,00 ; Não se rejeita Ho

Você também pode gostar