21036
ELEMENTOS DE BIOESTATÍSTICA
2019/2020
ATIVIDADE FORMATIVA 3
TEMA 3 – MÉTODOS PARAMÉTRICOS DE INFERÊNCIA
Estimação de parâmetros populacionais e Testes Paramétricos para 2 ou mais amostras
(i.e., comparação de 2 ou mais grupos de indivíduos, objetos, sobre medições de variáveis
quantitativas)
Os exercícios propostos contemplam os seguintes subtemas
Estimação pontual e intervalar (de parâmetros populacionais que são desconhecidos, com
base em amostras da população).
Testes Paramétricos para Amostras Independentes (2 ou mais amostras/grupos)
Testes Paramétricos para Amostras Emparelhadas (2 ou mais amostras/grupos)
Nota: O aplicativo Excel (e suas alternativas em software livre) é uma mais-valia na condução
de várias análises estatísticas. Recomenda-se assim, a instalação do módulo Análise de
Dados.
O módulo básico não realiza Análise de Variância (teste de comparação de médias – ANOVA-
para 3 ou mais amostras que seja emparelhadas).
Para estudantes que já possuam as bases, pode ser utilizado também o software R (acesso
livre).
Ano letivo 2019-2020 MRR – UAb 1
Exercícios de Estimação, pontual e intervalar
3.1. Distinga os seguintes os conceitos (consolidação):
a) Estimador e Estimativa de um parâmetro;
b) Estimação pontual e Estimação por intervalo de Confiança.
3.2. Numa amostra de 140 cidadãos de um certo aglomerado populacional, 38 revelaram
tencionar votar no candidato A nas próximas eleições para a sua junta de freguesia.
a) Determine um intervalo de confiança a 95% para a verdadeira proporção de votantes no
candidato A. Na resolução, explicite o estimador que utiliza.
b) Interprete o significado do respetivo intervalo no contexto.
c) Qual será o efeito sobre a amplitude do intervalo se, mantendo o grau de confiança,
aumentarmos a dimensão da amostra? Justifique.
3.3. Os dados seguintes referem-se aos resultados obtidos num teste intermédio por dois
grupos de estudantes de uma universidade: um grupo de 15 rapazes e outro de 32 raparigas.
Ambos os grupos realizaram o teste intermédio de uma disciplina de Ciências Exatas.
Estatísticas dos resultados Xi
n
Rapazes 150 2
Xi X = 140
15
Raparigas 357 S2=3.423 32
Admita que os resultados dos rapazes e das raparigas podem ser considerados duas
amostras aleatórias independentes dos universos dos rapazes e das raparigas matriculados
na respetiva disciplina. Suponha ainda que os resultados dos rapazes e das raparigas seguem
ambos uma distribuição normal. Determine um intervalo de confiança a 95% para a média
dos resultados dos rapazes e um intervalo de 95% de confiança para a média dos resultados
das raparigas. Justifique as suas opções e, em cada caso, interprete o significado do respetivo
intervalo.
3.4 Determinou-se um intervalo de 90% de confiança para o tempo médio, em minutos, de
uma crise respiratória em indivíduos com doença obstrutiva crónica, que, segundo estudos
científicos está relacionada com o indivíduo ser fumador. A amostra é de 10 indivíduos que
fumam regularmente e que têm a doença. Assume-se que a duração da crise é uma variável
com distribuição normal. O intervalo calculado foi 12.071 < µ < 13.063.
a) Determine a amplitude do intervalo calculado e interprete o seu significado.
b) Indique a fórmula que originou este intervalo e calcule o valor médio amostral, em horas,
no qual se baseou este intervalo.
c) Explicite a margem de erro do intervalo dado, justificando.
Exercícios sobre:
Testes Paramétricos para Amostras Independentes (casos de 2 amostras/grupos e de 3 ou
mais amostras – técnica de Análise de Variância – ANOVA))
Testes Paramétricos para Amostras Emparelhadas (casos 2 amostras/grupos 2
amostras/grupos e 3 ou mais amostras emparelhadas – técnica de Análise de Variância –
ANOVA própria)
Ano letivo 2019-2020 MRR – UAb 2
Notas: a estatística de teste (variável fulcral) adequada a um problema, está associada ao tipo
de amostras em estudo, e implica em toda a resolução do exercício.
3.5. Apresentam-se vários estudos possíveis que envolvem diferentes tipos de amostras de
acordo com os objetivos do estudo, as disponibilidades económicas e os sujeitos disponíveis,
que observem os critérios de inclusão no estudo.
Indique, para cada uma das situações apresentadas, quantas amostras (ou grupos) estão em
análise e se estas amostras são independentes ou emparelhadas (dependentes). Indique
também qual é a variável que está a ser medida/registada em cada situação. Justifique.
a) Um estudo realizado numa empresa farmacêutica pretende concluir sobre a eficácia de
um novo antibiótico em dois tipos de pessoas, nomeadamente com e sem diabetes. Para tal,
o antibiótico foi administrado a 15 pacientes sem diabetes e a 15 pacientes que sofrem de
diabetes. Foi depois observado o tempo decorrido até o medicamento fazer efeito nos
indivíduos de cada grupo.
b) Um estudo na área da medicina do trabalho teve como base de dados os resultados das
análises clínicas que os empregados de uma grande empresa fazem anualmente. A empresa
tem 3 tipos de instalações/locais de trabalho dos seus empregados (Fábrica, Escritórios,
Exterior). Um dos objetivos é comparar os níveis de glicose no sangue dos empregados que
trabalham em cada um dos locais. Para tal, foram recolhidos os valores de glicose no sangue
obtidos sobre uma amostra de 20 trabalhadores da instalação fabril, 12 dos escritórios e 18
dos que fazem serviços no exterior.
c) Um estudo pretende analisar a diferença de peso de bebés recém-nascidos filhos de mães
que fumaram durante a gravidez (numa quantidade e frequência medicamente considerada
como significativa) e de mães que não fumaram neste período (ou fumaram em frequência
residual).
d) Uma autarquia promove um programa educacional infantojuvenil para desenvolver nesta
comunidade conhecimentos sobre as vantagens da prática de exercício físico regular e de
hábitos de higiene, para uma vida mais saudável. Antes de abranger toda a população
escolar foi conduzido um estudo sobre um grupo piloto de 20 crianças. Para analisar o efeito
do programa, foram administrados 3 testes com um determinado conjunto de questões
sobre os temas. O 1º teste foi realizado antes da frequência do programa educacional, o 2º
teste imediatamente a seguir ao final do programa, e o 3º teste cerca de um mês e meio
após a conclusão do programa, para avaliar a completa assimilação. A nota dos testes pode
variar entre 0 e 100%.
e) Uma queijaria está a experimentar uma nova variedade de queijo amanteigado e, por
razões económicas para envio dos queijos para o mercado, pretende comparar a
consistência do queijo em dois tempos de cura que diferem de apenas 15 dias. No seu estudo
observou um total de 30 queijos.
3.6 Para cada uma das alíneas da questão anterior (9.) pense no teste estatístico associado.
Escreva as hipóteses do estudo, nomeadamente as hipóteses na linguagem comum
(hipótese experimental) e as hipóteses na linguagem estatística.
Ano letivo 2019-2020 MRR – UAb 3
3.7 Uma linha de produção opera com dois sistemas de tratamento de plásticos de grande
dimensão, sendo que um deles é bastante mais antigo do que o outro. Com intuito de
comparar os dois sistemas, anotou-se, durante 32 dias, o número de produtos tratados por
dia, obtendo-se os seguintes resultados:
Sistema Novo Sistema Antigo
Média = 246 Média = 240
Desvio Padrão =15,6 Desvio Padrão =24.2
Verifique se os sistemas têm produção idêntica, em média. Utilize um nível de significância
de 10% para a sua decisão estatística. O que conclui?
3.8 Os dados do quadro que se segue representam o tempo (em segundos) que um
aplicativo informático para Sistemas de Informação Geográfica (SIG) demora a responder a
um conjunto de instruções mais complexas. Os dados registados são relativos a uma amostra
de 15 computadores portáteis, todos com o mesmo tipo de processador e memória
instalada.
6,2 8,9 7,7 8,3 7 5,6 5,1 9,5 6,8 5,8 6,7 8,2 7,1 4,9 6,7
Passado um tempo aumentou-se a memória de cada portátil, idêntico para todos os
equipamentos, e observou-se novamente o tempo de resposta às mesmas instruções.
5,2 6,4 5,7 7,4 4,8 5,4 4,8 6,1 5,5 6,2 4,9 5,7 6,3 5,1 6,3
Com base neste dados realize um teste estatístico para verificar se o tempo de resposta
diminuiu significativamente após aplicar-se um aumento da memória em cada computador
portátil. Utilize os cálculos manuais e compare com os obtidos recorrendo aplicativo Excel –
Suplemento de Análise de Dados, caso esteja a vontade neste aplicativo.
3.9 Três freguesias do mesmo Concelho estão a concorrer ao prémio Freguesia Sustentável
2012. Um dos critérios de seleção é a quantidade de lixo reciclável recolhida em média,
mensalmente, por habitante. O júri tem acesso aos registos de recolha mensal por habitante
(em kg) nos últimos seis meses das freguesias a concurso. Para duas das freguesias, a
quantidade recolhida em cada um dos 6 meses por habitante é a seguinte:
Olinda do Norte – 3 kg, 2.6 kg, 4.7 kg, 3.4 kg, 2.9 kg, 4.2 kg
Olinda do Sul – 3.9 kg, 4.1 kg, 3.5 kg, 2.8 kg, 3.3 kg, 4.5 kg
A variância corrigida da amostra relativa à freguesia Olinda do Norte é s'2= 0.67.
a) Utilize um teste estatístico para comparar as duas freguesias relativamente às
quantidades médias recolhidas por habitante nos últimos seis meses. Se tivesse de tomar
uma decisão com base nestes dados, acha que as freguesias estão empatadas, ou, pelo
contrário, existirá uma vencedora (que recolhe mais lixo reciclável por habitante)?
Indique o teste escolhido, as hipóteses, o tipo de amostras os pressupostos assumidos. Para
a sua decisão utilize α=5%.
b) Quando recebeu os dados dos mesmos seis meses relativos à terceira freguesia a
concurso, a Olinda do Oeste, o júri decidiu realizar uma ANOVA (Análise de Variância) para
comparar as três freguesias, com um teste simultâneo. Complete a seguinte tabela ANOVA,
resultante dos dados das três freguesias. Justifique todos os valores calculados. Em seguida,
Ano letivo 2019-2020 MRR – UAb 4
teste se existem diferenças entre as freguesias. Considere um nível de confiança de 95%.
Fonte de Soma Quadrados
Graus de Liberdade F
Variação Quadrados Médios
Tratamentos 4,208
Erro aleatório 0,523
Total 12,06 17
Indique as hipóteses em causa, conclua sobre os resultados da aplicação do teste,
justificando os cálculos e afirmações que apresenta.
c) Indique o procedimento que deveria realizar caso rejeite a hipótese nula e coloque-o em
prática caso se justifique.
3.10. Sete indivíduos com o mesmo problema de insónias disponibilizaram-se para realizar
uma experiência com um novo medicamento para combater a insónia. Pensa-se que o
medicamento pode diminuir o tempo de reação a certos estímulos. Os sete indivíduos
submeteram-se à análise em três situações distintas: Antes de ingerir um comprimido do
medicamento; Depois de ingerir um comprimido do medicamento; depois de ingerir um
comprimido do medicamento juntamente com um chá de ervas com propriedades
calmantes. Foi assegurado um tempo razoável de “descanso” entre as três situações, de
modo a não haver influência de uma sobre as outras. Cada exame consistiu em medir (em
centésimos de segundo) o tempo de resposta a um sinal sonoro. Admite-se os tempos de
resposta ao sinal sonoro seguem uma distribuição aproximadamente normal em todas as
situações analisadas. Os resultados desse encontram-se na tabela seguinte:
Indivíduos A B C D E F G
Tempo de reação sem o medicamento 19 22 34 21 28 23 29
Tempo de reação com o medicamento 18 24 35 27 30 21 33
Tempo de reação - medicamento+chá 18 26 38 25 34 24 35
Investigue se existe evidência estatística para afirmar que este medicamento provoca, como
efeito secundário, o aumento do tempo de resposta a estímulos auditivos. Indique as
hipóteses do teste, classifique as amostras (independentes ou emparelhadas). Justifique a
escolha do teste e os resultados que apresentar.
Ligações e aplicativos úteis
http://www.alea.pt/
Excel MS Office (funções usuais e suplemento de Análise de Dados – a instalar pelo
estudante)
Stat Trek Teach Yourself statistics (tutoriais, tabelas online, etc)
Sample Size Calculators UCSF
Arquivo Escolar (área Prob. e Estatística)
FIM AF3
Ano letivo 2019-2020 MRR – UAb 5