0% acharam este documento útil (0 voto)
103 visualizações60 páginas

Introdução à Estatística

O documento apresenta uma introdução à estatística, definindo o que é estatística e suas principais aplicações. Também resume os principais tipos de estatística (descritiva, probabilidade e indutiva), conceitos importantes como população e amostra, técnicas de amostragem e classificação de variáveis e dados.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Tópicos abordados

  • Média,
  • Análise de Dados,
  • Amostragem por Conveniência,
  • Variáveis Discretas,
  • Dados Qualitativos,
  • Estatística Experimental,
  • Moda,
  • Dados Quantitativos,
  • Amostragem,
  • Análise de Regressão
0% acharam este documento útil (0 voto)
103 visualizações60 páginas

Introdução à Estatística

O documento apresenta uma introdução à estatística, definindo o que é estatística e suas principais aplicações. Também resume os principais tipos de estatística (descritiva, probabilidade e indutiva), conceitos importantes como população e amostra, técnicas de amostragem e classificação de variáveis e dados.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Tópicos abordados

  • Média,
  • Análise de Dados,
  • Amostragem por Conveniência,
  • Variáveis Discretas,
  • Dados Qualitativos,
  • Estatística Experimental,
  • Moda,
  • Dados Quantitativos,
  • Amostragem,
  • Análise de Regressão

UNIVERSIDADE DE CRUZ ALTA – RS

APOSTILA
de
ESTATÍSTICA
Profª Ma. Adriana Cláudia Schmidt

Aluno:______________________

2021 - 1
INTRODUÇÃO À ESTATÍSTICA

Estatística: é a parte da Matemática Aplicada que fornece métodos para a coleta,


organização, apresentação, análise e interpretação de dados para a tomada de decisões.

Algumas aplicações da estatística:

- Um professor comunica que a nota média da classe foi 7;

- O meteorologista informa que a probabilidade de chover hoje é de 30%;

- Um fabricante testa a resistência à ruptura, de cintos de segurança de automóveis, sem


destruir toda a sua produção.

A Estatística divide-se principalmente em:

Descritiva: resume os dados e descreve fatos. Exemplos: médias de estudantes, taxa de


desemprego, consumo médio de automóveis, índice pluviométrico, etc.

Probabilidade: analisa situações que envolvem o acaso. Exemplos: chance de vitória


em uma competição esportiva, decisão de imunizar ou não pessoas contra determinada
doença, etc.

Indutiva: analisa através de amostras, uma parcela pequena de determinada


“população” e infere conclusões sobre a população toda. Exemplo: através do cálculo
da idade média de alguns alunos de uma faculdade, determina uma aproximação, para a
idade média de todos os alunos da faculdade.

Em estatística, população é um conjunto de elementos com pelo menos uma


característica em comum. É o conjunto universo que se pretende estudar, um conjunto
de elementos com alguma característica em comum. Uma população poderia ser, por
exemplo, todos os habitantes do seu município (população finita) ou, todas as orquídeas
da Mata Atlântica (população infinita – não temos como determinar). Quando uma
população concentra um grande número de elementos, seu estudo irá exigir grande
dispêndio de tempo, material, pesquisadores, recursos financeiros, etc. Neste caso,
trabalha-se não com toda a população, mas com uma parte chamada amostra, que é um
subconjunto da população, ou seja, uma parte da população retirada para ser analisada.
O estudo desta parcela deverá permitir que se conheça a população toda de forma geral.
Resumidamente:

População: é o conjunto formado por todos os elementos (pessoas, objetos, etc.) que
contém pelo menos uma característica comum a qual temos interesse em estudar.

Amostra: é uma parte da população retirada para ser analisada, a qual permite que se
conheça tal população.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 2
Técnica de Amostragem: é um procedimento para se obter uma amostra que seja
representativa de uma população. As técnicas usadas para obtenção de uma amostra
podem ser classificadas como amostragens probabilísticas ou não-probabilísticas.

Técnicas de amostragem não-probabilísticas são as que não permitem a retirada de


uma amostra de forma aleatória, pois em algumas situações a amostragem se torna
obrigatória. Dentre essas técnicas existe a amostragem por Conveniência.

→ Amostragem por Conveniência: Ocorre quando o pesquisador seleciona os membros


da população dos quais é mais fácil se obter informações.

Amostragem probabilística é a técnica de seleção de uma amostra na qual cada


elemento da população tem probabilidade conhecida e diferente de zero, de pertencer à
amostra. Os principais tipos são:

→ Amostragem Casual Simples ou Aleatória: os elementos da população são


escolhidos ao acaso (sorte), é o processo mais elementar e frequentemente utilizado,
embora não muito confiável.

→ Amostragem Sistemática: os elementos da população são escolhidos a cada período


(tempo ou quantidade), ou seja, a seleção dos elementos que constituirão a amostra pode
ser calculada por um fator de sistematização ou feita por um sistema imposto pelo
pesquisador, por exemplo, um policial pode parar um veículo a cada dez, outro
exemplo, uma embalagem de um produto de uma linha de fabricação, pode ser retirada
a cada 5 minutos.

→ Amostragem Estratificada: é uma técnica muito utilizada, que separa a população


em partes chamadas de estratos, por exemplo: sexo (masculino ou feminino), faixa
etária, classe econômica, etc. Os elementos que constituirão a amostra são retirados dos
estratos, em quantidade proporcional ao tamanho de cada estrato. Exemplificando,
numa empresa onde trabalham 1.000 pessoas (800 homens e 200 mulheres), deseja-se
fazer uma pesquisa por amostragem, com 100 funcionários, quantos homens e quantas
mulheres serão entrevistados? Como a amostra 100, corresponde a 10% da população
de 1.000 funcionários, devemos entrevistar 10% dos homens e 10% das mulheres, ou
seja, serão entrevistados 80 homens e 20 mulheres.

Dados: os dados são as informações obtidas através de observações, medidas, respostas


de pesquisas ou contagens em geral. Os dados podem ser classificados em:

- NUMÉRICOS ou QUANTITAVIVOS;

- CATEGÓRICOS ou QUALITATIVOS.

A escolha do processo a utilizar na análise ou descrição de dados estatísticos depende


do tipo de dado considerado, após a classificação de suas variáveis.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 3
As variáveis quantitativas podem ser contínuas ou discretas. E as variáveis qualitativas
podem ser nominais ou ordinais.

Variáveis Quantitativas Contínuas (QC): podem assumir qualquer valor numérico num
intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ou
seja, quando pode assumir qualquer valor dentro de dois limites definidos, números
“quebrados”, por exemplo: pesos de peças fabricadas, temperatura do corpo humano,
etc.

Variáveis Quantitativas Discretas (QD): assumem valores numéricos inteiros. Os


dados discretos são o resultado da contagem do número de itens. Ou seja, quando só
pode assumir valores pertencentes a um conjunto enumerável, números inteiros, como
por exemplo, quantidade de peças fabricadas, número de filhos, etc.

Variáveis Qualitativas Ordinais (QO): consistem de valores relativos (numéricos ou


não) atribuídos para denotar ordem. Os dados referentes a tais variáveis dizem-se dados
ordinais. Ou seja, apresenta uma ordenação, por exemplo: grau de escolaridade
(Fundamental, Médio, Superior), nota obtida numa prova (de ZERO a DEZ ou de A até
E ou de MB até I), etc.

Variáveis Qualitativas Nominais (QN): referem-se a avaliações subjetivas. Os dados


referentes a tais variáveis dizem-se dados nominais. Ou seja, não apresentam ordem,
nem estrutura numérica, como por exemplo, religião, sexo, cor da pele, etc.

A dificuldade para classificar dados, se dá em função da fácil confusão gerada entre


uma variável quantitativa discreta e uma variável qualitativa ordinal.

Por exemplo, num questionário estatístico, a pergunta: grau de importância que você dá
ao seu curso (de 0 a 10) é uma variável qualitativa ordinal QO. Outro exemplo: soma da
renda familiar (até $ 1.000,00, entre $ 1.000,00 e $ 2.000,00, acima de $ 2.000,00), é
variável numérica, mas quando se pede para encaixar numa categoria, é classificada
como variável qualitativa ordinal QO.

Exemplo 1: Considere as afirmações a seguir e assinale a alternativa correta.

I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado


qualitativo.
II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um dado
qualitativo.
III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado
quantitativo.
a) Todas as afirmações estão corretas.
b) Apenas a afirmação I está correta.
c) Apenas as afirmações I e III estão corretas.
d) Todas as afirmações estão incorretas.
e) Apenas a afirmação III está correta.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 4
Exemplo 2: Classifique as variáveis abaixo em Qualitativa Nominal (QN), Qualitativa
Ordinal (QO), Quantitativa Discreta (QD) e Quantitativa Contínua (QC).

a) sexo (masculino ou feminino); b) idade;

c) tempo de vida; d) peso;

e) estado civil; f) tipo de escola (pública/particular);

g) número de alunos numa classe; h) disciplina que mais gosta;

i) rua de uma residência; j) número de uma residência.

EXERCÍCIOS:

1. População é um conjunto de:

a) Pessoas.

b) Elementos quaisquer.

c) Pessoas com uma característica comum.

d) Elementos com pelo menos uma característica em comum.

e) Indivíduos de um mesmo município, estado ou país.

2. Uma parte da população retirada para ser analisada denomina-se:

a) Universo. b) Parte. c) Pedaço. d) Dados brutos. e) Amostra.

3. A parte da estatística que resume os dados e descreve fatos denomina-se:

a) Estatística da população. b) Estatística da amostra. c) Estatística Inferencial.

d) Estatística descritiva. e) Estatística grupal.

4. A variável, cor dos olhos, pode ser classificada como:

a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.

d) Qualitativa discreta. e) Qualitativa contínua.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 5
5. A variável, número de filhos, pode ser classificada como:

a) Qualitativa ordinal. b) Quantitativa discreta. c) Quantitativa contínua.

d) Qualitativa discreta. e) Qualitativa contínua.

6. A variável, peso, pode ser classificada como:

a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.

d) Qualitativa discreta. e) Qualitativa contínua.

7. A variável, tipo sanguíneo, pode ser classificada como:

a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.

d) Qualitativa discreta. e) Qualitativa contínua.

8. A variável, sexo, pode ser classificada como:

a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.

d) Qualitativa discreta. e) Qualitativa contínua.

9. Identifique nos exemplos abaixo, qual o tipo de dado:

a) nº de defeitos num carro. b) Salário (R$).

c) Cor azul. d) muito dispendioso.

10. Numa empresa, para estudar a preferência em relação a sabores de sucos naturais,
sorteiam-se 150 funcionários, entre os 850 funcionários próprios (não terceirizados).
Responda:

a) Qual a população envolvida na pesquisa?

b) Que tipo de amostragem foi utilizado?

c) Qual é a amostra considerada?

Gabarito: 1)D 2)E 3)D 4)A 5)B 6)C 7)A 8)A 9)a)discreto b)contínuo c)nominal
d)ordinal 10)a)850funcionários b)aleatória c)150funcionários.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 6
ORGANIZAÇÃO DE DADOS

Quando os dados são coletados para uma pesquisa, são chamados de dados
brutos. Um exemplo de dado bruto corresponde ao valor médio (em dólares) de
comercialização nos últimos 10 meses da saca de soja, na Bolsa de Cereais, conforme
apresentado abaixo:

9,0 - 8,0 - 8,0 - 2,0 - 6,3 - 6,5 - 6,8 - 7,0 - 7,1 - 7,1

Geralmente, este tipo de dado traz pouca ou nenhuma informação ao leitor,


sendo necessário organizar os dados, com o intuito de aumentar sua capacidade de
informação.

Rol: A primeira forma de organização que vamos estudar é o Rol, que são os dados
organizados em ordem crescente ou decrescente.

2,0 – 6,3 – 6,5 – 6,8 – 7,0 – 7,1 – 7,1 – 8,0 – 8,0 – 9,0

Como podemos observar, a simples organização dos dados em um rol aumenta


muito a capacidade de informação destes. Pode-se verificar facilmente que o menor
preço observado foi 2 dólares e o maior, 9 dólares, o que nos fornece uma amplitude
total de variação da ordem de 7 dólares. Amplitude total corresponde à diferença entre
o maior e o menor valor observado em um conjunto de dados, simbolizado por A. Outra
informação que podemos obter nos dados por meio da organização em rol crescente, é
que alguns preços, como 7,1 e 8,0, foram os mais frequentes, ou seja, os mais citados
na pesquisa.

Tabela: Para organizar os dados de uma forma mais eficiente, na qual se possa
apresentar uma quantidade maior de informações, podemos usar as tabelas. Os
elementos básicos de uma tabela são: o título, o corpo e a fonte. Quando temos poucos
valores, podemos agrupá-los numa tabela simples. Por exemplo:

Quando temos muitos valores, fica inviável a tabela simples, dessa forma, os
agrupamos numa tabela com intervalos de classe. Classes são intervalos nos quais os
valores da variável analisada são agrupados (linhas da tabela). Distribuindo-se os dados
observados em classes e contando-se o número de observações contidas em cada classe,
obtém-se a frequência de classe. A disposição tabular dos dados agrupados em classes,

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 7
juntamente com as frequências correspondentes, se denomina distribuição de
frequências. A partir dos dados do exemplo relativo ao preço da saca de soja, vamos
construir uma distribuição de frequência:

TIPOS DE FREQUENCIA

Como já vimos, após a coleta dos dados, não temos informações claras. Ou seja,
na tabela abaixo, temos os dados brutos ou uma tabela primitiva, pois os dados não
estão organizados.

Na tabela anterior, é difícil averiguar, qual o Menor valor, o Maior valor, a Faixa
de valores, a Amplitude, etc. Por isso, é melhor organizarmos a tabela acima, num rol.

Através do Rol, fica fácil averiguar, o Menor valor (4,5), o Maior valor (5,5), a Faixa de
valores (4,5 a 5,5) e a Amplitude (1).

Frequência simples ou absoluta (f): É a quantidade de vezes que um dado


aparece, ou seja, a frequência absoluta, ou apenas frequência, de um valor é o número
de vezes que uma determinada variável assume esse valor. Ao conjunto das frequências
dos diferentes valores da variável dá-se o nome de distribuição da frequência (ou apenas
distribuição). Conforme tabela abaixo:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 8
Na tabela acima, temos uma observação direta, do número de vezes (frequência)
que cada valor aparece. Quando uma tabela possui muitas linhas, podemos transformá-
la de simples em intervalos de classe, conforme abaixo:

OBS.: A escolha do intervalo de classe (0,4) geralmente é arbitrário, embora possa ser
definido por diferentes métodos de cálculo, como o método de Sturges.

_ O símbolo - significa intervalo fechado à esquerda e aberto à direita, ou seja:

4,5 - 4,9 significa 4,5  x < 4,9 ou [ 4,5 ; 4,9 [

Na tabela simples, percebe-se que não há nenhum resultado com 4,6, mas na
tabela com intervalos de classe, não observamos este detalhe. Ou seja, a tabela simples é
mais detalhada que a tabela com intervalos de classe.

Frequência relativa (fr): São os valores das razões entre as frequências simples e a
frequência total fr = f / ∑f . Ou seja, a frequência relativa, é a porcentagem relativa à
frequência. O propósito das frequências relativas é o de permitir a análise ou facilitar as
comparações, pois multiplicando a frequência relativa por cem, temos o percentual de
f 1
cada dado. fr  fr   0,04
f 25

Através da tabela acima e análise de dados, 20% das amostras apresentam o valor 5,0.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 9
Frequência acumulada (F): também chamada de fa, é o total das frequências de todos
os valores inferiores ao limite superior do intervalo de uma dada classe F   f .

Através da tabela acima e análise de dados, há 3 resultados com valores ≤ 4,7, há 12


resultados com valores ≤ 5.

Frequência acumulada relativa (Fr): É a porcentagem relativa à frequência


acumulada. Ou seja, a frequência relativa acumulada de uma classe é a frequência
acumulada da classe, dividida pela frequência total da distribuição Fr 
F .
f

Através da tabela acima e análise de dados, 16% das amostras apresentam valores ≤ 4,8.

Uma tabela de frequências, para variáveis quantitativas, apresenta, porém, outros


conceitos que permitem uma maior profundidade para análise e devem ser adicionadas.
São eles o PONTO MÉDIO (PM), a FREQUENCIA PERCENTUAL ACUMULADA
(F%).

PM é o valor médio de cada classe, ou intervalo, é o ponto médio de cada classe. Torna-
se o valor representativo de cada classe.

F% é a frequência percentual acumulada, obtida repetindo-se o primeiro valor de f% e


somando aos demais.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 10
Veja como exemplo, uma tabela de frequências para a variável quantitativa
“idades” de forma completa:

Amplitude em tabelas de frequências: a amplitude de um rol é a diferença entre o maior


e o menor valor. Numa tabela de frequências, temos a amplitude de cada classe, a
amplitude total das classes, a amplitude dos pontos médios e a amplitude das
frequências. Por exemplo, na tabela acima, temos que a amplitude de cada classe é 14 –
12 = 2, a amplitude total das Classes ou amplitude da distribuição é 20 – 12 = 8, a
amplitude dos pontos médios é 19 – 13 = 6 e a amplitude das frequências é 7 – 3 = 4.

Exemplo: um grupo de alunos foi consultado sobre o time paulista de sua preferência, e
os votos foram registrados assim: Santos: I I, Palmeiras: I I I I, Grêmio: I I I I I I I I,
Inter: I I I I I I. Construa a tabela de frequência correspondente a essa pesquisa.

Obs.: O número de classes pode ser definido pela seguinte fórmula por K = n
Após determinar o número de classes (k) em que os dados serão agrupados,
deve-se, então, determinar a amplitude do intervalo de classe (c).
Para calcularmos a amplitude do intervalo de classe, vamos primeiramente
calcular a amplitude total dos dados (At), que corresponde à diferença entre o maior
valor observado e o menor valor observado. Com base neste valor da amplitude total
(At) calculado, vamos obter a amplitude do intervalo de classe (c), como é mostrado a
seguir:
At
c
k 1
Deve ficar claro, que existem outros procedimentos para determinação da
amplitude do intervalo de classe que podem ser encontrados na literatura.
Conhecida a amplitude de classes, você deve determinar os intervalos de classe.
O limite inferior e o superior das classes devem ser escolhidos de modo que o menor
valor observado esteja localizado no ponto médio (PM) da primeira classe.
LI  LS c
PM  Limite Inf. 1ª = menor valor -
2 2

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 11
Exemplos:

1) A tabela 4 mostra a distribuição de frequências do tempo em segundos de


uso de telefone celular por consumidores de uma determinada operadora

Classes f (consumidores) fa Fr%


69,2 |― 94,8 3
94,8 |― 120,4 8
120,4 |― 146,0 16
146 |― 171,6 7
171,6 |― 197,2 4
197,2 |― 222,8 2
Total 40

2) A tabela a seguir é resultante de uma pesquisa sobre os “gêneros musicais”


mais vendidos em uma loja de CDs durante um dia. Complete os espaços.
Gênero Musical f fr (decimal) fr (%)
Sertanejo 30%
MPB 0,24
Rock
Clássico 14%
Total 50

3) Foi feito um levantamento dos salários dos funcionários de uma empresa e,


em seguida, foi elaborada a tabela de frequências, com os valores da variável
em classes. Complete a tabela:
Salário (R$) f fr
|- 10%
|- 15
|- 30 50%
|- 6
960 |- 1050
Total

4) Na copa do Mundo da África do Sul (2010), o Brasil disputou os seguintes


jogos:
Brasil 2 x 1 Coreia do Norte
Brasil 3 x 1 Costa do Marfim
Brasil 0 x 0 Portugal
Brasil 3 x 1 Chile
Brasil 1 x 2 Holanda
a) Construa a tabela de frequências da variável “resultados”, considerando
como valores as vitórias, os empates e as derrotas do Brasil.
b) Elabore a tabela de frequência da variável “gols marcados pelo Brasil por
partida”.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 12
5) Para os dados abaixo construa uma distribuição de frequências:

Em uma prova de vestibular com 160 testes de múltipla escolha, 50 candidatos fizeram
os seguintes números de pontos:

92 12 17 110 23 107 27 32 96 39

40 98 42 45 70 65 46 48 99 49

80 50 92 52 106 53 100 55 57 61

120 92 61 118 62 63 105 64 66 67

67 68 69 70 40 71 45 72 73 74

REPRESENTAÇÕES GRÁFICAS

Os resultados de uma pesquisa estatística podem ser apresentados em forma de


ROL, de TABELA ou de GRÁFICO.

Os Gráficos Estatísticos são importantes ferramentas para analisar e interpretar


dados numéricos relativos a uma pesquisa, possibilitando melhor visualização.

Uma tabela de distribuição de frequência pode ser representada através de um


gráfico chamado Histograma, conforme abaixo:

Polígono de frequências: é um gráfico em linha, obtido unindo-se por segmentos


de reta os pontos médios das bases superiores dos retângulos de um histograma. Para
realmente obtermos um polígono (linha poligonal fechada) devemos completar a figura,
ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da
posterior à última, da distribuição.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 13
EXERCÍCIOS:

1) O que é rol?
a) sequência desordenada gerada a partir dos dados brutos.
b) sequência dos dados brutos.
c) dados brutos.
d) dados gerados a partir da pesquisa.
e) sequência ordenada gerada a partir dos dados brutos.

2) O que é frequência?
a) dados apresentados em sequência.
b) fato que acontece em uma determinada coleta de dados.
c) quantidade de vezes que a pesquisa é realizada.
d) quantidade de vezes que um elemento ou fato acontece em uma determinada coleta
de dados.
e) coleta de dados.
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 14
3) De acordo com a tabela dada, responda:
a) Qual o número de classes.
b) Qual é o intervalo de classe.
c) Qual o intervalo que aparece a maior frequência?
d) A estatura 176 cm ou 1,76 m, está na classe de qual frequência?

ESTATURA DE 100 FUNCIONÁRIOS DE UMA EMPRESA


Estatura (cm) nº de funcionários (f)
150 ├ 155 2
155 ├ 160 5
160 ├ 165 11
165 ├ 170 39
170 ├ 175 32
175 ├ 180 10
180 ├ 185 1

4) Organizando os valores 89, 54, 34, 56, 56, 34, 80, 28 em um rol, temos:
a) 89, 54, 34, 56, 80, 28
b) 28, 34, 34, 54, 56, 56, 80, 89
c) 89, 80, 56, 54, 34, 28
d) 28, 34, 54, 34, 80, 56, 56, 89

5) Nas séries de valores: A: 2; 4; 5; 8; 9


B: 35; 17; 22; 46; 15; 26
C: 16,1; 21,3; 25,6; 45,2
Assinale a alternativa correta:
a) A maior amplitude é da sequência C.
b) A maior amplitude é da sequência A.
c) A maior amplitude é da sequência B.
d) As sequências A e B possuem amplitudes iguais.
e) As sequências A e C possuem amplitudes iguais.

6) Calcule a amplitude total dos conjuntos de dados:


a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 24, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) 100 |— 150, 150 |— 200, 200 |— 250, 250 |— 300, 300 |— 350, 350 |— 400
e) -2, -1, 0, 1, 2, 3

7) Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos


40 alunos de uma turma de curso técnico:
42103120210211043235
80165321643432102103
Com relação a esses valores, pede-se:
a) Organize os dados em uma tabela sem intervalos de classe.

b) Responda: qual o percentual de alunos que adquiriram menos de 4 livros?

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 15
8) A tabela abaixo apresenta a comissão recebida pelos funcionários de uma empresa.
Comissões (R$) nº de funcionários
100 ├ 150 4
150 ├ 200 8
200 ├ 250 16
250 ├ 300 24
300 ├ 350 20
350 ├ 400 8
Total 80
Quantos funcionários ganham comissão inferior a R$ 300,00?
a) 20 funcionários b) 28 funcionários c) 52 funcionários d) 38 funcionários

9) Os dados da tabela a seguir, referem-se ao consumo familiar anual (kg) de um gênero


alimentício. Complete a tabela.
Peso f f%
42 ├ 54 6
9
19
11
5
Total

10) Em um escritório trabalham 40 pessoas cujas idades, em anos, são dadas em ordem
crescente:
18 - 19 - 20 - 20 - 20 - 24 - 24 - 24 - 24 – 24 - 28 - 28 - 28 - 30 - 30 - 30 - 30 - 30 - 32 -
32 - 35 - 35 - 35 - 35 - 36 - 36 - 36 - 36 - 36 – 40 - 40 - 40 - 42 - 45 - 45 - 48 - 48 - 50 -
50 – 60
Observe que a tabela seguinte está parcialmente preenchida com as idades agrupadas em
intervalos (classes) que devem ter o mesmo comprimento.

Pergunta-se: a) A classe que corresponde a 6 funcionários é:


a) 35 ├ 42 b) 37 ├ 45 c) 39 ├ 46 d) 46 ├ 49 e) 50 ├ 60
b) Relativamente ao total de funcionários desse escritório, a porcentagem dos que têm
idades inferiores a 32 anos é: a) 45% b) 38% c) 37,5% d) 25% e) 12%

11) Ao se lançar 24 vezes um dado de 10 lados (decaedro), obteve-se os seguintes


resultados:
4 2 6 1 2 3
5 6 3 4 2 1
1 6 5 4 5 6
8 7 10 9 7 8
Para os valores acima, construa uma tabela sem intervalos de classe e outra com
intervalos de classe de amplitude 2.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 16
12) Complete a tabela abaixo:

13) Com a tabela de distribuição de frequência abaixo, foi construído ao lado


o histograma dessa distribuição. Complete no eixo nº de estudantes (f), os valores
correspondentes às classes. Altura (cm) freqüência

14) O gráfico representativo abaixo é um gráfico:

a) de setores;
b) de barras;
c) de colunas;
d) em forma de histograma;
e) em forma de polígono de frequência.

15) O gráfico representativo abaixo é um gráfico:

a) de setores; b) de barras;
c) de colunas; d) em forma de histograma;
e) em forma de polígono de freqüência.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 17
16) Nas informações abaixo, faça as tabelas de distribuição de frequência, calculando
pela fórmula o número de classes, e seus respectivos intervalos de classe:
a) Os dados abaixo se referem a idades de pessoas de uma certa comunidades. Organize
os dados em classes, determine as frequências e o ponto médio.
21 25 31 33 58 41 41 46 47
75 69 65 64 57 57 42 53 45
23 30 33 59 38 55 53 52 50
70 68 64 34 39 55 54 48 50
48 44 43 42 68 69 70 75 75

b) Os dados abaixo apresentam as produções diárias em unidades em uma fabrica de


roupas. Organize os dados em classes, determine as frequências e o ponto médio.
10 10 11 32 35 19 12 45 27 32 30

22 24 41 37 15 48 15 25 28 29 30

10 11 25 24 23 28 29 30 32 33 34

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 18
MEDIDAS DE TENDÊNCIA CENTRAL - MÉDIA, MEDIANA E MODA

As Medidas de Posição, também denominadas de medidas de tendência central,


são as medidas que representam os fenômenos pelos seus valores médios, em torno dos
quais tendem a concentrar-se os dados. São usadas para indicar um valor que resume
um conjunto de números. As mais utilizadas são a média, a mediana e a moda.
Média Aritmética: É a soma de todos os resultados obtidos dividido pela
quantidade de valores.
Utiliza-se a letra grega mu “µ” (leia-se “mi”) para a média de uma população de N
elementos. E, a média de uma amostra de n elementos é representada pelo símbolo “ x ”
(leia-se “xis barra”).
Fórmulas:

Quando o exercício não mencionar se os dados são amostrais ou populacionais,


usaremos o símbolo x , pois quase a totalidade das estatísticas são feitas através de
dados amostrais.
Exemplo 1: Determinar a média aritmética dos valores amostrais: 5, 8, 10, 12 e 15.

Exemplo 2: Em uma empresa de cosméticos, a exportação nos últimos 4 anos, em


milhares de dólares, foi US$ 800,00; US$ 880,00; US$ 760,00 e US$ 984,00.
Determine a média de exportações dessa empresa.

Média Aritmética Ponderada (µp e x p): A fórmula anterior para calcular a média
aritmética supõe que cada observação tem a mesma importância. A Média ponderada é
uma média aritmética na qual será atribuído um peso a cada valor da série.

Exemplo 1: Um professor de Matemática adotou para 2017 os seguintes pesos para as


notas bimestrais:
1° bimestre: peso 1 3° bimestre: peso 3
2° bimestre: peso 2 4° bimestre: peso 4
Qual será a média de um aluno que obteve as seguintes notas: 5, 4, 3 e 2 nos respectivos
bimestres ?

Mediana (Me): É o valor que ocupa a posição central de um conjunto de dados, desde
que estejam colocados ordenadamente, seja em ordem crescente ou em ordem
decrescente.
Exemplo 1: Calcular a mediana dos dados: 5 ; 8 ; 4 ; 6 ; 7 ; 3 ; 4.
OBS.: Quando a quantidade de dados for ímpar, o valor da mediana será dado pelo
valor central da série de dados.

Exemplo 2: Calcular a mediana dos dados: 8 – 0 – 7 – 4 – 7 – 10 – 6 – 5.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 19
OBS.: Quando a quantidade de dados for par, o valor da mediana será dado pela média
dos dois valores centrais da série de dados.

Moda (Mo): É o valor que ocorre com maior frequência nos dados de uma pesquisa. Ou
seja, É o valor que aparece a maior quantidade de vezes. É a única que pode ser usada
para dados nominais.
Exemplos 1: Determinar a moda dos dados: 4 4 5 5 5 6 7 8 9
Nesse caso dizemos que a série é unimodal.

Exemplos 2: Determinar a moda dos dados: 10 10 10 15 15 15 17 18 19 19


Nesse caso dizemos que a série é bimodal.

Exemplos 3: Determinar a moda dos dados: 100 200 300 400 500 600 700
Nesse caso dizemos que a série é amodal.

OBS.: Uma série pode ser: amodal, unimodal, bimodal, trimodal e acima disso,
polimodal.

Separatrizes: Muitas vezes torna-se necessário conhecermos outras medidas, além das
de Tendência Central, há as medidas de posição chamadas Separatrizes: Mediana,
quartis, decis e percentis.
Mediana é uma medida de posição que é simultaneamente, medida de tendência
central e medida separatriz. Por esse motivo a mediana já foi estudada anteriormente, e
pode-se verificar que ela separa a série em duas partes iguais, e que cada parte contém o
mesmo número de elementos. Contudo, uma mesma série pode ser dividida em duas ou
mais partes que contenham a mesma quantidade de elementos. O nome da medida de
posição separatriz será de acordo com a quantidade de partes em que é dividida a série.

 Mediana: divide a série em duas partes iguais (Xmd);


 Quartis: divide a série em quatro partes iguais (Q1, Q2, Q3);
 Decis: divide a série em 10 partes iguais (D1, D2, D3, D4, D5, D6, D7, D8, D9);
 Percentis: divide a série em 100 partes iguais (P1, P2, P3, ..., P99).

Quartis (QK)

Nos quartis, a série é dividida em quatro partes iguais. Os elementos separatrizes


da serie são Q1, Q2, e Q3.

25% 50% 75%

Q1 Q2 Q3

Q1: é o primeiro quartil, corresponde à separação dos primeiros 25% de


elementos da série.
Q2: é o segundo quartil, coincide com a mediana (Q2 = Md).

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 20
Q3: é o terceiro quartil, corresponde à separação dos últimos 25% de elementos
da série, ou seja, os 75% dos elementos da série.

Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da


mediana. Consequentemente, podem-se utilizar as mesmas fórmulas do calculo da
mediana, levando em conta que onde houver a expressão  f i será substituída por
2
K  fi , sendo K o número da ordem do quartil, em que K =1 corresponde ao primeiro
4
quartil; K = 2 corresponde ao segundo quartil e K = 3 ao terceiro quartil.

Cálculo do quartil para o rol

1° Passo: Determina-se a posição do Quartil.


Kn
PQK  (onde K  1,2ou3)
4

2° Passo: Identifica-se a posição mais próxima do rol.

3° Passo: Verifica-se quem está naquela posição.

Exemplo: Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores:


A4,1,8,0,11,10,7,8,6,2,9,12

Decis (DK): Nos decis, a série é dividida em 10 partes iguais (D1, D2, D3, ...D9).

10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D1 D2 D3 D4 D5 D6 D7 D8 D9

D1: é o primeiro decil, corresponde à separação dos primeiros 10 % de


elementos da série.
D5: é o quinto decil, coincide com a mediana (D5 = Md).
D9: é o nono decil, corresponde à separação dos últimos 10% elementos da série.

Cálculo do Decil para o rol: Os passos são os mesmos para o cálculo do quartil para o
rol
Exemplo: Calcular D1 e D8 do conjunto dado: A7,12,15,20,2,4,6,18,10,24

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 21
Percentis (Pk): Nos percentis, a série é divida em 100 partes iguais (P1, P2, P3, ... P99).
P1: é o primeiro percentil, corresponde à separação do primeiro 1% de elementos
da série.
P50: é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 = Md).

Para o cálculo dos percentis, utilizamos técnicas semelhantes às do cálculo dos


quartis e decis. Inicialmente, determina-se a classe que contém o valor percentil a ser
calculado pela expressão:
K   fi
(K = 1; 2; 3;...; 98; 99)
100

Cálculo de Percentil para rol: o raciocínio é o mesmo utilizado para o cálculo do


Quartil e Decil. Consideremos o exemplo abaixo:

Exemplo: Calcular o P28 e P82 do conjunto B15,2,4,6,10,12,13,7,21,18,20

EXERCÍCIOS:

1) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6


– 10, determinar a média aritmética dos mesmos.

2) Dados os valores a seguir, 10 – 10 – 11 – 11 – 11 – 11 – 12 – 12 – 12 – 13


– 13 – 13 – 14, determinar a moda dos mesmos.

3) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6


– 10, determinar a mediana dos mesmos.

4) Dados os valores a seguir, 9 – 5 – 4 – 9 – 10 - 7 – 4 – 5 – 10 – 3 - 3 – 9 – 10 - 6,


determinar a mediana dos mesmos.

5) Para a série de valores abaixo, calcule a média, a moda e a mediana.


50 60 40 70 60 40 70 40 60 50 60 50

6) A moda para a sequência numérica 4, 8, 8, 4, 9, 10, 8, 10, 4 e 11 é:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 22
7) Um aluno, nos três primeiros bimestres letivos do ano, obteve as seguintes notas em
matemática: 4,5; 8,0 e 6,5. Quanto precisará de nota no 4° bimestre, para alcançar a
média final 7,0 ?

8) Considere os dados apresentados na tabela, retirados de uma amostra do peso das


crianças índias recém nascidas no Alto Xingu em 2016 e assinale a alternativa correta:

9) Considere os aspectos teóricos envolvidos nas medidas de tendência central e


assinale a alternativa correta:
a) A média aritmética amostral é indicada pela letra µ.
b) O valor da média sempre coincide com o valor da mediana.
c) A mediana é indicada por Mo.
d) A moda é o valor mais frequente.
e) O valor da moda sempre coincide com o valor da mediana.

10) A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos
funcionários se aposentou com 60 anos, saindo da empresa. A média de idade dos 10
funcionários restantes passou a ser de quanto?

11) Numa Universidade, a nota de Cálculo do 2º semestre é obtida calculando a média


ponderada das notas de Álgebra, Geometria e Trigonometria com pesos 3, 2 e 2,
respectivamente. Qual a nota obtida por um aluno que teve 7,5 em Álgebra, 6,0 em
Geometria e 5,5 em Trigonometria?

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 23
12) Considere o conjunto de valores que representa as idades de um grupo de crianças
de uma comunidade: 3,9,2,8,4,6,5,9,10,4,3,5,6,11
a) Qual a idade que corresponde a 25% das crianças (Q1)?

b) Qual a idade que corresponde a 70% das crianças (D7)?

c) Qual a idade que corresponde a 45% das crianças (P45)?

Gabarito: 1)7 2)11 3)7 4)6,5 5)X = 54,17; Me = 55 e Mo = 60 6)4 e 8 7)9,0 8)E 9)D
10)38 anos 11)6,5

MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS AGRUPADOS

Medidas Centrais (Dados Agrupados SEM Intervalos de Classes)

Moda: A Moda para dados agrupados sem intervalos de classes, é calculada


observando-se o maior valor da frequência.
Exemplo: Calcular a moda dos valores representados na distribuição de frequências:

Média: A Média para dados agrupados sem intervalos de classes, é calculada de


maneira análoga a média ponderada.
Exemplo: Calcular a média das idades representadas na distribuição de frequências:

Mediana: Para dados agrupados sem intervalos de classe, identifica-se a frequência


acumulada imediatamente superior à metade da soma das frequências. A mediana será
o valor da variável que corresponde a tal frequência acumulada.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 24
Exemplo: Calcular o valor da mediana da distribuição dada:

Cálculo do quartil:

1° Passo: Calcula-se a posição do quartil.

K  fi
PQK  (onde K  1,2ou 3)
4
2° Passo: É necessário inserir a coluna da frequência acumulada, e nela procurar o valor
da posição do quartil .
3° Passo: O Valor do quartil será o valor da variável que corresponde àquela classe.
Exemplo: Calcular os valores do Q1, Q2 e Q3 da tabela seguinte:

Números de acidentes /mês no Cruzamento X em CG/07


N° de acidentes / f fa
mes
0 4 4
1 6 10
2 9 19
3 5 24
4 4 28
f  28

Cálculo do Decil: Os procedimentos são os mesmos utilizados para o cálculo dos


quartís.
Exemplos: Calcular D3 e D7 usando a seguinte tabela:

Quantidade de filhos dos funcionários de uma pequena empresa.


filhos f fa
0 18 18
1 35 53
2 46 99
3 28 127
4 25 152
5 10 162
6 5 167
7 3 170
f  170
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 25
Cálculo do Percentil: O cálculo do Percentil para a tabela sem intervalo de classe é o
mesmo que para os cálculos dos Quartís e Decís.

Exemplo: Calcular P45 e P93 da tabela

Número de quartos/chalés em Bonito/MS/17


Número de f fa
quartos/chalés
1 15 15
2 30 45
3 20 65
4 12 77
5 10 87
6 8 95
 f i  95

MEDIDAS CENTRAIS (DADOS AGRUPADOS COM INTERVALOS DE


CLASSES)

Média: A média para dados agrupados com intervalos de classes é calculada de maneira
análoga a média ponderada, utilizando-se os pontos médios.
Exemplo: Calcular a média das idades representadas na distribuição de frequências:

Moda Bruta e Classe Modal: A classe que apresenta a maior frequência é


denominada classe modal, uma vez agrupados os dados, é possível determinar
imediatamente a classe modal, basta fixar o valor da variável de maior frequência.

Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta
informação, encontre a classe modal e a moda bruta.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 26
Mediana Bruta e Classe Mediana: A classe que apresenta o valor central das
frequências é denominada classe mediana, uma vez agrupados os dados, é possível
determinar imediatamente a classe mediana, por observação e contagem das frequências
acumuladas.
Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta
informação, encontre a classe mediana e a mediana bruta.

obs.: A moda bruta é o ponto médio da classe de maior frequência e a mediana bruta é
o ponto médio da classe da frequência mediana. Para se obter uma moda e uma
mediana mais precisa, para dados agrupados, existem várias fórmulas, de matemáticos
como KING e CZUBER.

Cálculo do quartil: Determina-se, inicialmente, a classe que contém o valor quartil a


ser calculado. A identificação da classe é feita por meio do termo da ordem calculada
pela expressão:

K  fi
PQK  (onde K  1,2ou 3)
4

Essa expressão determina a posição do referente quartil ou classe que contém o quartil.
Assim, temos:
 K   fi 
  Fant 
Qk  lqk   4   aQk
 f QK 
 

Sendo:
lQk = limite inferior da classe do quartil considerado.
Fant = freqüência acumulada da classe anterior à classe do quartil considerado.
aQK = amplitude do intervalo de classe do quartil considerado.
fQK = freqüência simples da classe do quartil considerado.

Exemplo: Para o cálculo dos quartis de dados agrupados com intervalos de classe,
consideramos a distribuição dos pesos de um grupo de turistas que visita um parque
temático em Porto Alegre/RS/Julho/18.
Pesos de um grupo de turistas do Parque Temático Fortaleza/CE/Julho/06.
Pesos Freqüência Freqüência
i
(kg) (fi) acumulada (Fa)
1 10 ├ 30 10 10
2 30 ├ 50 24 34
3 50 ├ 70 57 91
4 70 ├ 90 44 135
5 90 ├ 110 29 164
6 110 ├ 130 16 180
  180
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 27
Cálculo do decil: Primeiramente, determina-se a classe que contém o valor do decil a
ser calculado pela expressão:

K  fi
(para K  1,2,3,...,9)
10

Esse termo está localizado numa classe que recebe o nome de classe decil. Para o
cálculo dos decis, utilizamos técnicas semelhantes às do cálculo dos quartis. Isto é,
utilizamos a fórmula:

 k   fi 
  Fant 
D K  lDK   10   aD K
 f DK 
 
Sendo:
l DK = limite inferior da classe de decil considerado
Fant = freqüência acumulada da classe anterior à classe de decil considerado
hDK = amplitude do intervalo de classe do decil considerado
fDK = freqüência simples da classe do decil considerado

Exemplo : O calculo dos decis será exemplificado com os dados da Tabela 3.6 que
organiza as estaturas de adolescentes, colhidas durante o período em que participaram
de um acampamento, durante as férias.

Estaturas dos participantes de um acampamento infantil/Bonito/Julho/06.


i Estaturas Freqüência Freqüência acumulada
(cm) (fi) (Fi)
1 120 ├ 128 6 6
2 128 ├ 136 12 18
3 136 ├ 144 16 34
4 144 ├ 152 13 47
5 152 ├ 160 7 54
  54

Cálculo para Percentil: Para o cálculo dos percentís, utilizamos técnicas semelhantes
as do cálculo dos quartís e decís. Inicialmente, determina-se a classe que
contém o valor percentil a ser calculado pela expressão:

K   fi
(K  1,2,3,4,...,98,99)
100
Para obtenção do percentil, utilizamos a fórmula:

 K   fi 
  Fant 
PK  lPK  100   aPK
 f PK 
 

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 28
Sendo:
l PK  limite inferior da classe do percentil considerado
Fant = freqüência acumulada da classe anterior do percentil considerado
a PK  amplitude do intervalo de classe do percentil considerado
f PK = freqüência simples da classe do percentil considerado

Exemplo: Calcular o 46º percentil (K=36) e o 76° percentil (K=76):

Estaturas dos participantes de um acampamento infantil/Bonito/Julho/06.


i Estaturas Freqüência Freqüência
(cm) (fi) acumulada (Fi)
1 120 ├ 128 6 6
2 128 ├ 136 12 18
3 136 ├ 144 16 34
4 144 ├ 152 13 47
5 152 ├ 160 7 54
  54

EXERCÍCIOS:

1) Calcular o valor da mediana da distribuição dada:

2) (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma


equipe de orientadores educacionais de uma instituição de ensino pesquisou um grupo
de adolescentes de uma comunidade próxima a essa escola e obteve os seguintes dados:

Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades
das adolescentes grávidas, que:
a) a média é 15 anos. x = 13.4 + 14.3 + 15.2 + 16.5 + 17.6 = 306/20 = 15,3
b) a mediana é 15,3 anos. Me = 20/2 = 10 f ac 14 Me = 16
c) a mediana 16,1 anos.
d) a moda é 16 anos. Mo = 17 anos
e) a média é 15,3 anos.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 29
3) (Unimontes-MG) O serviço meteorológico registrou, em alguns estados brasileiros,
as seguintes temperaturas:

A moda e a mediana dessas temperaturas são, respectivamente,


a) 39ºC e 24ºC
b) 8ºC e 39ºC
c) 8ºC e 21ºC
d) 21ºC e 8ºC

4) Considere os faturamentos mensais das seguintes filiais de uma grande empresa (em
milhares de Reais)

Utilize a medida de posição MEDIANA para comparar o desempenho das filiais.

5) Na linha de produção de uma grande empresa farmacêutica, existem 7 diferentes


testes no controle de qualidade. Sorteamos alguns dias e observamos 6.934 tubos de
pomada, anotando o número de aprovações que cada pomada recebeu.

Determine o número médio de aprovações por tubo de pomada produzido.

6) Considere a tabela que representa os valores economizados por crianças para a


compra do presente do dia das mães.
Valores economizados pelas crianças
Valores Num. de fa
(R$) crianças(fi)
10 2
15 6
20 8
25 15
30 13
35 11
40 5
 fi  60
a) Qual o valor economizado por 75% das crianças (Q3)?

b) Qual o valor economizado por 40% das crianças (D4)?

c) Qual o valor economizado por 92% das crianças (P92)?

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 30
7) Em uma pesquisa realizada numa Empresa Farmacêutica quanto aos salários médios
de seus funcionários, verificou-se o seguinte resultado:

Baseado nesses resultados determine o salário médio desses funcionários.

8) Considere a tabela de distribuição das alturas, em cm, de 40 alunos de uma sala de


aula.

Calcule a média das alturas.

9) Calcule a Moda da tabela abaixo, para o dado qualitativo, tipo sanguíneo de alguns
indivíduos.

10) Calcule a moda nas tabelas abaixo e diga qual o tipo de série modal.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 31
11) Calcule a média, a moda bruta e a mediana bruta da tabela de distribuição das
alturas, em cm, de 40 alunos de uma classe.

12) Considere a tabela que representa os salários de funcionários de uma empresa de


reciclagem.
Salários da empresa de reciclagem Coisas &Tal
Salários funcionários
500 ├ 600 3
600 ├ 700 8
700 ├ 800 12
800 ├ 900 17
900 ├ 1000 10
1000 ├ 1100 8
1100 ├ 1200 6
 fi  64
a) Qual o salário de 25% dos funcionários que ganham menos(Q1)?

b) Qual o salário de 60% dos funcionários que ganham menos(D6)?

c) Qual o salário de 90% dos funcionários que ganham menos(P90)?

Gabarito: 1) 15,5 2) E 3) C 4) 24 e 39,5 5)X = 6,6 6) 7) 830,40 8) 170,50 9) Mo


= tipo O 10) a) Mo = 4,5 (série unimodal) b) Mo = 4,5 e Mo = 4,6 (série bimodal) c)
Não há Mo (série amodal) 11)Ẍ = 174,25; Me = 175 e Mo = 165 e 185

MEDIDAS DE DISPERSÃO - AMPLITUDE, VARIÂNCIA, DESVIO PADRÃO E


COEFICIENTE DE VARIAÇÃO

Quando se trata de interpretar dados estatísticos, é necessário ter-se uma idéia


retrospectiva de como se apresentavam esses mesmos dados nas tabelas.
Para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão ou de variabilidade. Pois são necessários dois tipos de
medidas para descrever adequadamente um conjunto de dados. Além da informação
quanto ao “meio” de um conjunto de números (estudado em medidas de tendência
central), precisamos saber também a dispersão desses dados. As medidas de dispersão
indicam se os valores estão relativamente próximos uns dos outros, ou separados. Essas

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 32
dispersões tem como ponto de referência as medidas de tendência central. O valor zero
indica a ausência de dispersão e quanto maior o valor, maior a dispersão.
Ou seja, as medidas de dispersão ou de afastamento são medidas estatísticas
utilizadas para verificar o quanto os valores encontrados em uma pesquisa estão
dispersos ou afastados em relação à média ou em relação à mediana. Para avaliar o grau
de variabilidade ou de dispersão são utilizadas as chamadas medidas de dispersão.
Dessas medidas, estudaremos a amplitude, a variância, o desvio padrão e o coeficiente
de variação.
Amplitude Total (A): é a diferença entre o maior e o menor valor de uma série
de dados. Quanto maior a amplitude total, maior a dispersão ou variabilidade dos
valores da variável.
Exemplo: No conjunto de números 4 , 6 , 8 , 9 , 12 , 17, 20, calcule a Amplitude.
A = maior valor – menor valor
A = 20 – 4
A = 16
Alternativamente, pode-se dizer que o intervalo de valores vai de 4 a 20.

No caso de termos uma distribuição de frequência com intervalos de classe,


calculamos a Amplitude total, pela diferença entre o limite superior da última classe e o
limite inferior da primeira classe.

Variância: É a média dos quadrados dos desvios dos valores a contar da média.
Utiliza-se a letra grega sigma minúsculo elevado a 2 “σ²” para a variância de uma
população de N elementos. E, a variância de uma amostra de n elementos é
representada pela letra “s²”. O símbolo da variância é elevado a 2, porque essa medida
de dispersão exprime em quadrados de unidades os valores observados e a média deles,
ou seja, se estivermos calculando uma dispersão de comprimento em cm, a variância
será obtida em cm². Por isso, também não é muito utilizada como medida de dispersão,
mas o cálculo da variância é usado para se obter o desvio padrão, que é a medida de
dispersão mais utilizada. Fórmula para a variância amostral:

Substitui-se “n-1” por “n” no denominador para a variância da população, ou


quando a finalidade é apenas descrever os dados e não fazer uma inferência sobre uma
população. Usaremos “n”, somente quando o exercício mencionar que os dados são
populacionais, ou seja, quando o exercício não mencionar se os dados são populacionais
ou amostrais, vamos considerá-los amostrais e usar n-1.

Exemplo 1: Calcule a variância para os valores amostrais 5; 7 e 9.


Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 33
Exemplo 2: Calcule a variância para a distribuição de frequência abaixo:

Se a tabela for com intervalo de classe, basta usar os valores dos pontos médios.

Exemplo 3: Calcule a variância para a distribuição de frequência abaixo:

A variância baseia-se nos desvios em torno da média aritmética, porém


determinando a média aritmética dos quadrados dos desvios. Ela é um número em
unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático,
é um inconveniente. Por isso, imaginou-se uma nova medida que tem utilidade e
interpretação práticas, denominada desvio padrão.

Desvio Padrão: Utiliza-se a letra grega sigma minúsculo “σ” para o desvio
padrão de uma população de N elementos. E, o desvio padrão de uma amostra de n
elementos é representada pela letra esse minúscula “s”. O desvio padrão é simplesmente
a raiz quadrada da variância.

O desvio padrão é a medida de dispersão mais utilizada, desempenha papel


relevante em toda a estatística e a sua unidade é a mesma da média. O desvio padrão dá
uma idéia de como os valores de uma amostra estão dispersos em relação à média.
Quanto maior o desvio padrão, maior é a dispersão dos valores em relação à média. Um
desvio padrão igual a zero indica que todos os valores são iguais à média.

Coeficiente de Variação (CV): O Índice de Variabilidade (IV) ou o


Coeficiente de Variação (CV) é a razão entre o desvio padrão e a média, o resultado
normalmente é multiplicado por 100 para que o coeficiente seja dado em porcentagem.
O CV é utilizado quando dois grupos apresentam mesmo desvio padrão e médias
diferentes, ou para se comparar duas ou mais séries de valores, quanto a sua dispersão
ou variabilidade, quando expressas em unidades diferentes, ou ainda quando duas
médias forem muito distantes.
O Coeficiente de Variação (CV), é uma medida relativa de dispersão, onde a
variabilidade, através do desvio padrão, é comparada com sua média, através da relação
abaixo:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 34
Onde s é o desvio padrão,  é a média aritmética e o fator 100 é utilizado para
apresentar a resposta na forma percentual.
Normalmente, dizemos que um CV abaixo de 15% indica um grupo de dados
com baixa dispersão. Um CV acima de 30% representa uma alta dispersão dos dados e,
entre esses valores, o CV representa uma dispersão média.

Exemplo 1: A análise de dois grupos diferentes de dados foi realizada e eles


apresentaram o mesmo desvio padrão, mas valores médios diferentes:
Grupo 1: (3; 1 e 5)
Grupo 2: (55; 57 e 53)
Qual deles possui maior dispersão?

Exemplo 2: (Grupos com unidades diferentes) Ao medir a variabilidade das


alturas em cm e comparar com a variabilidade das massas em kg dos alunos. Os
resultados foram:
Alturas: s = 15 cm e  = 165 cm Massas: s = 10 kg e  = 65 kg
Pela comparação direta dos desvios chegaríamos a conclusão que as alturas tem
mais variabilidade do que as massas. Mas obtendo o CV:
Alturas: CV = 9,1% Massas: CV = 15,4%
Concluímos que:
As massas tem maior variabilidade que as alturas.

Exemplo 3: (Grupos com mesmas unidades, porém com médias distantes)


Imagine que desejamos comparar a variabilidade das massas de adultos com as de
recém-nascidos:
Adultos: s = 10 kg ,  = 65 kg e CV = 15,4%
Recém nascidos: s = 1 kg ,  = 3 kg e CV = 33,3%
Analogamente ao exemplo 2, a comparação das variabilidades através do desvio
nos levaria a decisão contrária, pois a maior variabilidade ocorreu entre os recém-
nascidos.

EXERCÍCIOS:

1) Calcule a amplitude, a variância e o desvio padrão dos valores: 4, 5, 6, 8, 9,


10

2) Calcule o desvio padrão para a tabela abaixo:


Idade 14 15 16 17 18 19 20
Frequência 7 6 1 2 1 0 4

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 35
3) Calcule a amplitude e o desvio padrão da tabela abaixo:
Estaturas (cm) Frequência
150 ├ 154 9
154 ├ 158 9
158 ├ 162 11
162 ├ 166 8
166 ├ 170 5
170 ├ 174 3

4) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um.


Veja as marcas obtidas por três atletas e responda:
* atleta A: 148cm, 170cm, 155cm, 131cm.
* atleta B: 145cm, 151cm, 150cm, 152cm.
* atleta C: 146cm, 151cm, 143cm, 160cm.
a) Qual deles obteve a melhor média? b) Qual deles foi o mais regular?

5) Calcule o CV das medidas das estaturas e dos pesos do grupo de indivíduos


abaixo e responda qual apresenta o maior grau de dispersão.
Média Desvio Padrão
ESTATURAS 175 cm 5 cm
MASSAS 68 kg 2 kg

6) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um
coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

7) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%.


Determine a média da distribuição.

Gabarito: 1)A = 6, s² = 5,6 e s = 2,36 2)2,28 3)24 e 6,03


4)O atleta A obteve a maior média, 151 cm. O atleta B foi o mais regular, pois
seu desvio padrão é o menor, aproximadamente 3,1 cm.
5)As massas apresentam maior grau de dispersão 2,94%, sendo o das estaturas
de 2,86% 6)5,41 7)51,72

PROBABILIDADES

A probabilidade serve para calcular a chance de algo acontecer. Seu estudo,


assim como o da Análise Combinatória, teve origem nos jogos de azar, onde as pessoas
queriam saber qual o melhor modo de jogar, para aumentar sua chance de vitória.
Devido a essa origem, os exemplos e exercícios de probabilidade que
encontramos nos livros didáticos, envolvem moedas, dados e baralhos. As regras aqui
ensinadas através de exercícios de jogos de azar, são as mesmas utilizadas em cálculos
das áreas de Exatas, Biológicas e até de Humanas.
Os modelos probabilísticos são úteis em várias áreas do conhecimento humano
e, atualmente a probabilidade desempenha papel importante em muitas situações que
envolvam uma tomada de decisão.
Aleatoriedade: Ao jogarmos uma moeda, não podemos prever o resultado, mas,
ainda assim, há um certo padrão regular nos resultados, padrão este que se evidencia
somente após muitas repetições. Por exemplo, a proporção de jogadas de uma moeda
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 36
que dão “cara” varia quando fazemos mais e mais jogadas, mas tende para 50% (0,5),
que é a probabilidade de “cara”. Este fato notável é o fundamento da idéia de
probabilidade.
A teoria da probabilidade surgiu para tentar medir a “chance” de ocorrer um
determinado resultado, num experimento aleatório. Numa experiência com vários
resultados possíveis, todos com a “mesma chance”, dizemos que:
_ Ponto Amostral: é qualquer um dos resultados possíveis.
_ Espaço Amostral (S): é o conjunto de todos os resultados possíveis.
_ Evento (E): é qualquer subconjunto do espaço amostral.
Também dizemos que n(S) é o número de elementos de S. E n(E) é o número de
elementos de E.
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Fenômenos
onde o resultado final depende do acaso são chamados fenômenos aleatórios ou
experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias
vezes sob condições semelhantes, apresentam resultados imprevisíveis, como por
exemplo, o lançamento de um mesmo dado repetidas vezes.

Espaço Amostral: A cada experimento correspondem, em geral, vários


resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis:
ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado, há seis resultados possíveis:
1, 2, 3, 4, 5 ou 6.
Os dois experimentos citados têm os seguintes espaços amostrais:
- lançamento de uma moeda: S = {Ca, Co};
- lançamento de um dado: S = {1,2,3,4,5,6}.
Cálculo da Probabilidade: A probabilidade de ocorrer o evento E, representada
por P(E), de um espaço amostral S ≠ ᴓ, é o quociente entre o número de elementos de E
e o número de elementos de S. Simbolicamente:

Cada elemento de S que corresponde a um resultado recebe o nome de ponto


amostral. Probabilidade é a possibilidade de que certo caso aconteça, a qual é calculada
em matemática pela razão entre o número de casos favoráveis e o número total de casos
possíveis.

Eventos Complementares: Sabemos que um evento pode ocorrer ou não.


Sendo A a probabilidade de que ele ocorra (sucesso) e Ā a probabilidade de que ele
não ocorra (fracasso), para um mesmo evento existe sempre a relação:

Assim, se a probabilidade de se realizar o evento é P(A) = 1/5, a probabilidade


de que ele não ocorra é P(Ā) = 4/5.
Sabemos que a probabilidade de tirar um 4 no lançamento de um dado é P(A) =
1/6. Logo, a probabilidade de não tirar o 4 no lançamento de um dado é: P(Ā) = 1 – 1/6
= 5/6.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 37
Eventos Independentes: Dizemos que dois eventos são independentes quando
a realização ou a não-realização de um dos eventos não afeta a probabilidade de
realização do outro e vice -versa. Por exemplo, quando lançamos dois dados, o resultado
obtido em um deles independe do resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
P(A ∩ B) = P(A) • P(B)
Por exemplo, ao lançarmos dois dados. A probabilidade de obtermos 3 no
primeiro dado é: P(A) = 1/6. A probabilidade de obtermos 5 no segundo dado é: P(B)
= 1/6. Logo, a probabilidade de obtermos, simultaneamente, 3 no primeiro e 5 no
segundo é: P(A ∩ B) = 1/6 • 1/6 = 1/36. Ou seja, a probabilidade de se tirar o 3 e
o 5 é: 1/36. A probabilidade de que um e outro se realize é igual ao produto das
probabilidades de que cada um deles se realize.

Eventos mutuamente exclusivos: Dizemos que dois ou mais eventos são


mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro
se realize é igual à soma das probabilidades de que cada um deles se realize:
P(A U B) = P(A) + P(B)
Por exemplo, ao lançarmos um dado, a probabilidade de se tirar o 3 ou o 5 é:
P(A U B) = 1/6 + 1/6 = 2/6 = 1/3, pois, como vimos, os dois eventos são mutuamente
exclusivos.
Eventos não mutuamente exclusivos: Como vimos anteriormente em Eventos
mutuamente exclusivos “ou” P(A U B) = P(A) + P(B), não existem elementos, que
pertençam simultaneamente a P(A) e a P(B). Quando existirem elementos que
pertencerem simultaneamente a P(A) e a P(B), devemos subtrair esses elementos (essa
intersecção), para não contá-los duas vezes, ou seja:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Por exemplo, retirando uma carta de um baralho comum de 52 cartas, qual é a
probabilidade de ocorrer uma dama ou uma carta de ouros? Se A for o evento dama e B
o evento carta de ouros, temos: n(A) = 4, n(B) = 13, n(A ∩ B) = 1, pois existe apenas
uma dama de ouros, a qual deve ser subtraída nessa intersecção, para não ser contada
duas vezes. Temos também que n(S) = 52.

Probabilidade condicional: Dados dois eventos, A e B, a probabilidade de que


o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade condicionada de
B, escrita por P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de A,
condicionada a ocorrência de B, como P(A/B) (lê-se: probabilidade de A dado que B
tenha ocorrido, ou probabilidade A condicionada à ocorrência B).
Suponha que existam 10 rótulos de papel que podem ser distinguidos pelo
número e pela cor: Por exemplo, os rótulos numerados por 1, 2 e 3, são amarelos e os
restantes, brancos. Se todos forem colocados em uma urna e retirados ao acaso, a
probabilidade de extrair um rótulo particular é 1 / 10. Se, porém, após retirar um rótulo

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 38
ao acaso, ele for amarelo, como calcular a probabilidade de que um certo rótulo, por
exemplo, aquele com o número 1, seja extraído?
Evidentemente, o número de acontecimentos favoráveis está agora reduzido de
10 para 3; em outras palavras, o rótulo desejado deve ter o número 1 e ser amarelo.
Calculamos a probabilidade condicionada pela razão:

Para alguns fins, é mais conveniente exprimir a probabilidade condicionada,


dividindo-se o numerador e o denominador da fórmula anterior pelo número total de
casos possíveis na experimentação. No caso presente, são 10 rótulos diferentes e,
portanto, 10 possíveis casos.
Assim:

De modo geral, dados dois eventos A e B, que não são independentes, a probabilidade
condicionada de A, dado B, ou de B dado A, é definida como:

RESUMO:

▪ Regra da Adição “ou”:


- Para eventos mutuamente exclusivos (quando a realização de um exclui a
realização do outro): P(A ou B ocorrerá) → P(A U B) = P(A) + P(B)
- Para eventos NÃO mutuamente exclusivos (é possível a realização conjunta
de ambos “A e B”): P(A ou B ou ambos ocorrerão) → P(A ∪ B) = P(A + B) − P(A ∩ B)
▪ Regra da Multiplicação “e”:
- Para eventos independentes (quando a ocorrência ou não de um evento, não
influencia na ocorrência do outro): P(A e B ocorrerá) → P(A ∩ B = P(A) • P(B)
▪ Regra para eventos dependentes “probabilidade condicionada” (a
probabilidade de que o evento A ocorra, dado que o evento B já ocorreu) →

EXEMPLOS:

1) Considerando os resultados de 2 lançamentos de uma moeda honesta,


responda:
a) Qual o número de elementos do espaço amostral?
b) Descreva o espaço amostral?
c) Qual o número de elementos do evento F: ocorrer coroa em pelo menos um
dos lançamentos?
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 39
d) Qual o número de elementos do evento E: ocorrer cara nos dois lançamentos?
e) Qual a probabilidade de ocorrer o evento E?

2) No lançamento simultâneo de 2 cúbicos honestos, determine:


a) O número de elementos do espaço amostral:
b) O número de elementos do evento A: soma dos pontos igual a 4:
c) A probabilidade de ocorrer o evento A.

3) No lançamento de um dado cúbico honesto, qual a probabilidade de obter na


face superior:
a) número par?
b) número menor ou igual a 6?
c) número 4?
d) número maior que 6?

4) A probabilidade de se realizar um evento é de 2/5, qual a probabilidade de


que esse evento não ocorra?

5) No lançamento de 2 cúbicos honestos, determine a probabilidade de obtermos


simultaneamente, 1 no primeiro dado e 5 no segundo dado?

6) No lançamento de 1 dado, qual a probabilidade de se tirar o 3 ou o 5?

7) Uma urna possui 10 bolas, sendo 3 brancas, 2 vermelhas e 5 verdes, retira-se


ao acaso duas bolas sem reposição. Qual é a probabilidade da primeira bola ser branca
e da segunda bola ser verde?

EXERCÍCIOS:
1) Qual a probabilidade de obter cara no lançamento de uma moeda?

2) Qual a probabilidade de sair um ás de ouros quando retiramos uma carta de


um baralho de 52 cartas?

3) Qual a probabilidade de sair um rei quando retiramos uma carta de um


baralho de 52 cartas?

4) Em um lote de 12 peças, quatro são defeituosas. Sendo retirada uma peça,


calcule:
a) A probabilidade dessa peça ser defeituosa.
b) A probabilidade dessa peça não ser defeituosa.

5) No lançamento de dois dados, calcule a probabilidade de se obter soma igual


a 5.
Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]
Página 40
6) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do
primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro
baralho ser um rei e a do segundo ser o 5 de paus?

7) de um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição.


Qual é a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus?

8) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos


uma carta de um baralho de 52 cartas?

9) No lançamento de um dado, qual a probabilidade, de se obter um número não


inferior a 5?

10) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas? (cartas com figura são: dama, valete e rei)

11) Ao se retirar uma carta de um baralho comum de 52 cartas, qual a


probabilidade de ela ser ou um ás ou uma carta de espadas?

12) Em uma disputa final de torneio de tiro ao alvo, a probabilidade de Kendric


acertar no alvo é de ½ e a de Marcel atingir o mesmo alvo é de 3/5. Qual a
probabilidade do alvo ser atingido, se ambos atirarem nele?
Gabarito: 1)1/2 2)1/52 3)1/13 4)a)1/3 b)2/3 5)1/9 6)1/676 7)1/2652 8)1/2
9)1/3 10)3/13 11)4/13 12) 80%

DISTRIBUIÇÃO NORMAL DE PROBABILIDADES

A distribuição normal é a mais importante das distribuições de probabilidades,


pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos
obedecem a esta distribuição, a qual é representada por uma curva em forma de sino,
sendo também conhecida como curva de Gauss.
Inicialmente, supunha-se que todos os fenômenos da vida real devessem ajustar-
se a uma curva em forma de sino; caso contrário, suspeitava-se de alguma anormalidade
no processo de coleta de dados. Daí a designação de curva normal.
Inúmeras variáveis contínuas que descrevem fenômenos naturais e sociais
apresentam distribuições de probabilidades próximas da distribuição normal, por isso
ela é a distribuição de probabilidades mais utilizada.
Ao representarmos de forma gráfica (histograma) um conjunto de dados
quantitativos de uma distribuição simétrica, chamada Normal ou Gaussiana, a maioria
dos dados se encontra próximo de um determinado valor central (média, moda ou
mediana), os demais dados se distribuem igualmente afastando-se dos valores centrais.
Por exemplo: segue abaixo a tabela de distribuição de frequências e o
histograma das notas obtidas em uma prova de estatística, por 118 alunos.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 41
Ao desenharmos o polígono de frequências, observamos que o mesmo se ajusta
a uma curva normal.

Características gerais da curva Gaussiana:

- O gráfico da distribuição normal é uma curva em forma de sino, simétrica em


torno da média µ;
- A área total da curva vale 1 ou 100%, porque corresponde à probabilidade de a
variável aleatória assumir qualquer valor real;
- Como a curva é simétrica em torno da média, os valores maiores do que a
média e os valores menores do que a média têm a mesma probabilidade de ocorrer;
- A configuração da curva é dada por dois parâmetros: a média, µ, e o desvio
padrão, σ;
- É uma curva unimodal (só uma moda) onde a moda, a mediana e a média tem o
mesmo valor;
- A curva normal aproxima-se mais do eixo x à medida que se afasta da média
em ambos os lados, mas nunca toca o eixo.

Valores padronizados na curva de Gauss:


Todas as curvas normais representativas de distribuições de frequências podem
ser transformadas em uma curva normal padrão (com valores padronizados z). A
Distribuição Normal Padrão é caracterizada por média igual a zero (µ = 0) e desvio
padrão igual a 1 (σ = 1).

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 42
Quando empregada para descrever a distribuição de dados, a curva normal
descreve de que maneira, ao fazermos muitas observações, os dados se localizam ao
redor da média, que é representada pelo pico da curva. Além disso, como a curva
descende simetricamente de cada lado, ela descreve o modo como o número de
observações diminui igualmente acima e abaixo da média, a princípio mais
abruptamente, depois de maneira menos drástica. Nos dados que seguem a distribuição
normal, cerca de 68% (aproximadamente 2/3) das observações cairão a menos de 1
desvio padrão da média, cerca de 95% cairão a menos de 2 desvios padrão, e 99,7% a
menos de 3 desvios padrão.
A curva varia no eixo z desde -4 até +4, ou seja, de menos 4 desvios padrões da
média até mais 4 desvios padrões da média. É estatisticamente impossível ocorrer algo
que diste mais do que 4 vezes o desvio padrão da média.
Os pesquisadores usam o termo “margem de erro” para descrever essa incerteza.
Quando dizem aos meios de comunicação que a margem de erro de uma pesquisa é de
5% para mais ou para menos, o que estão dizendo é que, se repetissem a pesquisa uma
grande quantidade de vezes, em 19 de cada 20 pesquisas (95%) o resultado estaria a
menos de 5% do valor correto, embora raramente mencionem o fato, isso também
significa, naturalmente, que aproximadamente 1 de cada 20 pesquisas terá um resultado
amplamente impreciso. Como regra, uma amostra de 100 gera uma margem de erro
grande demais para a maioria dos propósitos. Uma amostra de mil, por outro lado,
costuma gerar uma margem de erro próxima de 3%, que é suficiente para a maior parte
das finalidades.

Cálculo da Distribuição Normal: Qualquer conjunto de valores x, normalmente


distribuídos, pode ser convertido em valores normais padronizados z pelo uso da
fórmula:
x
z

Na fórmula acima, o desvio padrão populacional σ, pode ser substituído pelo


amostral s.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 43
A tabela acima mostra os valores da metade positiva da curva. Os valores
negativos são obtidos por simetria.

Exemplos de aplicação da distribuição normal:

1) Sabemos que a vida útil de determinado componente elétrico segue uma


distribuição normal com média µ = 2.000 horas e desvio padrão s = 200 horas.
Qual a probabilidade de que um componente elétrico, aleatoriamente
selecionado, dure entre 2.000 e 2.400 horas?

2) Com respeito aos componentes elétricos descritos no exemplo 1, suponhamos


que estivéssemos interessados na probabilidade de que um componente,
aleatoriamente escolhido, durasse mais que 2.200 horas.

3) Os pesos dos alunos de determinada escola tem uma distribuição normal com
média de 50 kg e desvio padrão de 5 kg. Qual a porcentagem de alunos dessa
escola com peso:
a) Abaixo de 45 kg;
b) Acima de 60 kg;
c) Entre 48 kg e 58 kg.

EXERCÍCIOS:

1) Suponhamos que a renda média de uma grande comunidade possa ser


razoavelmente aproximada por uma distribuição normal com média de R$
1.500,00 e desvio padrão de R$ 300,00. Nessa situação:
a) Qual a porcentagem da população que tem renda superior a R$ 1.860,00?

b) Qual a porcentagem da população que tem renda inferior a R$ 1.000,00?


c) Qual a porcentagem da população que tem renda entre R$ 1.050,00 e
R$1.780,00?
d) Numa amostra de 500 assalariados, quantos podemos esperar que tenham
menos de R$ 1.050,00 de renda?

2) Analisando os resultados das avaliações dos 2.000 alunos de certa escola,


verificou-se a distribuição das notas tem uma distribuição aproximadamente
normal com média igual a 6 e desvio padrão igual a 1. Quantos alunos
podemos esperar que tenham tirado nota:
a) Inferior a 5; b) Superior a 7,5; c) Entre 6,5 e 8,5.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 44
3) Por intermédio de documentação e observação cuidadosas, constatou-se que
o tempo médio para se fazer um teste padrão de estatística é
aproximadamente normal com média de 80 minutos e desvio padrão de 20
minutos. Com base nesses dados, responda:
a) Que percentual de candidatos leva menos de 80 minutos para fazer o
teste?
b) Que percentual de candidatos não termina o teste se o tempo máximo
concedido for de duas horas?
c) Se 100 pessoas fazem o teste, quantas podemos esperar que terminem o
teste na primeira hora?

4) Em um exame de estatística, a média foi igual a 78 e o desvio padrão foi


igual a 10. Nesse caso:
a) Determine os escores padronizados ou a variável normal padronizada de
dois estudantes cujas notas foram 93 e 52;
b) Determinar as notas cujos escores reduzidos foram -0,6 e 1,2.

5) O processo de empacotamento em uma companhia de cereais foi ajustado de


maneira que uma média de µ = 13,00 kg de cereal é colocada em cada saco.
É claro que nem todos os sacos têm precisamente 13,00 kg devido a fontes
aleatórias de variabilidade. O desvio padrão do peso líquido é s = 0,1 kg e
sabemos que a distribuição dos pesos segue uma distribuição normal.
Determine a probabilidade de que um saco, escolhido aleatoriamente,
contenha entre 13,00 e 13,20 kg de cereal.

6) As alturas dos alunos de determinada escola tem uma distribuição normal


com média de 170 centímetros e desvio padrão de 10 centímetros. Qual a
porcentagem de alunos dessa escola com altura entre 150 centímetros e 190
centímetros?

7) Em um vestibular, verificou-se que os resultados tiveram uma distribuição


normal com média igual a 6,5 e desvio padrão igual a 1,0. Qual a
porcentagem de candidatos que teve média entre 4,0 e 5,0?

GABARITO: 1) a) 11,51%; b) 4,75%; c) 75,7%; d) 33 pessoas


2) a) 317 alunos; b) 134 alunos; c) 605 alunos
3) a) 50%; b) 2,28%; c) 16 pessoas
4) a) + 1,5 e – 2,6; b) 72 e 90
5) 47,72% 6) 95,44% 7) 6,06%

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 45
INTERVALO DE CONFIANÇA

INTERVALO DE CONFIANÇA PARA MÉDIA DE AMOSTRAS


GRANDES

Aqui inicia-se o estudo da Estatística Indutiva onde vamos conhecer


populações por meio das informações amostrais.
Calculando a média aritmética de uma amostra de tamanho n, indicada por 
(xis barra), conseguimos determinar um intervalo onde se encontra a média de uma
população de tamanho N, simbolizada por µ (letra grega mu “minúsculo” – lê-se: mi).

Intervalo de Confiança para a média: é um intervalo de valores obtido a partir


de observações de uma amostra e determinado de tal maneira que haja uma alta
probabilidade desse intervalo conter o valor desconhecido da média populacional que
se deseja determinar, ou seja, é o intervalo que possui alta probabilidade de conter o
valor da média populacional desejado .

Nível de Confiança: é a probabilidade (geralmente 95%) de um intervalo de


confiança conter o parâmetro populacional, ou seja, é um número que exprime o grau de
confiança (ou porcentagem) associado a um intervalo de confiança. É comum
determinarmos intervalos de confiança com 95% de probabilidade de conter o valor do
parâmetro (média), mas também são muito utilizados os valores 90%, 98% e 99%. Ou
seja, nível de confiança c é a probabilidade de que o intervalo estimado contenha o
parâmetro populacional (média).
Se n ≥ 30, a distribuição amostral das médias é uma distribuição normal
(podemos usar a tabela de distribuição normal). O nível de confiança c é a área sob a
curva normal reduzida, entre os valores críticos –Zc e Zc.

Cálculo do Intervalo de Confiança para a Média (Amostras Grandes):


Considerando um nível de confiança c, a margem de erro E é a maior distância possível
entre a estimativa pontual (média amostral) e o valor do parâmetro a ser estimado
(média populacional). A fórmula usada para o cálculo desse erro é:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 46
Quando n ≥ 30, o desvio padrão amostral s pode ser usado em lugar de  .

Um intervalo de confiança c para a média populacional µ é:

A probabilidade de que o intervalo de confiança contenha µ é c.

Normalmente,  está no meio do intervalo de confiança. Assim, podemos dizer


que o verdadeiro valor de µ está próximo ao valor de  . Só não sabemos o quanto está
próximo.

Exemplo 1: Uma amostra aleatória de 36 elementos retirados de uma população


aproximadamente normal forneceu média de X = 15,50 e desvio padrão de 1,50.
Construir um intervalo de 95% de confiança para a média dessa população.

c = 95%
n = 36
x = 15,5
DP = 1,5

1) 95% ÷ 2 = 47,5% ÷ 100 = 0,475 procurar no meio da tabela Z = 1,96

2) E = 1,96 . 1,5/6 = 0,49


3) I.C.

15,5 – 0,49 < u < 15,5 + 0,49


15,01 < u < 15,99

Logo, com 95% de confiança, a média populacional está entre 15,01 e 15,99

Tamanho da Amostra: Para encontrarmos os intervalos de confiança para as


médias populacionais, supomos um nível de confiança c. Esse nível de confiança deve
ser fixado conforme a probabilidade de acerto que desejamos ter na estimação por
intervalo.
Para aumentar a precisão, sem diminuir o nível de confiança, devemos ampliar o
tamanho da amostra.
Para um nível de confiança c e um erro máximo E, o tamanho mínimo da
amostra necessária para estimar a média populacional é:

Exemplo 2: Com os dados do exemplo 1, determinar o tamanho requerido de


uma amostra para assegurar que, com confiança de 90% a média amostral esteja dentro
do intervalo de 0,25 da média populacional.
C = 90% ÷ 2 = 45 ÷ 100 = 0,45 = Z = 1,65
E = 0,25 n = (1,65 . 1,5 / 0,25)²
n = 98,01= 99

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 47
Exemplo 3: Para as tabelas amostrais abaixo, determine um intervalo de
confiança de 95% para a média populacional µ.

a) x = 270 /55 = 4,91 b) x = 314 /56 = 5,61

Z = 95% ÷2 =0,475 = 1,96 Z = 1,96

E = 1,96 . 2,2 /raiz 55 =0,58 E = 1,96 . 2,1 / raiz 56 = 0,55

4,91 – 0,58 < u < 4,91 + 0,58 5,61 – 0,55< u < 5,61 + 0,55

I. C. 4,33 < u < 5,49 IC 5,06 < u < 6,16

INTERVALO DE CONFIANÇA PARA MÉDIA DE AMOSTRAS


PEQUENAS

Para amostras de tamanho menor que 30 (n < 30) e com desvio padrão
populacional desconhecido (ocorre muito em amostras pequenas), a distribuição normal
não é adequada, devemos usar então a distribuição t de Student.

Distribuição t de Student: é parecida com a normal. A principal diferença entre


as duas distribuições é que a distribuição t tem maior área nas caudas. Isto significa que,
para um dado nível de confiança o valor t será um pouco maior que o correspondente
valor z, ou seja, o intervalo de erro é maior.

Para encontrarmos um intervalo de confiança para a média populacional de


amostras pequenas, devemos encontrar primeiramente o erro máximo, que é calculado
pela fórmula:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 48
O valor de tc é encontrado na tabela da distribuição t, onde devemos fazer o
tamanho da amostra menos um (n – 1), para a sua localização. Esse valor é chamado de
grau de liberdade (g.l.).
A tabela de distribuição t, é um pouco diferente das tabelas normais. As áreas
(ou porcentagens ou probabilidades) aparecem no topo e não no corpo da tabela; os
valores de t são dados no corpo da tabela; e os graus de liberdade (g.l.) estão
relacionados ao lado da tabela.
O valor tc na tabela para uma amostra de 10 elementos, com nível de confiança
95%, é igual a 2,262 (10ª linha e 7ª coluna), pois devemos subtrair uma unidade da
amostra 10 (g.l.), na utilização da tabela de Student.

Exemplo 1: Uma amostra de 15 elementos retirados de uma população forneceu


média X = 5,40 e desvio padrão S = 0,80. Construir um intervalo de 90% de confiança
para a média dessa população.

Exemplo 2: Construa um intervalo de 95% de confiança para a média de uma


população, da qual obteve-se a seguinte amostra: 9; 8; 12; 7; 9; 6; 11; 6; 10; 9, com S =
2.

TESTE DE HIPÓTESE

O teste de hipótese é uma técnica que nos permite aceitar ou rejeitar a hipótese
estatística, a partir dos dados da amostra dessa população. Logo, usaremos uma amostra
da população em estudo para verificarmos se ela confirma ou não o valor do parâmetro
informado.
Hipótese Nula: É a hipótese a ser testada. Usamos a notação H0 para indicar a
hipótese nula.
Hipótese Alternativa: É a hipótese a ser considerada como uma alternativa à
hipótese nula.
Usamos a notação Ha para indicar a hipótese alternativa.

A hipótese nula é uma igualdade enquanto que a hipótese alternativa é uma


desigualdade. Dessa forma, podem existir 3 possibilidades para a hipótese alternativa.
Sendo, µ0 uma média pré determinada que será testada (é um valor que será dado no
exercício) e µ a média da população, temos as possibilidades abaixo:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 49
Para teste bilateral usa-se ± Z, para teste unilateral à esquerda usa-se – Z e para
teste unilateral à direita, usa-se + Z. Para amostras pequenas (n < 30), usamos a
distribuição t.
Erros Tipo 1 e Tipo 2: ao fazer um teste de hipótese, corre-se o risco de
rejeitar uma hipótese que era verdadeira ou aceitá-la quando era falsa. Temos, portanto,
dois tipos possíveis de erro:

Um erro do tipo 1 é, mais importante que um erro do tipo 2. Por exemplo,


suponhamos a decisão de aprovar ou reprovar um aluno na prova final.

Ou seja, o objetivo principal é não cometer o erro tipo 1, o qual só é possível de


ocorrer, quando se rejeita H0.

Nível de Significância: é a probabilidade de se cometer um erro do tipo 1.


Dizemos, por exemplo, que nosso teste de hipótese está planejado ao nível de
significância igual a 5% ou 1% que são os níveis mais utilizados. Vamos chamá-lo de
α (no caso, α = 5%). Ou seja, existe uma chance de 5% de cometermos o erro tipo 1.
Tamanho da Amostra: para n ≥ 30, utiliza-se a tabela de distribuição normal e
para n < 30 e desvio padrão populacional desconhecido (é o que geralmente ocorre em
estatísticas com amostras pequenas), utiliza-se a tabela de distribuição t de Student.
De uma forma resumida a estratégia é a seguinte, escolhemos uma amostra
aleatória da população e fazemos uma comparação com a hipótese nula, se os dados da
amostra forem consistentes com esta, não rejeitamos a hipótese nula, caso não sejam
consistentes rejeitamos a hipótese nula e assumimos que a hipótese alternativa é
verdadeira.
Exemplo 1: Segundo uma empresa fabricante de baterias para oxímetro de pulso
(dispositivo médico que mede indiretamente a quantidade de oxigênio no sangue de um
paciente), as suas baterias duram em média 93 minutos, com desvio padrão de 5
minutos. Recentemente, estagiários da área de qualidade, testaram 81 baterias e
obtiveram um valor médio de 92 minutos. Teste a hipótese de que a média populacional
seja menor que 93 minutos, considerando um nível de significância de 10%.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 50
Exemplo 2: Segundo uma pesquisa feita pelo CFF (Conselho Federal de
Farmácia), a média salarial dos farmacêuticos que trabalhavam em drogarias da região
metropolitana de Porto Alegre, no ano de 2010, foi de R$ 1.123,00. Neste mesmo ano,
alunos do curso de farmácia de uma universidade, coletaram uma amostra aleatória dos
salários pagos por 15 farmácias, durante o ano de 2010 e calcularam uma média de R$
1.344,27 com desvio padrão de R$ 231,00. Teste a hipótese de que a média salarial dos
farmacêuticos foi maior que R$ 1.123,00, considerando um nível de significância de
5%.
Exemplo 3: Uma empresa fabrica sabonetes de massa 90 gramas, com desvio
padrão de 2,7 gramas. Para verificar se a máquina que os produz está calibrada
corretamente, uma amostra aleatória composta por 50 sabonetes foi retirada ao longo de
um dia. As massas dos sabonetes (em gramas) da amostra estão na tabela a seguir:

Os dados da amostra permitem concluir que a máquina que produz os sabonetes


está descalibrada? Use α = 5%.

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO

Correlação em estatística se refere à medida da relação entre variáveis, onde a


análise dessa correlação verifica como duas ou mais variáveis estão relacionadas uma
com a outra numa dada população.

Correlação Linear: é um indicador da força (forte ou fraca) de uma relação


linear entre duas variáveis, representadas num plano cartesiano, por pares ordenados
(x,y), onde os pontos formados pelas coordenadas x e y, se apresentam, geralmente, de
forma elíptica, sendo que quanto mais fina a elipse, mais linear é a correlação, ou seja,
mais ela se aproxima de uma reta.
Se for exatamente uma reta, dizemos que a correlação é linear perfeita.

Diagrama de Dispersão: O gráfico de pares ordenados (x,y) é chamado de


diagrama de dispersão ou mapa de dispersão. Um diagrama de dispersão é usado para

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 51
determinar se existe uma correlação linear (uma reta) entre duas variáveis. Em um mapa
de dispersão, os pares ordenados (x,y) representam pontos em um plano coordenado. A
variável independente x é medida sobre o eixo horizontal, enquanto a variável
dependente y é medida sobre o eixo vertical.
Os mapas de dispersão a seguir mostram alguns tipos de correlação.

Na correlação linear positiva, as variáveis em estudo alteram-se no mesmo


sentido (se uma variável aumenta, a outra variável também aumenta, ou se uma
variável diminui, a outra também diminui). Na correlação negativa, as variáveis em
estudo alteram-se em sentidos opostos (se uma variável aumenta, a outra variável
diminui).

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 52
O procedimento para determinar a correlação curvilínea, não faz parte do plano
de ensino desta disciplina, assim voltemos nossa atenção para os exercícios de
correlação linear a seguir:
Exemplo 1: Um administrador de marketing conduz um estudo para determinar
se existe uma relação linear entre o dinheiro gasto em propaganda e as vendas de uma
companhia. Os dados estão dispostos na tabela abaixo. Posicione os dados em um
diagrama de dispersão e determine se existe uma correlação linear negativa ou positiva
ou se não existe uma correlação linear.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 53
Coeficiente de Correlação de Pearson: A interpretação da existência de uma
correlação usando o diagrama de dispersão pode ser subjetiva. Uma maneira mais
precisa de medir o tipo e o grau de uma correlação linear entre duas variáveis é por
meio do cálculo do coeficiente de correlação de Pearson.
O coeficiente de correlação de Pearson é um instrumento empregado para a
medida da correlação linear. Esse coeficiente indica o grau de intensidade da correlação
(forte ou fraco) entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou
negativo). O símbolo r representa o coeficiente de correlação amostral. A fórmula para r
n  x. y   x  y 
é:
r
 
n  x 2   x  . n  y 2   y 
2

2

onde n é o número de observações (dados).

O coeficiente de correlação populacional é representado por  (deve-se


pronunciar rô).
O intervalo de variação do coeficiente de correlação vai de –1 a 1. Ou expresso
em porcentagens, entre – 100% e + 100%. Se x e y tiverem forte correlação linear
positiva, r estará próximo de 1. Se x e y tiverem forte correlação linear negativa, r
estará próximo de –1. Se não existir correlação linear ou ainda se a correlação for fraca,
r estará próximo de zero. Podemos proceder à seguinte classificação:
→ r =]-0,75; –1,00]: Correlação negativa perfeita.
→ r = ]-0,50, –0,75]: Correlação negativa forte.
→ r = ]-0,25; –0,50]: Correlação negativa média.
→ r = ]0,00; –0,25]: Correlação negativa fraca.
→ r = ]0,25; 0,00]: Correlação linear inexistente.
→ r = ]0,00; 0,25]: Correlação positiva fraca.
→ r = ]0,25; 0,50]: Correlação positiva média.
→ r = ]0,50; 0,75]: Correlação positiva forte.
→ r = ]0,75; 1,00]: Correlação positiva perfeita.

Exemplo 2: Calcule o coeficiente de correlação de Pearson, para os gastos com


propaganda e vendas da companhia, dados no Exemplo 1. O que você pode concluir?

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 54
REGRESSÃO

Regressão em estatística se refere a uma técnica para se obter uma equação que
descreve o relacionamento matemático para duas variáveis. A regressão e a correlação
são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação.
Regressão Linear: é uma tentativa de estabelecer uma equação matemática
linear (linha reta) que descreve o relacionamento entre duas variáveis.
Há diversas maneiras em que as equações de regressão são utilizadas. Uma é em
situações em que as duas variáveis medem aproximadamente a mesma coisa, mas uma
delas é relativamente trabalhosa, enquanto que a outra não. Por exemplo, a resistência e
a dureza de um metal podem estar relacionadas, de modo que conhecendo a dureza
podemos estimar a resistência. Se o teste de resistência destrói o metal, enquanto que o
teste de dureza não o destrói, uma pessoa interessada em estimar a resistência,
obviamente preferirá confiar nos resultados do teste de dureza para estimar a resistência.
A finalidade de uma equação de regressão seria então estimar valores de uma variável,
com base em valores conhecidos da outra.
Cálculo de Regressão Linear: Após ter verificado que a correlação entre duas
variáveis é significante, o próximo passo é determinar a equação da reta que melhor
modela os dados. Essa reta é chamada de regressão e sua equação pode ser usada para
prever o valor de y para um dado valor de x. Embora muitas retas possam ser traçadas
ao longo de um conjunto de pontos, uma reta de regressão é determinada por critérios
específicos. A equação de uma reta de regressão para uma variável independente x e
uma variável dependente y é:
y = ax + b
Onde a e b são chamados de parâmetros. O parâmetro a é chamado de
coeficiente angular, ou taxa de variação, ou inclinação da reta e o parâmetro b é
chamado de coeficiente linear ou intercepto y da reta.
Calculamos os valores dos parâmetros a e b com ajuda das fórmulas:

Para calcular os valores dos parâmetros a e b utilizamos as fórmulas:

n  x.y   x.  y b  y  ax
a
n  x 2   x 
2 É preciso calcular a
média da coluna x e y.

onde :
A tabela já fornece os x  média dos valores de x
dados y  média dos valores de y

Onde n é o número de observações (dados), y é a média dos valores de y e x é a


média dos valores de x. A reta de regressão sempre passa pelo ponto ( x; y) .

Exemplo 1: Obtenha a equação da reta de regressão para os gastos com


propaganda e as vendas de uma companhia, conforme tabela abaixo:

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 55
EXERCÍCIOS:

1) Nas tabelas abaixo verifique a correlação entre as variáveis x e y construindo o


diagrama de dispersão.

a) X 2 3 4 5 6 b) X 5 10 14 15 19

Y 5 6,5 7 7,9 8,9 Y 5 12 15 17 20

c) d)

X 4 6 8 10 12 X 1 5 10 15 20 25 30

Y 10 3 12 5 7 Y 20 17 14 11 8 5 2

2) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de
aço varia conforme a temperatura, encontre o coeficiente de correlação:

Temperatura °C 10 15 20 25 30

Comprimento (mm) 1003 1005 1010 1011 1014

Resp. 0,98

3) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da


escola A:

X 11 14 19 19 22 28 30 31 34 37

Y 13 14 18 15 22 17 24 22 24 25

a) Verifique, pelo diagrama, se existe correlação.

b) Em caso afirmativo, calcule o coeficiente de correlação. Resp: 0,89

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 56
4) Para o exercício (2) calcule:

a) o valor estimado do comprimento da barra para a temperatura de 18°C.


Resp. 1007,5 mm

b) o valor estimado do comprimento da barra para a temperatura de 35°C.


Resp. 1017 mm

5) O lucro mensal de certa empresa varia com o investimento em propaganda. A função


que representa essa relação é

Lucro = 6,2 . Investimento + 170, ou seja, y = 6,2.x+170. Calcule:

a) o lucro obtido para um investimento de R$ 100,00. Resp: R$ 790,00


b) se a meta da empresa é lucrar R$ 2.000,00 no mês, quanto deverá investir?
Resp: R$ 295,16

6) A partir da tabela:

X 1 2 3 4 5 6

Y 70 50 40 30 20 10

a) calcule o coeficiente de correlação, Resp: -0,99

b) determine a reta ajustada. Resp: Y = -11,4.X+76,6

c) estime o valor de Y para X = 0. Resp: 76,6

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 57
TABELA NORMAL REDUZIDA

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 58
TABELA ESTATÍSTICA DE DISTRIBUIÇÃO t DE STUDENT

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 59
REFERÊNCIAS:

- Apostila Bioestatística Prof. Richard

- COSTA NETO, Pedro Luiz de Oliveira. Estatística.

- SIMON, Gary A.; FREUD, John E. Estatística Aplicada – Economia


Administração e Contabilidade.

Estatística – Profª Ma Adriana C. Schmidt – e-mail: adrischmidt@[Link]


Página 60

Você também pode gostar