0% acharam este documento útil (0 voto)
21 visualizações68 páginas

Apostila

O documento aborda conceitos fundamentais de probabilidade e estatística, incluindo estatística descritiva, inferencial e probabilística. Ele apresenta métodos de organização e apresentação de dados, como tabelas e gráficos, além de definir variáveis e amostragem. A obra é uma coletânea organizada pelo Centro Superior de Tecnologia Tecbrasil e contém diretrizes para a aplicação de estatísticas em diversas situações.

Enviado por

alexandrapro79
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
21 visualizações68 páginas

Apostila

O documento aborda conceitos fundamentais de probabilidade e estatística, incluindo estatística descritiva, inferencial e probabilística. Ele apresenta métodos de organização e apresentação de dados, como tabelas e gráficos, além de definir variáveis e amostragem. A obra é uma coletânea organizada pelo Centro Superior de Tecnologia Tecbrasil e contém diretrizes para a aplicação de estatísticas em diversas situações.

Enviado por

alexandrapro79
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

PROBABILIDADE E ESTATÍSTICA

Jeronimo Flores
SUMÁRIO
Esta é uma obra coletiva organizada por iniciativa e direção do CENTRO SU-
INTRODUÇÃO À ESTATÍSTICA 3 PERIOR DE TECNOLOGIA TECBRASIL LTDA – Faculdades Ftec que, na for-

NOÇÕES INTRODUTÓRIAS 4 ma do art. 5º, VIII, h, da Lei nº 9.610/98, a publica sob sua marca e detém os
direitos de exploração comercial e todos os demais previstos em contrato. É
MÉTODOS TABULARES E MÉTODOS GRÁFICOS 7
proibida a reprodução parcial ou integral sem autorização expressa e escrita.
DISTRIBUIÇÃO DE FREQUÊNCIA  11
SÍNTESE14
CENTRO UNIVERSITÁRIO UNIFTEC
MEDIDAS ESTATÍSTICAS 17
Rua Gustavo Ramos Sehbe n.º 107. Caxias do Sul/ RS
MEDIDAS DE TENDÊNCIA CENTRAL  18
MEDIDAS ESTATÍSTICAS COM PLANILHAS ELETRÔNICAS  29
REITOR
SÍNTESE30
Claudino José Meneguzzi Júnior
PROBABILIDADES32
PRÓ-REITORA ACADÊMICA
CONCEITOS INTRODUTÓRIOS  33
Débora Frizzo
PROBABILIDADE DE UM EVENTO 35 PRÓ-REITOR ADMINISTRATIVO

DISTRIBUIÇÕES DE PROBABILIDADE  37 Altair Ruzzarin

INTERVALO DE CONFIANÇA  41 DIRETOR DE ENSINO A DISTÂNCIA (EAD)


Rafael Giovanella
SÍNTESE44
ESTATÍSTICA AVANÇADA 47
REGRESSÃO LINEAR SIMPLES 48 Desenvolvido pela equipe de Criações para o Ensino a Distância (CREAD)
Coordenadora e Designer Instrucional
A EQUAÇÃO DA RETA  49
Sabrina Maciel
VALOR ESPERADO 51
Diagramação, Ilustração e Alteração de Imagem
ENCONTRANDO A RETA NA PLANILHA ELETRÔNICA  51 Igor Zattera, Thaís Munhoz
CORRELAÇÃO  52 Revisora

ANÁLISE DE VARIÂNCIA  55 Simone Marin

SÍNTESE60
GABARITOS63
INTRODUÇÃO À
ESTATÍSTICA
A estatística é um ramo da Matemática que se propõe a coletar,
organizar, sistematizar, descrever, analisar e interpretar dados para o
auxílio no processo de tomada de decisão.

3
SUMÁRIO

Iniciamos nosso estudo discorrendo acerca do uso da estatística desde tempos atrás. • Variável: uma característica que pode assumir distintos valores, de acordo com os su-

Não sendo um conteúdo atual, ela vem sendo utilizada há séculos. Na Bíblia Sagrada já exis- jeitos e o contexto (CORREA, 2003), como o crescimento de uma planta, a distância que

tiam relatos de contagem de pessoas com finalidades militares e para cobrança de impostos. o vendedor percorre com o carro da empresa, o desgaste de uma peça etc.

A estatística é um ramo da Matemática que se propõe a coletar, organizar, sistemati-


Exemplo: o gerente de um setor de uma determinada empresa está pesquisando al-
zar, descrever, analisar e interpretar dados para o auxílio no processo de tomada de decisão.
guns aspectos socioeconômicos dos colabores da seção. Com informações obtidas no depar-

tamento pessoal ele elaborou a seguinte tabela:


Você se considera uma pessoa azarada? A fila em que você está no supermercado sem-

pre anda mais devagar? Ou sempre chove quando você esquece o guarda-chuva? A maior
Variável Representação
parte dos fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem ser calculados,

medidos e até mesmo previstos por meio de procedimentos estatísticos. Estado Civil x

Escolaridade y
Podemos dividir a estatística em três grandes áreas: a estatística descritiva, a esta-
Número de filhos z
tística inferencial e a estatística probabilística. Na estatística descritiva os procedimentos

se resumem a descrever os dados, o que exige organização síntese e apresentação. Na esta- Salário w

tística inferencial, procuramos generalizar um fenômeno a partir do estudo com uma fração Idade v
ou pedaço dele. Já a estatística probabilística mede as tendências de um fenômeno aconte-
Sexo u
cer, partindo de observações preliminares (CORREA, 2003).
Cidade natal k

NOÇÕES INTRODUTÓRIAS
Perceba que algumas variáveis, como sexo, escolaridade e estado civil, por exemplo,

Para o nosso sucesso, nesta disciplina, precisamos ter em mente alguns conceitos que tratam de atributos ou qualidades dos pesquisados, essas são as variáveis qualitativas. Ou-

irão nos acompanhar no decorrer da maioria dos conteúdos. Procure estar inteirado deles tras, como salário, idade e número de filhos trazem como possível resposta números passí-

para minimizar as dificuldades futuras. veis de contagem e quantificação, são as variáveis quantitativas.

PROBABILIDADE E ESTATÍSTICA 4
SUMÁRIO

As variáveis quantitativas podem ser classificadas como: Exemplo:

• Variáveis quantitativas contínuas: representam números reais, passíveis de mensura- Na empresa em que você trabalha, existem 30 funcionários que tem Ensino Funda-

ção, tais como a altura e a massa do funcionário. Podem trazer infinitos resultados du- mental, 27 que tem Ensino Médio e 12 com Ensino Superior. Você irá fazer uma pesquisa

rante a realização de uma pesquisa, como a medida do desgaste de uma engrenagem de com 10% de cada estrato em relação à satisfação profissional. É preciso fazer uma tabela

uma máquina. Perceba que a medida do desgaste pode ser milimétrica, ou seja, assumir indicando população e amostra.

infinitos valores, conforme a temperatura, pressão, condições de uso etc. Assim, não

conseguimos estabelecer um limite claro. Número da


População Amostra
amostra

Ensino
• Variáveis quantitativas discretas: possuem um número finito e enumerável de resul- 30 3 3
Fundamental
tados, passíveis de contagem, como o número de filhos. Temos outro exemplo: o setor
Ensino Médio 27 2,7 3
de produção da empresa “ABC” tem 4 motores elétricos em funcionamento. A possibi-

lidade de falha de motores é um dado discreto, pois só podem falhar 1,2,3 ou 4 motores,
Ensino Superior 12 1,2 1
logo, existe um limite claro.

Total 69 6,9 7
• População: é o conjunto formado por elementos que tenham pelo menos uma variável

comum (MORETTIN, 2010).

Perceba que não podemos entrevistar 2,7 ou 1,2 pessoas. Assim, devemos “arredon-

• Amostra: após a população ser definida, um subconjunto ou “recorte” dessa será a dar” a amostra encontrando o “número da amostra”, que indica o número efetivo que ire-

amostra. mos entrevistar. Quando a dezena for maior que 5, arredonda-se para cima, quando a dezena

for menor que 5, arredonda-se para baixo. Quando for exatamente 5, o Instituto Brasileiro

Utiliza-se n para indicar o número que foi amostrado (MORETTIN, 2010). de Geografia e Estatística (IBGE) recomenda que arredonda-se sempre para cima.

PROBABILIDADE E ESTATÍSTICA 5
SUMÁRIO

• Amostragem: é o processo utilizado para a composição da amostra (MORETTIN, 2010).

• Dados brutos: são os dados na forma com que foram coletados, sem qualquer tratamento

matemático. (CORREA, 2003).

• Frequência: é o número de vezes que um fenômeno se repete (CORREA, 2003). O conceito de

frequência é muito estudado em estatística.

• Rol: é a organização dos dados brutos na forma crescente ou decrescente (CORREA, 2003).

• Parâmetro: é uma medida utilizada para descrever as características de uma população de

forma numérica. A média e a variância são exemplos de parâmetros (MORETTIN, 2010).

• Censo: é uma pesquisa em que a população é igual à amostra (CORREA, 2003). O IBGE se pro-

põe a fazer um censo da população brasileira, ou seja, entrevistar todos os habitantes do país.

Exemplo:

População: 300 pessoas

Você trabalha no restaurante de uma empresa onde almoçam 300 funcionários diariamen-
Amostra: 30 pessoas
te. O seu interesse é mudar o cardápio, mas não tem certeza se irão aprovar. Você não tem tempo

nem recursos para fazer um almoço para todos. Dessa forma, você sorteia 30 pessoas, faz um al-
Amostragem: sorteio
moço teste e pede para que eles atribuam uma nota de zero a dez ao cardápio. Para estimar uma

nota geral, faz-se uma média das notas. Assim, temos: Parâmetro: média

PROBABILIDADE E ESTATÍSTICA 6
SUMÁRIO

Dia Distância (Km)


Uma pesquisa científica deve ter os elementos citados Segunda-feira 80
anteriormente muito claros, de forma que o leitor consiga
Terça-feira 75
compreender os procedimentos adotados pelo pesquisador.
Quarta-feira 120

Quinta-feira 100

Sexta-feira 84
MÉTODOS TABULARES E MÉTODOS GRÁFICOS
Sábado 67

Métodos tabulares e métodos gráficos são estudados em um ramo da estatís-


Considerando unicamente os números 80, 75, 120, 100, 84 e 67, podemos dizer que temos os
tica chamado estatística descritiva. Tabelas, gráficos e histogramas são os recur-
dados brutos da distância percorrida. No momento em que eles forem organizados, seguindo um
sos utilizados com o objetivo de apresentar e descrever dados.
padrão matemático (67, 75, 80, 84, 100 e 120), temos um rol.

TABELAS
Outro conceito importante é o de amplitude total (h).

Tabelas podem ser muito úteis no processo de organização, sistematização e Amplitude, refere-se ao tamanho, ou seja, o maior valor menos o menor.
apresentação dos dados. A maior parte delas apresenta as variáveis e a sua frequ- Assim, podemos dizer que a amplitude total da distância percorrida pelo
ência. Uma tabela pode ser de entrada simples, quando conter apenas uma variável vendedor é dada por h= 120 -67h= 53km
ou de entrada dupla quanto conter mais de uma.

Interesse em realizar
Vale a pena lembrar que a estatística descritiva parte de um processo de con- Homens Mulheres Total
horas extras
tagem. Você conta algo para posteriormente seguir com os demais processos. Por Não 16 35 51

exemplo, verificou-se a distância que o vendedor da empresa onde você trabalha Sim 45 5 50

anda com o carro da empresa. Total 61 40 101

PROBABILIDADE E ESTATÍSTICA 7
SUMÁRIO

Quando o nosso processo de contagem exigir a consideração de mais de uma va-

riável significativa, podemos montar uma tabela de entrada dupla. Por exemplo, você

foi responsabilizado para verificar se os funcionários da empresa desejam realizar

horas extras. A sua experiência anterior indica que homens e mulheres tem opiniões

diferentes a respeito desses assunto. Então, a tabela é organizada com as variáveis

“homens” e “mulheres”.

GRÁFICOS

Gráficos além de fornecerem a organização dos dados são excelentes para apre-

sentações e palestras, pois produzem um efeito visual interessante e revelam o com-

portamento do fenômeno. Entretanto, são necessários alguns cuidados na sua elabo- Observe que o gráfico apresentado, apesar de representar o fenômeno, pode conter proble-

ração, dentre os quais destacamos: veracidade, clareza e simplicidade. Lembre-se que mas para uma apresentação. Veja que alguns vendedores não tem a sua venda indicada, levando

os gráficos podem ser apresentados para pessoas que não conhecem a sua pesquisa, o leitor a precisar supor o valor exato da venda. Além disso, seria necessário especificar o período

então eles precisam fornecer uma ideia do que aconteceu. para termos uma noção de como as vendas aconteceram.

GRÁFICO EM COLUNAS GRÁFICO EM COLUNAS

Exemplo: Assemelha-se ao gráfico em colunas, porém os retângulos são dispostos horizontalmente

(CORREA, 2003, p.25). A escolha do modelo depende exclusivamente do interesse e da preferên-

O gráfico a seguir indica as vendas dos vendedores da empresa Sul Metais Ltda. cia de quem fez o gráfico, pois são representações muito similares.

PROBABILIDADE E ESTATÍSTICA 8
SUMÁRIO

Exemplo:

Esse gráfico, apesar de produzir um bom efeito visual, apresenta algumas limitações. Por exem-

plo, observe a quantia de tons de azul e roxo utilizadas, o que pode confundir o leitor. Apesar de ter-

GRÁFICO EM SETORES mos uma legenda, ela não indica exatamente em que local está o mês inicial. Podendo causar uma certa

confusão. Logo, podemos dizer que esse gráfico falha no aspecto clareza. Sobretudo, no que se refere a

É o famoso gráfico em “pizza”. Consiste em repartir um círculo em vá- apresentações, devemos estar muito atentos ao modo que as pessoas irão entender o nosso gráfico.

rios setores ou fatias. Utilizamos principalmente quando queremos comparar

os valores encontrados com o total (CORRREA, 2005, p.25). Esse gráfico produz GRÁFICO EM LINHAS
um bom aspecto visual, sendo muito utilizado em apresentações.

Constitui uma aplicação do processo de representação das funções num sistema de coordena-

Exemplo: das cartesianas (CORREA, 2003, p.24). São bastante úteis quando almejamos visualizar a variação de

um fenômeno, por exemplo, as vendas da empresa, subiram, baixaram ou mantiveram-se constantes.

O gráfico que segue revela os gastos com papel em um escritório de uma Comparações entre dois fenômenos também são interessantes.

determinada empresa.

PROBABILIDADE E ESTATÍSTICA 9
SUMÁRIO

Exemplo: GRÁFICO DE DISPERSÃO

O gráfico a seguir indica as vendas de João Carlos durante os primeiros meses São representações em que as variáveis x e y são apresentadas em um plano cartesiano. Esse

do ano de 2016. tipo de gráfico é muito utilizado para a verificação da correlação de variáveis.

Exemplo:

Um biólogo estudou o crescimento de uma planta, chegando ao seguinte resultado:

Semana Altura (cm)

1 5

2 12

3 16

4 22

5 34

Perceba que com este tipo de gráfico é possível observarmos com clareza os

períodos de queda e de crescimento nas vendas do vendedor.

Existem outros tipos de gráficos que devem ser usados de acordo


com a necessidade do pesquisador, mas, sobretudo, com o uso
do bom senso.

PROBABILIDADE E ESTATÍSTICA 10
SUMÁRIO

DISTRIBUIÇÃO DE FREQUÊNCIA Podemos organizar esses dados considerando o número de funcionários que faltou e o

número de vezes que isto ocorreu (frequência absoluta).

Podemos entender a frequência como o número de vezes que um fenômeno se repete.


Número de funcionários que Número de meses
faltaram (frequência)
Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma va- 1 3
riável se encontram agrupados em classes, registrando-se o número de valores observados 2 1

em cada classe (KAZMIER, 1982, p.8). Ela pode ser feita sem agrupar dados ou com o uso de 4 2

dados agrupados. 5 1
6 3
7 3
DISTRIBUIÇÃO DE FREQUÊNCIA SEM AGRUPAR DADOS
8 3
9 4
A distribuição de frequência sem agrupar dados é feita observando-se o número de 10 4
acontecimentos em determinados intervalos de uma amostra. Total 52

Exemplo:
A tabela apresentada é uma denominada distribuição de frequência, sem agrupar dados.

O departamento pessoal da empresa PL Calçados efetuou um levantamento dos fun-


DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS AGRUPADOS
cionários que estiveram ausentes no decorrer de dois anos.

Uma distribuição de frequência com dados agrupados consiste em realizar agrupa-


Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
mentos, sendo muito utilizada quando temos muitas informações. No entanto, a constru-

Ano 1 6 7 1 6 9 2 7 9 1 8 10 9 ção desses grupos exige procedimentos matemáticos e o conhecimento de alguns conceitos:

Ano 2 8 8 5 1 7 4 10 9 4 10 6 10
• Classes (k): são os grupos que serão formados;

PROBABILIDADE E ESTATÍSTICA 11
SUMÁRIO

• Amplitude do intervalo de classe (h): é o tamanho da classe; Veremos como compor cada um desses elementos em uma pesquisa.

• Intervalo de classe: são os limites da classe. Temos o limite inferior e o superior; Exemplo:

• Ponto médio do intervalo de classe (xi): é o limite superior mais o limite inferior divi- O rol a seguir indica a quilometragem mensal que um vendedor fez com o veículo da

dido por dois; empresa em um determinado período. Faça a distribuição de frequência utilizando dados

agrupados por intervalos de classes.

• Frequência absoluta (fi): são os números de observações dos elementos de uma deter-
550 580 615 630 650
minada classe;
700 780 805 830 850

865 900 925 940 950


• Frequência relativa (fr): é a proporção que a frequência absoluta da classe ocupa em re-
955 970 980 1000 1100
lação ao total. Ela é obtida a partir da divisão da frequência absoluta pelo total;
1150 1230 1300 1350 1500

2000 2500 2800 2950 3000


• Frequência percentual (fp): indica o percentual que cada classe ocupa em relação ao

todo. É obtida a partir da multiplicação da frequência relativa por cem;


Passo 1: estimar o número de classe.

• Frequência acumulada (fa): é a soma da frequência absoluta da classe com a da classe


Utilizamos a fórmula de Sturges
anterior. É comumente utilizada quando queremos ter uma ideia de muitas classes con-
k=1+3,3logn
juntamente;

• Frequência acumulada percentual (fap): é a soma da frequência percentual da clas- Importante:

se com a da classe anterior. É comumente utilizada quando queremos ter uma ideia de Explore a sua calculadora! Em algumas basta digitar a fórmula, em outras, você
precisa calcular o log primeiro, multiplicar por 3,3 e, por último, somar um.
muitas classes conjuntamente.

PROBABILIDADE E ESTATÍSTICA 12
SUMÁRIO

Vamos considerar que a nossa amostra temha 30 elemen- Passo 3: montar a tabela com a frequência absoluta. Para isso, partimos do primeiro valor do rol (ver tabela 5),

tos, então n=30. ou seja, 550. Esse será o limite inferior da primeira classe. Para encontrarmos o limite superior somamos 550 com 409,

que é a amplitude do intervalo, resultando em 959. A segunda classe começará com 959, que será somado com 409. O
Logo,
processo segue até alcançarmos 6 classes, conforme a tabela que segue. Para encontrar a frequência absoluta, voltamos

para a tabela 5 e contamos quantos elementos pertencem a cada classe. Perceba que existem 16 eventos entre 550 e 959.
k=1+3,3logn

k=1+3,3log30 Distância Frequência absoluta (fi)

550 |–959 16
k=1+3,3.1,47
959 |– 1368 8
k=5,87, aproximadamente, 6 classes. 1368 |– 1777 1

1777 |– 2186 1

Passo 2: estimar a amplitude de cada classe. 2186 |– 2595 1

2595 |–3004 3

TOTAL 30

Passo 4: frequência relativa. Basta dividir cada um dos valores da frequência absoluta pelo total, ou seja, 30.

Distância fi fr

550 |–959 16 16/30 : 0,53

Importante: 959 |– 1368 8 8/30: 0,27


1368 |– 1777 1 1/30: 0,033
A amplitude de classe é o único caso que devemos
1777 |– 2186 1 1/30: 0,033
arredondar “para cima”, sempre, pois, caso contrário,
2186 |– 2595 1 1/30: 0,033
o último valor da tabela pode não se encaixar na
2595 |–3004 3 3/30: 0,1
distribuição de frequência. Assim, h = 409.
TOTAL 30 Aprox. 1

PROBABILIDADE E ESTATÍSTICA 13
SUMÁRIO

Passo 5: frequência percentual. Basta multiplicar a frequência relativa por 100. Classe 1: (550 + 959) /2 = 754,5

Classe 2: (959+1368) /2 = 1163,5


Distância fi fr fp
Classe 3: (1368+1777) /2 = 1572,5
550 |–959 16 16/30 : 0,53 53%
Classe 4: (1777+ 2186) /2 = 1981,5
959 |– 1368 8 8/30: 0,27 27%
Classe 5: (2186+2595) /2 = 2390,5
1368 |– 1777 1 1/30: 0,033 3,3%
Classe 6: (2595+3004)/ 2 = 2799,5
1777 |– 2186 1 1/30: 0,033 3,3%

2186 |– 2595 1 1/30: 0,033 3,3%


SÍNTESE

2595 |–3004 3 3/30: 0,1 10%


Neste capítulo, compreendemos que:
TOTAL 30 Aprox. 1 Aprox. 100%
• A estatística se divide em distintos campos de estudo;

Passo 6: frequência acumulada e frequência acumulada percentual.


• É necessário considerar as variáveis em um estudo;

Distância fi fr fp fa fap • Os tipos/características dos gráficos e suas necessidades de uso.


550 |–959 16 16/30 : 0,53 53% 16 53%

959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80%

1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3%

1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6%

2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9%

2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9%

TOTAL 30 Aprox. 1 Aprox. 100%

Passo 7: estimar o ponto médio. Em muitas situações é necessário sabermos o ponto

médio de cada classe. Assim:

PROBABILIDADE E ESTATÍSTICA 14
EXERCÍCIOS SUMÁRIO

1. Uma franquia de lojas instalou algumas representações em diversas regiões do Rio

Grande do Sul. Com o fim de conferir a satisfação dos clientes, resolveu entrevistar 7%

desses de cada região. Então, vamos completar a tabela a seguir, indicando a amostra

e o número da amostra. OBS: O número da amostra é a amostra, porém arredondada.

Região Clientes Amostra Número de amostra

Metropolitana 690

Serra 380

Campanha 160

Litoral 280

2. O número de produtos que os clientes trocam em uma loja foram registrados na tabela

que segue:

Casacos Camisetas Camisas Meias Sapatos Cintos

8 5 0 5 7 4

7 4 1 4 8 3

6 3 4 2 6 2

Vamos construir uma distribuição de frequência, sem agrupar dados.

PROBABILIDADE E ESTATÍSTICA 15
EXERCÍCIOS SUMÁRIO

3. Os funcionários da empresa 123 Testes Informática estavam reclamando do tempo de reuniões. Para 5. João Oliveira, o gerente da empresa onde você trabalha, recebeu um e-mail

verificar se a reclamação procedia, foi realizado um estudo, no qual se controlou o tempo das reuni- com o seguinte conteúdo:

ões em minutos, que foram organizados na tabela que segue:


Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, enquanto o Bruno rodou ape-
Segunda Terça Quarta Quinta nas 124 km e vendeu R$540,00. Só não entendi o Gilmar que rodou 1389 km e vendeu ape-
45 52 70 58
nas R$123,00. Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar por tele-
50 51 46 63
fone, conseguiu vender R$560,00. Acho que está na hora de tomarmos algumas decisões.
42 44 59 54
Att,
41 40 64 60
Vinicius Araújo

Construa uma tabela de distribuição de frequência com dados agrupados por classes. Considere
Construa uma tabela de entrada dupla com os dados envolvidos no e-mail
a frequência absoluta, frequência relativa, frequência percentual, frequência acumulada e frequência
recebido pelo gerente da situação anterior.
acumulada percentual.

4. Observe um estrato de uma tabela extraída do site do IBGE:

Empresas que não apresentaram ações de inovações organizacionais e marketing no Brasil


entre 2006 e 2008.

Segmento Número de empresas

Fabricação de produtos alimentícios 6.839

Fabricação de bebidas 551

Fabricação de produtos do fumo 42

Fabricação de produtos têxteis 2.206

Confecção de artigos do vestuário e acessórios 8 939

Construa um gráfico de setores, preferencialmente, utilizando planilhas eletrônicas.

PROBABILIDADE E ESTATÍSTICA 16
MEDIDAS
ESTATÍSTICAS
Medidas estatísticas são recursos matemáticos utilizados com a
finalidade de interpretar e compreender as características de um
determinado fenômeno.

17
SUMÁRIO

As medidas estatísticas dividem-se em medidas de tendência MÉDIA ARITMÉTICA


central e medidas de variabilidade. Ambas podem ser aplicadas com

dados não agrupados ou agrupados. Preste atenção nessa diferença. É um número que representa um fenômeno. Kazmier (1982, p. 29) define a média aritmética como “a soma

dos valores do grupo de dados divididos pelo número de valores”. Usamos a média aritmética em diversas situ-

Quando realizamos uma pesquisa quantitativa, o primeiro pas- ações do nosso cotidiano, quando queremos projetar uma situação intermediária. Por exemplo, se você faz duas

so é a coleta de dados. Para isso, precisamos definir a população, a provas valendo 10 pontos cada uma, e tira 6 na primeira e 8 na segunda, qual foi a sua média? Não foi 7? E como

amostra e a técnica de amostragem que será utilizada. De posse dos chegamos a esse resultado? Somamos 6 com 8 e dividimos por 2, não é verdade?

dados, eles precisam ser organizados e sistematizados, sendo grá-

ficos e tabelas os recursos mais comumente utilizados para isso. O

passo seguinte é interpretar e analisar as informações que temos. A

partir daí a pesquisa começa a se tornar relevante para o processo de

tomada de decisão. Assim, para que isso seja possível, é indispen-

sável o uso de medidas estatísticas que usam técnicas matemáticas

para a compreensão dos fenômenos.

MEDIDAS DE TENDÊNCIA CENTRAL

Como vimos anteriormente, os dados obtidos em uma pesqui-

sa podem ser apresentados em gráficos ou tabelas. Entretanto, um

fenômeno pode ser representado por meio de uma única quantia,

denominada medida de tendência central. As principais são a média,

a moda e a mediana. Ambas trazem uma ideia geral do comporta-

mento de um fenômeno.

PROBABILIDADE E ESTATÍSTICA 18
SUMÁRIO

PARA DADOS NÃO AGRUPADOS O estoque de uma loja tem os seus valores organizados por intervalo de classes, se-

gundo a tabela a seguir. Então, encontre a média aritmética:

A tabela abaixo indica o lucro da KouroteK calçados. Faça a média:


Média com dados agrupados
Média aritmética
Preço unitário (R$) Quantidade (fi) Ponto médio (xi) Total da classe (xifi)
Meses Venda (R$)
18,00 |– 20,00 120 19 19.120= 2280
Janeiro 22.000
20,00 |– 22,00 150 21 21.150= 3150
Fevereiro 18.000

Março 10.000 22,00 |– 24,00 180 23 23.180= 4140

Abril 26.000 24,00 |– 26,00 200 25 25.200= 5000


Maio 14.000
26,00 |– 28,00 190 27 27.190=5130
Junho 30.000
28,00 |– 30,00 160 29 29.160=4640
Total 120.000
n=6 1000 24340

Média: 120.000/6 = R$ 20.000,00


Perceba que estimamos o ponto médio (xi) e multiplicamos esse pela frequência abso-

Observe que basta somar os valores e dividir pelo número luta (fi). Os valores de cada classe devem ser somados e divididos pela soma da frequência

de eventos. absoluta. A fórmula que resume esse processo é:

PARA DADOS AGRUPADOS POR INTERVALO DE CLASSE


Média: ∑[Link]
∑fi
Quando nossos dados estão agrupados por intervalo de classe, devemos considerar

seus pontos médios e as suas frequências absolutas.


Média: 24.340 = R$ 24,34

1.000
Exemplo:

PROBABILIDADE E ESTATÍSTICA 19
SUMÁRIO

Observação: sempre que você estiver trabalhando com planilhas eletrônicas, não use Assim:

dados agrupados. As planilhas calculam medidas estatísticas sem agrupar dados.

Gerentes: 2 x 10.000 = R$ 20.000,00


MÉDIA PONDERADA
Engenheiros: 6 x 9.000 = R$ 54.000,00

A média ponderada é uma média aritmética utilizada quando cada elemento tem um Operários: 20 x 1.500 = R$ 30.000,00
peso distinto em relação ao total. Assim, esse recurso será utilizado quando ocorrer repre-
Estagiários: 16 x R$ 850,00 = R$ 13.600,00
sentatividade distinta dentro do grupo (KAZMIER, 1982).

Exemplo:
Desse modo, podemos concluir que o total que a empresa investe em salários é R$

Na empresa em que você trabalha, existe o seguinte quadro funcional: 117.600,00. Tal investimento deve ser repartido entre 44 funcionários, ou seja:

Média ponderada
Função Número Salário

Gerente 2 R$ 10.000,00

Engenheiros 6 R$ 9.000,00
OBS: A média aritmética é uma medida que sempre é atraída para
Operários 20 R$ 1.500,00
os “outliers”, que são os valores atípicos que se afastam em demasia
Estagiários 16 R$ 850,00
do padrão. Assim, olhar um fenômeno somente a partir da média
n=4 44 aritmética pode, de certa forma, “maquiá-lo”. Logo, recomenda-se que
ela seja utilizada, conjuntamente, com as outras medidas que veremos
A primeira coisa que devemos fazer é estimar o valor total do salário de cada um dos na sequência.
estratos.

PROBABILIDADE E ESTATÍSTICA 20
SUMÁRIO

MEDIANA Então fazemos a média aritmética dos dois termos centrais:

Podemos entender a mediana com o valor que está no centro ou no

meio de um intervalo de dados. Para localizá-la é importante que os dados


Para dados agrupados:
estejam no formato de um rol, um seja, organizados de maneira crescente

ou decrescente (KAZMIER, 1982).


A mediana para dados agrupados exige um pouco mais de trabalho manual, por isso precisamos estar

atentos para não perdermos nenhum valor. Devemos seguir a fórmula:


Para dados não agrupados:

Basta construir o rol e localizar o valor do meio.

Exemplos:

Não se assuste! Se você “traduzir” a fórmula corretamente e montar uma tabela para a
I. Um vendedor fez a seguinte quilometragem durante a semana, utili-
sua organização, não haverá problemas.
zando o carro da empresa: 150, 110, 200, 80, 130.

Iniciamos construindo um rol: 80, 110, 130, 150, 200.


Vamos traduzir a fórmula, ou seja, compreender o que cada letra ou abreviatura significa, para que
A mediana será 130, pois está exatamente no meio do rol.
possamos identificar os elementos em nossos exercícios.

II. Uma loja vendeu o seguinte número de peças durante a semana: 45, 80, li = limite inferior

45, 130, 175, 90. n/2= total da frequência absoluta dividido por 2

facant = frequência acumulada anterior


Rol: 45, 45, 80, 90, 130, 175.
fi = frequência absoluta da classe
Perceba que não temos um termo que divida o rol ao meio.
h = amplitude do intervalo de classe

PROBABILIDADE E ESTATÍSTICA 21
SUMÁRIO

Exemplo: o estoque de uma loja tem os seus valores organizados por intervalo de clas- Passo 1: determinar a classe em que está localizado o valor da mediana. Isso é feito di-

ses. De acordo com a tabela a seguir, encontre a mediana: vidindo o número da amostra por 2, e identificando, a partir da frequência acumulada, em

qual classe ele se encontra.


Mediana

Preço unitário (R$) Quantidade (fi) Fa

18,00 |– 20,00 120 120

Perceba que na classe destacada em vermelho, quando olhamos para a frequência acu-
20,00 |– 22,00 150 270
mulada, ela vai do 450 ao 650. Ou seja, o número 500 estará entre esses valores.
22,00 |– 24,00 180 450

24,00 |– 26,00 200 650 Passo 2: identificar os demais elementos da fórmula.

26,00 |– 28,00 190 840


li = 24. Perceba que na classe destacada em vermelho o limite inferior é 24.
28,00 |– 30,00 160 1000
fi = 200. Perceba na classe destacada em vermelho que a frequência absoluta é 200.
N 1000

facant = 450. Perceba na classe destacada em vermelho que a frequência acumulada da

classe anterior é 450.

h=2. Perceba que a amplitude de todos intervalos de classe é 2.


Observe: a mediana sempre depende da frequência acumulada. Caso
você não lembre como ela é feita, volte nessa apostila ou consulte o seu
Passo 3: Aplicar a fórmula.
professor.

PROBABILIDADE E ESTATÍSTICA 22
SUMÁRIO

Med: 24 + ((500-450)/200).2 Qual foi a moda?

Med: 24 +0, 25.2


A moda foi 8, pois é o número com maior frequência, ou seja, o número que aparece

mais vezes.
Med: 24,5

Para dados agrupados sem intervalo de classe:


MODA

Para fazer um plano preventivo de manutenção, foi realizada uma pesquisa em relação
Em nosso cotidiano, dizer que alguma coisa está na moda, normalmente se relaciona
ao número de peças que quebram em uma empresa em determinado período. Qual é a moda?
com aquilo que a maioria das pessoas estão usando, tem ou querem. Em estatística, o signifi-

cado é similar. Podemos entender a moda como o fenômeno que ocorre com maior frequência. Moda
Número de vezes que
Número de peças
aconteceu (fi)
Para dados não agrupados:
0 0
1 18
Basta observar o que mais se repete.
2 25
3 32
Exemplo: Carlos é um representante comercial de uma certa marca de colchões, e ob- 4 23
teve os seguintes resultados como vendas: 5 13

Março: 5 unidades Julho: 8 unidades

Basta olharmos para o valor, que temos a maior frequência absoluta, ou seja, Moda =
Abril: 6 unidades Agosto: 8 unidades
3. Com isso, concluímos que o mais comum de acontecer é a quebra de 3 peças no período

considerado.
Maio: 8 unidades Setembro: 9 unidades

Junho: 2 unidades Outubro: 8 unidades Para dados agrupados com intervalo de classe:

PROBABILIDADE E ESTATÍSTICA 23
SUMÁRIO

Utilizamos a seguinte fórmula: Exemplo: o estoque de uma loja tem os seus valores organizados por intervalo de clas-

ses, conforme a tabela abaixo. Encontre a moda:

Moda
Preço unitário (R$) Quantidade (fi)
18,00 |– 20,00 120
20,00 |– 22,00 150
Basta traduzir a fórmula e organizar os dados que não teremos
22,00 |– 24,00 180
problemas.
24,00 |– 26,00 200
26,00 |– 28,00 190
28,00 |– 30,00 160
Traduzindo a fórmula: N 1000

li = fronteira inferior da classe que contem a moda (classe modal). Passo 1: identificar a classe modal. A Classe 24 I- 26 é a classe modal, pois apresenta

maior frequência absoluta.

d1= diferença entre a frequência da classe modal e a frequência da classe anterior.

Passo 2: encontrar o d1 e d2.

d2 = diferença entre a frequência da classe modal e a frequência da classe posterior.


d1 : 200 -180 = 20

d2: 200-190 = 10
i = amplitude do intervalo de classe.

Passo 3: aplicar a fórmula.

Observe: a classe modal é aquela que apresenta a maior frequência


absoluta.

PROBABILIDADE E ESTATÍSTICA 24
SUMÁRIO

MEDIDAS DE VARIABILIDADE Lembre-se que dissemos anteriormente que a média pode maquiar o fenômeno.

Medidas de variabilidade medem a oscilação de um fenômeno, ou seja, quanto se dis- Média de Adriano: 30/5 = 6 eletrodomésticos.

persam quando comparadas à média. As principais medidas são a variância e o desvio padrão.

Média de Daiane: 30/5 = 6 eletrodomésticos.

VARIÂNCIA
Mesmo que ambos os vendedores tenham obtido a mesma média, não podemos dizer

A variância representa a dispersão de uma variável em relação à sua média. que são vendedores iguais, pois Adriano tende a ter oscilações nas suas vendas, enquanto

Daiane é mais constante. Para medir essas variações podemos utilizar a variância.

Para dados não agrupados

Vamos aos passos:


Exemplo: na loja “123 Eletrodomésticos” trabalham dois vendedores, Adriano e Daia-

ne, que tiverem os seguintes desempenhos de vendas: • Passo 1: determinar a média aritmética (µ) da sequência;

Adriano: • Passo 2: determinar as diferenças entre a média e cada elemento da sequência. (fi-µ);

Variância
• Passo 3: elevar ao quadrado e somar os valores encontrados no passo 2. ∑(fi-µ)²;
Segunda Terça Quarta Quinta Sexta

10 2 8 3 7 • Passo 4: dividir o resultado do passo 4 pelo número de eventos do conjunto.

Esses passos podem ser sintetizados com as fórmulas:


Daiane:

Variância a. Para população:


Segunda Terça Quarta Quinta Sexta

6 6 6 6 6

PROBABILIDADE E ESTATÍSTICA 25
SUMÁRIO

b. Para a amostra: Lembre-se que estamos trabalhando com todas as vendas

de Adriano, então devemos considerar a fórmula da população:

Observe: desenvolva todos os passos completando uma tabela. Quando O numerador da fórmula foi gerado a partir da tabela, e o
ela estiver completa troque os valores para a fórmula. denominador n é 5, pois o vendedor fez 5 vendas.

Exemplo: Adriano vendeu os seguintes eletrodomésticos durante a semana: 10, 2, 8, 3


Com dados agrupados por intervalos de classe:
e 7. Calcule a variância de suas vendas:

A variância com dados agrupados pode ser um pouco traba-


Calculando a média = (10+2+8+3+7)/ 5 = 30/5 = 6
lhosa. Você vai precisar organizar, muito bem, uma tabela com os

dados e seguir os passos abaixo:


Organizando a tabela:

Variância • Passo 1: determinar o ponto médio de cada intervalo de clas-


Adriano se (xi);
fi (fi-µ) (fi-µ)²

10 10 - 6 = 4 4 x 4 = 16 • Passo 2: elevar cada ponto médio ao quadrado (xi²);

2 2 – 6= - 4 (-4) x (-4) = 16
• Passo 3: multiplicar cada xi² pela frequência da classe fi cor-
8 8-6=2 2x2=4
respondente;
3 6 - 3 =- 3 (-3) x (-3) = 9

7 7-6=1 1x 1 = 1
• Passo 4: calcular a média aritmética considerando que os da-
∑= 46
dos estão agrupados.

PROBABILIDADE E ESTATÍSTICA 26
SUMÁRIO

Construímos uma tabela e aplicamos os dados em uma das fórmulas: A tabela precisa ser ajustada em acordo com os passos descritos anteriormente. Che-

gamos no seguinte resultado:


a. Para população:
Variância
Classe xi fi xifi xi² xi²fi

2 |− 14 8 13 104 64 832

b. Para a amostra: 14 |− 26 20 9 180 400 3600

26 |− 38 32 8 256 1024 8192

38 |− 50 44 23 1012 1936 44528

50 |− 62 56 15 840 3136 47040


Exemplo: o número de produtos vendidos por uma loja está representado por uma dis-
62 |− 74 68 10 680 4624 46240
tribuição de frequência conforme a tabela que segue. Calcule a variância:
74 |− 86 80 2 160 6400 12800

Variância ∑ 80 3232 163232

Produtos fi

2 |− 14 13 Vamos nos recordar que a média aritmética para dados agrupados é calculada por:

14 |− 26 9

26 |− 38 8

38 |− 50 23

50 |− 62 15 Assim, a média será Média: 3232/80 = 40, 4. Também vamos considerar que esta-
62 |− 74 10 mos trabalhando com todas as vendas da loja em um dado período, então será utilizada a

78 |− 86 2 fórmula da população:

PROBABILIDADE E ESTATÍSTICA 27
SUMÁRIO

COEFICIENTE DE VARIAÇÃO (V)

Para Kazmier (1982, p.52), “o coeficiente de variação V, indica a magnitude relativa do

desvio padrão quando comparado com a média da distribuição das medidas”.

V: Coeficiente de variação

σ: Desvio Padrão
DESVIO PADRÃO

µ: Média
A resolução do último exemplo, leva-nos a perceber que a variância é uma medida que

permanece elevada ao quadrado. Em situações práticas pode ser difícil imaginarmos essa
Exemplo: o preço médio diário das ações de uma empresa A durante um certo período
situação. Por isso, normalmente se utiliza o desvio padrão. Segundo Youssef, Soares e Fer-
do mês foi de R$150,00, com um desvio padrão de R$5,00. A empresa B teve o preço médio
nandes (2004, p.257) “o desvio padrão pode ser obtido diretamente da variância, extrain-
R$ 50,00 no mesmo período, com desvio padrão de R$3,00.
do-se a raiz quadrada do valor encontrado”. Ele informa a dispersão dos dados em relação

à média, porém parece nos dar suma dimensão mais exata.


Empresa A:

V= σ/µ V= 5/150= 0,033


Exemplo: pense nos dados do último exemplo. Considerando que a variância foi σ²=

408,24, o desvio padrão será DP: √408,24, ou seja, DP aprox. 20,20.


Empresa B:

Isso significa que o fenômeno está se afastando da média 20,20 unidades, seja para V= σ/µ v= 3/50= 0,060
mais, seja para menos.

PROBABILIDADE E ESTATÍSTICA 28
SUMÁRIO

Kazmier (1982), esclarece que em termos de comparação absoluta, a empresa A teve

uma maior variação, pois seu desvio padrão é maior. No entanto, quando pensamos em re-

lação ao preço, podemos perceber que o preço das ações da empresa B é quase duas vezes

mais variável quando comparado a empresa A.

MEDIDAS ESTATÍSTICAS COM PLANILHAS ELETRÔNICAS

Planilhas eletrônicas podem ser muito úteis para encontrarmos medidas estatísticas,

especialmente quando trabalhamos com uma quantia excessiva de dados. Também é impor-

tante ter a clareza de que as planilhas fazem diretamente cálculos com dados não agrupados.

Caso contrário, elas terão a finalidade de organizar e ajustar alguns cálculos, não realizando

o algoritmo. É muito importante que você entre em contato com esse tipo de software, visto

que ele pode ser muito relevante para o seu futuro profissional.

Após lançarmos os dados na planilha, observe que temos o link fx, o assistente de

função. Lá, encontramos muitas funções, dentre as quais, algumas destinadas às medidas

estatísticas. Veremos algumas delas:

Média: calcula a média aritmética. Após, escolhemos a função no assistente, abrimos

uma guia similar, a seguinte:

PROBABILIDADE E ESTATÍSTICA 29
SUMÁRIO

SÍNTESE

Neste capítulo, compreendemos que:

• Não basta haver acesso à informação. É necessário dar voz aos dados, e uma

das possibilidades é o uso de medidas estatísticas;

• As medidas estatísticas dividem-se em medidas de tendência central e me-

didas de variabilidade;

No espaço Núm1, devemos selecionar as células nas quais os nossos dados se encontram. Basta
• É indispensável o uso de medidas estatísticas que usam técnicas matemáti-
clicar no botão OK e teremos o resultado da média.
cas para a compreensão dos fenômenos;

Os comandos utilizados para as medidas a seguir seguem a mesma lógica utilizada na Média, ou • As medidas de tendência central (média, moda e mediana) trazem uma ideia
seja, o comando é acionado após a guia ser aberta, ainda, os dados são selecionados e, clicando em OK, geral do comportamento de um fenômeno.
teremos os resultados.

MED: calcula a mediana.

MODO: calcula a moda.

VAR. A: calcula a variância com base na amostra.

VAR. P: calcula a variância com base na população.

DESVPAD.A: calcula o desvio padrão com base na amostra.

DESVPAD.P: calcula o desvio padrão com base na população.

OBS: Também podemos calcular o desvio padrão tirando a raiz quadrada da variância.
Assim, se você já obteve a variância basta digitar = RAIZ (“valor obtido na variância”).

PROBABILIDADE E ESTATÍSTICA 30
EXERCÍCIOS SUMÁRIO

1. O automóvel da empresa rodou as seguintes quilometragens. Encontre a mediana: a. Qual é a média de salário?

Seg Ter Qua Qui Sex Sáb Seg Ter Qua Qui b. Para responder a questão “a”, você utilizou média aritmética ou ponde-

126 128 134 135 138 131 139 132 138 136 rada? Justifique sua resposta.

c. Qual a moda?
2. Na disciplina de estatística, o professor realizou 10 avaliações. Ana teve as seguintes notas: 2, 3, 3,

4, 5, 6, 7, 8, 9 e 10. Encontre a variância. 5. A seguinte tabela representa uma distribuição de dados agrupados por classes

relativas às vendas da Loja Doce Ilusão Ltda. Analise a tabela e responda:


3. A tabela abaixo traz o tamanho dos bebês em uma determinada maternidade. Encontre a mediana:
Preço do produto (R$) Produtos
Tamanho Frequência absoluta
18 I- 23 14
50 I- 54 4
54 I- 58 9 23 I- 28 10
58 I- 62 11
28 I- 33 16
62 I- 66 8
33 I- 38 4
66 I- 70 5
70 I- 74 3 38 I- 43 26

43 I- 48 8
4. A tabela a seguir traz os salários de alguns funcionários da empresa X. Analise e responda:

Salário Funcionário a. Encontre a Média.

750 18
b. Encontre a Moda.
800 27

950 10
c. Encontre a Variância.
1100 6

2500 2 d. Encontre o Desvio Padrão.

PROBABILIDADE E ESTATÍSTICA 31
PROBABILIDADES
O estudo de probabilidades iniciou com Girolamo Cardano, um
inveterado jogador que conseguia seu “suado” dinheiro em partidas de
xadrez e jogos de azar (STEWART, 2013).

32
SUMÁRIO

Espaço amostral (S): Youssef, Soares e Fernandes (2004, p. 229) definem o espaço amos-

Os fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem tral como “o conjunto dos resultados possíveis para aquele experimento”. O espaço amostral é

ser previstos a partir da probabilidade. a totalidade de resultados possíveis.

Exemplos:

Dessa forma, trabalhamos com chances ou probabilidades de que algo aconteça a


I. Lançamento de um dado honesto: S = {1,2,3,4,5,6}
partir da identificação dos padrões de repetições. Mesmo fenômenos humanos ou só-

ciais, tais como o número de suicídios e divórcios, por exemplo, quando considerados
II. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener: S = {G,K, M, B, D}
a longo prazo, obedecem uma certa regularidade estatística, sendo passíveis de previ-

são (STEWART, 2013). Evento (E): qualquer subconjunto de um espaço amostral (TAVARES, 2007). Um avento

pode ser considerado como uma ocorrência dentro do espaço amostral. Chamamos de evento ou

CONCEITOS INTRODUTÓRIOS caso favorável quando temos um interesse naquele acontecimento.

Evento determinístico: mantidas as mesmas condições apresentam sempre os Exemplos:

mesmos resultados ou com pouca variação (CORREA, 2003). Ex.: tempo de queda de
I. No lançamento de um dado honesto almejamos tirar um número par: temos então três even-
um corpo, temperatura de ebulição da água.
tos E={2,4,6}.

Evento probabilístico ou aleatório: podem conduzir a diferentes resultados, mesmo


II. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener. Tenho uma ta-
quando mantidas as condições iniciais (CORREA, 2003). Ex.: o número encontrado no lan-
refa específica para um homem. Temos então três eventos: E= {Gilson, Kléber e Dener}.
çamento de um dado honesto, os números da loteria, o cavalo vencedor em uma corrida etc.
Experimento: é um processo que produz resultados definidos, sendo que, em um experi-

É importante considerarmos que mesmo os eventos aleatórios acabam adotando mento ocorrerá apenas um resultado dentre os possíveis (ANDERSON, 2008, p.130).

um padrão estatístico.

PROBABILIDADE E ESTATÍSTICA 33
SUMÁRIO

Experimento Resultados Experimental Cosntrução Pintura Rádio

Lançar de uma moeda Cara, coroa. 3 x 2 x 2

Selecionar uma peça


Defeituosa, não defeituosa.
para inspeção

Oferecer um produto Vender, não vender.

Lançar um dado honesto 1,2,3,4,5,6.

PRINCÍPIO FUNDAMENTAL DA CONTAGEM

Quando um evento for composto por duas fases consecutivas e independentes, deve-

mos multiplicar as possibilidades para cada evento ocorrer. Assim, o produto dos números

de possiblidades é válido para qualquer número de tentativas independentes.

Exemplo:

Uma montadora instalou-se num certo país e começou a produzir três tipos de veícu-

los: carros, caminhonetes e utilitários. Esses veículos são fabricados apenas em duas cores: Exemplos:

preto e branco. Ainda saem com duas opções de sonorização: com ou sem rádio. Quantas

configurações diferentes são possíveis? Faça a árvore de possibilidades. I. Quero fazer uma senha de três dígitos com os algarismos 1,2,3 e 4. Quantas senhas eu

posso formar?

Perceba que o diagrama, chamado de árvore de possiblidades, indica todas as possibli-

dades de como os automóveis podem ser montados. Para facilitar os cálculos, não precisa- 4x4x4= 64 senhas

mos fazer a árvore, bastando multiplicar cada uma das possibilidades.

PROBABILIDADE E ESTATÍSTICA 34
SUMÁRIO

II. Quero fazer uma senha de três dígitos com os algarismos 1,2,3 e 4 não repeti-los. Quan- P(F)=n/S

tas senhas eu posso formar?


P(F)= 1/5, ou seja, 0,2 x100 = 20%.

4x3x2= 24 senhas
OBS: Utilizamos a terminologia P(F) como “probabilidade de falta”.

PROBABILIDADE DE UM EVENTO
II. Considerando a mesma situação do último exemplo, qual é a probabilidade de uma mu-

Para calcular a probabilidade ou a chance de ocorrência de um evento, utilizamos a se- lher faltar?

guinte fórmula:
S= {G, K, M, B, D}, ou seja, 5.

n={Márcia, Bruna}, ou seja, 2.

O cálculo de probabilidades tem amplas aplicações no processo de tomada de decisão, P(F) = 2/5

pois podemos ter noções preliminares da ocorrência de um evento, podendo, assim, anteci-
P(F) = 0,4, ou seja, 40%.
par nossas ações.

III. No lançamento de uma moeda ao acaso, determinar a probabilidade de ocorrer cara.


Exemplos:

I. No setor X de uma empresa trabalham Gilson, Kléber, Márcia, Bruna e Dener. Qual é a S : {cara, coroa}

probabilidade de um deles aleatoriamente faltar?


E : {cara}

S= {G, K, M, B, D}, ou seja, 5.


p(E)=1/2=50%

n= 1

PROBABILIDADE E ESTATÍSTICA 35
SUMÁRIO

IV. Um dado honesto é lançado para cima. Qual é a probabilidade de ocorrer um Exemplos:

divisor de 6?

I. Temos duas urnas contendo, respectivamente, 10 e 5 bolas. Na primeira existem 6 bolas brancas e
S:{1,2,3,4,5,6}
2 na segunda. Qual é a probabilidade de se extrair duas bolas brancas, sendo uma de cada urna?

E: { 1,2,3,6}
II.
p(E)=4/6=66,66 %

P1= 6/10=3/5
V. Qual é a possibilidade de sair um “dois”, ao retirar, por acaso, uma carta de

um baralho de 52 cartas? P2 = 2/5

Vamos lembrar que um baralho tem 4 naipes: copas, espadas, paus e ouro.
Probabilidade composta: 3/5 x 2/5=6/25
Cada naipe tem números que vão do 2 ao 10, um valete (11), uma dama (12) , um

rei (13) e um ás (1 ou14).


III. Uma urna contém 10 bolas, sendo 7 brancas e três pretas, qual é a probabilidade de se tirar, suces-

sivamente, 3 bolas brancas sem reposição?


Assim: S= 52 e= 4

p(E)=4/52 aprox.7,69% P1= 7/10

PRINCÍPIO DA PROBABILIDADE COMPOSTA P2 = 6/9

A probabilidade de um evento composto de um número finito de eventos P3 = 5/8

simples e independentes é igual ao produto das probabilidades desses eventos.

P= 7/10 x 6/9 x 5/8=210/720=7/24

PROBABILIDADE E ESTATÍSTICA 36
SUMÁRIO

DISTRIBUIÇÕES DE PROBABILIDADE Devemos entender o “sucesso” como o objetivo do pesquisador e “fracasso” como o

contrário do “sucesso”.

A aplicação de procedimentos estatísticos na resolução de problemas práticos, muitas

vezes, faz com que verifiquemos características que indicam um modelo teórico assumido Exemplo:

pelos dados. Existem dois tipos: a distribuição discreta (com variáveis discretas) e a distri-
Você está analisando um lote de peças e procurando quantas estão defeituosas.
buição contínua (com variáveis contínuas).

As peças defeituosas serão o sucesso.


DISTRIBUIÇÃO DISCRETA
As peças boas serão o fracasso.

Esse tipo de distribuição de probabilidade parte de hipóteses definidas e certas. Por


Fórmula para a distribuição binomial:
exemplo, ao analisar uma peça um inspetor de qualidade pode classificá-la como própria ou

imprópria. No nascimento de uma criança, existem só duas hipóteses: menino e menina. Os

fenômenos com comportamento similar se enquadrarão neste tipo de distribuição. Existem

diversos tipos de distribuição de probabilidade discreta, de acordo com o comportamento


Onde:
do fenômeno, destacando-se: bernoulli, binomial, geométrica, pascal, hipergeométrica e

poisson. Estudaremos apenas as mais usadas: n: número de testes

k: número de sucessos
DISTRIBUIÇÃO BINOMIAL

p: probabilidade de sucesso
É uma distribuição adequada para uma sucessão de experimentos aleatórios indepen-

dentes, onde se observa em cada um a probabilidade de “sucesso” ou de “fracasso” de um q: probabilidade de fracasso (1-p)

determinado evento de probabilidade p com n provas.


n/k: combinação de n tomado k a k

PROBABILIDADE E ESTATÍSTICA 37
SUMÁRIO

Exemplos: n: 10 k: 6 p: 0,2 q: 0,8

I. Em um campeonato de futebol todas as partidas são desempatadas. Um certo time tem

80% de probabilidade de vitória sempre que joga em casa. Se o time jogar 20 partidas em

casa, qual é a probabilidade que ele tem de ganhar exatamente 15 jogos? C(10,6) Combinação de 10 elementos tomados 6 a 6.

C(10,6)= 210
OBS: Se as partidas são desempatadas, temos apenas dois resultados possíveis: vitória

ou derrota. Isso define a situação como uma distribuição binomial.


P=210x 0,26 x 0,810-6=0,55%

n: 20 K: 15 p: 0,8 q: 0,2
III. Um inspetor de qualidade extrai uma amostra de 10 tubos aleatoriamente de uma carga

muito grande de tubos que se sabe que contém 20% de tubos defeituosos. Qual é a pro-

babilidade de que não mais que 2 tubos sejam defeituosos?


C(20,15) = 20!/15!5!=15.504 Combinação de 20 elementos tomados 15 a 15.

n= 20 p: 0,20 q: 0,80
P= 15504x0,815 x 0,220-15=0,1745 ou 17,54%

Zero tubos C10,0 X 0,200 X 0,8010= 0,1074


II. Na prova de grau C, de estatística, o professor elaborou 10 questões fechadas, cada uma

com 5 alternativas, sendo uma correta. Infelizmente, um aluno não sabe nenhum dos
Um tubo C10,1 X 0,201 X 0,809= 0,2684
conteúdos e resolve “chutar”. Qual é a probabilidade dele acertar 6 questões e ser apro-

vado na disciplina?
Dois tubos C10,2 X 0,202 X 0,808= 0,3019

A probabilidade do aluno acertar uma questão é de 1 em 5, pois cada questão tem 5 al-
Probabilidade: 0,1074+ 0,2684+ 0,3019 = 67,77%
ternativas. Assim, p= 1/5 ou seja p= 0,20.

PROBABILIDADE E ESTATÍSTICA 38
SUMÁRIO

DISTRIBUIÇÃO GEOMÉTRICA P(X=x)=qx-1. p

P(X=x)=0,805-1 . 0,20 = 0,08192 = 8,192%


A distribuição geométrica conta o número de falhas até obtermos o sucesso. Assim,

x assume o número de tentativas necessárias ao aparecimento do primeiro sucesso.


II. Qual a probabilidade de ser lançado 15 vezes para que na 15ª vez ocorra a face 6 pela pri-

meira vez?
Fórmula

X = 15 p=1/6 q= 5/6
P (X=x) = qx-1. p

P(X=x)=qx-1 . p

Propriedade importante
P(X = x) = (5/6)15-1 . 1/6 = 0,01298 = 1,2981%
Falta de memória: essa propriedade indica a maneira que a variável
incorpora a informação anterior. Ou seja, a variável “lembra” do presente, mas
DISTRIBUIÇÕES CONTÍNUA DE PROBABILIDADE
“esqueceu” o que ocorreu no passado.

São distribuições em que a variável pode assumir infinitos valores dentro de um intervalo.
Exemplos:

DISTRIBUIÇÃO NORMAL
I. A probabilidade de se encontrar o sinal de trânsito aberto numa esquina é 0,20.

Qual é a probabilidade necessária para se passar 5 vezes no local e encontrar o sinal


É uma das distribuições mais utiliza-
aberto pela primeira vez?
das, tendo uma ampla importância na mate-
Perceba que só são admitidas duas possibilidades: ou o sinal está aberto ou está mática. Ela ocorre quando a sua distribuição é
fechado. Logo, a distribuição é discreta. Como estamos considerando o fracasso antes perfeitamente simétrica, e seu gráfico lembra
do sucesso, devemos trabalhar com a distribuição geométrica. um sino, também chamado de curva de Gauss.

Logo, observe a figura a seguir:


x= 5 p= 0,20 q= 0,80

PROBABILIDADE E ESTATÍSTICA 39
SUMÁRIO

A média da moda e a mediana correspondem ao mesmo valor, ou seja, a média sempre Primeiro: gerar o parâmetro para a tabela z aplicando a fórmula:

ficará no meio do gráfico.

CÁLCULO DA PROBABILIDADE EM UMA DISTRIBUIÇÃO NORMAL

A probabilidade de um evento acontecer é a área abaixo da curva. Podemos calcular


Agora pegue a tabela z no final do ebook.
essa área com o teorema fundamental do cálculo (utilizando integrais) ou utilizar a tabela

z, que será o método adotado. Assim, precisamos gerar um parâmetro com o fim de encon-
Como encontramos, -1,5 considere 1,5, pois a tabela é simétrica. Nas linhas temos a
trá-lo na tabela z (veja anexo no final do ebook).
unidade e a dezena, enquanto na linha temos a unidade. Assim, o valor de 1,5 será dado cru-

zando a linha de 1,5 com a coluna do 0. Veja a figura a seguir:

Onde µ é a média, σ é o desvio padrão e x é o valor que queremos obter.

Exemplos:

Suponha que o tempo de permanência na fila de um banco seja, normalmente, distri-

buído com média de 8 minutos e desvio padrão de 2 minutos. Qual é a probabilidade que o

tempo de permanência seja de 5 e 8 minutos?

PROBABILIDADE E ESTATÍSTICA 40
SUMÁRIO

Logo o valor encontrado para z = 0,4332, ou seja 43, 32%. Esse valor é INTERVALO DE CONFIANÇA
a probabilidade entre a média e x, ou seja, a chance de você ficar na fila en-

tre 5 e 8 minutos. O intervalo de confiança é uma faixa de valores onde um fenômeno pode acontecer, com um relativo

risco. Na pesquisa política, o padrão do intervalo de confiança é de 95%, o que isso significa? Isso significa

Exemplo: que o candidato tem 95% de chance de estar dentro da margem de erro e 2,5% de estar acima dela, ainda,

2,5% de estar abaixo dela.

Pense nos dados do último problema. Qual é a probabilidade de per-

manecer menos de 5 minutos na fila? Margem de erro ou erro máximo: pode ser entendido como a quantia que o fenômeno pode oscilar,

para cima ou para baixo. Quando a população (N) for infinita ou não for fornecida.

Em que σ e S são o desvio padrão e n é o número da amostra.

Quando a população for maior ou igual a 30 unidades, utilizamos a tabela z para intervalo de confiança

(ver anexo no final da tabela). Quando for menor que 30 utilizamos a tabela t (ver anexo no final da tabela).
O procedimento será o mesmo, você chegará aos mesmos 43,32%. En-
tretanto, essa é a probabilidade de se permanecer entre 5 e 8 minutos. Con-
FÓRMULAS
sidere que do zero até o 8 será a metade, ou seja 50%. Dessa maneira, basta

fazer 50% - 43,32% = 6,68%.


População Amostra

OBS: É muito importante o desenho da curva para que você tenha no- n ≥ 30 média ± margem de erro média ± margem de erro

ção da área que deseja calcular. n < 30 média ± margem de erro média ± margem de erro

PROBABILIDADE E ESTATÍSTICA 41
SUMÁRIO

Exemplos:

I. Para estimar o tempo médio em uma consulta, foram amostrados

64 pacientes. Essa amostra indicou um tempo médio de 10 mi-

nutos, com desvio padrão de 3 minutos. Com base nisso, qual é o

tempo médio de atendimento, com um nível de confiança de 90%?

n= 64 Média: 10 S: 3

Perceba que estamos trabalhando com a amostra, e n>30. Então,

usaremos tabela z.

MÉDIA ± MARGEM DE ERRO

Como queremos um nível de confiança de 90%, temos uma mar-

gem de erro de 10%, sendo 5% em cada cauda. Observe que o valor -1,64 gera a 0,05. Logo, 1,64 será o parâmetro z e não precisamos considerar o sinal.

• Passo 1: procuramos na tabela z um parâmetro z, cujo valor resul- • Passo 2: encontra a margem de erro.

te em 0,05 (5%).

Perceba que não é a mesma tabela da distribuição normal.

Veja que não temos exatamente o valor 0,05. Nesse caso, pega-

mos um dos mais aproximados.

PROBABILIDADE E ESTATÍSTICA 42
SUMÁRIO

Assim: • Passo 1: encontrar o parâmetro t. Devemos usar a tabela t, pois n é menor que 30. Veja

o anexo no final da apostila. Vamos cruzar 5% do teste bilateral com o 16, pois nossa
Média ± margem de erro
amostra é 17 com 1 grau de liberdade.
10±0,615=

10-0,615 = 9,385

10+0,615 = 10,615

Temos uma estimativa intervalar entre 9,385 e 10,615, ou seja, o tempo médio de aten-

dimento oscila entre 9,385 e 10,615 minutos.

II. Na década de 90, foi realizada uma pesquisa em 17 cinemas de São Paulo, indicando que

o ingresso custava em média R$ 5,50 com desvio padrão de R$ 0,50. Determine um in-

tervalo de confiança para o preço médio com um nível de confiança de 95%:

Fórmula: Média ± margem de erro


t= 2,1199
N =17

• Passo 2: Margem de erro


Média= 5,50

S= 0,50

Grau de liberdade= n-1 = 17-1= 16

α=5% (nível de significância ou nível de desconfiança)


5,50 ±0,25=[5,25;5,75], ou seja, se entrasse em um cinema, em 95% das vezes você

OBS: Para o intervalo de confiança o teste será sempre bilateral. pagaria entre R$ 5,25 e R$ 5,75.

PROBABILIDADE E ESTATÍSTICA 43
SUMÁRIO

Na planilha eletrônica

A função [Link]ÇA (versões mais antigas) ou [Link]ÇA.


NORM nos retorna a margem de erro a partir de uma distribuição
normal. Ainda existe a função [Link]ÇA.T para amostras pequenas.
Os critérios são Alfa, o qual é o nível de significância ou de desconfiança
e deve ser lançado percentualmente. Portanto, precisamos do desvio
padrão e do tamanho da amostra.

SÍNTESE

Neste capítulo, compreendemos que:

• Quando falamos de probabilidade, queremos identificar a chance de ocorrência de um

determinado resultado de interesse, em situações nas quais não é possível calcular com

exatidão o valor real do evento;

• A probabilidade de um evento pode ser calculada, utilizando fórmula;

• Aplicar procedimentos estatísticos para resolver problemas práticos faz com que verifi-

quemos características que indicam um modelo teórico assumido pelos dados;

• Existem dois tipos de distribuições: discreta e a distribuição contínua, subdividindo-se;

• O intervalo de confiança é uma faixa de valores onde um fenômeno pode acontecer, com

um relativo risco.

PROBABILIDADE E ESTATÍSTICA 44
EXERCÍCIOS SUMÁRIO

1. Lança-se um dado honesto ao acaso. Determine a probabili- 5. Considerando que o peso de determinado artigo produzido por uma

dade de obter-se na face superior: fábrica seja normalmente distribuído com média de 20 gramas e

desvio padrão de 4 gramas, determine a probabilidade de que uma


a. O número 4
unidade, selecionada ao acaso, tenha peso:
b. Um número menor que 3

c. Um múltiplo de 3 a. entre 16 e 22 gramas

d. Um divisor de 20 b. entre 22 e 25 gramas

c. maior que 23 gramas

2. Um baralho tem 52 cartas, das quais 4 são damas e 4 são reis.

Retira-se uma carta ao acaso. Determine a probabilidade de: 6. As vendas diárias de um restaurante têm distribuição normal com

média igual a 53 unidades monetárias e desvio padrão igual a 12 U.M.:


a. Ser retirada uma dama

b. Não ser retirado um rei a. Qual a probabilidade das vendas excederem 70 U.M. em de-

terminado dia?

3. De um baralho que inicialmente tinha 52 cartas, perderam-se b. Esse restaurante deve vender no mínimo 30 U.M. por dia. Para

uma dama, dois reis e um quatro. Se retirarmos ao acaso uma não ter prejuízo. Qual a probabilidade de que, em certo dia,

carta desse baralho, qual é a probabilidade de sair: exista prejuízo?

a. Outro rei
7. Suponha que as notas em certa disciplina estão normalmente dis-
b. Outro 4
tribuídas com média 5,0 e desvio padrão 1,5:

4. Numa caixa há 6 bolas brancas e 4 vermelhas. Qual é a pro- a. determine o percentual de estudantes com nota superior a 8,0
babilidade de, ao acaso, retirar-se: b. se a nota mínima para obter aprovação é 3,0, determine o per-

centual de estudantes reprovados


a. Uma bola vermelha
c. Qual é a probabilidade de obter nota acima de 9,8?
b. Uma bola branca

PROBABILIDADE E ESTATÍSTICA 45
EXERCÍCIOS SUMÁRIO

8. Suponha que o consumo diário de álcool pelos alcoólatras de certa cidade seja, normal-

mente, distribuído com média 320 ml e desvio padrão 50 ml. Selecionando ao acaso um

alcoólatra desta cidade, determine a probabilidade de que ele tenha consumo diário:

a. maior que 330 ml

b. inferior a 370 ml

c. entre 240 e 330 ml

d. entre 320 e 380 ml

9. Uma moeda é lançada 20 vezes. Qual é a probabilidade de saírem 8 caras?

10. Suponha que a probabilidade de um pai ter um filho com os cabelos loiros seja ¼. Se

houverem 6 crianças na família, qual é a probabilidade de que a metade delas tenha ca-

belos loiros?

11. Uma fábrica que produz papel quer estimar o tempo médio requerido para uma nova

máquina produzir uma resma de papel. Sabe-se que uma amostra de 36 resmas produ-

zidas por essa máquina requer em média de 1,5. Assumindo um desvio padrão de 0,30,

construa um intervalo de confiança de 95%.

12. O dono de um café quer calcular o lucro médio diário por cliente. Numa amostra de 100

clientes, ele verificou que o gasto médio por cliente era de 350 unidades monetárias

(u.m.), sendo o desvio padrão dessa amostra de 75 u.m.. Estime um intervalo de con-

fiança para o verdadeiro gasto médio com 90%de confiança.

PROBABILIDADE E ESTATÍSTICA 46
ESTATÍSTICA
AVANÇADA
Existem técnicas de análise de dados que nos permitem compreender
o fenômeno, fazer inferências e tomar decisões fundamentadas em
parâmetros matemáticos.

47
SUMÁRIO

Em diversas situações do nosso cotidiano, seja na nossa vida pessoal, seja na profis- correlação existe entre as variáveis. Barbetta (2002) considera que existe uma correlação

sional, muitas decisões são complexas e difíceis de serem tomadas. Quando conhecemos o direta entre duas variáveis quando elas caminham no mesmo sentido, como peso e altu-

desempenho de determinado fenômeno, conseguimos identificar o seu padrão de compor- ra podem ser exemplos de correlação direta entre variáveis, pois espera-se que um sujeito

tamento, podendo, assim, prever como ele irá se comportar, com um certo nível de preci- mais alto seja mais pesado. Já a correlação inversa ocorre quando elas caminham em sentido

são. Decidir fundamentos em argumentos matemáticos será mais racional do que decidir a oposto, como, no Brasil, a renda e o número de filhos por família apresentam uma correla-

partir do senso comum ou da intuição. ção inversa, pois de um modo geral, quando menor a renda mais o número de filhos.

REGRESSÃO LINEAR SIMPLES Exemplos:

A regressão linear simples consiste em uma tentativa de estabelecer uma equação ma- I. O gráfico a seguir indica as vendas (em cruzeiros) de uma empresa durante um deter-

temática linear, ou seja, uma linha que descreva a relação estabelecida entre duas variáveis. minado período:

A reta de regressão é utilizada para traçar uma estimativa linear entre duas variáveis e a sua

equação pode ser utilizada para estimar uma variável a partir da outra. Dessa forma, con-

firmando uma relação entre ambas. Então, chamamos o x de variável independente, pois é o

próprio fenômeno e não depende de outros fatos. Já o y é chamado de variável dependente,

pois depende do x.

DIAGRAMA DE DISPERSÃO

Uma das maneiras de estimar a relação entre as variáveis a partir de uma linha é o dia-

grama de dispersão. Esse consiste em representar as variáveis em um plano cartesiano por Observe que o gráfico se aproxima de uma reta, o que indica uma forte correlação entre

pontos com coordenadas (x,y), em que x é a variável observada e y o correspondente (BAR- as variáveis. A reta crescente indica que a correlação é direta, ou seja, quanto mais aumen-

BETTA, 2002). Quanto mais os pontos estiverem concentrados em torno de uma reta, mais tam os anos, mais aumentam as vendas da empresa.

PROBABILIDADE E ESTATÍSTICA 48
SUMÁRIO

II. O gráfico seguinte demonstra o resultado de uma pesquisa em que foram consideradas Perceba que o fenômeno fica disperso, não se concentrando em torno de uma reta.

a idade e a massa muscular de um grupo de pessoas: Isso significa que não existe correlação entre as variáveis, ou seja, a idade não interfere no

tempo de leitura.

A EQUAÇÃO DA RETA

Perceba nos últimos gráficos que projetamos uma reta e analisamos como o fenôme-

no se comporta em torno dela. Essa reta explica o comportamento das variáveis e a relação

estabelecida entre elas.

Perceba que mesmo que não forme uma reta perfeita, os dados se concentram em tor- ENCONTRANDO A RETA
no de uma linha imaginária, indicando que existe correlação. Como a linha é decrescente, a

correlação é inversa, ou seja, quanto mais a idade aumenta, mais a massa muscular diminui. A reta de regressão linear simples seguirá o seguinte formato:

y=a+bx, sendo:
III. O gráfico seguinte demonstra o resultado de uma pesquisa em que foram considerados

a idade e o tempo de leitura: a=médiay-bmédiax

Considerando:

n: como o número da amostra

εx: somatório de x

εy: somatório de y

PROBABILIDADE E ESTATÍSTICA 49
SUMÁRIO

Exemplo: Semana (x) Altura (y) x2 y2 x.y

1 5 1 25 5

Um biólogo registrou o crescimento de uma determinada planta, conside- 2 12 4 144 24

rando o tempo e a altura em centímetros, chegando aos seguintes resultados: 3 16 9 256 48

4 22 16 484 88

Semana Altura (m) 5 34 25 1156 170

1 5 6 38 36 1444 228

2 12 7 41 49 1681 287

3 16 8 45 64 2025 360
4 22 9 50 81 2500 450
5 34 Soma 43 263 285 9715 1660
6 38
7 41
Lembre-se que 5² = 5x5= 25 e que 9²= 9x9= 81
8 45
9 50

Encontre a equação da reta e estime a altura com 3,5 semanas:

Perceba que o parâmetro. a=médiay-bmédiax

Sendo:

Média y=εy/n
exige que seja efetuada a soma das variáveis, logo, eleve elas ao quadrado, além
Média de y = 263/9 = 29,22
de multiplicá-las. Assim, precisamos ajustar a tabela, considerando as semanas

como x e a altura como y: Média de x = εx/n

PROBABILIDADE E ESTATÍSTICA 50
SUMÁRIO

Média de x=45/9=5 ENCONTRANDO A RETA NA PLANILHA ELETRÔNICA

a = 29,22 – 5,75.5 a= 0,47


Encontrar a reta de regressão linear na planilha eletrônica é relativamente simples. Vamos fazer o
Logo, a equação da reta será:
mesmo exemplo de antes na planilha.

y= 0,47 + 5,75x
Importante: procure, você também, realizar o exemplo na planilha para se acostumar com o uso

VALOR ESPERADO do software.

Quando conhecemos a equação da reta, podemos estimar os valores fu- • Passo 1: lance os dados na planilha.

turos. Respondendo a pergunta do último exemplo: “estime a altura com 3,5

semanas”. Basta substituir o x por 3,5 e teremos o valor esperado para a al- • Passo 2: faça um gráfico de dispersão.

tura em 3,5 semanas.


INSERIR > GRÁFICO > DISPERSÃO

y= 0,47 + 5,75x

y = 0,47 + 5,75.3,5

y = 0,47 + 20,125

y = 20,596 cm

Mesmo que consigamos imaginar a reta, não temos precisão dela. A planilha adiciona a reta.

Ou seja, a partir dos valores conhecidos, podemos estimar que com 3,5

semanas a planta tinha 20,596 cm de altura. • Passo 3: projetar a reta.

PROBABILIDADE E ESTATÍSTICA 51
SUMÁRIO

Clique com o botão direito em cima de um dos pontos. Então, abrirá uma aba flutuante Escolhemos o ajuste linear (veja a figura) e já temos uma reta que nos leva a perceber

e selecione: que o fenômeno se concentra em torno dela.

Adicionar linha de tendência


• Passo 4: encontra a equação.

Baixando a guia: Formatar linha de tendência, encontramos um espaço denomi-

nado: Exibir equação no gráfico (veja a figura). Assim, a equação de regressão linear será

exibida junto com o gráfico.

Perceba que agora temos uma aba na direita da planilha. Observe a figura:

CORRELAÇÃO

Correlação é uma medida que estima a relação entre duas variáveis. Essa medida é

chamada de r (coeficiente de Pearson). Exemplo: quando aumenta a venda de pão, aumenta

a venda de margarina? Existe correlação entre essas variáveis?

PROBABILIDADE E ESTATÍSTICA 52
SUMÁRIO

O valor r da correlação ocorre entre -1 e 1 , sendo: HDL Horas de Exercícios


0: nula 40 0
Entre 0,10 e 0,29 : pequena 50 2
Entre 0,30 e 0,60 : moderada
55 3
Entre 0,60 e 0,90: forte
60 4
Maior que 0,90: muito forte
65 6
R > 0 correlação direta

R=0 correlação nula


Existe correlação entre as variáveis? Em que nível?
R< 0 correlação inversa

X sempre será a variável independente.


Para saber o nível de correlação não é suficiente fazer o gráfico de correlação. Quando que-
Y sempre será a variável dependente.
remos encontrar a medida é necessário estimar o coeficiente de Pearson.

FÓRMULA
• Passo 1: ajustar a tabela montando as colunas x.y, x² e y², pois a fórmula exige tais elementos.

x y x.y x2 y2

40 0 0 1.600 0
Exemplo:
50 2 100 2.500 4

55 3 165 3.025 9
Em uma certa cidade foi realizado um estudo visando compreender a saúde das
60 4 240 3.600 16
pessoas. Os entrevistados tinham entre 5 e 50 anos de idade. Foram considerados o
65 6 390 4.225 36
nível de HDL (colesterol bom) no sangue e as horas de exercícios semanais. Assim,
Soma 270 15 895 14.950 65
chegou-se aos seguintes resultados:

PROBABILIDADE E ESTATÍSTICA 53
SUMÁRIO

• Passo 2: aplicar a fórmula.

r: 0,98

O coeficiente de Pearson indicou que existe uma correlação muito forte e dire-

ta entre as duas variáveis, os seja, quanto mais exercícios a pessoa praticar, maior

será o seu “colesterol bom”. Desse modo, você pode tomar a decisão de fazer exer-

cícios para melhorar o seu HDL. • Matriz 1 são os valores independentes, ou seja, aqueles que não dependem de outros fatores.

No nosso caso, são as semanas (x). Marque a coluna das semanas.

ENCONTRANDO A CORRELAÇÃO NA PLANILHA


• Matriz 2 são os valores dependentes, ou seja, aqueles que dependem de outros fatores. No

nosso caso é a altura (y) que depende das semanas. Marque a coluna das semanas.
Vamos realizar o mesmo exemplo de antes, porém fazendo o cálculo na planilha

eletrônica.
• Clique em OK e teremos o coeficiente de Pearson.

• Passo 1: lançar os dados na planilha.


Perceba que temos um valor muito próximo do que havíamos estimado com a fórmula, re-

• Passo 2: selecione o assistente de função fx e escolha o comando PEARSON. velando uma correlação muito forte e direta.

PROBABILIDADE E ESTATÍSTICA 54
SUMÁRIO

ANÁLISE DE VARIÂNCIA

ANÁLISE DE FATOR ÚNICO (ANOVA FATOR ÚNICO)

ANOVA é uma coleção de modelos estatísticos no qual com-

paramos a variância da amostra com diversos fatores ou variáveis.

Desse modo, podemos identificar a influência das variáveis em uma

determinada característica que temos interesse.

NO EXCEL

Para trabalharmos com ANOVA no Excel, precisamos habilitar

um recurso chamado Análise de Dados. O roteiro a seguir pode mu-

dar de acordo com a versão do programa utilizado.


Escolha os suplementos que você deseja trabalhar, nesse caso, ferramentas de análise, e clique em OK. Clique

na aba Dados para conferir se a ferramenta Análise de Dados está disponível no canto direito de sua planilha.
Clique em:

NO LIBREOFFICE CALC
Arquivo > Opções > Suplementos > Ir

Caso você prefira trabalhar com o LibreOffice, o suplemento já vem habilitado. Basta clicar em:
Teremos uma janela similar à seguinte figura:

PROBABILIDADE E ESTATÍSTICA 55
SUMÁRIO

Dados > Estatística > Análise de Variância (Anova) veja a figura adiante: Borda 3m 10m Centro

11 8 5 4

8 5 7 4

5 2 3 2

8 5 3 0

5 5 7 0

11 8 6 4

Média 8 5,5 5,17 2,33

Vamos trabalhar exclusivamente com planilha eletrônica.

Após termos habilitado ou identificado a ferramenta, seguimos os seguintes passos:

• Passo 1: lançar os valores na tabela.


Exemplo:

• Passo 2: escolha ANOVA fator único, pois temos apenas uma variável dependente.
Um agricultor está tendo problemas com frutos que estão sendo atacados por pragas.

Ele parte da hipótese de que o local em que a planta está interfere no número de frutos ata-
• Passo 3: preenchemos o quadro, completando:
cados. Também, o agricultor sabe que outros fatores, tais como clima, solo e humidade, por

exemplo, podem interferir nesse processo. Qual é o nível de interferência da localização?


• Intervalo de entrada: são os valores que serão analisados;
Qual é o nível de interferência de outros fatores?

Para responder a essas questões, amostrou-se as seguintes regiões de um pomar: cen- • Intervalo de saída: o local em que você quer que o quadro de ANOVA seja colocado;

tro, 10 m da borda, 3 m da borda e borda.

PROBABILIDADE E ESTATÍSTICA 56
SUMÁRIO

• Alfa: o padrão estatístico é 0,05 que se refere ao nível de significância, o que quer

dizer é que temos 95% de confiança em nossos resultados;

• Selecionamos Rótulos Na Primeira Linha para uma melhor organização e entendi-

mento dos resultados.

Veja a figura a seguir:

O primeiro quadro consiste em um breve resumo estatístico dos dados considerados.

O segundo é que faz o comparativo entre o fator considerado (local) e os outros fatores cha-

mados de resíduo. Consideramos F como a fração do que queremos analisar, nesse caso, o

local, verificando a posição que ela ocupa em relação aos resíduos. Quando F superar F crí-

tico, dizemos que ele afeta as demais variáveis. No nosso exemplo, podemos dizer que sim,

o local interfere nas frutas afetadas pelas pragas.

Como o nosso alfa é 0,05, devemos considerar que o valor-P ficou menor que isso, o

que indica que a pesquisa tem significância e pode ser levada em consideração.

ANOVA FATOR DUPLO SEM REPETIÇÃO

• Passo 4: analisar os dados; Quando quisermos analisar a variância e tivermos mais de uma variável, podemos uti-

lizar a ANOVA fator duplo. A ANOVA fator duplo sem repetição será utilizada quando os va-

Após clicar em OK, teremos o seguinte quadro: lores não se repetirem.

PROBABILIDADE E ESTATÍSTICA 57
SUMÁRIO

Exemplos:

Realizou-se um estudo sobre a quantidade de calorias ingeridas em uma refei-

ção, chegando aos seguintes resultados:

Quantidade de calorias
Chá Suco Água

Pão de trigo 75 87 60

Pão com sementes 74 82 55

Pão integral 70 79 53

Analise a variação de calorias presente na ingestão de pão e de líquido.

Escolhemos ANOVA fator duplo sem repetição. Fator duplo, pois estamos anali- Perceba que temos no primeiro quadro um breve resumo do fenômeno. No segundo, a análi-
sando duas variáveis (pão e líquido), e os dados não se repetem. O processo é semelhan- se de variância. A Análise é a mesma, quando quisermos analisar os pães observamos “linhas” e,
te, lançamos os dados na planilha e selecionamos a ANOVA fator duplo sem repetição. em relação aos líquidos, as “colunas”. Em ambos os casos, percebemos que F supera o F crítico, o

que significa que existe diferença nos tipos de pães e de líquidos em relação às colorias ingeridas.
Vamos observar o quadro gerado:

PROBABILIDADE E ESTATÍSTICA 58
SUMÁRIO

ANOVA FATOR DUPLO COM REPETIÇÃO O quadro de ANOVA é o que segue:

Quando quisermos analisar a variância e tivermos mais de uma variável podemos uti-

lizar a ANOVA fator duplo. Essa será utilizada quando os valores se repetirem.

Exemplo:

Um professor aplicou três testes em duas turmas diferentes e almeja compreender se


Nesse caso, as linhas são chamadas de Amostra, ou seja, as turmas são as amostras. Temos
existem diferenças significativas entre os testes e entre as turmas. Os resultados obtidos
5 linhas por amostra. As colunas são os três testes aplicados pelo professor. Em relação às tur-
estão expressos na tabela seguinte:
mas (amostra), não existem diferenças, pois F não supera o F crítico. Em relação aos testes (co-

lunas) também não existem diferenças significativas, visto que F também não supera o F crítico.
Teste 1 Teste 2 Teste 3
12 8 6
16 8 11
Turma 1
15 9 8
12 12 8
15 16 10

12 20 12
16 3 15
Turma 2 12 10 17
14 10 3
15 8 4

Existe diferença significativa entre as notas das turmas? E entre os testes?

PROBABILIDADE E ESTATÍSTICA 59
SUMÁRIO

SÍNTESE

Neste capítulo, compreendemos que:

• Não basta termos acesso à informação, é preciso saber como analisá-la;

• A regressão linear simples é uma tentativa de estabelecer uma equação

matemática linear, ou seja, uma linha que descreva a relação estabele-

cida entre duas variáveis;

• A reta explica o comportamento das variáveis e a relação estabelecida

entre elas e como ela funciona;

• Quando se conhece a equação da reta, pode-se estimar os valores futu-

ros, aplicando-a;

• É possível encontrar a reta de regressão linear na planilha eletrônica;

• Correlação é uma medida que estima a relação entre duas variáveis;

• ANOVA é uma coleção de modelos estatísticos no qual se compara a va-

riância da amostra com diversos fatores ou variáveis.

PROBABILIDADE E ESTATÍSTICA 60
EXERCÍCIOS SUMÁRIO

1. Um pesquisador deseja verificar se um instrumento para medir a concen- 3. Uma revenda de automóveis instalou filiais em 4 regiões do Brasil. Você quer saber se há diferença nas

tração de determinada substância no sangue está bem calibrado. Para isso, vendas médias realizadas em cada uma delas. Uma seleção aleatória chegou aos seguintes resultados:

ele tomou 15 amostras de concentrações conhecidas (X) e determinou a res-


Norte Leste Sul Norte
pectiva concentração através do instrumento (Y), obtendo:
34 47 40 21
28 36 30 30
18 30 41 24
24 38 29 37

Calcule o coeficiente de correlação entre as variáveis X e Y.


O quadro de ANOVA foi o seguinte:

2. Estudos na área da saúde indicam que a massa muscular da pessoa ten-

de a diminuir na medida em que a idade aumenta. Um nutricionista fez

uma pesquisa observando um grupo de pessoas, considerando a idade (x)

e a massa muscular (y). Logo, che-


Idade (x) Massa Muscular (y)
gou aos resultados apresentados na Existe diferença entre as regiões em relação à venda? Justifique sua resposta.
71 82
tabela ao lado:
64 91
43 100 4. O professor de estatística comparou a nota de uma amostra de alunos na prova de matemática do
a. Encontre o coeficiente de cor-
67 68 vestibular com a obtida no final da disciplina e chegou à seguinte tabela:
relação
56 87
Nota no Vestibular (x) Nota na disciplina (y)
73 73
b. Encontre a equação da reta
39 65
68 78
57 92
c. Estime o valor esperado para 56 80
34 56
80 anos 76 65
40 70
65 84
43 78
45 116 47 89
58 76 42 75

PROBABILIDADE E ESTATÍSTICA 61
EXERCÍCIOS SUMÁRIO

a. Faça o gráfico de dispersão.

b. Existe correlação entre as variáveis? Como ela pode ser classificada?

5. O mesmo professor seguiu estudando o comportamento da sua turma. Agora, ele

amostrou 23 alunos, comparando o número de faltas com a nota no final da disci-

plina. Ele encontrou um coeficiente de correlação de Pearson de - 0,66. E os estu-

dantes da turma fizeram os seguintes comentários sobre esse resultado:

I. Isso significa que nenhum aluno com muitas faltas tirou nota alta;

II. Existe uma tendência para que a nota se relacione inversamente com as faltas;

III. O professor não precisa mais fazer provas. Basta fazer a chamada;

IV. De um modo geral, a maior parte dos alunos com boa frequência tende a tirar

boas notas.

Considerando os conceitos estatísticos discutidos em aluno, é correto o que afir-

mamos em:

a. Somente em I

b. Em I e II

c. Em II e IV

d. Em II, III, IV

e. N.d.a.

PROBABILIDADE E ESTATÍSTICA 62
GABARITO SUMÁRIO

GABARITOS 3. 3 Frequência Frequência Frequência


Frequência Frequência
Classe percentual acumulada acumulada
absoluta (fi) relativa (fr)
(fp) (fa) percentual (fap)
CAP. I
40 I – 46 5 0,3124 31,24% 5 31,24%

46 I – 52 3 0,1875 18,75% 8 49,99%


1. 0 Região Clientes Amostra Número da amostra
52 I – 58 2 0,125 12,5% 10 62,49%
Metropolitana 690 48,3 48 58 I – 64 4 0,25 25% 14 87,49%
Serra 380 26,6 27 64 I - I 70 2 0,125 12,5% 16 99,99%

Campanha 160 11,2 11 Total 16 0,9999 99,99%

Litoral 280 19,6 20

4. 0

2. 0 OBS: as cores, a
Peças fi
disposição da legenda e
0 1 o título podem alterar.
Observar a relação entre
1 1
a tabela e o gráfico.
2 2

3 2

4 4
5. 0
5 2 Vendedor Km R$

6 2 Ricardo 344 456


Bruno 124 540
7 2
Gilmar 1389 123
8 2
Marisa 0 560
Total 468 1556

PROBABILIDADE E ESTATÍSTICA 63
GABARITO SUMÁRIO

CAP. II 4. a. Média = (750.18+800.27+950.10+1100.6 + 2500.2)/ 63

Média = (13500 + 21600 + 9500 + 6600 + 5000)/63

1. 134,50 Média = 56200/63

Média = 892,06

2. 6,81
b. Deve ser utilizada a média ponderada. A justificativa é porque cada

faixa salarial tem um número diferente de funcionários, dessa for-


3. 0
ma, tendo uma representatividade ou “peso” diferente.

c. A moda é R$ 800,00, pois é o salário que mais funcionários recebem.

5. Tabela para organização:

Li = 58

n/2= 40/2 = 20

facant = 13

fi= 11

h=4

a. 0

µ= 2589/78 µ= 33,19

PROBABILIDADE E ESTATÍSTICA 64
GABARITO SUMÁRIO

b. Li = 38 CAP. III
6. a. 7,93%
D1= 26-4= 22
1. a. 1/6 b. 2,87%
D2= 26-8= 18

i=5 b. 1/3
7. a. 2,28%
Moda= li+( d1/(d1+d2))i
c. 1/3
Moda= 38+ (22/(22+18 )) x 5 b. 9,18%
d. 2/3
Moda= 38 + 22/40 x 5
c. 0,07%
Moda= 38 + 0,55 x 5
2. a. 1/13
Moda = 38+ 2,75= 40,75
8. a. 42,07%
b. 12/13
c. Am b. 84,13%

3. a. 1/24 c. 52,45%

b. 1/16 d. 38,49%

4. a. 2/5 9. 0,12013
OBS: pode haver uma variação significativa nas casas depois da vírgula.
b. 3/5
Quanto mais casas utilizarmos maior será a precisão que obteremos. 10. 13,18%

5. a. 53,28%
d. OBS: lembrem-se, o desvio padrão é a raiz qua- 11. [1,402002; 1,597998]
b. 20,30%
drada da variância, portanto, existirá diferença

em função das casas decimais utilizadas. c. 22,66% 12. [337,6636; 362,3364]

PROBABILIDADE E ESTATÍSTICA 65
GABARITO SUMÁRIO

CAP. IV

1. 0,99

2. a. -0,8098

b. y = -1,0898x +150,72

c. 63,536

3. Não existem diferenças significativas, pois o valor de F foi inferior ao de F Crítico.

4. a.

b. A correlação é de 0,93 ou seja, muito forte e direta.

5. c

PROBABILIDADE E ESTATÍSTICA 66
REFERÊNCIAS SUMÁRIO

ANDERSON, D. R. Estatística aplicada à administração e economia. 2 ed. São Paulo: Cengage Learning: 2008.

BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5.a ed. Florianópolis: Editora da UFSC, 2002.

CLARKE, A. B., DISNEY, R. L. Probabilidade e Processos Estocásticos. Rio de Janeiro: Livros Técnicos e

Científicos Editora, 1979.

CORREA, S.M.B.B. Probabilidade e Estatística. 2.a ed. Belo Horizonte: PUC Minas Virtual, 2003.

KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. São Paulo: Makron Books, 2004.

MORETTIN, L.G. Estatística Básica: Probabilidade e inferência. Volume único. São Paulo: Pearson Prentice

Hall, 2010.

STEWART, Ian. Dezessete equações que mudaram o mundo. Tradução de George Schlesinger. Rio de Ja-

neiro: Zahar, 2013.

TAVARES, M. Estatística aplicada à administração. UAB, 2007. Disponível em<[Link]

conteudo/material_online/disciplinas/estatistica/download/Estatistica_completo_revisado.pdf> Acesso

em: dez. 2016.

YOUSSEF, A. N., SOARES, E. e FERNANDEZ, V. P. Matemática de olho no mundo do trabalho. São Paulo:

Scipione, 1ª ed. 2004.

PROBABILIDADE E ESTATÍSTICA 67

Você também pode gostar