Introdução à Estatística e Probabilidade
Introdução à Estatística e Probabilidade
PROBABILIDADE E ESTATÍSTICA
AULA 1
https://univirtus.uninter.com/ava/web/roa/ 1/30
10/05/2022 21:08 UNINTER
CONVERSA INICIAL
A estatística está presente no nosso dia a dia e nas diferentes áreas, sendo que muitas vezes
recorremos a ela para tomar decisões. Mas o que é estatística e onde podemos utilizá-la?
Toda ciência que utiliza dados experimentais necessita da estatística como método de análise
para que o pesquisador chegue a conclusões que tenham validade científica. A estatística possui uma
vasta aplicação nas engenharias e é extremamente importante para qualquer engenheiro, pois auxilia
no planejamento de novos produtos e sistemas, na melhoria de projetos e processos existentes, além
Martins (2010) comenta que somos expostos a uma quantidade de informações numéricas, e
que, dependendo das situações, ora somos consumidores de informações numéricas, ora precisamos
informações numéricas produzidas por outros, bem como nos habilitar a construí-las. Os
procedimentos, técnicas e métodos estatísticos são fundamentais para o auxílio à execução dessas
tarefas.
<http://www.estatconsultoria.org/2017/06/14/a-importancia-da-estatistica-em-diferentes-cam
po/>.);
<https://www.youtube.com/watch?v=ahccyeXOxFQ>).
como elaborar uma distribuição de frequência e uma distribuição de frequência por classe. Além
https://univirtus.uninter.com/ava/web/roa/ 2/30
10/05/2022 21:08 UNINTER
A estatística pode ser pensada como a ciência de aprendizagem a partir de dados que fornece
métodos para coleta, organização, análise, interpretação e apresentação de dados. Podemos
representar a estatística como meio entre os dados e a geração das informações, obtendo melhor
conjunto de dados, ou seja, é um número resumo que possibilita reduzir os dados a proporções
estatística que, baseando-se em resultados obtidos na análise de uma amostra da população, procura
inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi retirada.
característica comum; já a amostra é uma pequena parte da população. Martins (2010) define
população ou universo como a totalidade de itens, objetos ou pessoas sob consideração, e amostra,
como uma parte da população que é selecionada para análise. Por exemplo, quando temos uma
https://univirtus.uninter.com/ava/web/roa/ 3/30
10/05/2022 21:08 UNINTER
pesquisa eleitoral, a população é formada por todos os eleitores, e a amostra pode ser um grupo de
eleitores de uma determinada região, cidade ou bairro. Na figura a seguir temos a representação da
população e a amostra:
é de 5 cm com uma variação de 0,02 cm. Um conjunto de 36 parafusos fabricados foi retirado da
produção para análise de qualidade. Podemos dizer que todos os parafusos produzidos estão dentro
resultado para toda a população, ou seja, analisaremos a amostra e, caso esteja dentro da
Quando utilizamos a estatística indutiva, temos associada uma margem de incerteza. Isso ocorre
pelo processo de generalização. Analisamos uma amostra e as características obtidas na amostra são
inferidas para toda a população, mas como não analisamos toda a população, surge a margem de
A estatística descritiva e a estatística indutiva podem ser utilizadas em conjunto. Essa utilização
https://univirtus.uninter.com/ava/web/roa/ 4/30
10/05/2022 21:08 UNINTER
determinada população ou amostra, o trabalho que realizamos deve passar por várias fases, que são
desenvolvidas até chegarmos aos resultados que procurávamos. Para realizar um estudo estatístico e
tratar dados numéricos, utilizamos o método estatístico, o qual fornece conclusões que servirão de
definição do problema: definir com clareza o que pretendemos pesquisar, o objetivo de estudo
planejamento: como resolver o problema? Que dados serão necessários? Como obtê-los? Será
utilizado um questionário? Qual será a amostragem? Qual será o tamanho da amostra? Qual
coleta dos dados: fase operacional, colocar o que foi planejando em prática; obtenção dos
dados;
apuração dos dados: criticar os dados coletados, excluindo os dados incompletos ou com erros.
Realizar um resumo dos dados por meio de uma contagem, fazer separação por tipo de
análise dos dados: ligada ao cálculo de medidas para descrever o fenômeno analisado;
https://univirtus.uninter.com/ava/web/roa/ 5/30
10/05/2022 21:08 UNINTER
TEMA 2 – VARIÁVEIS
dependemos de uma variável que pode assumir diferentes valores numéricos ou não numéricos.
As variáveis qualitativas estão associadas a uma característica que denota qualidade ou atributo,
estado civil.
Quando uma variável qualitativa apresenta uma ordenação natural com intensidades crescentes
de realização, ela é chamada de qualitativa ordinal. Por exemplo:
A variável que não apresenta uma ordem natural entre seus valores é classificada como
altura;
peso;
idade;
número de filhos;
número de carros.
https://univirtus.uninter.com/ava/web/roa/ 6/30
10/05/2022 21:08 UNINTER
inteiros. Exemplos:
número de filhos;
Quando a variável trata de medidas, temos as variáveis quantitativas contínuas, ou seja, essa
variável está associada às medições. Exemplos:
peso;
comprimento dos parafusos fabricados por certa máquina;
classificações:
Estudamos no Tema 1 o método estatístico, que é composto de várias fases, sendo a coleta e a
apuração dos dados duas etapas do método. Após a fase de coleta dos dados, obtemos os dados
originais, também chamados de dados brutos, que precisam ser organizados para a realização das
análises, pois foram transcritos aleatoriamente, fora de qualquer ordem. Um conjunto de observações
https://univirtus.uninter.com/ava/web/roa/ 7/30
10/05/2022 21:08 UNINTER
de certo fenômeno não organizado fornece poucas informações de interesse do pesquisador, por
isso precisamos organizá-lo para gerar informações úteis e conclusões mais assertivas.
Suponha que uma pesquisa tenha sido realizada em uma máquina em relação à quantidade de
peças produzidas com defeito e para essa pesquisa tenham sido coletadas 20 amostras diferentes de
100 peças. Na primeira amostra, foram inspecionadas as 100 peças e separadas 14 com defeito; na
segunda amostra, após a verificação das 100 peças, foram separadas 15 com defeitos, e assim
sucessivamente até a última amostra, obtendo-se os seguintes resultados:
14 15 16 17 18 19 14 15 16 17 14 15 16 14 15 16 15 16 15 15
14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 17 17 18 19
O Rol é a nossa primeira organização, mas podemos melhorar ainda mais agrupando os valores.
Ao número de vezes que um mesmo número se repete, denominamos de frequência ou frequência
absoluta (f).
No nosso exemplo, 14 defeitos se repetem 4 vezes; isso significa que esse número de defeitos
possui frequência igual a 4. O mesmo ocorre com 15 defeitos que possuem frequência igual a 7, 16
defeitos que possuem frequência igual a 5, 17 defeitos que possuem frequência igual a 2, e os
defeitos 18 e 19, aparecendo uma única vez cada, com uma frequência igual a 1. Ou seja, 4 amostras
apresentaram quantidade de produtos com defeito igual a 14, 7 amostras igual a 15 defeitos, e assim
sucessivamente para as demais amostras analisadas na pesquisa.
Para facilitar ainda mais a interpretação, a frequência pode ser organizada em uma tabela
resultado.
https://univirtus.uninter.com/ava/web/roa/ 8/30
10/05/2022 21:08 UNINTER
apresentados na pesquisa e a segunda com a frequência com que cada dado aparece. Em nossa
pesquisa, os dados se referem aos defeitos. Dessa forma, temos a seguinte tabela de distribuição de
frequência:
14 4
15 7
16 5
17 2
18 1
19 1
apresentaram 14 peças com defeitos, 7 amostras apresentaram 15 peças com defeitos, 5 amostras
apresentaram 16 peças com defeitos, 2 amostras apresentaram 17 defeitos, 1 amostra apresentou 18
acumulada (fa), é o somatório das frequências. Para calcular, repetimos o primeiro valor e somamos
com o próximo até a última frequência. Verifique na tabela abaixo o cálculo da frequência acumulada
com base em nosso exemplo:
https://univirtus.uninter.com/ava/web/roa/ 9/30
10/05/2022 21:08 UNINTER
Observe que o valor final encontrado na frequência acumulada sempre é igual à quantidade de
dados que temos na pesquisa. Se contarmos a quantidade de valores fornecidos no dado bruto,
temos 20 dados, que é exatamente o valor final que encontramos.
Atrelado ao conceito de frequência absoluta, temos o conceito de frequência relativa (fr) de uma
variável, que é a divisão entre a frequência absoluta (f) e o número de elementos (N) da amostra, ou
seja:
No nosso exemplo, temos N = 20, assim calculamos a frequência relativa dividindo cada
frequência por 20 e depois multiplicando o valor por 100 para encontrarmos o resultado em
https://univirtus.uninter.com/ava/web/roa/ 10/30
10/05/2022 21:08 UNINTER
Total 20 100%
podemos realizar várias análises. No nosso exemplo, podemos ter as seguintes perguntas:
defeitos menor ou igual a 16, significa que podemos ter quantidade de defeitos de 14, 15 e 16,
seguir:
qual é a porc
https://univirtus.uninter.com/ava/web/roa/ 11/30
10/05/2022 21:08 UNINTER
defeitos, somando a frequência relativa, temos um total de 80% (20% + 35% + 25% = 80%), ou seja,
80% das amostras apresentaram quantidade de defeitos menor ou igual a 16, conforme tabela a
seguir:
Novamente, utilizamos a frequência relativa, pois foi solicitada a porcentagem de defeitos que
aparecem com maior frequência. Para encontrar o resultado, verificamos qual é a quantidade de
defeitos que apresenta maior porcentagem, que nesse caso é 15, que representa 35% das amostras:
https://univirtus.uninter.com/ava/web/roa/ 12/30
10/05/2022 21:08 UNINTER
informações. Dessa forma, podemos utilizá-la nas diferentes pesquisas realizadas tanto com dados
frequencia-.htm>.
Você já respondeu alguma pesquisa em que não é perguntada a sua idade, mas sim a faixa de
idade em que você se encontra? Por exemplo, não respondemos que temos 25 anos e, sim, que
temos entre 20 e 30 anos de idade. A mesma situação pode ocorrer quando a pesquisa gira em torno
de salário; não respondemos o valor do salário que recebemos e, sim, a faixa salarial, ou seja, que
Imagine realizar uma pesquisa em relação à idade de um grupo de 1.000 pessoas. Quantas
idades diferentes podem aparecer? Nesse caso, se utilizarmos a tabela de distribuição de frequência,
teremos muitas linhas que equivalem às idades diferentes que aparecerão na pesquisa. Segundo
Castanheira (2010), quando o número de resultados obtidos em uma pesquisa é demasiadamente
https://univirtus.uninter.com/ava/web/roa/ 13/30
10/05/2022 21:08 UNINTER
intervalos.
100 pessoas:
Classe f
0 |-- 10 20
10 |-- 20 30
20 |-- 30 40
30 |-- 40 10
Verificamos que essa tabela possui, na primeira coluna, faixas de valores e não apenas um valor
como a distribuição de frequência. Quando isso ocorre, chamamos de distribuição de frequência por
classe: é o intervalo do grupo. A tabela indica que 20 pessoas têm entre 0 e 10 anos e 40
pessoas têm entre 20 e 30 anos. O primeiro grupo é a primeira classe (de zero a 10), a segunda
linha é a segunda classe (10 a 20), e assim por diante. Essa tabela é formada por 4 classes;
os limites de um intervalo ou classe são os números extremos de cada intervalo ou classe. Aos
valores à esquerda de cada classe, damos o nome de limite inferior (Li), e aos valores à direita,
limite superior (Ls). Na primeira classe, temos:
0 – limite inferior
10 – limite superior
o símbolo ├ representa que a classe ou o intervalo é fechado à esquerda, ou seja, significa que
o limite inferior pertence ao intervalo, e, aberto à direita, então, o limite superior não pertence
ao intervalo. Analisando a segunda classe 10|--- 20 temos que 10 faz parte da segunda classe e
https://univirtus.uninter.com/ava/web/roa/ 14/30
10/05/2022 21:08 UNINTER
não da primeira, já o 20 não faz parte da segunda classe, mas está sendo considerado na
terceira. Qualquer que seja a idade ela se encaixa em apenas um dos intervalos.
A = Ls –Li
Na segunda classe, temos uma amplitude igual a 10, ou seja, A = 20 – 10 = 10. Se calcularmos a
amplitude para as demais classes, observaremos que todas as classes têm a mesma amplitude, então,
na distribuição de frequência apresentada, as classes têm amplitude igual a 10, ou seja, A = 10.
Quando trabalhamos com uma distribuição de frequência por classe ou intervalo, assumimos
que para todo intervalo o resultado é um valor único igual ao ponto médio da classe ou intervalo
(Pm), que é a soma do limite superior (Ls) com o limite inferior (Li) dividido por 2, ou seja, o
Classe f PM
0 |-- 10 20 5
10 |-- 20 30 15
20 |-- 30 40 25
https://univirtus.uninter.com/ava/web/roa/ 15/30
10/05/2022 21:08 UNINTER
30 |-- 40 10 35
quantidade de dados, mas vale lembrar que quando agrupamos os dados em faixa de valores não
número de classes =
Recomenda-se que o número mínimo de intervalos seja igual a 5 e o número máximo, igual a 20,
o que facilitará a construção da tabela com um mínimo de precisão e de informação. Lembrando que
funcionários de uma determinada empresa e construa uma tabela de distribuição por classe.
Dados brutos:
https://univirtus.uninter.com/ava/web/roa/ 16/30
10/05/2022 21:08 UNINTER
24 23 22 28 35 21 23 23 33 34
24 21 25 36 26 22 30 32 25 26
33 34 21 31 25 31 26 25 35 33
21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31
31 32 33 33 33 34 34 35 35 36
Verificamos no Rol qual é o maior e qual é o menor valor encontrado nessa pesquisa e depois
Maior valor = 36
Menor valor = 21
amplitude total = 36 – 21 = 15
3. determine o número de classes: temos dois métodos e podemos escolher um deles para
aplicação. Em nosso exemplo, resolveremos das duas formas para verificar as diferenças no
cálculo:
número de classes =
No exemplo, a amostra é igual a 30, que é a quantidade de dados apresentados nos dados
brutos.
número de classes =
https://univirtus.uninter.com/ava/web/roa/ 17/30
10/05/2022 21:08 UNINTER
i 1+3,3.log n
i = 1+3,3.log 30
i = 1+3,3.1,47712
i = 1+ 4,87450
i = 5,87450 = 6
Nos dois métodos, arredondamos o valor obtido para o inteiro mais próximo à maior e
obtivemos o mesmo número de classe. Assim, nossa distribuição vai conter 6 classes.
Amplitude total = 15
Número de classes = 6
Sempre que a divisão resultar em um número não inteiro, arredonde para o inteiro mais
próximo, maior que o encontrado na divisão. Dessa forma, nossa distribuição terá uma amplitude de
classe igual a 3.
rol:
https://univirtus.uninter.com/ava/web/roa/ 18/30
10/05/2022 21:08 UNINTER
21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31
31 32 33 33 33 34 34 35 35 36
Como nossa amplitude das classes é igual a 3, significa que precisamos agrupar os valores de 3
primeira classe, consideramos o primeiro valor, que é 21, ou seja, nosso limite inferior. Para encontrar
o limite superior, somamos 3 e temos 24. Na segunda, seguimos o mesmo raciocínio, mas agora
começando em 24 mais 3. O limite superior será 27. Siga esse procedimento até chegar em 6 classes,
Para encontrar a frequência de cada classe, verificamos quantas vezes os números daquela classe
aparece. Por exemplo, na primeira classe, o limite inferior é 21 fechado, ou seja, contamos o 21, mas
o superior é 24 aberto, não sendo considerado no cálculo da frequência. Assim, contamos apenas os
valores 21, 22 e 23. Verificamos quantas vezes esses valores aparecem, ou seja, a frequência desses
valores é igual a 8. Fazemos esse procedimento para todos os valores do rol e, em seguida,
Classe f
21 |-- 24 8
24 |-- 27 9
27 |-- 30 1
30 |-- 33 4
33 |-- 36 7
36 |-- 39 1
Total 30
https://univirtus.uninter.com/ava/web/roa/ 19/30
10/05/2022 21:08 UNINTER
Analisaremos mais um exemplo em que temos uma tabela que representa o tempo (segundos)
para inicialização de um aplicativo. Com base nos dados brutos e os passos apresentados
anteriormente, elabore a tabela de distribuição de frequência por classe e intervalos para praticar o
3,5 1,9 2,1 1,6 3,1 1,0 1,4 1,8 1,2 1,3
0,8 1,1 0,5 2,5 1,3 0,7 1,7 1,4 1,3 1,6
Rol:
0,5 0,7 0,8 1,0 1,1 1,2 1,3 1,3 1,3 1,4
1,4 1,6 1,6 1,7 1,8 1,9 2,1 2,5 3,1 3,5
Distribuição de frequência:
Tempo (s) f
Observação: para elaborar a tabela foi utilizado no cálculo do número de classes a raiz
quadrada da amostra. Caso utilize o método de Sturges, é possível elaborar a tabela com 6 classes.
https://univirtus.uninter.com/ava/web/roa/ 20/30
10/05/2022 21:08 UNINTER
Uma das fases do método estatístico, estudado no Tema 1, é a apresentação de dados em que
podemos utilizar tabelas e gráficos para auxiliar na obtenção das conclusões que servirão de base
para a tomada de decisão. Os gráficos têm como finalidade representar os resultados de forma
simples, permitindo uma leitura rápida e global dos fenômenos estudados. Demonstra a evolução do
fenômeno em estudo, e permite observar a relação dos valores da série, representar a relação entre
tipo de série. De acordo com Castanheira (2010), série estatística é a denominação que se dá a uma
tabela na qual há um critério distinto que a especifica e a diferencia. Para diferenciar uma série
estatística de outra, temos que levar em consideração três fatores: tempo, local e espécie. Assim, as
séries estatísticas são classificadas em:
faturamento mensal.
ou mais regiões. Exemplo: produção por região, venda por cidade, faturamento por estado.
https://univirtus.uninter.com/ava/web/roa/ 21/30
10/05/2022 21:08 UNINTER
séries mistas, conjugadas ou tabelas de dupla entrada: combinação entre as séries temporais,
geográficas e específicas. Exemplo: faturamento mensal dividido por estados, veículos vendidos
Tabela 4 – Evolução da arrecadação de IPVA, em milhões de reais, nos Estados do Sul do Brasil, de
2002 a 2005
https://univirtus.uninter.com/ava/web/roa/ 22/30
10/05/2022 21:08 UNINTER
Fonte: SEFA/RS/SC/PR
Com base nos diferentes tipos de série, podemos indicar a utilização de cada tipo de gráficos. Os
principais são:
linhas: representa observações feitas ao longo do tempo e são utilizadas nas chamadas séries
históricas ou temporais.
https://univirtus.uninter.com/ava/web/roa/ 23/30
10/05/2022 21:08 UNINTER
setores: dividem em setores os termos da série e é mais utilizado para séries específicas ou
geográficas com pequeno número de termos e quando se quer salientar a proporção de cada
termo em relação ao todo. Esse gráfico também é conhecido como gráfico em forma de pizza.
https://univirtus.uninter.com/ava/web/roa/ 24/30
10/05/2022 21:08 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 25/30
10/05/2022 21:08 UNINTER
Segundo Martins (2010), o gráfico de barras e o gráfico em forma de pizza são os gráficos mais
comuns para a descrição de dados oriundos de variáveis qualitativas. Basicamente, eles mostram as
frequências de observações para cada nível, ou categoria, da variável que se deseja descrever.
Figura 9 – Histograma
https://univirtus.uninter.com/ava/web/roa/ 26/30
10/05/2022 21:08 UNINTER
iniciamos com 2, que é a nossa menor frequência, e vamos até 13, que é a maior frequência.
https://univirtus.uninter.com/ava/web/roa/ 27/30
10/05/2022 21:08 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 28/30
10/05/2022 21:08 UNINTER
Tempo (s) f
Na elaboração dos gráficos, precisamos indicar os seguintes elementos: título, escala e fonte que
forneceu os dados (que deve ser exibida no rodapé do gráfico). Esses elementos são importantes,
FINALIZANDO
Nesta aula, verificamos que a estatística é dividida em estatística descritiva e estatística indutiva.
Vimos também que, para gerar informações, utilizamos o método estatístico, que é composto de
Estudamos os tipos de variáveis que podem aparecer em uma pesquisa, como organizar um
dado bruto, elaborar uma distribuição de frequência, calcular frequência acumulada e relativa além
da interpretação dos resultados obtidos. Observamos, ainda, a construção e diferenças entre uma
distribuição de frequência e distribuição de frequência por classe ou intervalos.
https://univirtus.uninter.com/ava/web/roa/ 29/30
10/05/2022 21:08 UNINTER
Fechando a nossa aula estudamos os tipos de séries e gráficos que facilitam a compreensão,
REFERÊNCIAS
LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Pearson, 2004.
NOÉ, M. Aplicação de estatística: frequência absoluta e frequência relativa. Brasil Escola, S.d.
Disponível em: <https://brasilescola.uol.com.br/matematica/aplicacao-estatistica-frequencia-
Pearson, 2009.
https://univirtus.uninter.com/ava/web/roa/ 30/30