Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
ESTATÍSTICA
● Introdução:
Neste trabalho iremos abordar a temática estatística, explicaremos a sua
importância e como é um instrumento indispensável na sociedade. Para a realização
deste trabalho recorremos a um inquérito e também ao manual de matemática A
Máximo 11 parte 2 .
● O que é estatística e a sua importância ?
A estatística, em latim “estado”, é um ramo da matemática que se dedica ao estudo
e análise de dados, fornecidos pelas diversas entidades e organismos . Esta
desempenha um papel fundamental em vários campos da atividade humana e
mantém uma posição central em quase todos os campos, como por exemplo nas
indústrias, física, química, economia, ciência, ...
Indústrias - Na recolha e análise dos dados e testes de hipóteses são utilizados
métodos estatísticos que nos permitem assim observar a relação oferta e procura,as
importações e exportações ,a taxa de inflação como outras razões que requerem
conhecimentos de estatística.
Economia- são os métodos estatísticos ,como a média e a mediana, que nos
permite tirar determinadas conclusões sobre a amostra em análise
Ciências- os métodos estatísticos são recorrentemente utilizados na análise dos
resultados das experiências, de modo a testar o seu significado nas diversas áreas
do conhecimento.
A estatística é uma grande complexidade de problemas que não permitem uma
solução através de um único modelo, isto é, surge com uma resposta exata. Para
conseguirmos resolver estes problemas, é necessário utilizarmos alguns conjuntos de
instrumentos e técnicas que nos dão resposta aproximadas com níveis de erro controlados.
A estatística também é a ciência que se baseia em noções e princípios bem definidos,
e tem como base um conjunto de objetos que possuem algumas características em comum.
● Variável estatística
A variável estatística é toda a característica que admite diferentes valores (um
número ou uma modalidade), um por cada variável estatísticas
Variável qualitativa- são aquelas que se baseiam em qualidades e não se pode
contar ou medir. Podendo assumir várias modalidades ou categorias. Como por
estado social, código postal, cor preferida, …
1
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
Dentro destas temos as qualitativas nominais e as qualitativas ordinais
❖ qualitativa nominal- são variáveis qualitativas que não são ordenáveis
como por exemplo a religião, o sexo,...
❖ qualitativa ordinal- ao contrário das anteriores estas podem ser
ordenadas, como por exemplo as classes sociais, …
Variável quantitativa- são aquelas que se referem a características suscetíveis de
ser medidas ou contadas. Como por exemplo velocidade média de um automóvel,
idade, número de irmãos,…
Dentro destas temos as quantitativas discretas e quantitativas contínuas
❖ quantitativa discreta- Referem-se a características que se podem contar
mas não se podem medir. Estas assumem um número finito ou número
infinito enumerável de valores. Como por exemplo número de peças
avariadas , número de acidentes por ano e número de nascimentos.
❖ quantitativa contínua - referem-se a características que se podem medir.
Estas assumem valores de um intervalo ou de uma coleção de intervalos.
Como por exemplo tempo, distâncias, peso ou altura.
● Medidas de localização:
Utilizamos constantemente medidas estatísticas para entender o mundo ao nosso
redor, uma vez que estas medidas permitem resumir de forma simples um conjunto
de dados. Essas medidas são a mediana, moda, média percentis e quartis.
★ Percentis- Os percentis são medidas que dividem a amostra ordenada em
100 partes, cada uma com uma percentagem de dados aproximadamente
igual .Esta medida é muito usada no quotidiano. Como por exemplo quando
uma mãe leva o seu filho ao pediatra fica a saber se ele está no percentil
adequado a sua idade.
○ Percentil para dados simples - Dado n∈IN,uma amostra x= (𝑥1,
𝑥2, ..., 𝑥𝑛) e um numero natural do intervalo ]0,100], designa-se por
percentual de ordem k, e representa-se por 𝑃𝑘:
- O valor máximo da amostra se k = 100
𝑘𝑛 𝑘𝑛
- a média dos elementos de ordem 100
e 100
+ 1 na amostra
𝑘𝑛
de ordenada, se 𝑘 ≠ 100 e 100
for inteiro;
𝑘𝑛 𝑘𝑛
- O elemento de ordem ⎡ ⎤ + 1 na amostra, se não
⎣ 100 ⎦ 100
inteiro;
Interpretação de 𝑃𝑘
2
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
Sendo 𝑃𝑘 o percentil de ordem de ordem 𝑘 significa que, pelo menos, 𝑘% das
unidades estatísticas da amostra têm valores inferiores ou iguais a 𝑃𝑘 ou que, no
máximo, (100-𝑘)% têm valores superiores a 𝑃𝑘.
○ Percentil para dados agrupados em classes- Para dados
agrupados em classes, 𝑃𝑘 determina-se utilizando o respectivo
histograma. Se desenharmos uma linha vertical que contém a
mediana, a área do histograma fica dividida em duas partes iguais.
Percentil ordem 𝑘
O percentil de ordem 𝑘, 𝑃𝑘, é o ponto do eixo horizontal para o qual a área
acumulada dos retângulos do histograma que estão à sua esquerda, acrescida da
área do retângulo que o ponto determina na classe a que pertence, é igual a 𝑘% da
área total do histograma.
★ Quartis- Os quartis são medidas de localização que dividem a amostra de
dados de tipo quantitativo, em quatro partes, cada uma com uma
percentagem de dados aproximadamente igual.
○ O 1º quartil, representado por Q1 ou 3º quartil, representado por Q3
são medidas que localizam alguns pontos da distribuição dos dados
de tal forma que:
■ Aproximadamente 25% dos dados são inferiores ou iguais a
Q1;
■ Aproximadamente 25% dos dados são superiores ou iguais a
Q3
■ Os restantes dados, aproximadamente 50%, situam-se entre
Q1 e Q3.
De um modo geral, quando nos referimos aos quartis, estamos a referir-nos ao 1º e
3º quartis, uma vez que o 2º quartil é designado por mediana.
★ Mediana- A mediana é o valor de centro de um conjunto de dados. A
mediana de uma amostra, que se representa por𝑀𝑒 é o percentil 50. Deste
modo, para determinar a mediana de um conjunto de dados determina-se
𝑃50.
3
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
○ O primeiro passo que se deve seguir para calcular a mediana é
ordenar o conjunto de dados em ordem crescente. Se o número de
elementos for par, a mediana é a média dos dois valores centrais. Se
o número de elementos for ímpar, a mediana é o valor central.
★ Média- A média de um conjunto de dados numéricos é o número que se
obtém dividindo a soma dos respetivos valores pelo número total de dados e
representa-se por 𝑥.
Nota: A soma de um conjunto de dados numéricos é igual ao produto da média pelo número
de dados.
○ Se os dados já são apresentados em classes e não temos acesso
aos dados originais, então não podemos calcular o valor exato da
média. No entanto se os dados estiverem agrupados em classes, o
valor aproximado da média calcula-se usando a fórmula anterior, mas
considerando para 𝑥𝑖 o ponto médio da respectiva classe i.
𝑘
∑ 𝑛𝑖 𝑥𝑖
○ 𝑥= 𝑖=1 𝑛
➢ 𝑘 é o número de classes do agrupamento;
➢ 𝑛𝑖 é a frequência absoluta da classe i ;
➢ 𝑥𝑖 é o ponto médio da classe i (𝑥𝑖 é considerado o elemento representativo da
classe)
𝑘
➢ 𝑛= ∑ 𝑛𝑖
𝑖=1
○ Propriedades da média
➢ Propriedade 1- A média situa-se entre o máximo e o mínimo da
amostra e não pode ser igual ao mínimo sem ser também igual ao
máximo, o que acontece se e somente se a amostra for constante.
➢ Propriedade 2- acionando-se a cada um dos valores 𝑥𝑖, uma
constante h (h≠0), a nova média será igual à média original
adicionada de h.
➢ Propriedade 3 - Multiplicando 𝑥𝑖 por uma constante a (a≠0), a nova
média será igual ao produto da média original por a.
★ Moda- A moda de um conjunto de dados quantitativos/qualitativos é a
categoria/classe com maior frequência absoluta. Esta é uma medida de
redução de dados de natureza qualitativa.
4
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
Para um conjunto de dados, pode existir mais que uma moda ou até mesmo
nenhuma.
○ Se o conjunto de dados reúne uma única moda, então esse conjunto
designa-se por unimodal
○ Se o conjunto de dados reúne duas modas, então designa-se por
bimodal.
○ Se o conjunto de dados reunir mais que duas modas, diz-se
multimodal
○ Se o conjunto de dados não reúne moda, designa-se por amodal
Nota: Quando os dados são exprimidos sob a forma de categorias ou nomes, não é
possível calcular a média, e se não forem suscetíveis de ordenação, também não é
possível indicar a sua mediana
○ Classe modal - Quando os dados são apresentados em classes, com
intervalos de igual amplitude, chama-se classe modal à classe com maior
frequência. Também pode ocorrer situações em que há mais que uma classe
com maior frequência.
● Medidas de dispersão:
Como as medidas de localização não caracterizam a dispersão ou a
variabilidade dos dados de uma amostra, então é necessário considerar
medidas estatísticas para medir a dispersão de dados de uma amostra, ou
seja, são usadas para obter o grau de variabilidade dos elementos de um
conjunto de informações. Essas medidas são a amplitude, amplitude
interquartil, variância e desvio-padrão.
★ Amplitude- A amplitude de um conjunto de dados numéricos é a
diferença entre o valor máximo e o valor mínimo desse conjunto de
dados
★ Amplitude Interquartil- Chama-se amplitude interquartis à diferença
entre o 3º e o 1º quartis.
5
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
★ Variância e desvio-padrão- são medidas que indicam a
regularidade de um conjunto de dados em função da média
aritmética.
○ Variância- é uma medida de dispersão que mostra o quão
distante cada valor desse conjunto está do valor médio, ou
seja, é a média dos quadrados dos desvios das observações
em relação à média da amostra. Esta medida representa-se
2
por 𝑠𝑥
○ Desvio-padrão- é calculado através da variância, indica qual
é o “erro” se quiséssemos substituir um dos valores coletados
pelo valor da média e está relacionado com o aspecto gráfico.
Este representa-se por 𝑠𝑥
Dados 𝑛∈ℕ (𝑛 > 1) e uma amostra 𝑥
2 𝑆𝑆𝑥
variância - 𝑠𝑥 = 𝑛−1
𝑆𝑆𝑥
Desvio-padrão - 𝑠𝑥= 𝑛− 1
Nota: quanto maior é o desvio-padrão maior é a dispersão dos dados.
● Distribuições bidimensionais:
★ Diagrama de dispersão- Um diagrama de dispersão é uma representação
gráfica para os dados bivariados, em que cada par de dados 𝑥𝑖, 𝑦𝑖 é ( )
( )
representado por um ponto de coordenadas 𝑥𝑖, 𝑦𝑖 , num sistema de eixos
coordenados.
Nota: Quando queremos estudar duas características ao mesmo tempo, os dados
observados aparecem sobre a forma de pares de valores, ou seja , cada indivíduo
ou resultado experimental contribui com um conjunto de dois valores. E a esse par
de variáveis chamamos dados bivariados.
○ Análise gráfica de dados bidimensionais
- Variáveis positivamente associadas- observando o gráfico abaixo,
verifica-se que, em média, quando a variável x aumenta, a variável y também
aumenta. Ao traçar a reta que “ melhor se aproxima” de todos os pontos do
gráfico, podemos verificar que a reta tem declive positivo.
6
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
- Variáveis negativamente associadas- Verifica-se que, em média, quando a
variável x aumenta, a variável diminui. Como vemos no gráfico abaixo
- Não há associação clara entre as variáveis- Verifica-se que a nuvem de
pontos se encontra bastante dispersa, o que faz prever que não existe uma
associação clara entre as duas variáveis,como observamos no gráfico
abaixo.
★ Coeficiente de correlação- O coeficiente de correlação é uma estatística
que quantifica o grau de associação entre duas variáveis. Esta estatística
representa-se por r que pode ser determinado pela seguinte fórmula:
𝑛
∑ (𝑥𝑖−𝑥)(𝑦𝑖−𝑦)
𝑖=1
𝑟=
𝑛 𝑛
⎡ 2⎤⎡ 2⎤
⎢ ∑ (𝑥 −𝑥) ⎥⎢ ∑ (𝑦 −𝑦) ⎥
⎢𝑖=1 𝑖 ⎥⎢𝑖=1 𝑖 ⎥
⎣ ⎦⎣ ⎦
● Propriedades do quociente de correlação:
1. Os valores do coeficiente de correlação variam entre -1 e 1;
2. Quanto maior for o valor absoluto de r, mais forte será a relação linear
existente entre as variáveis;
3. Se r é positivo significa que existe uma associação entre as variáveis;
4. Se r é negativo, significa que existe uma associação negativa entre as
variáveis;
5. A correlação não é afetada por uma mudança de unidades das
variáveis
7
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
○ Interpretação geométrica do coeficiente de correlação linear
r> 0
Aos maiores valores de x correspondem os maiores valores de y.
Os produtos
(𝑥 − 𝑥)(𝑦 − 𝑦)
𝑖 𝑖
são, de um modo geral, positivos
r< 0
Aos maiores valores de uma variável estão associados, de um modo
geral, os menores valores da outra variável.
Os produtos
(𝑥 − 𝑥)(𝑦 − 𝑦)
𝑖 𝑖
são, de um modo geral, negativos
r= 0
Não existe correlação linear entre os valores de x e os valores de y.
★ Reta de regressão- Dá-se o nome de reta de regressão à reta junto à qual
os pontos de um diagrama de dispersão estão colocados. Um dos critérios
para definir esta reta é o tornar mínima a soma dos quadrados dos desvios
dos pontos em relação é reta
8
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626
Nota : a reta de regressão pode não passar por qualquer dos pontos do
diagrama de dispersão.
Fontes:
https://estat.com.br/2020/10/30/a-importancia-da-estatistica/ 12/04
https://mundoeducacao.uol.com.br/matematica/estatistica.htm
https://wikiciencias.casadasciencias.org/wiki/index.php/Vari%C3%A1vel_(Estat%C3
%ADstica)
https://matematicabasica.net/media-moda-e-mediana/
https://wikiciencias.casadasciencias.org/wiki/index.php/Quartis