0% acharam este documento útil (0 voto)
24 visualizações9 páginas

Importância da Estatística na Análise de Dados

Este documento discute conceitos estatísticos básicos como variáveis, medidas de localização e suas aplicações. Aborda variáveis qualitativas e quantitativas, e medidas como média, mediana, percentis e quartis que são usadas para resumir e analisar conjuntos de dados.

Enviado por

Regina Amorim
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
24 visualizações9 páginas

Importância da Estatística na Análise de Dados

Este documento discute conceitos estatísticos básicos como variáveis, medidas de localização e suas aplicações. Aborda variáveis qualitativas e quantitativas, e medidas como média, mediana, percentis e quartis que são usadas para resumir e analisar conjuntos de dados.

Enviado por

Regina Amorim
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Agrupamento de Escolas de Ponte da

Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

ESTATÍSTICA
● Introdução:

Neste trabalho iremos abordar a temática estatística, explicaremos a sua


importância e como é um instrumento indispensável na sociedade. Para a realização
deste trabalho recorremos a um inquérito e também ao manual de matemática A
Máximo 11 parte 2 .

● O que é estatística e a sua importância ?


A estatística, em latim “estado”, é um ramo da matemática que se dedica ao estudo
e análise de dados, fornecidos pelas diversas entidades e organismos . Esta
desempenha um papel fundamental em vários campos da atividade humana e
mantém uma posição central em quase todos os campos, como por exemplo nas
indústrias, física, química, economia, ciência, ...

Indústrias - Na recolha e análise dos dados e testes de hipóteses são utilizados


métodos estatísticos que nos permitem assim observar a relação oferta e procura,as
importações e exportações ,a taxa de inflação como outras razões que requerem
conhecimentos de estatística.

Economia- são os métodos estatísticos ,como a média e a mediana, que nos


permite tirar determinadas conclusões sobre a amostra em análise

Ciências- os métodos estatísticos são recorrentemente utilizados na análise dos


resultados das experiências, de modo a testar o seu significado nas diversas áreas
do conhecimento.

A estatística é uma grande complexidade de problemas que não permitem uma


solução através de um único modelo, isto é, surge com uma resposta exata. Para
conseguirmos resolver estes problemas, é necessário utilizarmos alguns conjuntos de
instrumentos e técnicas que nos dão resposta aproximadas com níveis de erro controlados.

A estatística também é a ciência que se baseia em noções e princípios bem definidos,


e tem como base um conjunto de objetos que possuem algumas características em comum.

● Variável estatística
A variável estatística é toda a característica que admite diferentes valores (um
número ou uma modalidade), um por cada variável estatísticas
Variável qualitativa- são aquelas que se baseiam em qualidades e não se pode
contar ou medir. Podendo assumir várias modalidades ou categorias. Como por
estado social, código postal, cor preferida, …

1
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

Dentro destas temos as qualitativas nominais e as qualitativas ordinais

❖ qualitativa nominal- são variáveis qualitativas que não são ordenáveis


como por exemplo a religião, o sexo,...
❖ qualitativa ordinal- ao contrário das anteriores estas podem ser
ordenadas, como por exemplo as classes sociais, …

Variável quantitativa- são aquelas que se referem a características suscetíveis de


ser medidas ou contadas. Como por exemplo velocidade média de um automóvel,
idade, número de irmãos,…

Dentro destas temos as quantitativas discretas e quantitativas contínuas


❖ quantitativa discreta- Referem-se a características que se podem contar
mas não se podem medir. Estas assumem um número finito ou número
infinito enumerável de valores. Como por exemplo número de peças
avariadas , número de acidentes por ano e número de nascimentos.
❖ quantitativa contínua - referem-se a características que se podem medir.
Estas assumem valores de um intervalo ou de uma coleção de intervalos.
Como por exemplo tempo, distâncias, peso ou altura.

● Medidas de localização:

Utilizamos constantemente medidas estatísticas para entender o mundo ao nosso


redor, uma vez que estas medidas permitem resumir de forma simples um conjunto
de dados. Essas medidas são a mediana, moda, média percentis e quartis.

★ Percentis- Os percentis são medidas que dividem a amostra ordenada em


100 partes, cada uma com uma percentagem de dados aproximadamente
igual .Esta medida é muito usada no quotidiano. Como por exemplo quando
uma mãe leva o seu filho ao pediatra fica a saber se ele está no percentil
adequado a sua idade.
○ Percentil para dados simples - Dado n∈IN,uma amostra x= (𝑥1,
𝑥2, ..., 𝑥𝑛) e um numero natural do intervalo ]0,100], designa-se por
percentual de ordem k, e representa-se por 𝑃𝑘:
- O valor máximo da amostra se k = 100
𝑘𝑛 𝑘𝑛
- a média dos elementos de ordem 100
e 100
+ 1 na amostra
𝑘𝑛
de ordenada, se 𝑘 ≠ 100 e 100
for inteiro;
𝑘𝑛 𝑘𝑛
- O elemento de ordem ⎡ ⎤ + 1 na amostra, se não
⎣ 100 ⎦ 100
inteiro;
Interpretação de 𝑃𝑘

2
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

Sendo 𝑃𝑘 o percentil de ordem de ordem 𝑘 significa que, pelo menos, 𝑘% das


unidades estatísticas da amostra têm valores inferiores ou iguais a 𝑃𝑘 ou que, no
máximo, (100-𝑘)% têm valores superiores a 𝑃𝑘.

○ Percentil para dados agrupados em classes- Para dados


agrupados em classes, 𝑃𝑘 determina-se utilizando o respectivo
histograma. Se desenharmos uma linha vertical que contém a
mediana, a área do histograma fica dividida em duas partes iguais.
Percentil ordem 𝑘

O percentil de ordem 𝑘, 𝑃𝑘, é o ponto do eixo horizontal para o qual a área


acumulada dos retângulos do histograma que estão à sua esquerda, acrescida da
área do retângulo que o ponto determina na classe a que pertence, é igual a 𝑘% da
área total do histograma.

★ Quartis- Os quartis são medidas de localização que dividem a amostra de


dados de tipo quantitativo, em quatro partes, cada uma com uma
percentagem de dados aproximadamente igual.

○ O 1º quartil, representado por Q1 ou 3º quartil, representado por Q3


são medidas que localizam alguns pontos da distribuição dos dados
de tal forma que:

■ Aproximadamente 25% dos dados são inferiores ou iguais a


Q1;

■ Aproximadamente 25% dos dados são superiores ou iguais a


Q3

■ Os restantes dados, aproximadamente 50%, situam-se entre


Q1 e Q3.

De um modo geral, quando nos referimos aos quartis, estamos a referir-nos ao 1º e


3º quartis, uma vez que o 2º quartil é designado por mediana.

★ Mediana- A mediana é o valor de centro de um conjunto de dados. A


mediana de uma amostra, que se representa por𝑀𝑒 é o percentil 50. Deste
modo, para determinar a mediana de um conjunto de dados determina-se
𝑃50.

3
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

○ O primeiro passo que se deve seguir para calcular a mediana é


ordenar o conjunto de dados em ordem crescente. Se o número de
elementos for par, a mediana é a média dos dois valores centrais. Se
o número de elementos for ímpar, a mediana é o valor central.

★ Média- A média de um conjunto de dados numéricos é o número que se


obtém dividindo a soma dos respetivos valores pelo número total de dados e
representa-se por 𝑥.

Nota: A soma de um conjunto de dados numéricos é igual ao produto da média pelo número
de dados.

○ Se os dados já são apresentados em classes e não temos acesso


aos dados originais, então não podemos calcular o valor exato da
média. No entanto se os dados estiverem agrupados em classes, o
valor aproximado da média calcula-se usando a fórmula anterior, mas
considerando para 𝑥𝑖 o ponto médio da respectiva classe i.
𝑘
∑ 𝑛𝑖 𝑥𝑖
○ 𝑥= 𝑖=1 𝑛
➢ 𝑘 é o número de classes do agrupamento;
➢ 𝑛𝑖 é a frequência absoluta da classe i ;
➢ 𝑥𝑖 é o ponto médio da classe i (𝑥𝑖 é considerado o elemento representativo da
classe)
𝑘
➢ 𝑛= ∑ 𝑛𝑖
𝑖=1

○ Propriedades da média

➢ Propriedade 1- A média situa-se entre o máximo e o mínimo da


amostra e não pode ser igual ao mínimo sem ser também igual ao
máximo, o que acontece se e somente se a amostra for constante.
➢ Propriedade 2- acionando-se a cada um dos valores 𝑥𝑖, uma
constante h (h≠0), a nova média será igual à média original
adicionada de h.
➢ Propriedade 3 - Multiplicando 𝑥𝑖 por uma constante a (a≠0), a nova
média será igual ao produto da média original por a.

★ Moda- A moda de um conjunto de dados quantitativos/qualitativos é a


categoria/classe com maior frequência absoluta. Esta é uma medida de
redução de dados de natureza qualitativa.

4
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

Para um conjunto de dados, pode existir mais que uma moda ou até mesmo
nenhuma.
○ Se o conjunto de dados reúne uma única moda, então esse conjunto
designa-se por unimodal
○ Se o conjunto de dados reúne duas modas, então designa-se por
bimodal.
○ Se o conjunto de dados reunir mais que duas modas, diz-se
multimodal
○ Se o conjunto de dados não reúne moda, designa-se por amodal

Nota: Quando os dados são exprimidos sob a forma de categorias ou nomes, não é
possível calcular a média, e se não forem suscetíveis de ordenação, também não é
possível indicar a sua mediana

○ Classe modal - Quando os dados são apresentados em classes, com


intervalos de igual amplitude, chama-se classe modal à classe com maior
frequência. Também pode ocorrer situações em que há mais que uma classe
com maior frequência.

● Medidas de dispersão:

Como as medidas de localização não caracterizam a dispersão ou a


variabilidade dos dados de uma amostra, então é necessário considerar
medidas estatísticas para medir a dispersão de dados de uma amostra, ou
seja, são usadas para obter o grau de variabilidade dos elementos de um
conjunto de informações. Essas medidas são a amplitude, amplitude
interquartil, variância e desvio-padrão.

★ Amplitude- A amplitude de um conjunto de dados numéricos é a


diferença entre o valor máximo e o valor mínimo desse conjunto de
dados

★ Amplitude Interquartil- Chama-se amplitude interquartis à diferença


entre o 3º e o 1º quartis.

5
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

★ Variância e desvio-padrão- são medidas que indicam a


regularidade de um conjunto de dados em função da média
aritmética.
○ Variância- é uma medida de dispersão que mostra o quão
distante cada valor desse conjunto está do valor médio, ou
seja, é a média dos quadrados dos desvios das observações
em relação à média da amostra. Esta medida representa-se
2
por 𝑠𝑥

○ Desvio-padrão- é calculado através da variância, indica qual


é o “erro” se quiséssemos substituir um dos valores coletados
pelo valor da média e está relacionado com o aspecto gráfico.
Este representa-se por 𝑠𝑥
Dados 𝑛∈ℕ (𝑛 > 1) e uma amostra 𝑥
2 𝑆𝑆𝑥
variância - 𝑠𝑥 = 𝑛−1

𝑆𝑆𝑥
Desvio-padrão - 𝑠𝑥= 𝑛− 1
Nota: quanto maior é o desvio-padrão maior é a dispersão dos dados.

● Distribuições bidimensionais:

★ Diagrama de dispersão- Um diagrama de dispersão é uma representação


gráfica para os dados bivariados, em que cada par de dados 𝑥𝑖, 𝑦𝑖 é ( )
( )
representado por um ponto de coordenadas 𝑥𝑖, 𝑦𝑖 , num sistema de eixos
coordenados.
Nota: Quando queremos estudar duas características ao mesmo tempo, os dados
observados aparecem sobre a forma de pares de valores, ou seja , cada indivíduo
ou resultado experimental contribui com um conjunto de dois valores. E a esse par
de variáveis chamamos dados bivariados.
○ Análise gráfica de dados bidimensionais
- Variáveis positivamente associadas- observando o gráfico abaixo,
verifica-se que, em média, quando a variável x aumenta, a variável y também
aumenta. Ao traçar a reta que “ melhor se aproxima” de todos os pontos do
gráfico, podemos verificar que a reta tem declive positivo.

6
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

- Variáveis negativamente associadas- Verifica-se que, em média, quando a


variável x aumenta, a variável diminui. Como vemos no gráfico abaixo

- Não há associação clara entre as variáveis- Verifica-se que a nuvem de


pontos se encontra bastante dispersa, o que faz prever que não existe uma
associação clara entre as duas variáveis,como observamos no gráfico
abaixo.

★ Coeficiente de correlação- O coeficiente de correlação é uma estatística


que quantifica o grau de associação entre duas variáveis. Esta estatística
representa-se por r que pode ser determinado pela seguinte fórmula:

𝑛
∑ (𝑥𝑖−𝑥)(𝑦𝑖−𝑦)
𝑖=1
𝑟=
𝑛 𝑛
⎡ 2⎤⎡ 2⎤
⎢ ∑ (𝑥 −𝑥) ⎥⎢ ∑ (𝑦 −𝑦) ⎥
⎢𝑖=1 𝑖 ⎥⎢𝑖=1 𝑖 ⎥
⎣ ⎦⎣ ⎦
● Propriedades do quociente de correlação:
1. Os valores do coeficiente de correlação variam entre -1 e 1;

2. Quanto maior for o valor absoluto de r, mais forte será a relação linear
existente entre as variáveis;

3. Se r é positivo significa que existe uma associação entre as variáveis;

4. Se r é negativo, significa que existe uma associação negativa entre as


variáveis;

5. A correlação não é afetada por uma mudança de unidades das


variáveis

7
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

○ Interpretação geométrica do coeficiente de correlação linear

r> 0
Aos maiores valores de x correspondem os maiores valores de y.
Os produtos

(𝑥 − 𝑥)(𝑦 − 𝑦)
𝑖 𝑖
são, de um modo geral, positivos

r< 0

Aos maiores valores de uma variável estão associados, de um modo


geral, os menores valores da outra variável.
Os produtos

(𝑥 − 𝑥)(𝑦 − 𝑦)
𝑖 𝑖
são, de um modo geral, negativos

r= 0

Não existe correlação linear entre os valores de x e os valores de y.

★ Reta de regressão- Dá-se o nome de reta de regressão à reta junto à qual


os pontos de um diagrama de dispersão estão colocados. Um dos critérios
para definir esta reta é o tornar mínima a soma dos quadrados dos desvios
dos pontos em relação é reta

8
Agrupamento de Escolas de Ponte da
Barca
Escola Básica e Secundária Ponte
Cód. Agr.: 152626

Nota : a reta de regressão pode não passar por qualquer dos pontos do
diagrama de dispersão.

Fontes:
https://estat.com.br/2020/10/30/a-importancia-da-estatistica/ 12/04
https://mundoeducacao.uol.com.br/matematica/estatistica.htm
https://wikiciencias.casadasciencias.org/wiki/index.php/Vari%C3%A1vel_(Estat%C3
%ADstica)
https://matematicabasica.net/media-moda-e-mediana/
https://wikiciencias.casadasciencias.org/wiki/index.php/Quartis

Você também pode gostar