O que é ESTATÍSTICA?
Aplicada em inúmeras áreas do conhecimento, a ESTATÍSTICA usa a Matemática para
coleta, interpretação e análise de dados numéricos de pesquisas sobre a natureza, a sociedade, a
economia e o mercado. Diante de gigantescas quantidades de informações, os profissionais de
ESTATÍSTICA usam ferramentas e softwares para dar sentido aos números e usá-los para fins
como pesquisas científicas, política, educação, tecnologia e até mesmo esportes.
Em diversas áreas, a ESTATÍSTICA também é acompanhada por estudos de lógica e
probabilidade. Além disso, formados na área devem ter conhecimentos de língua portuguesa,
metodologia de pesquisa, conhecimentos de demografia e econometria para usarem os números
em prol de sentidos e resultados positivos. O trabalho dos profissionais é, portanto, essencial
em pesquisas eleitorais, de controle de qualidade de serviços e produtos, censo populacional,
industriais, entre outras.
HISTÓRICO
NA ANTIGUIDADE
Os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas".
NA IDADE MÉDIA
As informações eram tabuladas com finalidades tributárias e bélicas.
NO SÉCULO XVI
Surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos.
NO SÉCULO XVIII
A estatística com feição científica é batizada pelo alemão GOTTFRIED ACHENWALL. As
tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos de
probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se
tornar "O estudo de como se chegar a conclusão sobre uma população, partindo da
observação de partes dessa população (amostra)".
Para entender o que significa estatística devemos saber que ela pode ser divida em
duas: estatística descritiva e estatística inferencial.
A estatística descritiva envolve a organização, resumo e representação dos dados. As
ferramentas utilizadas para isso são as bem conhecidas tabelas de frequência; gráficos; cálculo
de medidas de tendência central como média, mediana e moda; e cálculo de medidas de
dispersão como variância e desvio padrão.
Os principais exemplos de estatísticas descritivas são:
1. Média Aritmética Simples 4. Moda
2. Média Aritmética Ponderada 5. Variância
3. Mediana 6. Desvio Padrão
O que significa Estatística Inferencial?
A estatística inferencial estamos sempre interessados em utilizar as informações de uma
amostra para chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Nesse
sentido, uma ferramenta muito utilizada na estatística inferencial é a probabilidade.
A estatística inferencial fornece informações sobre uma pequena seleção de dados, assim
esta informação pode ser utilizada para inferir algo sobre o conjunto de dados maior do qual ela
foi coletada. A seleção de dados menor é conhecido como amostra, e o conjunto de dados maior
a partir do qual a amostra é retirada é chamado população.
Os principais conceitos de estatística inferencial são:
1. População: É qualquer conjunto que constitui todo o universo de informações
necessárias. O conceito de população sempre depende do objetivo do estudo;
2. Amostra: Corresponde a um grupo representativo da população;
3. Variável quantitativa: é aquela que mede quantidade, por exemplo, idade, altura, preço,
quantidade de vendas etc;
4. Variável qualitativa: é aquela que mede uma qualidade do indivíduo e pode ser separada
em categorias, por exemplo, sexo: masculino ou feminino; nível de escolaridade, etc.
As variáveis quantitativas podem ser divididas em duas:
1. Discretas: Possuem em suas características números mensuráveis para assumir um
número finito ou infinito de variáveis. Só terão sentido quando forem valores inteiros,
geralmente esses valores são buscados nos resultados das contagens. Exemplo número
de filhos, número de bactérias, número de carros em um estacionamento, número de
cigarros fumados ao dia, etc.
2. Contínuas: São características mensuráveis que possuem valores de uma escala contínua
de uma reta real. Ou seja, representa uma classificação de indivíduos nominais ou
ordinais.
As variáveis qualitativas podem ser:
1. Nominais: Não têm ordenação entre as diversas categorias. Por exemplo, a cor de nossos
olhos.
2. Ordinais: Possui uma ordenação em todas as suas categorias. Por exemplo, o nível de
escolaridade, tempo de gestação.
ROL
Organização dos dados por ordem de valor, sendo ele crescente ou decrescente.
FREQUÊNCIA
Frequência Absoluta (ƒi): É o número de observações correspondente a cada classe.
A frequência absoluta é, geralmente, chamada apenas de frequência.
Frequência Relativa (ƒri): É o quociente entre a frequência absoluta da classe correspondente e
a soma das frequências (total observado).
Frequência Percentual (pi): É obtida multiplicando a frequência relativa por 100%.
Observe a tabela a seguir:
Frequência Acumulada: É o total acumulado (soma) de todas as classes anteriores até a classe
atual. Pode ser: frequência acumulada absoluta (Fi), frequência acumulada relativa (Fri), ou
frequência acumulada percentual (Pi).
Observe a tabela a seguir:
MEDIDAS DE TENDÊNCIA CENTRAL
1. Média Aritmética Simples
A média é a medida de centralidade que mescla
de maneira mais uniforme os valores mais baixos e os mais
altos de uma lista. Ela é o valor que aponta para onde mais
se concentram os dados de uma distribuição, e pode ser
considerada o ponto de equilíbrio das frequências em um
histograma. A média é calculada através da combinação de valores de um conjunto de um
modo específico. A média aritmética é a forma
mais simples de calcular uma média, mas
existem outros métodos, como a mediana
(usada quando a distribuição de valores é mal
organizada, com grandes e pequenos valores,
como valores de rendimento).
2. Moda
É o valor ou valores que aparecem mais frequentemente, ou seja, o “valor mais comum”. O
termo moda refere-se ao uso popular, significando o objeto que se está usando muito no tempo
presente. A moda não é necessariamente única, ao contrário da média ou da mediana. Ela é
bastante útil principalmente quando os valores não são numéricos, e a média e a mediana
podem não ser bem definidas.
Determine o valor de moda dos números da lista a seguir?
133, 425, 244, 385, 236, 236, 328, 1000, 299, 325
A moda é o número que aparece com maior frequência. Observe que todos os números
aparecem apenas uma vez na lista, exceto 236, que aparece duas vezes. Assim, a moda é 236.
2. Mediana
A mediana de um conjunto de dados é o dado que está localizado na posição
central quando os dados são colocados em ordem crescente, isso se a quantidade desses
valores for ímpar. Se a quantidade desses valores for par, a mediana será a média dos dois
valores centrais.
A mediana pode ser calculada para um conjunto de observações ou para funções de distribuição
de probabilidade.
4. Média Aritmética Ponderada
É calculada multiplicando cada valor
do conjunto de dados pelo seu peso. Depois,
encontra-se a soma desses valores que será
dividida pela soma dos pesos.
Considerando as notas e os respectivos pesos de cada uma delas, indique qual a média que o
aluno obteve no curso.
Disciplina Nota Peso
Biologia 8,2 3
Filosofia 10,0 2
Física 9,5 4
Geografia 7,8 2
História 10,0 2
Língua Portuguesa 9,5 3
Matemática 6,7 4
TIPOS DE GRÁFICOS
Histograma
É um gráfico usado para análise de dados. Esse tipo de apresentação facilita a observação dos
valores.
É basicamente formado por colunas que indicam a frequência de dados obtidos em uma
pesquisa ou estudo. Os histogramas são utilizados principalmente para demonstrar dados
colhidos em estatísticas, como a coleta de informações sobre a população de um local.
Mas o uso dos histogramas não é restrito só a esse tipo de apresentação, eles também podem ser
usados para expor outras informações, como na avaliação de processos de qualidade de uma
empresa.
Quais as partes de um histograma?
Um histograma é formado por três elementos: classes, amplitude e frequência.
Classes: são as barras indicadoras de valores da estatística, que representam tanto os valores
mínimos como os máximos (chamados de limites da classe).
Amplitude: representa o tamanho de cada uma das classes (barras).
Frequência: é a representação da variação dos conjuntos de dados.
Veja as partes do histograma nesse exemplo de análise de dados sobre as reclamações recebidas
por uma empresa após a venda de produtos.
Como fazer um Histograma?
Para poder fazer um histograma de maneira fácil, siga estas etapas.
Reunir o conjunto de dados que vai ser usado no histograma e fazer uma tabela de
frequência.
Verificar a amplitude (diferença) entre o maior e o menor valor encontrado.
Definir quantas classes (barras) serão usadas de acordo com a quantidade de dados. Basta
dividir a amplitude pelo número de classes.
Montar o histograma utilizando as barras e os dados obtidos (maior e menor valor de
intervalos).
Exemplo Prático: Cálculo da amostra da idade dos funcionários de uma empresa com 50
funcionários.
Organizar os dados obtidos em uma tabela de frequência:
Encontrar a amplitude entre o maior e o menor valor. Nesse exemplo o maior valor é 70 anos
e o menor é 20 anos. A amplitude encontrada (70 – 20 = 50) é de 50 anos.
A quantidade de classes é definida conforme a amplitude. Nesse caso, para a amplitude de 50
podemos utilizar 5 classes (50/5 =10). Cada classe corresponde a 10 anos.
Classes Idades Número de Funcionários
1 20-30 anos 10
2 30-40 anos 20
4 40-50 anos 15
4 50-60 anos 3
5 60-70 anos 2
Montar o Histograma:
MEDIDAS DE DISPERSÃO
1. Amplitude
Subtração entre o maior valor e o menor valor dos elementos do conjunto. Quanto maior
a amplitude, mais heterogêneo é o grupo.
2. Variância
Dispersão dos dados variáveis em relação à média.
3. Desvio Padrão
Raiz quadrada da variância. Indica a distância média entre a variável e a média aritmética da
amostra. Um valor baixo de desvio padrão significa que os dados tendem a estar próximos da
média; um desvio padrão mais alto indica que os dados estão espalhados por uma gama de
valores.
Considere o exemplo:
Na preparação para os jogos Olímpicos de Atenas, três atletas do salto em altura ao realizarem
um treinamento diário, consideraram seus quatro melhores saltos em centímetros. Veja:
Dentre os atletas, a melhor média foi a do Atleta
Z, veja:
Atleta X = (144 + 171 + 150 + 138) / 4 = 150,75
Atleta Y = (146 + 170 + 152 + 137) / 4 = 151,25
Atleta Z = (145 + 169 + 154 + 140) / 4 = 152
Atleta W = (150 + 167 + 149 + 141) / 4 = 151,75
Em situações que envolvam disputas olímpicas, o atleta com
melhor média, às vezes não é considerado o mais indicado,
pois verifica-se a questão da regularidade dos resultados
obtidos. É referente a esses casos que aplicamos os cálculos
ligados à Variância e ao Desvio Padrão. Lembre-se de que o
desvio padrão consiste na raiz quadrada da variância.
Cálculo da Variância e do Desvio Padrão
Atleta X
Atleta Y
Atleta Z
Atleta W
Conclusão:
O atleta que obteve o menor Desvio Padrão deve ser considerado o de melhor regularidade
em resultados. Dessa forma, temos que o atleta W se enquadra nessa condição de melhor
regularidade.