Bibiana Vinholes T8A
Estudo dos processos de obtenção, coleta, organização, apresentação, descrição,
análise e interpretação de dados numéricos variáveis, referentes a qualquer fenômeno,
seja sobre a população, seja sobre conjunto de seres para a utilização dos mesmos na
tomada de decisões.
Áreas da estatística:
- Descritiva: descreve e resumo os dados de um certo grupo
- Probabilidade: análise de situações que lida com acaso e incertezas
- Inferencial: conclusões de uma população baseado em um subconjunto de valores
(amostra)
Precisão: avalia a dispersão de resultados entre ensaios independentes repetidos de
uma mesma amostra.
Exatidão: é a concordância entre o resultado de um ensaio e o valor referência aceito
como convencionalmente verdadeiro. Erro absoluto (E) = Xi – Xv
Erro relativo (E%) = ((Xi – Xv)/Xv)x100
Tipos de erros:
- Erro sistemático (tendência): falha na execução de uma coleta de dados. Pode ser
reproduzido
- Erro aleatório (indeterminado): pequenas variações nas medidas de uma amostra;
pesquisador não possui controle. Pode ser corrigido aumentando o tamanho da amostra
População: conjunto total de pessoas com pelo menos uma característica em comum
Amostra: subconjunto não vazio finito e representativo da população
Variáveis: característica de interesse que pode assumir diferentes valores ou
classificações para diferentes sujeitos, organismo ou objetos selecionados para estudo.
São classificadas em quantitativas (discretas e contínuas) e qualitativas (ordinais e
nominais), escolhidas de acordo com o objetivo da investigação.
à Quantitativa: expressam grandezas matemáticas.
• Discreta: valores de conjunto finito, contáveis. Resultado de contagem (0,1,2,3)
(nº de filhos, quantidade de moedas, nº de pessoas na sala)
• Contínua: valores em escala contínua, aceitam decimais. Resultado de medição
(peso, altura, quantidade de chuva)
à Qualitativas: descrevem classificações, atributos ou qualidades mutuamente
exclusivas.
• Ordinais: ordem natural lógica. Pode ser representada por nomes, símbolos ou
números. Há ordenação de uma categoria em relação à outra, mas a distância entre as
duas não pode ser medida numericamente. Não é possível fazer média.
(escolaridade, classe social, gravidade de uma doença)
• Nominais: não há ordem para as classificações, atributos ou qualidades. Não é
possível realizar soma ou produto. Só é possível a contagem das observações em cada
categoria. (cor de cabelos, tipo de sangue, sexo, religião)
Bibiana Vinholes T8A
Titulo, corpo, cabeçalho, coluna indicadora, cédula, elementos complementares (fonte,
notas e chamadas colocadas).
Deve ter traços horizontais, mas não traços verticais (nem devem ser fechadas nos
lados)
Apresentação de variáveis qualitativas:
Resumir informações em uma tabela que mostre as contagens (frequência).
Frequência absoluta- número de vezes que o evento ocorreu em um experimento
Frequência relativa- proporção de unidades que caem em cada categoria
Os dados devem ser apresentados em tabelas de contingência, ou
seja, tabelas de dupla entrada – cada entrada relativa a uma
FR (%) = frequência absoluta
variável. Podem apresentar os dois tipos de frequências.
Tamanho da amostra
Apresentação de variáveis quantitativas:
Dados discretos- tabela normal
Dados contínuos- tabela de distribuição de frequências com classes
Interessante incluir frequência acumulada
Apresentação:
Titulo abaixo do gráfico.
Escala deve crescer da esquerda para direita e de baixo para cima.
O sistema de eixos cartesianos e as linhas auxiliares devem ser traçados mais leves do
que a parte do gráfico que se pretende evidenciar.
Þ Gráficos para Frequência de Variáveis Qualitativas
• Gráficos de Colunas ou Barras: tanto para nominais quanto ordinais. Frequência
absoluta e relativa. Barras de mesma largura.
• Gráfico de Setores (pizza): preferencia nominal. Área de cada setor proporcional à
frequência relativa.
Þ Gráficos para Frequência de Variáveis Quantitativas
- Variável Discreta
• Gráfico de Bastões ou Hastes: frequência absoluta de cada possível valor da
variável é descrita como pontos que são ligados por uma linha vertical até o eixo das
abcissas
- Variável Contínua
• Histograma: colunas justapostas proporcionais as frequências.
• Polígono de Frequências: admite-se que as frequências das classes estão
concentradas nos pontos médios dos intervalos que as definem. Após colocar os pontos,
esres são ligados por meio de retas. Total da área é proporcional a frequência total
(100%)
• Box Plot
Bibiana Vinholes T8A
- Relações entre duas variáveis quantitativas
• Diagrama de Dispersão ou Scatter Plot: cada par de observações é
representado por um ponto em um sistema de coordenadas cartesianas.
- Comportamento de uma Variável no Tempo (séries temporais)
• Gráfico de Linhas ou Colunas: para medir mensurações de interesse que
modificam-se ao longo do tempo. Permite representar séries longas, o que auxilia
detectar flutuações tanto quanto analisar tendências. Ideal para séries históricas.
- Gráfico para Dados Pareados (pré e pós intervenção, lado direto e esquerdo...)
• Gráfico tipo pré e pós ou Ladder Plor
Bibiana Vinholes T8A
São ferramentas de estatística descritiva que permitem caracterizar um conjunto de
dados quantitativos de acordo com sua tendência central ou a dispersão dos resultados.
Þ Medidas de Tendência Central (de posição)
Buscam caracterizar um conjunto de observações por meio de um valor em torno do
qual estas se distribuem
• Média:
É afetada por valores extremos. Bastante utilizada em distribuições
Soma das observações
simétricas. Não é utilizável em variáveis qualitativas.
Nº de observações
• Mediana: distribui os números do menor ao maior e vê qual número se encontra no
meio – esse é considerado a mediana. Em número par de dados se faz a média dos dois
do meio.
Não é utilizável em variáveis qualitativas. Pouco afetada por valores extremos. Indicada
para distribuição assimétrica.
• Moda: observação que ocorre com mais frequência. Pode ser utilizada para dados
qualitativos. Moda ≠ Maioria.
Þ Medidas de Dispersão
Traduz a variação de um conjunto de dados em torno da média, ou seja, da maior ou
menor variabilidade dos resultados obtidos. Permite identificar até que ponto os
resultados se concentram ao redor da tendência central.
• Amplitude Amostral: é a diferença entre o maior e menor valor das observações.
Quanto maior a amplitude amostral maior a dispersão dos dados.
Maior nº – Menor nº = amplitude amostral
• Variância: relaciona os desvios em torno da média (é a média aritmética dos
quadrados dos desvios). Leva em consideração valores extremos e intermediários. A
unidade de medida é ao quadrado, então eliminamos o quadrado e definimos o desvio
padrão.
1º passo: realizar a média normal (M) X1 – M = Y 1
2º passo: pegar cada dado (X) e subtrair a média (M) = Y Y²1 = Z1
3º passo: pegar o número resultante (Y) e elevar ao quadrado = Z Z1 + Z2 + Z3 + Z4 + ... = W
4º passo: somar todos os Z = W W = variância
5º passo: pegar o W e dividir pela quantidade de dados (n) – 1 = variância n - 1
(X1 – M)² + (X2 – M)² + (X3 – M)² + ... = variância
n-1
Bibiana Vinholes T8A
Exemplo: Idade de n=8 pessoas
38; 40; 49; 67; 33; 57; 54; 64
1ºpasso : 2º passo X – M = Y 3º passo Y² = Z
38 + 40 + 49 + 67 + 33 + 57 + 54 + 64 = 50,25 (M) 38 – 50,25 = -12,25 (-12,25)² = 150,06
8 40 – 50,25 = -10,25 (-10,25)² = 105,06
49 – 50,25 = -1,25 (-1,25)² = 1,56
4º passo: 150,06 + 105,06 + 1,56 + 280,56 + 297,56 + 67 – 50,25 = 16, 75 (16,75)² = 280,56
45,56 + 14,06 + 189,06 = 1.083,48 ~ 1.083,5 (W) 33 – 50,25 = -17,25 (-17,25)² = 297,56
57 – 50,25 = 6,75 (6,75)² = 45,56
5º passo: 1.083,5 = 154,8 anos² 54 – 50,25 = 3,75 (3,25)² = 14,06
8–1 64 – 50,25 = 13,75 (13,25)² = 189,06
• Desvio Padrão: determina a dispersão dos valores em relação à média. Tem a mesma
medida de unidade e é definido como a raiz quadrada da variância. É as distâncias entre
cada observação e a média amostral.
√variância = desvio
Ex anterior: variância 154,8 anos²
√154,8 = 12,44 anos -> desvio
• Coeficiente de Variação: mede a variabilidade dos dados em relação a média. Não
possui unidade de medida. Útil para comparar a variabilidade de duas medidas ou mais
variáveis que possuem unidades diferentes.
Desvio padrão x 100 = coeficiente de variação
Ex anterior: 12,44 x 100 = 24,75 ~ 24,8%
Média
50,25
Não é possível comparar a média nem o desvio padrão de um estudo de peso (kg) e
comprimento (cm), pois possuem unidades diferentes. Para podermos compará-los,
calculamos o coeficiente de variação de cada um e assim podemos comparar.