17/02/2025
1- Lezione statistica
Che cos’è la statistica?
ISTAT Produrre informazioni riguardo ai dati raccolti.
Le statistiche ufficiali danno una visione, anche economica, sulla popolazione
italiana.
I dati ufficiali vengono prodotti attraverso la raccolta di informazioni da parte
della popolazione, su un campione di persone.
Questi dati servono ai politici per prendere decisioni correttive dei problemi
sociali.
La statistica, quindi, è una scienza dei dati.
Definizione dal libro:
insieme delle metodologie e tecniche per la trattazione quantitativa dei
fenomeni osservati dalla realtà sociale, in natura, in laboratorio o al computer.
REALIZZAZIONE DEL PROCESSO LOGICO:
CAMPIONE: parte di popolazione che viene estratto secondo determinati
metodi.
STATISTICA DESCRITTIVA: studia le caratteristiche della popolazione
STATISTICA INFERENZIALE: utilizza la teoria della probabilità per estendere
alla popolazione lo studio del campione.
Questionario in aula rilevazione di quattro caratteristiche diverse sulla base
della natura delle domande.
1-Conoscenza della statistica Carattere qualitativo
2- Opinione sulla statistica Carattere qualitativo
3-Mezzi impiegati per raggiungere l’Università Carattere quantitativo
4-Distanza dall’Università Carattere quantitativo
Le prime due sono caratteristiche qualitative perché le modalità di risposta
sono parole
nella prima non ho un ordine (non ho uno più bravo o meno bravo)
CARATTERE NOMINALE
esempi di carattere qualitativo nominale:
- maschio o femmina
- colore capelli
- tipologia di clienti di un'azienda
nella seconda c'è un ordine ‘naturale’ CARATTERE ORDINALE
esempi di carattere qualitativo ordinale:
- qualità del prodotto
- livello di felicità
- livello di scolarità
Le ultime due sono caratteristiche quantitative perché le modalità di
risposta sono numeri.
Il carattere quantitativo può essere:
CARATTERE DISCRETO proviene un conteggio. Es. numero di prodotti
venduti
CARATTERE CONTINUO proviene da una misurazione. Es. quanti prodotti
produce la mia macchina; quanto ha pagato un cliente per un prodotto
DEFINIZIONE E NOTAZIONE
U= Popolazione o universo statistico
N= numerosità o dimensione di U
X, Y,W,A: fenomeni statistici
x,y,w,z,a: singola manifestazione del fenomeno statistico (modalità o valori del
fenomeno)
MODALITA’ i diversi valori assumibili dal carattere
Le modalità devono essere:
- INCOMPATIBILI: le unità devono essere attribuite ad una ed una sola modalità.
ES. luogo di nascita: Milano, comune di Milano, Province lombarde, altre
regioni SBAGLIATO
- ESAUSTIVE: tutte le unità devono essere attribuite a una delle modalità.
Es. aggiungo ESTERO così chiunque può classificarsi in una delle modalità e in
una sola.
Se le modalità sono espresse da parole, lettere, qualità etc.. QUALITATIVO
ES. colore preferito, opinione, luogo di nascita, conoscenza della statistica…
Se le modalità sono espresse in numero QUANTITATIVO
➠Le modalità di carattere quantitativo possono essere:
-DISCRETO (nascono da una numerazione) es. numero di figli, numero di
caffè
-CONTINUO (nascono da una misurazione), possono assumere qualsiasi valore
di un intervallo a-b es. numero di km di distanza, altezza, salario, voto media,
peso…
Differenza: discreto, numero intero; continuo, proviene da una numerazione.
SCALE DI MISURAZIONE DI UN CARATTERE
A seconda di quale scala so utilizzando, sono concesse alcune cose che posso fare:
CARATTERE
QUALITATIVO QUANTITATIVO
NOMINALE ORDINALE A INTERVALLI DI
RAPPORTI
Tra le modalità non Tra le modalità Non esiste uno Esiste lo ‘zero’
Tra le un
esiste modalità
ordinenon esiste un ordine ‘zero’ assoluto assoluto
esiste un ordine
naturale. ES. naturale
Genere, naturale. ES. livello (assenza del
reg. di nascita… di apprezzam. fenomeno), ma
possono essere = o Bicocca… = o div, < solo
Assenza dello zero assoluto: i valori sono sempre positivi e maggiori di zero. =;
≠ ; <; >; +; -
ES. temperatura gradi
celsius
Esiste lo zero assoluto: può prevedere l’assenza del fenomeno. =; ≠ ; <; >; +; -;
x; :
ES. valore del fatturato, valore di
prodotto.
Posso usare un rapporto e una
Rapporto es. rilevazione di una diminuzione
Anno 2023 fatturato di 1.000.000 del 50% perché il fenomeno
Anno 2024 fatturato di 500.000 può essere anche zero.
GERARCHIA TRA LE SCALE
Il livello di gerarchia aumenta a seconda delle operazioni matematiche che si
possono fare.
RILEVAZIONE DEI DATI
Viene fatta su un campione, le info arrivano in maniera più veloce, costi
minori, ma devo avere la sicurezza che il campione rappresenti
sicuramente tutto l’insieme soggetto all’analisi.
Esempio: studenti presenti il giorno 17/02 in aula.
N: 116 coloro che erano presenti in aula.
Matrice dei dati:
- K colonne (numero di variabili)
- N righe (numero di unità) VARIABILI
X1 X2 …. Xk
1 X11 X12 … X1k
2 X21 X22 … X2k
3 X31 X32 … X3k
4 x41 X42 … X4k
….
N
1,2,3,4,5… Unità statistiche
Xij i= riga; j= colonna
SPOGLIO DEI CASI
Riunire tutti i casi che presentano la stessa modalità per un determinato
carattere.
ES. Conoscenza statistica, si fa una tabella e si contano i sì e i no.
Se non voglio farlo manualmente faccio una tabella Pivot (su excel)
Distribuzione di frequenza si usa quando faccio lo spoglio dei casi di
una variabile.
La statistica BIVARIATA prevede di analizzare la relazione di due caratteri
congiuntamente, si fa lo spoglio dei casi di due variabili. Per ora
studiamo quella UNIVARIATA.
Che cos’è una tabella/ distribuzione di frequenza?
Una tabella (distribuzione) di frequenze è una successione di modalità di un
carattere con le rispettive frequenze.
FREQUENZE= numero di unità che presentano una certa modalità. ES.
quantità di NO.
Conoscenza Frequenze
statistica
NO 86
SI 21
CARATTERE QUALITATIVO (anche detta MUTABILE STATISTICA)
Come lo scrivo?
Per il carattere A (si indica con la lettera maiuscola) con le modalità (lettera
minuscola+ pedice)
a1, a2… aS
CARATTERE= conoscenza della statistica MODALITA’= si o no
a1= si
a2= no
S= numero di modalità
La distribuzione della frequenza, quindi, è una coppia di valori che indico con
aj, nj tale per cui j sono le modalità.
J va da 1,2… a S grande (numero modalità)
nj è il numero di unità che assumono il valore j-esimo la chiameremo
FREQUENZA ASSOLUTA della modalità aj.
La tabella di frequenza di indica con nella prima colonna la a e sulle righe le
modalità di a.
N tutte le frequenze assolute che ho associato a ciascuna modalità
N: n1+n2+…+nj+…+nS
S
∑ nj
j=1