Disciplina de Informatică Medicală și Biostatistică
Universitatea de Medicină și Farmacie ”Victor Babeș” Timișoara
Introducere în biostatistică
Metode de studiu
Statistica descriptivă
Statistica inferențială
Distribuția normală
Estimarea mediei
Estimarea proporțiilor
Asist. Univ. Dr. Costela Șerban
Email:
[email protected]Ce e biostatistica? De ce o studiem?
Expertiza
clinică
individuală
Medicina bazată pe dovezi Valorile & Dovezile
așteptările științifice
pacienților relevante
2
Individ vs populație
3
Metode de studiu: Recensământ
• un tip particular de anchetă în care investigăm întreaga populație țintă
Þ prevalențe punctuale
Þ Nu se pot determina incidențe
Þ Nu se poate determina cauzalitate
Populația orasului Timișoara
Recensamânt
Ex: recensământul populației din Timișoara
pentru statusul ponderal
4
Metode de studiu: Screening
Un tip de investigație folosită pentru a stabili care dintre persoanele
dintr-o populație aparent sănătoasă sunt susceptibile de a avea (sau
nu) o patologie de interes.
• Persoanele semnalate în acest mod vor fi, de obicei, supuse unor
investigații mai riguroase pentru confirmarea diagnosticului lor.
• Populația de studiu se numește populație la risc
• Ex: screeningul pentru Cancerul de col uterin
5
Metode de studiu
• Eșantionare
• Eșantionul e un subgrup al unei populații
• Eșantionul este caracteristic pentru populația din care a fost extras pentru
anumite determinări
• După obținerea rezultatelor caracteristice
eșantionului, procesul de extindere a concluziilor Populația feminină cu HPV
la populația din care a fost extras tulpina 16
Eșantion
= INFERENȚĂ STATISTICĂ
6
Eșantion, n
Eșantion reprezentativ Eșantion, n
Eșantion, n
Eșantion, n
Populație, N
Eșantion, n
Eșantion, n
Eșantion, n
Eșantion, n
7
Eșantion reprezentativ: scheme random
• Eșantionarea aleatorie simplă: se enumeră membrii unei populații=
cadru de eșantionare , se selectează n indivizi
• Eșantion de conveniență
• Eșantionarea sistematică: se pleacă de la un cadru de eșantionare, se
determină un interval de eșantionare (n/N), se alege un individ din
primul interval, și apoi se păstrează intervalul de eșantionare
8
Eșantion reprezentativ: scheme non-random
• Eșantionarea stratificată
• Se organizează populația în staturi mutual exclusive, indivizii se selectează
randomizat din fiecare strat
• Eșantionarea în cote
• Se selectează un număr predeterminat de indivizi din grupuri de interes
9
Metodele statistice
Statistica inferențială Eșantio
Populația, n,
n,
µ=?
Statistici descriptive
10
Tipuri de variabile
Categorice Numerice
(calitative) (cantitative)
Nominale Ordinale Discrete Continue
Categoriile sunt Categoriile sunt Valori numerice
Pot lua orice valori
mutual exclusive și mutual exclusive și întregi, în mod tipic
într-un interval
neordonate ordonate implică numărarea
evenimentelor
Ex:
Ex: Ex:
Greutatea în kg
Sex (bărbați/femei) Stadializarea unei Ex: Numărul de zile
Înălțimea în m
Grupele de sânge patologii (ușoară, de spitalizare
(A,B, AB, 0) moderată, severă)
11
12
Variabilele categorice – mărimi descriptive
• Numărul absolut (n)
• Proporția (%)
13
Statistica descriptivă
• Rate (ex: bolnavi la 1000 locuitori)
- Prevalența
- Ex: prevalența diabetului in lume: 8,5% sau 85 pacienți la 1000
locuitori în 2014
- Incidența
- Ex: incidența diabetului: 3,2% sau
32 pacienți la 1000 locuitori în
2014, pentru grupul de vârstă 18
– 44 ani
14
15
1
16
17
Tabele de frecvență
18
Tabele de frecvență / reprezentarea grafică
19
Tabele de frecvență / reprezentarea grafică
20
Variabile numerice
• Tendința centrală
• Media
• Mediana
• Moda
• Dispersia
• Deviația standard
21
Media
Media
22
Mediana
• Reprezintă valoarea din mijloc (a 50a percentilă)
• Daca șirul e impar: (nr de determinări + 1)/2
• Ex:
TAS: 145 mmHg, 146 mmHg, 148 mmHg, 155 mmHg, 163 mmHg
• (5+1)/2= 3
• Dacă șirul e par: nr de determinări/2, apoi se face media aritmetică dintre
valoarea determinată și următoarea
• Ex:
TAS: 145 mmHg, 148 mmHg, 155 mmHg, 163 mmHg
4/2=2
(148 +155)/2=151,5 mmhg
23
Moda
• Cea mai frecventă valoare a șirului
• Ex: 145 mmHg, 146 mmHg, 146 mmHg 148 mmHg, 155 mmHg, 163 mmHg
24
Deviația standard (s)
• Mărime a dispersiei datelor
25
Alte mărimi ale variabilității
• Varianța (s2) = pătratul deviației standard
• Eroarea standard (SE) = , unde s=deviația standard
n=numărul de participanți
26
27
Histograma
25
MEDIANA MEDIA
2463.9 g
20
2463.
Qua 9g Quartila
75%
15 rtila
Frecvența
25% Frecvența
10
0
1150 1300 1450 1600 1750 1900 2050 2200 2350 2500 2650 2800 2950 3100 3250 3400 3550 3700 3850 4000 More
Greutatea la naștere
28
Inferența statistică
• Mărimile eșantionului = statistici sau indicatori (x, s, sx)
• Mărimile populației = parametri (se notează cu litere grecești: µ, σ, σx)
Prin
Statisticile INFERENȚA Parametrii
eșantionuloui STATISTICĂ populației
Ex: Media vârstei la Media vârstei la
diagnosticul de diagnostic de HTA
HTA din eșantion pentru populație
29
Distribuția normală
• Este o distribuție ideală,
simetrică
• Media = 0
• Deviația standard = 1
• AUC =1
• media = mediana = moda
30
Estimarea mediei
• • x= media eșantionului,
• SE= eroarea std a mediei,
• s=deviația std
• SE =
• 68%: (x – SE, x + SE)
• 95%: (x – 2SE, x + 2SE)
• 99%: (x – 3SE, x + 3SE)
31
Exemplu: Intervalul de încredere a mediei
Suntem interesați să determinăm vârstă medie la prima naștere la femeile care
prezentau tulburări de coagulare. La un lot de 49 de paciente care au născut în 2007:
• Vârsta medie la naștere a fost de = 27,01 ani
• Deviația standard, s = 5,12 ani
• Eroarea standard, SEM= = 0,7326 ani
• Calculați intervalul de încredere 95% a mediei
27,01 +/- (2 * 0,7326) = (25,54; 28,48)
• Calculați intervalul de încredere 99% a mediei
27,01 +/- (3* 0,7326) = (25,05; 28,97)
32
Estimarea proporțiilor
• P= proporția de pacienți care au caracteristica de interes
• SE=
• 68%: (p – SE; p + SE)
• 95%: (p – 2SE; p + 2SE)
• 99%: (p – 3SE, p + 3SE)
33
Exemplu: Intervalul de încredere al
proporțiilor
Din 64 de femei incluse într-un studiu, 27 (42,2%) au raportat că au
prezentat sângerări gingivale ce puțin o dată pe săptămână.
Proporția = = 42,2%
Eroarea standard a populației = = 0,0617
Calculați intervalul de încredere 95%
Intervalul de încredere 95% = 0,422 +/- (2 *0,0617) = (0,301; 0,543)
34
Vă mulțumesc!
Email: [email protected]
35