Elemente de Biostatistica
FMAM an II Lp1
STATISTICA
Domeniu tiinific care permite studiul fenomenelor, parametrilor a cror proprietate fundamental este variabilitate
BIOSTATISTICA
- studiul fenomenelor biologice i medicale Se ocup de
culegerea, centralizarea i gruparea datelor prelucrarea datelor permite determinarea unor indicatori pentru descrierea fenomenelor biomedicale studiate, pe baza unor regulariti sau variabiliti statistice
2. NOTIUNI DE STATISTICA
-colectivitate statistic (populaie statistic) -unitate statistic -variabil statistic -varianta statistica -serie statistic
2.1. Colectivitatea statistic (populaia statistic) formeaz obiectul analizei statistice i este reprezentat de totalitatea elementelor care au anumite caracteristici (nsuiri sau atribute) comune.
Numrul elementelor populaiei reprezinta volumul sau talia populaiei.
O populaie statistic poate fi: -n medicin, mulimea bolnavilor internai, mulimea hematiilor din sngele unei persoane, mulimea microbilor dintr-o cultur etc.
-ntr-un studiu demografic, populaia unei ri
-un grup de indivizi (populaia colar dintr-un ora la un moment dat, populaia vrstnic dintr-o anumit regiune la un moment dat) -un grup de evenimente sau fenomene
-o mulime de obiecte
Colectivitatea statistic general sau populaia este reprezentat de totalitatea elementelor de un anumit tip existente teoretic sau practic.
criterii de includere criteriile de excludere
Elementele unei populaii statistice se numesc uniti statistice (uniti de observare) sau indivizi ai populaiei statistice.
2.2. Unitatea statistic este reprezentat de fiecare element component al colectivitii statistice.
Ea este supus observrii, i se determin i i se nregistreaz valoarea caracteristicii sau caracteristicilor studiate. Uniti statistice pot fi: persoana, familia, cstoria, nscutul viu, gravida, cabinetul medicului de familie etc. Trstura comun a tuturor unitilor unei populaii care poate s prezinte interes n cadrul unei analize statistice se numete caracteristic variabil.
2.3. Caracteristica (variabila) este una din nsuirile prin care se manifest unitatea de observare, este acea nsuire comun unitilor unei populaii investigate. O variabila trebuie sa poata lua cel putin doua stari (variante) Analiza studiului unei populaii se poate face dup una sau mai multe variabile.
Ex. S presupunem c intereseaz studiul numrului de leucocite la bolnavii internai ntr-un spital de boli infecioase
Populaia statistic este format din mulimea bolnavilor internai ntr-o anumit perioad (un an), O unitatea statistic este constituit din fiecare bolnav, Caracteristica studiat este numrul de leucocite ale bolnavului la internare, Un eantion din aceast populaie statistic poate fi, de exemplu mulimea alctuit din 100 de bolnavi internai luai din doi n doi n ordinea internrii.
Ex. S presupunem c ntr-un studiu prezint interes numrul de pacieni consultai zilnic n cabinetele medicilor de familie dintr-o anumit zon. Atunci:
-Populaia
statistic este reprezentat de mulimea cabinetelor, -O unitate statistic este reprezentat de oricare cabinet, -Numrul de pacieni consultai zilnic reprezint o caracteristic.
Variabila este o funcie X: M C unde M este populaia statistic C este o mulime n care caracteristica ia valori. Variabilele statistice pot fi de dou tipuri:
De natur cantitativ, asociate unor caracteristici susceptibile de a fi msurate, De natur calitativ, asociate unor caracteristici care nu pot fi msurate, sunt rezultatul aprecierii
Variabilele cantitative
Sunt asociate unor caracteristici msurabile, exprimabile numeric. Sunt nsuiri msurabile ale unitilor de observare i care pot fi exprimate printr-o unitate de msur (cm,g, ore etc.). Ele pot fi: -continue -discrete
Tipuri de variabile cantitative
Variabile continue asociate unor caracteristici msurabile care pot lua orice form numeric (inclusiv o fraciune zecimal sau ordinal).
Calculul mediei are ntotdeauna semnificaie. Variabile discontinue sau discrete asociate unor caracteristici msurabile care iau valori numai numere ntregi
Valoarea mediei nu are ntotdeauna semnificaie.
Variabile calitative
sunt asociate unor caracteristici care nu se exprim n uniti de msur. Sunt nemsurabile, finite, iar calculul mediei valorilor ei nu are sens.
Tipuri de variabile calitative
Variabilele calitative pot fi: Nominale grupeaz subiecii n categorii ce nu pot fi ordonate dupa un criteriu logic
Ordinale subiecii sunt grupati n categorii ce pot fi ordonate dupa un criteriu logic
Dihotomiale nu accepta decat alternative pt. gruparea subiectilor doua
2.4. Varianta este valoarea concret sub care
se nregistreaz o variabil. Calitatea msurrii datelor este dat de:
Acuratee: gradul n care msurtoarea efectuat red valoarea adevrat a variabilei n studiu
Validitatea: msura n care ceea ce se msoar este exact ce trebuie msurat
Precizia: msura n care consistent i reproductibil msurtoarea efectuat este
Sigurana: msurtoarea este stabil i demn de ncredere
2.5. Frecvena este numrul de repetiii sub care
se nregistreaz aceeai variant.
2.6. Seria statistic (sau repartiia statistic) este
irul de valori numerice ale unei variabile, ordonate dup un anumit criteriu, n funcie de irul valorilor altei caracteristici, reprezentnd corespondena dintre dou iruri de date. Repartiia statistic este caracterizat de legea de repartiie.
2.7. Parametrul statistic este valoarea reprezentativ, dedus dintr-un calcul numeric aplicat unei repartiii statistice (adic din legea de repartiie). De exemplu, media, dispersia, frecvena unui caracter etc.
2.8. Indicatorul statistic este mrimea statistic, cu ajutorul cruia se poate caracteriza un fenomen - n cazul nostru, un fenomen bio sau socio-medical sub raportul structurilor interdependenelor ori modificrilor n timp sau spaiu. 2.9. Indicele statistic este valoarea numeric relativ ce rezult din compararea valorilor unui indicator statistic, fie la diferite momente de timp fie n spaii diferite, fie pentru categorii diferite constituite n raport cu o caracteristic oarecare.
3. INDICATORI AI TENDINEI CENTRALE, DE DISPERSIE, LOCALIZARE I SIMETRIE 3.1. CARACTERISTICI CANTITATIVE
INDICATORI AI TENDINEI CENTRALE
3.1.1. Seria de variaie sau distribuia de frecven
Variantele sub care se nregistreaz caracteristica sunt dispuse n sens cresctor, alturat se noteaz frecvena lor de apariie. Se alctuiete astfel o serie de variaie simpl sau o distribuie de frecven. O distribuie de frecven se obine prin observarea frecvenei de apariie a unui eveniment.
Seriile de variaie pot fi:
Serii de variaie simple Exemplu: Tabel I. Vrsta persoanelor dintr-un lot supus cercetrii
Variabila Xi 0 1 2 3 4 5 . . 95 96 97 98 99 Frecvena fi 0 20 13 14 21 . . 2 0 0 0 1 fi =1.000
Serii de variaie cu clase
Clasa Centrul clasei xi 0-4 2,5 5-9 7,5 10-14 12,5 15-19 17,5 20-24 22,5 25-29 27,5 30-34 32,5 35-39 37,5 40-44 42,5 45-49 47,5 50-54 52,5 55-59 57,5 60-64 62,5 65-69 67,5 70-74 72,5 75-79 77,5 80-84 82,5 85-89 87,5 90-94 92,5 95-99 97,5 Frecvena fi 58 32 48 36 40 58 67 73 80 84 85 83 75 67 64 32 6 7 5 3 fi =1.000
Centrul clasei
(valoarea central a intervalului) care se noteaz cu Xi . Pentru variabilele cantitative continue, centrul clasei este egal cu semisuma valorii minime a clasei respective i a valorii minime a clasei urmtoare. Pentru variabilele cantitative discontinue, centrul clasei este egal cu semisuma valorilor extreme ale clasei. Nu este obligatoriu ca centrul clasei s fie o valoare ntreag. Pentru variabilele cantitative continue, cu mai multe valori (peste 10) se observ c o mare parte dintre observaii se concentreaz n jurul unei valori centrale.
Aceast concentrare este denumit tendina central a distribuiei de frecven.
Principalii indicatori de tendin central sunt:
media, X mediana, Me modul.Mo
3.1.2. Media 3.1.2.1. Media aritmetic (x ) Media aritmetic este o msur a tendintei centrale a seriei de date n jurul creia se aglomereaza datele acesteia. Media nu d nici o indicaie asupra gradului de fluctuaie (de abatere) de la tendinta centrala, adic asupra a ceea ce se numete frecvent dispersia datelor. Media aritmetic a seriei de date asociate unui eantion x1 , x2 , .., xn, este raportul dintre suma acestora i numrul lor: n xi i=1 x1 + x2 + ..+ xn x = = n n x media aritmetic, n xi suma valorilor seriei de date (a variabilei) i=1 n numrul valorilor (seriei de date); i = 1, 2,, n
3.1.3. Mediana (Me) Valoarea care mparte irul ordonat de variante n dou pri egale, situndu-se la mijlocul seriei de variaie, astfel nct jumtate dintre valori i sunt inferioare (sau egale) i cealalt jumtate i sunt superioare (sau egale). Rangul medianei; se disting dou situaii: Pentru serii cu numr impar de valori (2k +1), mediana este valoarea de rang k+1. Pentru serii cu numr par de valori (2k), mediana se afl ntre valorile de rang k i k+1, convenindu-se a fi reprezentat de media aritmetic a celor dou valori.
Exemplu: Caracteristicile lungimii la natere sunt: 48, 49, 50, 52, 54 cm. Se observ c valoarea 50 este mediana. Ea a mprit irul de valori astfel nct numrul valorilor mai mici dect ea nsi s fie egal cu numrul valorilor mai mari, n exemplu existnd valorile inferioare 48, 49 i valorile superioare 52, 54.
3.1.4. Modul (Mo) Modul (sau valoarea modal) este definit ca fiind varianta cu numrul cel mai mare de apariii, deci cu frecvena observata cea mai mare. Modul este o valoare observat i nu una calculat, ca n cazul mediei i a medianei.
Se vorbete de: distribuie de frecvene unimodal dac distributia de frecvena are o singura valoare maxima distribuie de frecvene multimodal dac are mai multe maxime. (ex. bimodale dac are dou valori maxime ale frecvenelor corespunznd a dou valori diferite ale variabilei) Pentru seriile unimodale, K.Pearson a stabilit c valoarea apropiat a modului, poate avea expresia: Mo = x + 3 (Me - x ) Grafic modul reprezint abscisa creia i corespunde ordonata maxim. Modul poate oferi indicaii asupra omogenitii seriei de variaie.
Exemplu: Determinri ale uricemiei la 100 de pacieni
xi
33 38 43 48 53 58 63 68 73 78 83 88 -
fi
1 5 10 27 25 11 8 7 3 1 1 1 100
xi fi
33 190 430 1296 1325 638 504 476 219 78 83 88 5360 xifi 5360 x = = = 53,60 Media aritmetic este fi 100 53,60.
fi + 1 101 Rg Me = = = 50,5 Rangul medianei este 50,5. 2 x50 = 53, 2 x51 = 53
x50 + x51 53 + 53 Me = = = 53 Mediana este 53.
2 2 Mo = 48 (corespunde frecvenei cea mai mare 27) Modul este 48.
3.2. Indicatori de dispersie pentru caracteristici cantitative
Indicatorii de dispersie ofer informaii asupra extinderii variabilitatii (mprtierii) variantelor observate. Indicatorii de dispersie sunt utili n caracterizarea generala a seriei. Principalii indicatori de dispersie sunt: amplitudinea absolut i relativ, variana, abaterea (deviaia) standard, coeficientul de variaie.
Tabele statistice
Def
Document statistic cu ajutorul cruia se urmrete asigurarea caracterului unitar al prezentrii informaiilor statistice, uurarea operaiunilor statistice, evidenierea sistematizat a rezultatelor cercetrii Elemente: macheta datele numerice notele explicative
Macheta cuprinde:
Titlul Capul de tabel (titlurile interioare) Reeaua tabelului
Coloane Rnduri Rubrici
Titlul tabelului
Trebuie s indice:
Coninutul tabelului Locul Perioada la care se refer informaiile respective
Ex. Nscuii vii din anul X dup greutatea la natere i sex, n Spitalul Clinic Judeean Sibiu Titlul trebuie s indice:
Problema la care se refer tabelul Modul de abordare a acestei probleme Locul i perioada n care s-a petrecut fenomenul
NU SE SCRIE CUVNTUL TABEL n titlu Tabelul se numeroteaz de obicei n colul din dreapta sus
Capul de tabel
Indic coninutul fiecrui rnd i al fiecrei coloane
Reeaua tabelului cuprinde:
Coloanele- spaiile ntre 2 linii verticale Rndurile- spaiile ntre 2 linii orizontale Rubricile- suprafeele rezultate din intersecia unei coloane cu un rnd
Datele numerice nscrise pot fi:
Valori absolute Valori relative Valori medii
Totaluri Subtotaluri de reportat Prile componente ale tabelului este indicat s fie delimitate cu linii de grosimi diferite Sub capul de tabel trebuie s existe un rnd mai ngust n care s se numeroteze coloanele Notele explicative indic:
Sursa datelor Metodologia de calcul folosit Lmuriri suplimentare
Tipuri de tabele
Simple De grupare Corelative
Tabele simple
Cauzele deceselor neonatale in Romnia n 1994
CAUZE DE DECES
Asfixia la nastere
Nr. Decese
527
Procentaj %
26,1
Traumatisme obstreticale
Stare septica Pneumonie Malformaii congenitale Alte cauze Total
92
7 181 598 606 2019
4,6
0,3 9 29,6 30 100
Clasificarea nscuiilor vii dup nivelul de educaie al tatlui
NIVELUL DE EDUCAIE AL TATLUI Absolventi de liceu Sub 12 clase
NUMR NSCUI VII 50,684 31,774
TOTAL
82,458
Tabele de grupare
Colectivitatea se grupeaz dup dou sau mai multe caracteristici (criterii) i se centralizeaz numai frecvenele de apariie ale valorilor caracteristicilor
Clasificarea nscuiilor vii dup educaia tatlui i timpul de asisten la natere, n statul x, 1996
EDUCAIA
ASISTAT DE TOTAL
TATLUI Absolvent de liceu
MEDIC N SPITAL 46606
MEDIC, DAR NU N SPITAL 3014
MOA 910
ALTE/ NESPECIFICAT 154 50684
Sub 12 clase
TOTAL
14334
60940
3094
6108
13930
14840
416
570
31774
82458
Tabel masterde sintez cuprinde o clasificare complet a datelor ct i totaluri
Internri n spitalul x n anul 1968, Clasificate dup vrst, reziden i sex
VRSTA IN ANI MASC URBAN FEM TOTAL MASC RURAL FEM TOTAL MASC TOTAL FEM TOTAL
<1 1-4
5-9 10-14 15-19 20-29 30-39 40-49 50-59 >59 TOTAL
18 46
12 18 20 23 55 12 12 66
23 40
14 16 12 32 66 24 32 50
41 86
26 34 32 55 121 36 44 116
Tabele corelative (cu dubl intrare)
Unitile sunt exprimate n acelai timp n funcie de dou caracteristici, fiecare dintre acestea reprezentnd o intrare
Tabel de contingen cu frecvenele cazurilor dup sex i dup starea de sntate
Sex
Masculin
Feminin
Total
Stare
Bolnav Sntos
241
446
687
302
511
813
Total
543
957
1500
Rezultatele cercetrii efectelor medicamentului A
Efect Medica ment adm Lot experim (adm medicam A) Lot martor(adm placebo) Total Efect prezent Efect absent total
250
150
400
25
75
100
275
225
500
Schema tabelului de corelaie pentru caracteristicile alternative a dou loturi de cercetare
Variantele Variantele caracteristicii caracteristi Y cii X Y1 Y2 X1 a b Total
a+b
X2
Total
c
a+c
d
b+d
C+d
a+b+c+d
Grafice sau prezentarea prin imagini a datelor
Elementele de baz ale unui grafic:
Titlulred
timpul, locul
coninutul graficului, obiectul reprezentrii,
Scara de reprezentareprezint
observate, respective prezentarea intervalelor i
problemele a valorilor
Reeaua graficuluireele
mai utilizate, care se coordonatelor carteziene
rectangulare sunt cele construiesc n sistemul
Tipuri de reprezentri grafice dup form:
diagrame reprezentri grafice pe hart
Diagramele
Sunt reprezentri grafice prin suprafee i prin linii Tipuri:
Prin coloane Prin benzi Structurale Liniar (historiograma) De distribuie cantitativ Cumulativ
Diagrama prin coloane
Dreptunghiuri
Numrul internrilor n spitalul X n funcie de vrst dispuse paralel cu scala de reprezentare ( anul 2004) cu suprafaa proporional cu nivelul fenomenului 140 121 116
se folosete cnd se reprezint grafic mai multe fenomene n acelai loc i la acelai moment de timp sau acelai fenomen n mai multe locuri i la acelai moment.
120 100 80 60 40 20 0
86 41 26 55 34 32 36 44
<1
1-4
5-9 10-14 15-19 20-29 30-39 40-49 50-59 >59 vrsta pacienilor
Diagrama prin benzi
Dreptunghiuri cu linie de baz vertical Aranjate n ordine cresctoare a mrimii indicatorilor sau dup un alt criteriu logic Trebuie s nu disproporionate fie
Cauzele deceselor neonatale in Romnia n 1994
Alte cauze Malformaii congenitale Pneumonie Stare septica 7 Traumatisme obstreticale Asfixia la nastere 0 92 527 100 200 300 400 500 600 700 Nr decese 181 606 598
Norway Spain EU members before May 2004 Luxembourg Austria Eur-A Malta Finland Greece United Kingdom EU Slovenia Czech Republic Croatia Poland European Region Montenegro EU members since 2004 or 2007 Hungary Serbia Romania Lithuania Eur-B+C Republic of Moldova Russian Federation 0
Life expectancy at birth, in years, 2005
10
20
30
40
50
60
70
80
90
Populaia Romniei pe vrste la 1 iulie 2005
Diagrama structural
Se folosete pentru evidenierea prilor componente ale fenomenului reprezentat. Poate fi sub form de cerc sau dreptunghi
Diagrama structural -ex
Cauzele Deceselor Neonatale in Romnia n 1994 Asfixia la nastere; 26,10%
Structura deceselor prin boli ale aparatului respirator, Romnia, 2000
Alte cauze; 30%
140% 120%
Traumatisme obstreticale; 4,60% Stare septica; 0,30% Pneumonie; 9%
100% 80% 60% 40% 20% 0%
9.6 44
Altele BPOC Pneumonie
49
Malformaii congenitale; 29,60%
Diagrama liniar
Numit i cronograma, historiograma Se utilizeaz pentru prezentarea seriilor dinamice, a succesiunii n timp a unui fenomen. Pe abscis se trece timpul Pe ordonat- valoarea indicatorilor
SPORUL NATURAL AL POPULAIEI, ROMNIA, 1990 2005