420 likes | 665 Views
Statistička obradba i tumačenje biomedicinskih podataka prof. dr. sc. Mladen Petrovečki dr. sc. Lidija Bilić-Zulle Vanja Pupovac, prof. Katedra za medicinsku informatiku Medicinski fakultet Sveučilišta u Rijeci. Priprema podataka za statističku raščlambu : 1-2-3-4-5.
E N D
Statistička obradba i tumačenje biomedicinskih podatakaprof. dr. sc. Mladen Petrovečkidr. sc. Lidija Bilić-ZulleVanja Pupovac, prof.Katedra za medicinsku informatikuMedicinski fakultet Sveučilišta u Rijeci
Priprema podataka za statističku raščlambu: 1-2-3-4-5 • vrsta podataka izbor testa • naziv varijable (plus opis varijable) • šifriranje (binariziranje, “nula” = ne) • nedostatak podatka prazno polje • preračunavanje složenih podataka
Mjere ishoda • varijable koje odabiremo kao pokazatelje za ishod pokusa: • glavne često teško mjerljive (npr. kvaliteta života, stanje stijenki krvnih žila...) • zamjenske (surogatne) dostatno opisuju glavne mjere ishoda, lako mjerljive (npr. pokretljivost, duljina remisije bolesti, koncentracija kolesterola) Oprez pri odabiru surogatnih mjera!
Raspodjela podataka • grafički prikaz mjerenja prikazan samostalno ili u odnosu na druge podatke • prikazuje: • raspon mjerenja • jednolikost raspodjele • modalnost raspodjele • simetričnost raspodjele • normalna raspodjela
Prikaz podataka • kvalitativni podatci kontingencijska tablica • kvantitativni podatci mjere središta (centralne tendencije) i raspršenja
Mjere središta i raspršenja • Najčešće rabljeni: • aritmetička sredina i standardna devijacija (normalna raspodjela i veliki N) • medijan i raspon (percentili, interkvartili)(nenormalna raspodjela, mali N) • interval pouzdanosti (i za aritmetičku sredinu i za medijan) • Rjeđe • varijanca, računski raspon, pogrješke...
Odabir testa • testovi dokazivanja statističkih hipoteza • kriterij odabira • osobine obilježja mjerne ljestvice • osobine uzorka • veličina • povezanost • osobine raspodjele (normalnost) • parametrijski testovi • neparametrijski testovi • broj obilježja uni/bi/multivarijatni testovi
Ovisnost o broju pokazatelja • univarijatni • raščlanjuju samo jedan pokazatelj • bivarijatni • raščlanjuju dva pokazatelja • multivarijatni • raščlanjuju više pokazatelja
Ovisnost o raspodjeli • Parametrijski testovi • pokazatelji koji slijede normalnu raspodjelu • obrađuju izvorna mjerenja • Neparametrijski testovi • nisu ograničeni normalnošću raspodjele • ne raščlanjuju izvorne podatke nego položaje (rangove)
Ovisnost o osobini uzorka • Veličina • veliki uzorci parametrijski testovi • mali uzorci neparametrijski testovi • Zavisnost • nezavisni uzorci neparni testovi • zavisni uzorci parni testovi
Tumačenje i prikaz rezultata • Poopćavanje s uzorka na populaciju • Kontingencijske tablice i mjere središnjice • Tablični i slikovni prikaz podataka • frekvencije: stupčasti grafikon • središnjice i rasap: kutije i brkovi (box and whisker) • Vrijednosti koje odskaču (outliers) • Raspon pouzdanosti (confidence interval, CI) • statističko i logičko zaključivanje
Statistička i stvarna značajnost • Statistička značajnost: ukazuje je li razlika ili povezanost između skupina značajna Pitanje: A je li važna? • Odgovor: stvarna (klinička) značajnost i tumačenje znanstvenika
Ne zaboravite: 1-2-3-4! • Vrijednost P uvijek se piše s tri decimalna mjesta; nema “P<0,05”, “P>0,05” ili p=NS • Vrijednost statističkog testa i koeficijenta korelacije pišu se s dva decimalna mjesta • Udjeli za N<100 i diskretne vrijednosti izražavaju se cijelim brojevima (bez decimalnih mjesta) • Učestalost u malim skupinama nije primjereno predstavljati relativno (“od tri miša 33% je pobjeglo”)
Veličina uzorka • veće bolje • manje etika cijena vrijeme istraživanja • mali uzorak zbog snage testa ne dokazivanje svojstva koje uistinu postoji • rješenje optimalna veličina uzorka
Izračun veličine uzorka • snaga testa, 1- • razina značajnosti, α • varijabilnost obilježja • najmanja vrijednost promjene koja je bitna za promjenu koja se istražuje • istinska, klinička, biološka, itd. značajnost
Postupci • matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • programska potpora
matematičke jednadžbe • brze jednadžbe • Lehrovejednadžbe a = 0,05 b = 80% 16N = ------------------------------------ standardizirana razlika2 npr. Pearsonov t-test: najmanja bitna razlika x1 i x2st. razlika = ---------------------------------------- standardna devijacija
matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • Altmanov nomogram
matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • programska potpora
Članak, CMJ • http://www.cmj.hr/2004/45/4/15311405.pdf • by Tom Lang(http://www.tomlangcommunications.com/) • #5 CMJ rad • SEM vs. SD
koja se hipoteza dokazuje što se računa kako (što je temelj matematičkog izračunavanja) prednosti uvjeti koja su ograničenja Što DA i što NE?
y y y x x x Primjer 1: kada NE računati r
uvjet N r p lin(bsj) : mt 118 0,25 0,006 log(bsj) : mt 118 0,43 <0,001
Primjer 2: kada NE računati 2 hrana studenti studenti u kantini iz Zagreba izvan Zagreba dobra 10 31 loša 0 19 ukupno 10 50
Primjer 3: kada NE zaključiti ovako Lupus 2004;14:426
Pogrješka temeljne prosudbe Kahneman D, Tversky A. On prediction and judgement. Oregon Res Inst Bull 1972;371:100.
Teorija... (1/3) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)
Teorija... (2/3) Osjetljivost testa = TP / (TP + FN) Specifičnost testa = TN / (FP + TN) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)
Teorija... (3/3) Osjetljivost testa = TP / (TP + FN) Specifičnost testa = TN / (FP + TN) Pozitivna prediktivna vrijednost = TP / (TP + FP) Negativna prediktivna vrijednost = TN / (FN + TN) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)
Priča, saobraćajna nezgoda... (1/4) 15% 85% PROMETNA NEZGODA, NOĆ, VOZAČ POBJEGNE p(zeleni) = ? p = 0,15 (15%)
Priča, saobraćajna nezgoda... (2/4) 15% 85% OČEVIDAC NEZGODE: “ZELENI TAXI” p(zeleni) = ? p = 1,0 (100%)
Priča, saobraćajna nezgoda... (3/4) 15% 85% OSPORAVANJE IZJAVE, TESTIRANJE NOĆNE VIDLJIVOSTI RAZLUČIVANJA BOJA:PREPOZNAJE 80%, GRIJEŠI 20% (OBJE)p(zeleni) = ? Osjetljivost testa = 80%, Specifičnost testa = 80% p = 0,8 (80%)
Stvarna boja vozila Svjedok vidi zeleno 12 17 plavo 03 68 ukupno 15 85 Priča, saobraćajna nezgoda... (4/4) Osjetljivost testa = 80%, Specifičnost testa = 80% Poz. PV = 12/(12+17) = 12/29 = 0,41 p = 0,41 (41%)
Mudrost zaključivanja! ZNANOST