490 likes | 863 Views
Zaključivanje u istraživanju. Osim ispravo određene vrste podataka za ispravno zaključivanje u istraživanju važno je i :. 1. Odrediti ovisne i neovisne varijable u istraživanju. Ovisna varijabla ili varijabla ishoda ( engl . outcome ) – ishod istraživanja koji nas zanima
E N D
Osim ispravo određene vrste podataka za ispravno zaključivanje u istraživanju važno je i :
1. Odrediti ovisne i neovisne varijable u istraživanju • Ovisna varijabla ili varijabla ishoda (engl. outcome) – ishod istraživanja koji nas zanima (% infekcija, % alergija, ukupni bodovi na skali koja procjenjuje ponašanje) • Neovisne varijable - varijable koje su neposredno ili posredno povezane s varijablom ishoda Npr. ako je ishod % infekcija i gledamo utjecaj dojenja na %infekcija: • neposredno - je li dijete isključivo dojeno • posredno - socioekonomski status majke
Ovisna varijabla? • Istraživač planira istražiti učinak davanja biljnih preparata dojiljama s ciljem povećanja proizvodnje mlijeka. Ovisna varijabla u ovom istraživanju je: • korištenje biljnih preparata • volumen mlijeka koje popije dojenče • volumen izdojenog mlijeka • Korištenje placebo pripravka
2. Postavljanje hipoteze • Sva istraživanja moraju započeti s jasno postavljenom hipotezom. • Hipoteza je pozitivna tvrdnja koja mora biti kvantitativna(dojenje smanjuje učestalost infekcije uha) i specifična (u koga = dojenčadi do 3 mjeseca života hranjenih isključivo majčinim mlijekom).
Postavljanje hipoteze • Primjer 1: “Dojenčad koja je dojena manje je bolesna od dojenčedi hranjene mlijekom iz boce.” O kojoj bolesti govorimo? Kako je definiran način prehrane “dojeno” vs “iz boce”? Je li razlika u riziku velika? • Bolji primjer: “U dojenčadi koja su isključivo dojena 3 mjeseca i više, dolazi do smanjenja incidencije hospitalizacija zbog gastroenteritisa tijekom prve godine života.
Postavljanje hipoteze… Opis istraživanja:
Postavljanje hipoteze… Opis istraživanja:
Postavljanje hipoteze… Opis istraživanja:
Postavite hipoteze za navedena istraživačka pitanja Pitanja:
Hipoteza i inferencijalna statistika • Za dokazivanje ili odbacivanje hipoteze koristimo statističke testove. • Statistički testovi dio su inferencijalne statistike. • Inferencijalnom statistikom poopćujemo rezultate naših istraživanja (npr. na naših 30 majki) na cijelu populaciju (na sve majke u Hrvatskoj)
Statistički testovi • Postavljanje statističke hipoteze • Provođenje testa i dobivanje P-vrijednosti kao rezultata testa • Tumačenje P-vrijednosti
1. Postavljanje statističke hipotezePrimjer dvostrane hipoteze • Ništična hipoteza = “ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu tijekom trudnoće jednaka je aritmetičkoj sredini beba iz kontrolne skupine; µ1=µ2 µ-oznaka za aritmetičku sredinu populacije • Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu tijekom trudnoće različita je aritmetičkoj sredini beba iz kontrolne skupine; hipoteza različita od nulte µ1≠µ2 • Kod dvostrane hipoteze ne zanima nas smjer razlike (veće ili manje) već samo razlika
1. Postavljanje statističke hipoteze Primjer jednostrane hipoteze • Ništična hipoteza =“ništa značajno nije nađeno” Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu tijekom trudnoće veća je od aritmetičke sredine beba iz kontrolne skupine; µ1>µ2 µ-oznaka za aritmetičku sredinu populacije • Alternativna hipoteza Aritmetička sredina porođajne težine beba čije su majke uzimale folnu kiselinu tijekom trudnoće manja je ili jednaka aritmetičkoj sredini beba iz kontrolne skupine; hipoteza različita od nulte µ1≠µ2 • Kod jednostrane hipoteze zanima nas smjer razlike tj. je li nešto veće ili manje
2. Provođenje testa i dobivanje P-vrijednosti kao rezultata testa • Izbor statističkog testa koji ćemo provesti ovisi o vrsti podataka koje testiramo • Rezultat testa: P vrijednost – broj od 0.0 do 1.0
Odabir testa • Vrsta varijable (vrsta podatka) • Broj uzoraka • Uzorci ovisni/neovisni
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 ili više neovisnih varijabli Kvalitativni McNemar test 2 ili više ovisnih varijabli Pearson r Kontinuirana varijabla Regresija 1 prediktor TIP PODATKA Spearman r Rangovi Testiranje hipoteze Multipla regresija Više prediktora Povezanost t test neovisne Mann-Whitney 2 skupine t test za povezane uzorke Kvantitativni ovisne One-way ANOVA Wilcoxon Razlika Kruskal-Wallis neovisne ANOVA za ponavljane uzorke Djelovanje novoga lijeka za snižavanje krvnoga tlaka u ukriženom se pokusu uspoređuje s djelovanjem placeba Više skupina Parametrijske Neparametrijske Friedman ovisne
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 ili više neovisnih varijabli Kvalitativni McNemar test 2 ili više ovisnih varijabli Pearson r Kontinuirana varijabla Regresija 1 prediktor TIP PODATKA Spearman r Rangovi Testiranje hipoteze Multipla regresija Više prediktora Povezanost t test neovisne Mann-Whitney 2 skupine t test za povezane uzorke Kvantitativni ovisne One-way ANOVA Wilcoxon Razlika Kruskal-Wallis neovisne ANOVA za ponavljane uzorke Više skupina Postoji li veći rizik oboljenja od karcinoma dojke u žena koje rabe hormonsku kontracepciju u odnosu na one koje to ne čine? Parametrijske Neparametrijske Friedman ovisne
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 ili više neovisnih varijabli Kvalitativni McNemar test 2 ili više ovisnih varijabli Pearson r Kontinuirana varijabla Regresija 1 prediktor TIP PODATKA Spearman r Rangovi Testiranje hipoteze Multipla regresija Više prediktora Povezanost t test neovisne Mann-Whitney 2 skupine t test za povezane uzorke Kvantitativni ovisne One-way ANOVA Wilcoxon Razlika Kruskal-Wallis neovisne ANOVA za ponavljane uzorke Razlikuju li se proporcije pušača u Francuskoj, Velikoj Britaniji i Njemačkoj? Više skupina Parametrijske Neparametrijske Friedman ovisne
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 ili više neovisnih varijabli Kvalitativni McNemar test 2 ili više ovisnih varijabli Pearson r Kontinuirana varijabla Regresija 1 prediktor TIP PODATKA Spearman r Rangovi Testiranje hipoteze Multipla regresija Više prediktora Povezanost t test neovisne Mann-Whitney 2 skupine t test za povezane uzorke Kvantitativni ovisne One-way ANOVA Wilcoxon Razlika Kruskal-Wallis neovisne ANOVA za ponavljane uzorke Je li prosječna vrijednost indeksa tjelesne mase (BMI) petnaestogodišnjaka u Škotskoj veća od istoga indeksa petnaestogodišnjaka u Engleskoj? Više skupina Parametrijske Neparametrijske Friedman ovisne
Goodness of fit x 2 1 neovisna varijabla Hi kvadrat (x 2) 2 ili više neovisnih varijabli Kvalitativni McNemar test 2 ili više ovisnih varijabli Pearson r Kontinuirana varijabla Regresija 1 prediktor TIP PODATKA Spearman r Rangovi Testiranje hipoteze Multipla regresija Više prediktora Povezanost t test neovisne Mann-Whitney 2 skupine t test za povezane uzorke Kvantitativni ovisne One-way ANOVA Wilcoxon Razlika Kruskal-Wallis neovisne ANOVA za ponavljane uzorke Usporedba djelovanja triju različitih lijekova u bolesnika s hiperkolesterolemijom, pri čemu su skupine ispitanika razdijeljene u podskupine s prosječnom razinom kolesterola. Više skupina Parametrijske Neparametrijske Friedman ovisne
3. Tumačenje P-vrijednosti • P-vrijednost je vjerojatnost da su uočene razlike između skupina slučajne (beznačajne) • P=0.1=10% vjerojatnosti (1 događaj u 10) • P=0.99=99% (99 događaja u 100) • P=0.001=0.1% (1 događaj u 1000)
Tumačenje P-vrijednosti (0.05) Razlike između skupina su slučajne (beznačajne) Ništična hipoteza se prihvaća Razlike između skupina su značajne Ništična hipoteza se odbacuje P<0.05 tj. 5% P>=0.05
Greške pri zaključivanju Greške tipa 1 (lažni pozitivi) Greške tipa 2 (lažni negativi) Ništična hipoteza je pogrešno prihvaćena (iako stvarna razlika postoji) Npr. skrivanje učinkovitog lijeka od bolesnika Statistički je utvrđeno da lijek A nije učinkovitiji od placeba iako je u stvarnosti lijek A značajno učinkovitiji! • Ništična hipoteza je pogrešno odbačena (iako stvarna razlika ne postoji). • Npr. puštanje neučinkovitog lijeka na tržište • Statistički je utvrđeno da je lijek A učinkovitiji od placeba iako u stvarnosti između njih nema razlike!
Snaga testa • Statistička snaga testa je mjera vjerojatnosti da će istraživač u uzorku naći statističku značajnost, ako učinak postoji u cjelokupnoj populaciji. • Uobičajeno je da je snaga 0.8=80% • u 100 ponovljenih eksperimenata značajna razlika naći će se u 80 eksperimenata
Statistička vs klinička značajnost • U usporedbi s isključivo dojenom djecom, utvrđen je statistički značajan porast mase dojenčeta u skupini koja je hranjena na bočicu: porast 3g (P<0.000001). • Je li 3 g klinički značajno!!
95% CI za aritmetičku sredinu 95% CI za aritm. sredinu ?
95% CI razlike aritm sredina između skupina Skupina B Skupina A • Izračunaj: • Glavni učinak (razlika u ishodu!) • Varijabilnost glavnog učinka Postavi ništičnu hipotezu (glavni učinak je 0) Izračunaj 95% CI oko glavnog učinka Izračunaj test statistiku da odrediš P-vrijednost Izvor: American CollegeofPhysicians – AmericanSocietyofInternal Medicine: EffectiveClinicalPractice
95% CI razlike između skupina Ako 95% CI uključuje 0 tj. nepostojanje razlike između skupina, tada je P>0.05 Slika. Odnos između P vrijednosti i 95% CI Ako 95% CI NE uključuje 0 tj. ima razlike između skupina tada je P<0.05 0 Nema razlike između skupina
TESTIRANJA HIPOTEZE U MEDICINI– Što testiramo? Učinci ili razlike koje su nam interesantne: • Razlike u aritmetičkoj sredini ili proporcijama • Omjer izgleda (OR) • Relativni Rizik (RR) • Korelacijski koeficijent – povezanost dvaju varijabli
Povezanost varijabli • Kvantitativne • koeficijent korelacije • Kategoričke • χ2 test, McNemartest • omjer izgleda, relativni rizik
Povezanost kvantitativnih varijabli Tumačenje podataka s točkastog grafikona Linearnost i smjersu dva koncepta koja nas interesiraju Pozitivna linearna ovisnost Negativna linearna ovisnost Slaba ili ne-linearna ovisnost Nema ovisnosti
Povezanost kvantitativnih varijabliKoeficijent korelacije Koeficijent korelacije je mjera smjera i jakosti povezanosti!
Primjer za povezanost kvantitativnih varijabli Analiza razine ekspresije gena iz mikročipova Citat iz rada:Squamous cell carcinoma tumor and perilesional display distinctly different scatter plots from normal tissue. Expresion levels for gene subset 1 in patient 1
Povezanost kvantitativnih varijabli Koeficijent korelacije Simulacija http://onlinestatbook.com/stat_sim/reg_by_eye/index.html
Opportunistic screening for alcohol use disorders in primary care: comparative study. OBJECTIVE: To evaluate the efficacy and relative costs of different screeningmethods for the identification of alcohol use disorders in an opportunistic screening programme in primary care in the United Kingdom. DESIGN: Comparative study.SETTING:Six general practices in south Wales. PARTICIPANTS:194 male primary care attendees aged 18 or over who completed an alcohol use disorders identification test (AUDIT) questionnaire. MAIN OUTCOME MEASURES:Scores on alcohol use disorders identification test and measures of gamma-glutamyltransferase, aspartate aminotransferase, per cent carbohydrate deficient transferrin, and erythrocyte mean cell volume. Hazardous alcohol consumption, weekly binge consumption, and monthly binge consumption were ascertained using the time line follow back method over the previous 180 days. Alcohol dependence was determined using the Diagnostic and Statistical Manual of Mental Disorders, fourth edition. Unit costs were established from published resource references and from actual costs of analysing the biochemical tests.
Opportunistic screening for alcohol use disorders in primary care: comparative study. RESULTS: A significant correlation was observed between alcohol consumption and score on the alcohol use disorders identification test (Pearson's correlation coefficient r = 0.74) and measures of gamma-glutamyltransferase (r = 0.20) and per cent carbohydrate deficient transferrin (r = 0.36) but not aspartate aminotransferase (r = 0.08) or erythrocyte mean cell volume (r = 0.02). The alcohol use disorders identification test exhibited significantly higher sensitivity, specificity, and positive predictive value than all of the biochemical markers for hazardous consumption (69%, 98%, and 95%), weekly binge consumption (75%, 90%, and 71%), monthly binge consumption (66%, 97%, and 91%), and alcohol dependence (84%, 83%, and 41%). The questionnaire was also more cost efficient, with a lower cost per true positive for all consumption outcomes. CONCLUSION: The alcohol use disorders identification test questionnaire is an efficient and cost efficient diagnostic tool for routine screening for alcohol use disorders in primary care.
Povezanost kvantitativnih varijabli Koeficijent korelacije – statist. značajnost Koeficijent korelacije: • utvrđivanje povezanosti (npr. P=0,001) • koliko je jaka povezanost (r=0,98 ili r=0,02)
Povezanost kategorijskih varijabli – Tablice frekvencija • Za usporedbu 2 kategorijske varijable • Ako prva varijabla imarkategorija, druga varijablackategorija,tada izrađujemo tablicu frekvencija r×c(cross table).
Povezanost kategorijskih varijabli Povezanost genotipa YPEL5 s bolešću X
Povezanost kategorijskih varijabli, χ2 test Analiza učestalosti različitih genotipova u bolesnih i zdravih pokazala je da je bolest X povezana s genotipom. Postotak bolesnih osoba s genotipom AA iznosio je 100%, dok je zdravih osoba s genotipom GG također bilo 100% χ2 = 6,0; P = 0,05 http://onlinestatbook.com/stat_sim/chisq_theor/index.html
Povezanost kategorijskih varijabli, Mjere povezanosti • ᵪ2 test odgovara na pitanje "Ima li povezanosti?" • Odgovor na pitanje “Koliko je jaka povezanost?” daju nam mjere za snagu povezanosti kao što je npr. relativni rizik, atributivni rizik, omjer izgleda,
Povezanost kategorijskih varijabliRelativni rizik,Atributivni rizik,Omjer izgleda, …