180 likes | 521 Views
Štatistické spracovanie a vyhodnotenie dát 2. Induktívna štatistika. Základným predpokladom použitia akejkoľvek induktívnej štatistickej metódy je náhodný výber , teda výber, ktorý spĺňa dve základné vlastnosti: Pravdepodobnosť zaradenia do vzorky je pre všetky štatistické jednotky nenulová.
E N D
Induktívna štatistika Základným predpokladom použitia akejkoľvek induktívnej štatistickej metódy je náhodný výber, teda výber, ktorý spĺňa dve základné vlastnosti: • Pravdepodobnosť zaradenia do vzorky je pre všetky štatistické jednotky nenulová. • Štatistické jednotky sú do vzorky vyberané nezávisle jedna od druhej. Použitie induktívnej štatistiky na vzorkách, ktoré neboli získané náhodným výberom (napr. kvótne výbery) a pre cenzusy (vyšetrovania celých základných súborov) je nesprávne. Induktívna štatistika rieši dva typy úloh: • Odhady parametrov. • Testy štatistických hypotéz.
Odhady parametrov Koľko premenných chcete skúmať súčasne: • Jednu premennú • Príklad: Možno na základe 30 meraní tvrdiť, že priemerný čas prečítania jednej strany knihy (X) je menej ako 4 minúty? • Dve premenné • Príklad: Súvisí počet vyriešených problémových úloh žiakmi (Y) a množstvo položenia otázok učiteľom žiakom počas vysvetľovania (X)? • Tri a viac premenných • Príklad: Existuje vzťah medzi dosiahnutým prospechom žiakov (Y) a vzdelaním (X1), vekom (X2) a pohlavím (X3) učiteľov?
Testy štatistických hypotéz Postup testovania hypotéz: • Formulácia nulovej hypotézy (H0) • Formulácia alternatívnej hypotézy (Ha) • Stanovenie hladiny významnosti (α) • Výpočet testovacej štatistiky a pravdepodobnosti • Rozhodnutie
Sila testu a veľkosti vzoriek Sila testu (pravdepodobnosť zachytenia existujúceho významného rozdielu) závisí od: • Variability • Veľkosti vzorky • Pravdepodobnosti chyby I. druhu (α) • Veľkosti efektu
Analýza sily (Power Analysis) Čím je vyššia variabilita hodnôt premennej, tým je nižšia sila testu. Zvýšenie zvyšných troch faktorov zvyšuje silu testu. Veľkosť efektu je veľkosť rozdielu parametrov (napr. rozdiel priemerov pri t-teste), ktorý možno zachytiť napr. experimentom. Na zachytenie veľkého efektu stačí menšia vzorka ako na zachytenie malého efektu. Voľba vhodnej veľkosti efektu je často ťažká, pretože je veľmi subjektívna. Voliť sa má vždy taká veľkosť efektu, ktorá je pre daný výskum užitočná. Vzťahmi medzi variabilitou, veľkosťou vzorky, alfou, veľkosťou efektu a silou testu sa zaoberá analýza sily (Power Analysis). Analýzou sily sa treba zaoberať už pri plánovaní výskumu. • Nedostatočná veľkosť vzorky, môže spôsobiť nezachytenie relevantného efektu. • Príliš veľká vzorka stojí zbytočne veľa času a peňazí s minimálnym úžitkom.
Nevýhody testovania hypotéz Výsledok testovania hypotéz je dichotomické rozhodnutie o tom, či zamietnuť alebo nezamietnuť nulovú hypotézu. Veľmi často je takýto výsledok nepostačujúci - napr. v prípade testovania efektívnosti novej liečby. Výskumník sa zaujíma o silu efektu nie o to, či sa efekt rovná presne 0. Porovnávanie P-hodnôt (aj v rámci jednej štúdie) bez doplňujúcich informácií a následným vyvodením záverov nemusí byť správne. Ak napríklad vo viacfaktorovej ANOVA faktor A má P=0,0001 a faktor B P=0,049, nemôžeme jednoducho povedať, že faktor A má silnejší efekt ako faktor B. Samotná P-hodnota 0,001 môže v skutočnosti znamenať 3 situácie: • triviálny (z praktického hľadiska nevýznamný) efekt v základnom súbore zistený z veľkej vzorky, • silný efekt v základnom súbore zistený zo stredne veľkej vzorky, • obrovský efekt v základnom súbore zistený z malej vzorky.
Výhody intervalových odhadov • odpovedajú na otázku v akých hraniciach možno očakávať skutočný efekt v základnom súbore. Poskytujú teda viac informácií ako testy hypotéz. • V prípade, že chceme zistiť, či je liek proti vysokému krvnému tlaku účinný, môžeme použiť párový t-test. Vzorke pacientov zmeriame tlak pred a po podávaní lieku. Ak sa priemerný rozdiel tlakov významne odlišuje od 0, potom má liek účinok. • Silu účinku však možno určiť len intervalovým odhadom priemerného rozdielu. Intervalový odhad nám s danou spoľahlivosťou (pravdepodobnosťou v %) povie, aký pokles tlaku môžeme očakávať v základnom súbore tvorenom pacientmi s vysokým krvným tlakom. Veľkou výhodou intervalových odhadov je ich výpovedná schopnosť. Z intervalu, ktorý je príliš široký (vykazuje veľkú chybu) jasne vidno, že veľkosť vzorky je nedostatočná. Naopak, z intervalu ktorý je úzky, pričom vyjadruje triviálny efekt vidno, že štatistická významnosť je dosiahnutá veľkou vzorkou (teda príliš veľkou silou testu).
Usporiadanie základných situácií štatistického usudzovania
Jednorozmerná induktívna štatistika - intervalová premenná • Jednovzorkový Studentov t-test • na testovanie nulovej štatistickej hypotézy, ktorá tvrdí, že priemer základného súboru sa rovná zadanej konštante. Test teda odpovedá na otázku, či možno na základe náhodnej vzorky tvrdiť, že (neznámy) priemer základného súboru sa rovná zadanému číslu (resp. či je väčší, príp. menší ako zadané číslo). • Viac informácií ako samotný test poskytuje Intervalový odhad priemeru, pretože určuje hranice v ktorých sa s danou spoľahlivosťou (pravdepodobnosťou – tradične 95 %) nachádza priemer základného súboru. Studentov t-test aj intervalový odhad priemeru predpokladajú normálne rozdelenie premennej v základnom súbore. Ak je vzorka malá (n < 50) a testy normality zamietnu normálnosť, treba použiť neparametrické alternatívy: Wilcoxonov test (1945) a znamienkový test, ktoré testujú nulovú hypotézu o zhode mediánu s konštantou.
Viacrozmerné prieskumné techniky Porovnanie dvoch nezávislých výberov z normálne rozdelených základných súborov • Skúmame tú istú premennú na dvoch nezávislých výberoch. • podmienky pokusu pre oba výbery sa odlišujú iba v pôsobení jedného faktora. Rozdiel výberových priemerov môžu podmieňovať náhodné vplyvy, vtedy nebude signifikantný rozdiel v nameraných priemeroch. Naopak, ak je rozdiel podmienený istým faktorom, vtedy zistíme signifikantnosť rozdielu. • Oprávnenosť použitia t-testu: normálne rozdelenie, oba výbery sú homogénne, teda variancia oboch súborov je rovnaká (pomocou kritéria F-testu – testovanie podielu variancií). Ak platí, že variancie sú v oboch súboroch rovnaké použijeme t-test určený pre takýto prípad. • variancie sledovaných súborov štatisticky významne odlišné – použiť upravený t-test určený pre prípad nehomogénných súborov.
Porovnanie dvoch závislých výberov (v niektorej literatúre sa označujú aj ako korelujúce výbery) z normálne rozdelených základných súborov • test nulovej hypotézy pre závislé výbery, v prípade, keď rovnaký test použijeme v tom istom súbore dvakrát. Vznikajú dvojice pozorovaných hodnôt (napríklad vstupný a výstupný test) – na analýzu použijeme párový t-test • musí platiť, že ide o normálne rozdelenie. • testujeme či aritmetický priemer rozdielu vo výsledkoch sa odlišuje od nuly náhodne alebo štatisticky signifikantne. • Hodnoty, ktoré premenná nadobúda pri oboch meraniach, musia pritom navzájom pozitívne korelovať.
Porovnanie dvoch nezávislých výberov neparametrickými testovacími metódami • Ak pracujeme s dátami, ktoré nemajú normálne rozdelenie, musíme zvoliť postup, ktorý je nezávislý od určitej formy rozdelenia. • Hypotézy, ktoré testujeme, sa v tomto prípade nevzťahujú na parametre rozdelení, a preto hovoríme o neparametrických testoch. Často sa takto používajú Wilcoxonov test a Kolmogorovov-Smirnov test.
Porovnanie dvoch závislých výberov neparametrickými testovacími metódami • Pre malé výbery ťažko dokázať normálnosť rozdelenia náhodnej premennej. Preto aj pre závislé (korelujúce) výbery treba siahnuť po neparametrickej testovacej metóde. V takomto prípade môžeme použiť znamienkový test (sign test – skúma smer odchýlky merania od predpokladaného mediánu).