Siste forelesning er i morgen!

Siste forelesning er i morgen! • Oppsummeringsforelesning den 5.mai flyttes til fredag 29.april kl. 15.15-17.00 • Holdes i dette auditoriet

Slutningsstatistikk PSY 1010

Utvalg og populasjon • Populasjon: alle enhetene i universet vi definerer, f eks: • - Alle over 18 år i Norge (3,5 mill) • Utvalg: avgrenset del av populasjonen • - 200 personer over 18 år Populajson Utvalg

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg • I populasjonen er og s = 15 • Du trekker tre utvalg á 25 tilfeldige personer fra denne populasjonen og beregner : Utvalg 1: 103 Utvalg 2 101 Utvalg 3 98 Utvalgsfeil (tilfeldigheter) 103-100 = 3 101-100 = 1 98-100 = -2

Utvalgsfeil (sampling error) • Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne” verdien i populasjonen • Vi må derfor regne med at en viss usikkerhet i de verdiene vi har regnet oss fram til basert på utvalget • Vi må ta hensyn til denne feilmarginen hvis vi vil slutte noe om populasjonen ut i fra utvalget

Utvalgsfordeling og standardfeil • Utvalgsfordeling (Sampling distribution): • fordeling over gjennomsnittsnittsverdier til et uendelig antall utvalg trukket fra en populasjon • Standardavviket i en utvalgsfordeling kalles standardfeil (standard error) • Gir et mål på størrelsen på statistisk usikkerhet • Standardfeilen (SX) er en funksjon av to ting: • S : Hvor stort standardavviket i populasjonen er • N: Størrelsen på utvalget

13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 50 % ligger over -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra en populasjon med et standardavvik (s) på 15 • N = 9 • N = 25 • N = 100 Altså: Størrelsen på utvalget påvirker hvor størrelsen på standardfeilen

N = 100 N = 9 Utvalgsfordeling med ulike utvalgsstørrelserAlle utvalg er trukket fra samme populasjon N = 25 Uendelig antall utvalg med: 85 90 95 100 105 110 115

IQ og morsmelk • Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket er 15 • En forsker har en hypotese om at morsmelk bidrar til høyere IQ • Et 25 utvalg på 12-åringer som er blitt ammet fram til 2 års alder har i snitt en IQ skåre på 103 • Hvor sannsynlig er det at disse har fått = 103 ved en ren tilfeldighet?

Hypotesetesting Nullhypotese (H0): Det er ingen forskjell i IQ i populasjonen mellom barns om er ammet fram til 2 års alder og de som ikke er det Dvs: forskjell skyldes utvalgsfeil / tilfeldigheter Forskningshypotese (H1): Det er en forskjell i IQ i populasjonen mellom barns som er ammet fram til 2 års-alder og andre barn Hvor sannsynlig er det at en forskjell på 3 poeng eller mer skyldes en tilfeldighet? Denne benevnes som p-verdi

13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Normalfordelig og utvalgsfeil Utvalgets = 103 -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX 91 94 97 100 103 106 109

Signifikanstesting • Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)? • I vårt eksempel: en på 103 eller høyere forekommer i 15,9 % av tilfellene vi trekker utvalg med N=25 fra populasjonen (p= 0.159) • Grense for å forkaste nullhypotesen kalles signifikansnivå () : • Vanlig grense: mindre enn 5 % sannsynlighet for at resultatet skyldes en tilfeldighet ( = 0.05) • Kan også være strengere f eks mindre enn 1 % ( = 0.01) • Hvis sjansen for at resultatet skyldes en tilfeldighet er større en signifikansnivået, beholdes nullhypotesen (H0)

Type I og type II feil Aldri 100% sikre på at vi gjør riktig beslutning om å beholde eller forkaste nullhypotesen:

Enhalet og tohalet hypotesetest • En enhalet hypotesetest er retningsbestemt H1 : Barn som ammes fram til 2 år har høyere IQ enn andre • En tohalet hypotesetest er ikke retningsbestemt H1 : Barn som ammes fram til 2 år har forskjellig IQ enn andre (dette betyr at de kan har lavere IQ eller høyere IQ enn populasjonen)

En-halet og to-halet test 1.65 1.96 -1.96

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg kvinner (n = 36) på en test for sosial intelligens. Vi får følgende Nullhypotese (H0): Det er ingen forskjell mellom menn og kvinner I populasjonen (forskjellen skyldes utvalgsfeil) Forskningshypotese (H1): Det er en forskjell i sosial IQ mellom menn og kvinner i populasjonen Hvor sannsynlig er det at forskjellen på 5 poeng skyldes en tilfeldighet? Denne benevnes som p-verdi

Parametriske hypotesetester • Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter at: • Utvalget er tilfeldig trukket fra populasjonen • Utvalgsfordelingen er normalfordelt rundt populasjonsgjennomsnittet Et tilleggskriterium (kan dog korrigeres for): • Hvis to eller flere utvalg sammenlignes, skal spredingen innen utvalgene være like

Eksempler på parametriske tester • Z-test • er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet? • t-test • Er det forskjell i gjennomsnittsverdi mellom to utvalg? • ANOVA (analysis og varians) • Forskjell i gj.snittsverdi mellom tre eller flere utvalg? • To-veis ANOVA

Ikke-parametriske tester • Benyttes ofte når vi har variabler som er målt på nominal eller ordinalnivå • Eller når forutsetningene for en parametrisk test ikke er oppfylt • Benytter ellers samme logikk som tidligere, dvs. tar hensyn til utvalgsfeil/tilfeldighetenes spill og vurderer resultatene opp i mot dette

Eksempel på ikke-parametrisk test • Er det lettere for en person med lys hudfarge å bli frikjent enn en med mørk hudfarge for en voldsforbrytelse? • Begge variablene (hudfarge og frikjent/dømt) er variabler som vi ikke kan regne gjennomsnitt på • I dette tilfellet benyttes en kji-kvadrat test (2) for å avgjøre om forskjellen er tilfeldig eller ikke

Signifikansnivå og praktisk betydning • Et signifikant resultat er ikke nødvendigvis av stor praktisk betydning • Dette er først og fremst fordi signifikanstesting er sterkt påvirket av utvalgets/utvalgenes størrelse • Store utvalg = lettere å få signifikant resultat (forkaste H0) • Et alternativ er å inkludere mål på effekt isteden, • f eks hvor stor andel kvinner har høyere sosial IQ enn menn • Eller hvor mange standardavvik skårer kvinner over menn

Siste forelesning er i morgen!

Siste forelesning er i morgen!

Presentation Transcript

100 høgfrekvente ord nynorsk

Forskningsmetoder: Oppsummering og utdypning

Familie heute – Familie morgen Familienfreundlichkeit im Landkreis Emmendingen

Equilibre hydro-électrolytique

Motorisk Kontroll

Lars Anders Kulbrandstad Høgskolen i Hedmark

Hverdagsliv og Psykisk Helse

Sain et Sauf Le sentier de la restauration

Seminarschulung zum Thema Zeitmanagement

Xerox ConnectKey

On résiste à l'invasion des armées; on ne résiste pas à l'invasion des idées

Bilgisayar ı Keşf ediyorum 2010 Dijital Dünyada Yaşamak

Peraturan Akademik di Perguruan Tinggi

Palliativ behandling ved KOLS

Datakommunikasjon høsten 2002

Die morgen werden we aan de schoolpoort verwelkomd door drie landbouwers.

Mad og Sundhed

Forelesning 2 Vulkanologi

INF5120 Modellbasert Systemutvikling

Hémorragies digestives Hémopéritoine

WELKOM

Om nasjonale og internasjonale IT-strategier