190 likes | 353 Views
Continue kansverdelingen. Continue kansverdelingen geven de verdelingen weer van continue stochasten. Een stochast X is continu als de uitkomsten-verzameling U niet aftelbaar is (meestal een interval) . Voorbeelden Gewicht, lengte, etc. van personen Levensduur van een hartklep Meetfouten
E N D
Continue kansverdelingen Continue kansverdelingengeven de verdelingen weer van continue stochasten. Een stochast X is continu als de uitkomsten-verzameling U niet aftelbaar is (meestal een interval). Voorbeelden • Gewicht, lengte, etc. van personen • Levensduur van een hartklep • Meetfouten Voor continue stochasten geldt altijd: P(X = x) = 0. Positieve kansen bestaan slechts op een interval: P(a < X < b). Bij continue stochasten vervult de dichtheidsfunctie (probability density function, pdf ) f de rol die de kansmassafunctie bij discrete stochasten heeft.
Continue Kansverdelingen Definitie Een functie f heet een kansdichtheid als De bijbehorende kansverdeling is bepaald door:
Cumulatieve verdelingsfunktie De cumulatieve verdelingsfunctie (cumulative distribution function, cdf ) is nu: De kansdichtheid is de afgeleide van de verdelings-functie We kunnen nu kansen berekenen door de kansdichtheidsfuntie te integreren of waardes van de verdelingsfunctie in de eindpunten van elkaar af te trekken: Vaak wordt f(x) alleen gegeven voor het domein waarop deze niet nul is. Uiteraard hoef je dan alleen te integreren binnen dat domein.
Verwachting Karakteristieken van continue verdelingen De verwachting (expectation of mean) van een stochast X met pdf f(x) is Je weegt dus elke mogelijke uitkomst x met de bijbehorende waarde van de kansdichtheidsfunctie f(x). Je kan ook de verwachting bereken van een functie van X, bijv. h(X) = X2. Dit gaat op dezelfde manier: elke mogelijke uitkomst van h(X) wordt gewogen met f(x): De variantie (variance) van X is een maat voor spreiding: De standaarddeviatie Xis gelijk aan de wortel van de variantie enheeft dezelfde eenheid als de verwachting.
Kansdichtheid als model Een kansdichtheid is vaak een model dat gebaseerd wordt op een steekproef uit een populatie. Begrippen als verwachting en variantie zijn zeer nuttig om dit model te vinden. De verwachting corresponderend met de kansdichtheid die die eerste steekproef modelleert zal ca. 0 moeten zijn. Zo ook voor de tweede. Verder: kansdichtheid één kleinere standaarddeviatie dan de twee.
Eigenschappen a en b: willekeurige niet-stochastische getallen. X en Y: stochasten. • E(aX + b) = aE(X) + b • Var(aX + b) = Var(aX) = a2Var(X). • E(X + Y) = E(X) + E(Y), ook als X en Y afhankelijk zijn. • Var(aX + bY) = a2Var(X) + b2Var(Y) als X en Y onderling onafhankelijk zijn. Let op: Var(X – Y) = Var(X) + (-1)2Var(Y) = Var(X) + Var(Y). Variantie en standaarddeviatie moeten altijd groter of gelijk aan nul zijn.
Continue Uniforme Verdeling U[a,b], uniforme verdeling op interval [a,b]. Dit betekent dat f(x) = 0 buiten dit interval en de kansdichtheidsfunctie is constant binnen dat interval: Toepassingen: • Ontstaan van een bloedstolsel in een bloedvat. • Passeren van de doellijn door een bal, wanneer deze blind geschoten wordt.
Normale Verdeling De Normale of Gaussische kansdichtheid is: De parameters van de normale verdeling, en 2, zijn tevens de verwachtingswaarde en variantie. Notatie: X is normaal verdeeld, E(X) = en Var(X) = 2, dan schrijven we X ~ N(,2).
Standaard Normaal Eigenschap Als X normaal is verdeeld dan is Y=aX+b ook normaal verdeeld m.a.w. Zij en Dan: Gevolg als dan (standaardnormaal verdeeld) Eigenschap De som van normaal verdeelde onafhankelijke stochasten is ook normaal verdeeld, m.a.w. Zij en en bovendien Dan:
Z-scores Definitie Zij X een aselecte trekking uit een normale verdeling en x de realisatie van X. De Z-score van X, ook wel gestandaardiseerde waarde genoemd,en de realisatie ervan zijn: De Z-scorevan X is de afstand van X tot µ in eenheden . Deze Z-scores zijn uitermate handig voor het berekenen van kansen voor normaal verdeelde stochasten. Waarom? Gevraagd: P(X x). We weten nu dat dit gelijk is aan:
Z-scores (vervolg) Helaas is deze integraal alleen maar numeriek te berekenen. We kunnen echter het volgende gebruiken: waarbij Z standaard normaal verdeeld is. Tabel 9.1 van het Statistisch Compendium geeft nu voor alle waardes van z (tot op twee decimalen) de gevraagde kans.
Voorbeeld We beschouwen een risicopopulatie waarin alle mensen een bloeddruk hebben van ongeveer 160. Van een bloeddrukverlagend middel is bekend dat het de bloeddruk gemiddeld verlaagt van 160 naar 150 eenheden. Op die verlaging zit echter een spreiding: de variantie is gelijk aan 100. Wat is de kans dat bij een willekeurig persoon uit de risicopopulatie het middel de bloeddruk daadwerkelijk verlaagt? We gaan uit van een normale verdeling. Noem het verschil ‘na – voor’: W. Zie ook: Applet Z-scores
Centrale Limiet Stelling Waarom is de normale verdeling zo belangrijk? Zij X1, X2, X3,…….., Xn een aselecte steekproef uit een willekeurige kansverdeling met verwachting µ en variantie 2. Dan geldt onder zeer zwakke voorwaarden dat voor n naar oneindig de kansverdeling van het gemiddelde een normale verdeling is. M.a.w. voor “grote” n is het gemiddelde bij benadering normaal verdeeld: In een meetexperiment betekent dat dat wanneer men veel metingen doet waarbij een stochastische meetfout optreedt, men meestal redelijkerwijs mag veronder-stellen dat het gemiddelde van de metingen normaal verdeeld is. Zie ook: illustratie CLS
Normaal als benadering voor binomiaal en Poisson Eén van de gevolgen van de CLS is dat we Binomiale kansen kunnen benaderen met een normale kans wanneer de parameter n voldoende groot is. De vuistregels is dat wanneer n*p > 5 en n*(1-p) > 5, we mogen gebruiken X ~ Bin(n,p) dan geldt dat bij benadering een standaard normaal verdeelde stochast is. Evenzo geldt voor een Poisson verdeelde stochast Y wanneer > 5, dat bij benadering een standaard normaal verdeelde stochast is. Dus, stel n = 100 and p = 0.25 en X ~ Bin(n,p) . Dan
Eigenschappen lin comb In het algemeen geldt: Als X1,X2,…….Xnonderling onafhankelijke stochasten zijn geldt: Opmerking: Als de stochasten niet onafhankelijk zijn geldt de optelregel voor de varianties NIET. Bovendien hebben we:
Eigenschappen lin. comb. (vervolg) Voor normaal verdeelde stochasten geldt: Als X1,X2,…….Xnonderling onafhankelijke stochasten zijn en dan Belangrijk gevolg: Als X1,X2,…….Xnonderling onafhankelijke normaal verdeelde stochasten zijn met dezelfde variantie en dezelfde verwachtingswaarde dan geldt voor het gemiddelde van die stochasten:
Voorbeeld We hebben 25 mensen een potentieel bloeddruk-verlagend middel gegeven. We willen weten of het effect heeft. De variantie van de bloeddrukmeting (niet van de bloeddruk zelf) binnen een persoon in de populatie is bekend en gelijk aan 50. We meten de bloeddruk voor en na toediening van het middel. De gemiddelde bloeddruk verlaagt van 160 naar 150. Wat is de kans dat dit gebeurt puur door statistische fluctuaties? We gaan uit van normale verdelingen. Noem de bloeddruk voor toediening bij patient i: Xi en na toediening Yi. Het verschil is Zi. Het gemiddelde verschil geven we weer met Als er sprake is van puur willekeurige fluctuaties dan mogen we aannemen dat de verwachtingswaarde van gelijk is aan 0. De variantie is:
Voorbeeld (vervolg) Onder de aanname dat de bloeddruk niet verandert geldt dus De kans dat we precies een gemiddeld verschil van 160 – 150 = 10 waarnemen is nul, want volgt een continue verdeling. We kunnen echter wel uitrekenen Als dit erg klein is, dan achten we het erg onwaarschijnlijk dat we te maken hebben met een statistische fluctuatie en we spreken van een significant verschil.
Exponentiële Verdeling De exponentiële verdeling geeft de verdeling van de ‘tussentijden’ in een Poisson proces aan. Deze verdeling wordt tevens gebruikt om levensduren van niet aan slijtage onderhavige zaken te modelleren. Belangrijke en unieke eigenschap: geheugenloosheid. D.w.z. P(X > t | X > s) = P(X > t-s). M.a.w: het feit dat X groter is dan s geeft geen enkele informatie over de restlevensduur.