250 likes | 510 Views
dr hab. Dariusz Piwczyński. Teoria estymacji. Estymacja. to postępowanie statystyczne zmierzające do oszacowania parametrów populacji generalnej ( , ) na podstawie statystyk (estymatorów) uzyskanych z populacji próbnej. Estymatory a Parametry. POPULACJA GENERALNA. Parametry ():
E N D
dr hab. Dariusz Piwczyński Teoria estymacji
Estymacja • to postępowanie statystyczne zmierzające do oszacowania parametrów populacji generalnej (, ) na podstawie statystyk (estymatorów) uzyskanych z populacji próbnej.
Estymatory a Parametry POPULACJA GENERALNA Parametry (): – przeciętna w populacji – odchylenie standardowe w populacji Estymatory: , Sx,
Cechy dobrego estymatora to Nieobciążoność. Estymator nazywamy nieobciążonym, gdy jego wartość oczekiwana jest równa parametrowi populacji generalnej, czyli E(Tn)= . Efektywność. Estymator efektywny, to taki, którego wariancja jest najmniejsza. Zgodność. Estymator nazywamy zgodnym, jeżeli wraz ze wzrostem liczebności próby jego wartość zbliża się do szacowanego parametru.
Rodzaje estymacji • punktowa • przedziałowa
Estymacja punktowa • polega na uznaniu estymatora z próby losowej, jako wartości parametru. Powyższemu stwierdzeniu towarzyszy dodatkowo podanie błędu oszacowania. • Średni błąd średniej arytmetycznej:
Błąd średniej • Jeżeli względny błąd estymatora nie przekracza 7,5%, to można uznać, iż wynik estymacji jest wysoce precyzyjny. Jeśli przyjmuje wartości z przedziału 7,5%-15%, to dopuszczalny, a powyżej – nie jest do przyjęcia.
Estymacja przedziałowa • polega na wyznaczeniu przedziału liczbowego, który z określonym prawdopodobieństwem zawiera szacowany parametr. Końce przedziału zależą od wartości estymatora.
Przedział ufności • to losowy przedział, który z określonym prawdopodobieństwem określa wartość parametru. To inaczej przedział liczbowy, w którym znajduje się prawdziwa, lecz nieznana wartość parametru . • Przedział (g1,g2) jest przedziałem ufności parametru , określonym na poziomie ufności 1-, jeżeli prawdopodobieństwo, że leży w tym przedziale jest równe 1-.
Poziom ufności • 1 – jest prawdopodobieństwem, że leży w przedziale (g1,g2). • Jeżeli = 0,05, to 1- =0,95 oznacza to, że średnio na każde 100 przedziałów ustalonych na 100 prób losowych, w 95 przypadkach prawdziwa wartość parametru znajduje się wewnątrz przedziału, natomiast w 5 przypadkach znajduje się poza przedziałem.
Przedział ufności dla średniej • Stosowany wtedy, gdy mamy do czynienia z rozkładem normalnym (N(, )), jest znane. • u- wartość zmiennej standaryzowanej U (U=(X-)/) o normalnym rozkładzie
Wartości krytyczne • Wartości krytyczne są to takie wartości danej statystyki u, że prawdopodobieństwo, iż zmienna losowa przyjmie wartość większą od u lub mniejszą od u wynosi .
Przedział ufności dla średniej • Stosowany wtedy, gdy mamy do czynienia z rozkładem normalnym lub innym, jest nieznane, próba duża > 30. • u- wartość zmiennej standaryzowanej U (U=(X-)/) o normalnym rozkładzie
Przykład Kontrolowano masę ciała 115 ślimaków winniczków. Średnia masa wyniosła 16,165 g, zaś odchylenie standardowe 6,103 g. Oszacuj 95% przedział ufności dla tej cechy. Nie znamy , nie znamy rozkładui, próba jest duża.
Rozwiązanie Oszacowany przedział ufności to: (15,05; 17,28).
Przedział ufności dla średniej 1 • Stosowany wtedy, gdy mamy do czynienia z rozkładem normalnym, ale nie znamy i próbie małej, tj. poniżej 30 elementów. • (w mianowniku wzoru na odchylenie standardowe znajduje się „/n”). • t - odczytujemy z tabeli testu t-Studenta dla liczby stopni swobody równej n-1i odpowiedniego poziomu ufności.
Rozkład t-Studenta • Załóżmy, że jeżeli z populacji o jakimkolwiek rozkładzie ze średnią i odchyleniem standardowym pobieramy próby o dużej liczebności N, to rozkład średnich z tych prób będzie rozkładem normalnym o średniej i odchyleniu
Rozkład t-Studenta • Jeżeli z populacji o rozkładzie normalnym pobieramy próby N - elementowe, to dla każdej próby możemy obliczyć statystykę t.
Rozkład t-Studenta • Wartości krytyczne są to takie wartości danej statystyki t, że prawdopodobieństwo, iż zmienna losowa przyjmie wartość większą od t lub mniejszą od t wynosi .
Przedział ufności dla średniej • Stosowany wtedy, gdy mamy do czynienia z rozkładem normalnym, ale nie znamy i próbie tj. poniżej 30 elementów. (w mianowniku wzoru na odchylenie standardowe znajduje się „/n-1”). • t - odczytujemy z tabeli testu t-Studenta dla liczby stopni swobody równej n-1i odpowiedniego poziomu ufności.