700 likes | 2.28k Views
DESKRIPTIVNA STATISTIKA. Prof. dr. sc. Božidar Tepeš Filozofski fakultet 2004. DESKRIPTIVNA STATISTIKA. 1. Statistika 2. Statistički niz 3. Sredine 4. Raspršenost 5. Odnosi među pojavama 6. Vremenski nizovi. 1. Statistika. 1.1 Definicija 1.2 Statistički skup 1.3 Statistička obilježja
E N D
DESKRIPTIVNA STATISTIKA Prof. dr. sc. Božidar Tepeš Filozofski fakultet 2004.
DESKRIPTIVNA STATISTIKA • 1. Statistika • 2. Statistički niz • 3. Sredine • 4. Raspršenost • 5. Odnosi među pojavama • 6. Vremenski nizovi
1. Statistika • 1.1 Definicija • 1.2 Statistički skup • 1.3 Statistička obilježja • 1.4 Prikupljanje podataka
1.1 Definicija • Masovna pojava (veliki broj elemenata) stanovništvo, proizvodnja, knjige, prometne nezgode … • Deskriptivna statistika opisuje, upoznaje, uspoređuje i analizira masovne pojave temeljem prikaza i brojčane obrade poznatih podataka • Induktivna statistika opisuje, upoznaje, uspoređuje i analizira masovne pojave temeljem uzorka koji procjenjuje podatke cjeline
1.3 Statistička obilježja • Statistička obilježja su opća svojstva elemenata statističkog skupa po kojima su elementi istovrsni i po kojima se razlikuju • Opisna obilježja se izražavaju riječima (spol, kvalifikacija, ….) • Redoslijedna obilježja se izražavaju rangom (ocjena uspjeha, školska sprema, …) • Numerička obilježja se izražavaju brojem ( površina, visina, … • Vremenska obilježja se izražavaju trenutkom ( vrijeme popisa stanovnika, vrijeme diplomiranja, …)
1.4 Prikupljanje podataka • Prikupljanjem podataka je određivanje modaliteta obilježja elemenata statističkog skupa • Mjerenje (težina knjige, vrijeme proizvodnje…) • Brojenje (broj stranica, broj proizvoda, …) • Ocjenjivanje (bodovi, ocjena kvalitete, …) • Anketiranje (oblik pitanja, redoslijed pitanja, …)
1.2 Statistički skup • Masovna pojava je statistički skup istovrsnih elemenata ( ne jednakih nego imaju isti obilježje) • Statistički skup je definiran pojmovno, prostorno i vremenski • Pojmovno definiranje statističkog skupa je određivanje obilježja (starost stanovnika, sadržaj knjige, vrste prometnih nezgoda …) • Prostorno definiranje statističkog skupa i određivanje prostora ( RH, NSK, Zagreb, …) • Vremensko definiranje statističkog skupa je određivanje vremenskog trenutaka ili razdoblja ( 31. ožujka 2001., godina izdanja, ljeto 2003. …)
2. Statistički niz • 2.1 Stvaranje statističkog niza • 2.2 Statistička tabela • 2.3 Grafički prikaz • 2.4 Relativni brojevi
2.1 Stvaranje statističkog niza • Grupiranje podataka prema modalitetima jednog obilježja • Grupiranje numeričkog obilježja u razrede ili određivanje donje i gornje granice razreda (diskretna – donja i gornja granica se razlikuju, kontinuirana – gornja granica i donja granica idućeg razreda su ista [d1, g1) [d2, g2) g1=d2) • Prave granice ako su granice između razreda iste [d1, g1) [d2, g2) g1=d2 • Otvoreni razredi (prvi ili posljednji) • Broj elemenata u razredu je frekvencija • Niz frekvencija je statistički niz • Kumulativni niz se dobiva zbrajanjem frekvencija u nizu
2.2 Statistička tabela • Dodatne oznake: - nema pojave, … ne raspolaže se podatkom, 0 podatak manji od o,5 mjere, ø prosjek
2.3 Grafički prikaz • Linijski grafikon (poligon frekvencija, kumulativ manje od i više od) • Površinski grafikoni (stupci, histogram, strukturni stupci i kružni grafikon) • Kartogrami (dijagramska karta, piktogram i statistička karta)
Primjeri grafikona • Linijski grafikon • Stupci • Kružni grafikon
2.4 Relativni brojevi • Relativna frekvencija je proporcija frekvencije prema ukupnom • Pi = fi / Σfi . 100 • Σpi = 100 • Indeksni brojevi opisuju smjer i intenzitet promjena • Ii = fi / f1 . 100
Pitanja (1) • Iz Tabela 1, 2, 3, 4, 5 i 6 odredite • 1. Elemente statističkih skupova • 2. Statistička obilježja • 3. Vrste statističkih obilježja • 4. Veličine statističkih skupova
3. Sredine • 3.1 Aritmetička sredina • 3.2 Harmonijska sredina • 3.3 Medijan • 3.4 Mod
3.1 Aritmetička sredina • Aritmetička sredina • Aritmetička sredina obilježja s frekvencijama • Sredina relativnih brojeva ako su ponderi nazivnici
3.2 Harmonijska sredina • Harmonijska sredina • Harmonijska sredina obilježja s frekvencijama • Sredina relativnih obilježja ako su ponderi brojnici
3.3 Medijan • Medijan je sredina niza obilježja • Medijan obilježja u razredima • L1 je donja granica medijalnog razreda • Σf1 je kumulativ do medijalnog razreda • fMe je frekvencija medijalnog razreda • i je veličina medijalnog razreda • n je zbroj frekvencija
3.4 Mod • Mod je najčešća vrijednost obilježja • Mod obilježja u razredima • L1 je donja granica modalnog razreda • a je frekvencija pred modalnog razreda • b je frekvencija modalnog razreda • c je frekvencija post modalnog razreda • i je veličina modalnog razreda
Pitanja (2) • Iz Tabela 4, 5, 6, 7 odredite: • 1. Srednju vrijednost • 2. Medijan • 3. Mod • Iz Tabele 8. odredite: • 4. Srednji prirod po hektaru za sve tri županije
4. Raspršenost • 4.1 Raspon varijacije • 4.2 Interkvartil • 4.3 Koeficijent kvartilne devijacije • 4.4 Grafički prikaz raspršenosti • 4.5 Varijanca • 4.6 Standardna devijacija • 4.7 Koeficijent varijacije
4.1 Raspon varijacije • Raspon varijacije je razlika najveće i najmanje vrijednosti u numeričkom nizu
4.2 Interkvartil • Donji i gornji kvartil dijele numerički niz u odnosu 1 : 2 : 1 ili do donjeg kvartila 25%, između kvartila 50% i iznad gornjeg kvartila 25% • Interkvartil je razlika gornjeg i donjeg kvartila
4.3 Grafički prikaz raspršenosti • Raspon varijacije, interkvartili i medijan se mogu grafički prikazati
4.4 Koeficijent kvartilne devijacije • Koeficijent kvartilne devijacije je kvocijent razlike i zbroja kvartila
4.5 Varijanca • Varijanca je srednje kvadratno odstupanje obilježja od aritmetičke sredine
4.6 Standardna devijacija • Standardna devijacija je korijen iz varijance
4.7 Koeficijent varijacije • Koeficijent varijacije je relativna mjera raspršenosti
Pitanja (3) • Iz Tabela 4, 5, 6, 7 odredite: • 1. Raspon varijacija • 2. Donji kvartil, gornji kvartil i interkvartil • 3. Grafički prikažite raspršenost • 4. Koeficijent kvartilne devijacije • 5. Varijancu i standardnu devijaciju • 6. Koeficijent varijacije
5. Odnosi među pojavama • 5.1 Statistički odnosi među pojavama • 5.2 Dijagram rasipanja • 5.3 Linearna regresija • 5.4 Stupanj statističke povezanosti • 5.5 Koeficijent linearne korelacije • 5.6 Koeficijent determinacije • 5.7 Korelacija ranga • 5.8 Koeficijent kontingencije
5.1 Statistički odnosi među pojavama • Odnosi među pojavama su funkcionalni i statistički • Kod funkcionalnog odnosa jednoj vrijednosti nezavisne varijabla odgovara jedna vrijednosti zavisne varijable (stranica kvadrata i površina) • Kod statističkog odnosa jednoj vrijednosti nezavisne varijabla odgovara više vrijednosti zavisne varijable (visina i težina ljudi)
5.2 Dijagram rasipanja • Dijagram rasipanja je grafikon parova vrijednosti dobivenih mjerenjem • Ako imamo n mjerenja vrijednosti nezavisnih varijabli x i vrijednosti zavisnih varijabli y, parovi jesu (x1, y1), (x2, y2), …, (xn, yn) • Povezanost (korelacija) može biti linearnog i nelinearnog oblika • Povezanost (korelacija) linearnog oblika može imati pozitivan ili negativan smjer • Odsutnost povezanosti ili nekorelativnost
5.3 Linearna regresija • Linearna regresijska jednadžba • Kovarijanca cov(x, y) • Koeficijent smjera a • Odsječak na osi b
5.4 Stupanj statističke povezanosti • Stupanj statističke povezanosti (korelativnosti) mjeri se prema vrsti obilježja • Koeficijent korelacije za numerička obilježja • Korelacija ranga za redoslijedna obilježja • Koeficijent kontingencije za opisna obilježja
5.5 Koeficijent linearne korelacije • Pearsonov koeficijent linearne korelacije je mjera smjera i stupnja statističke povezanosti • r > 0 pozitiva linearna korelacija • r < 0 negativna linearna korelacija • r = 0 nekorelativnost • r = 1 funkcionalna povezanost • 0 < | r | < 0,25 slaba linearna korelacija • 0,25 < | r | < 0,64 srednje jačine linearna korelacija • 0,64 < | r | < 1 čvrsta linearna korelacija • r ima isti predznak kao koeficijent smjera a
5.6 Koeficijent determinacije • Koeficijent determinacije je postotak varijance zavisne varijable V(y) objašnjen linearnom regresijom
5.7 Korelacija ranga • Spearmanov koeficijent korelacije ranga za redosljedna obilježja • rS = 1 savršena pozitivna korelacija ranga • rS = - 1 savršena negativna korelacija ranga • rS > 0 pozitivna korelacija ranga • rS < 0 negativna korelacija ranga
5.8 Koeficijent kontingencije • Tabela kontingencije ima k redaka i s stupaca s frekvencijama fij • Sume po redcima jesu fi. , a sume po stupcima jesu f.j • Očekivane frekvencije uz pretpostavku nezavisnosti jesu eij • Koeficijent kontingencije je C
Pitanja (4) • Iz Tabela 9. i 10. odredite: • 1. Dijagram rasipanja • 2. Linearnu regresijsku jednadžbu • 3. Pearsonov koeficijent korelacije i koeficijent determinacije • 4. Iz Tabele 10. odredite Spearmanov koeficijent korelacije ranga • 5. Iz Tabele 11. odredite koeficijent kontingencije
6. Vremenski nizovi • 6.1 Podjela vremenskih nizova • 6.2 Grafički prikaz • 6.3 Trend • 6.4 Indeksi • 6.5 Bazni i verižni indeksi • 6.6 Stope promjene
6.1 Podjela vremenskih nizova • S obzirom na obilježja imamo opisne, redoslijedne i numeričke vremenske nizove • S obzirom na nastanak imamo intervalne i trenutačne vremenske nizove • Intervalni imaju svojstvo kumulativnosti • Trenutačni nemaju svojstvo kumulativnosti
6.2 Grafički prikaz • Intervalni vremenski niz se prikazuje površinski (histogram) ili linijski • Različiti vremenski intervali se crtaju korigiranim frekvencijama • Trenutačni vremenski niz se prikazuje linijskim grafikonom
6.3 Trend • Trend pokazuje osnovni tijek vremenskog niza • Linearni trend je linearna regresija s nezavisnom varijablom vremena (vidi 5.3)
6.4 Indeksi • Indeksi prate razvoj pojave u vremenu • Indeksi su relativni brojevi koji izražavaju odnos vrijednosti pojave u različitim razdobljima ili trenutcima • Indeksi su bazni i verižni