660 likes | 824 Views
Okna vesmíru statistiky dokořán. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava. Co je to statistika?. Google – 196.10 6 odkazů (čeština), 2,88.10 9 odkazů (angličtina) Uspořádaný datový soubor (statistika přístupů na web. stránky,
E N D
Okna vesmíru statistiky dokořán Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava
Co je to statistika? • Google – 196.106 odkazů (čeština), 2,88.109 odkazů (angličtina) • Uspořádaný datový soubor(statistika přístupů na web. stránky, • statistika střel na branku, statistika nehodovosti, ekonomické • statistiky, …) • Český statistický úřad, Real TimeStatistics Project • Teoretická disciplína, která se zabývá metodami sběru a analýzy dat • (matematická statistika vs. aplikovaná statistika) • Číselný údaj „syntetizující“ vlastnosti datových souborů (četnost, • průměr, rozptyl, …)
Proč je dobré znát (alespoň) základy statistiky? „Informace, informace….“ „Ó, data! “ Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz
Proč je dobré znát (alespoň) základy statistiky? „Informace, informace….“ „Ó, data! “ Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz
Základní pojmy ze statistické metodologie • Populace (základní soubor) je množina všech prvků, které sledujeme při • statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich • společných vlastností. • (Statistické) jednotky - prvky populace • (Statistické) znaky (proměnné, veličiny) – kvantitativní údaje, které • u výběrového souboru sledujeme • Pokus (sledování vlivů různých faktorů) vs. šetření (výzkumník je pouze • pozorovatelem)
Základní pojmy ze statistické metodologie úplné šetření výběrové šetření • Populace (základní soubor) je množina všech prvků, které sledujeme při • statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich • společných vlastností. • (Statistické) jednotky - prvky populace • (Statistické) znaky (proměnné, veličiny) – kvantitativní údaje, které • u výběrového souboru sledujeme • Pokus (sledování vlivů různých faktorů) vs. šetření (výzkumník je pouze • pozorovatelem)
Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika • Reprezentativní výběr (odráží strukturu populace) vs. selektivní výběr • Metody vybírání prvků z populace: záměrný výběr (založen na expertním • stanovisku), náhodný výběr
Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika • Popisná statistika (angl. ExploratoryData Analysis, EDA) - uspořádání • proměnných do názornější formy a jejich popis několika málo • hodnotami, které by obsahovaly co největší množství informací • obsažených v původním souboru.
Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika
Kategoriální veličina nominální (nemá smysl uspořádání) (např. Typ SŠ, Barva auta, Pohlaví, …)
Číselné charakteristiky + Modus (název nejčetnější varianty)
Číselné charakteristiky Modus = Muž
Grafické znázornění • Sloupcový graf (bar chart) „…můžete vytvořit sloupcový graf a dodat mu zcela nový a přitažlivý vzhled“ http://office.microsoft.com/cs-cz/excel-help/prezentace-dat-ve-sloupcovem-grafu-HA010218663.aspx
Grafické znázornění • Sloupcový graf (bar chart)
Grafické znázornění • Sloupcový graf (bar chart)
Grafické znázornění • Sloupcový graf (bar chart)
Grafické znázornění • Sloupcový graf (bar chart)
Grafické znázornění • Sloupcový graf (bar chart)
Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“.
Grafické znázornění • Sloupcový graf (bar chart) Na co si dát pozor? zdroj dat: http://en.wikipedia.org/wiki/List_of_countries_by_carbon_dioxide_emissions_per_capita
Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“. • Nadbytečné názvy grafu, legendy, … • Neefektivní nuly • A na co ještě?
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor?
Anketa Jste pro navýšení hodinové dotace matematiky na SŠ? TAKHLE NE!!!
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • A na co ještě?
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • „Jediná věc je horší než výsečový graf – několik nebo • dokonce mnoho výsečových grafů“ • Van Belle
Kategoriální proměnná ordinální (má smysl uspořádání) (např. míra nezaměstnanosti (nízká, střední, vysoká), dosažené vzdělání, …)
Číselné charakteristiky Seřazené podle velikosti + Modus
Číselné charakteristiky Modus = střední
Grafické znázornění • Sloupcový graf (bar chart) • B) Výsečový graf – koláčový graf (pie chart)
Číselné charakteristiky • Míry polohy • Míry variability
Aritmetický průměr • Na co si dát pozor? • Harmonický průměr (proměnné vyjadřující čas na jednotku výkonu, • poměrná čísla) • Geometrický průměr (tempa růstu) • Vážený průměr • Průměrování dat na cirkulární škále • Průměr není rezistentní vůči odlehlým pozorováním! CircularStatisticsToolbox
Kvantily 100p %-ní kvantil xp odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)
Význačné kvantily • Kvartily Dolní kvartil x0,25 Medián x0,5 Horní kvartil x0,75 • Decily – x0,1; x0,2; ... ; x0,9 • Percentily – x0,01; x0,02; …; x0,99 • Minimumxmin a Maximumxmax
Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování
Identifikace odlehlých pozorování • Metoda vnitřních hradeb Dolní mez vnitřních hradeb Horní mez vnitřních hradeb
Identifikace extrémních pozorování • Metoda vnějších hradeb Dolní mez vnějších hradeb Horní mez vnějších hradeb
PříkladV předložených datech identifikujte odlehlá pozorování: