1 / 66

Okna vesmíru statistiky dokořán

Okna vesmíru statistiky dokořán. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava. Co je to statistika?. Google – 196.10 6 odkazů (čeština), 2,88.10 9 odkazů (angličtina) Uspořádaný datový soubor (statistika přístupů na web. stránky,

harry
Download Presentation

Okna vesmíru statistiky dokořán

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Okna vesmíru statistiky dokořán Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

  2. Co je to statistika? • Google – 196.106 odkazů (čeština), 2,88.109 odkazů (angličtina) • Uspořádaný datový soubor(statistika přístupů na web. stránky, • statistika střel na branku, statistika nehodovosti, ekonomické • statistiky, …) • Český statistický úřad, Real TimeStatistics Project • Teoretická disciplína, která se zabývá metodami sběru a analýzy dat • (matematická statistika vs. aplikovaná statistika) • Číselný údaj „syntetizující“ vlastnosti datových souborů (četnost, • průměr, rozptyl, …)

  3. Proč je dobré znát (alespoň) základy statistiky? „Informace, informace….“ „Ó, data! “ Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz

  4. Proč je dobré znát (alespoň) základy statistiky? „Informace, informace….“ „Ó, data! “ Číslo 5 žije Kvantitativní výzkum Teorie Hypotéza Sběr dat Analýza dat Vyhodnocení Hledání pravdy Zdroj: technet.idnes.cz

  5. Základní pojmy ze statistické metodologie • Populace (základní soubor) je množina všech prvků, které sledujeme při • statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich • společných vlastností. • (Statistické) jednotky - prvky populace • (Statistické) znaky (proměnné, veličiny) – kvantitativní údaje, které • u výběrového souboru sledujeme • Pokus (sledování vlivů různých faktorů) vs. šetření (výzkumník je pouze • pozorovatelem)

  6. Základní pojmy ze statistické metodologie úplné šetření výběrové šetření • Populace (základní soubor) je množina všech prvků, které sledujeme při • statistickém výzkumu. Je dána výčtem prvků nebo vymezením jejich • společných vlastností. • (Statistické) jednotky - prvky populace • (Statistické) znaky (proměnné, veličiny) – kvantitativní údaje, které • u výběrového souboru sledujeme • Pokus (sledování vlivů různých faktorů) vs. šetření (výzkumník je pouze • pozorovatelem)

  7. Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika • Reprezentativní výběr (odráží strukturu populace) vs. selektivní výběr • Metody vybírání prvků z populace: záměrný výběr (založen na expertním • stanovisku), náhodný výběr

  8. Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika • Popisná statistika (angl. ExploratoryData Analysis, EDA) - uspořádání • proměnných do názornější formy a jejich popis několika málo • hodnotami, které by obsahovaly co největší množství informací • obsažených v původním souboru.

  9. Základní pojmy ze statistické metodologie výběrové šetření Exploratorní (popisná) statistika

  10. Exploratorní analýza dat

  11. Typy proměnných

  12. EDA pro kategoriální veličinu

  13. Kategoriální veličina nominální (nemá smysl uspořádání) (např. Typ SŠ, Barva auta, Pohlaví, …)

  14. Číselné charakteristiky + Modus (název nejčetnější varianty)

  15. Číselné charakteristiky Modus = Muž

  16. Grafické znázornění • Sloupcový graf (bar chart) „…můžete vytvořit sloupcový graf a dodat mu zcela nový a přitažlivý vzhled“ http://office.microsoft.com/cs-cz/excel-help/prezentace-dat-ve-sloupcovem-grafu-HA010218663.aspx

  17. Grafické znázornění • Sloupcový graf (bar chart)

  18. Grafické znázornění • Sloupcový graf (bar chart)

  19. Grafické znázornění • Sloupcový graf (bar chart)

  20. Grafické znázornění • Sloupcový graf (bar chart)

  21. Grafické znázornění • Sloupcový graf (bar chart)

  22. Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“.

  23. Grafické znázornění • Sloupcový graf (bar chart) Na co si dát pozor? zdroj dat: http://en.wikipedia.org/wiki/List_of_countries_by_carbon_dioxide_emissions_per_capita

  24. Grafické znázornění • Sloupcový graf (bar chart) • Na co si dát pozor? • Subjektivně vnímáme plochu (objem), nikoliv výšku • jednotlivých „sloupců“. • Nadbytečné názvy grafu, legendy, … • Neefektivní nuly • A na co ještě?

  25. Který z grafů je „správný“?

  26. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

  27. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

  28. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor?

  29. Anketa Jste pro navýšení hodinové dotace matematiky na SŠ? TAKHLE NE!!!

  30. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu

  31. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • A na co ještě?

  32. 2 grafy ještě chybí …

  33. 100% skládaný pruhový graf

  34. Grafické znázornění B) Výsečový graf – koláčový graf (pie chart) • Na co si dát pozor? • Neuvádění absolutních četností, resp. celkového • počtu respondentů v „blízkosti“ grafu • Nadbytečné názvy grafu, legendy, … • Ne vždy je graf přehlednější než tabulka • „Jediná věc je horší než výsečový graf – několik nebo • dokonce mnoho výsečových grafů“ • Van Belle

  35. Kategoriální proměnná ordinální (má smysl uspořádání) (např. míra nezaměstnanosti (nízká, střední, vysoká), dosažené vzdělání, …)

  36. Číselné charakteristiky Seřazené podle velikosti + Modus

  37. Číselné charakteristiky Modus = střední

  38. Grafické znázornění • Sloupcový graf (bar chart) • B) Výsečový graf – koláčový graf (pie chart)

  39. EDA pro numerická data

  40. Číselné charakteristiky • Míry polohy • Míry variability

  41. Míry polohy

  42. Aritmetický průměr • Na co si dát pozor? • Harmonický průměr (proměnné vyjadřující čas na jednotku výkonu, • poměrná čísla) • Geometrický průměr (tempa růstu) • Vážený průměr • Průměrování dat na cirkulární škále • Průměr není rezistentní vůči odlehlým pozorováním! CircularStatisticsToolbox

  43. Kvantily 100p %-ní kvantil xp odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)

  44. Význačné kvantily • Kvartily Dolní kvartil x0,25 Medián x0,5 Horní kvartil x0,75 • Decily – x0,1; x0,2; ... ; x0,9 • Percentily – x0,01; x0,02; …; x0,99 • Minimumxmin a Maximumxmax

  45. Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

  46. Identifikace odlehlých pozorování • Metoda vnitřních hradeb Dolní mez vnitřních hradeb Horní mez vnitřních hradeb

  47. Identifikace extrémních pozorování • Metoda vnějších hradeb Dolní mez vnějších hradeb Horní mez vnějších hradeb

  48. PříkladV předložených datech identifikujte odlehlá pozorování:

More Related