190 likes | 473 Views
Statisztikai alapfogalmak. Fogalomlista. Hisztogram Átlag Szórás Konfidencia-intervallum ( megbízhatósági tartomány) Szignifikancia Percentilis CSH-index (családiháttér-index). 1. Hisztogram. Egy változó lehetséges értékeinek megoszlását bemutató oszlopdiagram .
E N D
Fogalomlista • Hisztogram • Átlag • Szórás • Konfidencia-intervallum(megbízhatósági tartomány) • Szignifikancia • Percentilis • CSH-index (családiháttér-index)
1. Hisztogram • Egy változó lehetséges értékeinek megoszlását bemutató oszlopdiagram. • A grafikon vízszintes tengelyén a változó lehetséges értékeivagy azok valamilyen csoportosítása szerepel, függőleges tengelyről pedig az adott kategóriában található értékek száma vagy aránya olvasható le. Városi ált. iskolába járó gyerekek körében az adott intervallumba eső gyerekek száma (ezer fő) Matematika képességpont50 pontnyi széles intervallumokra osztva
2. Átlag • Leggyakrabban a számtani átlagot használjuk:Jelölés: x1, x2,…, xnaz n db érték • Jelentősége abban rejlik, hogy egyetlen számadattal jól jellemzi az adathalmazt, mert az adatok az átlag környezetébe esnek. • Óvatosan kell használni, mert a „környezet” nagy is lehet!Kell egy másik mutató mellé (pl. szórás, konfidencia-intervallum, szignifikancia).
3. Szórás • Azt mutatja meg, hogy az egyes értékek átlagosan mennyivel térnek el az átlagtól. • Minél kisebb a szórás, az átlag annál pontosabban jellemzi az adatokat. • Az átlagtól vett eltérések négyzetes átlaga: Jelölések: x1, x2,…, xn: n db érték A: számtani közép (átlag) kicsi szórás: nagy szórás:
4. Konfidencia-intervallum (megbízhatósági tartomány) • 95%-os konfidencia-intervallum jelentése: a becsült adat 95%-os valószínűséggel a megadott intervallumba esik. • A becsült adat most: a tanulók átlagos képességpontja. 249 pontnyi széles tartomány! 2 pontnyi széles tartomány
4. Konfidencia-intervallum (megbízhatósági tartomány) • FONTOS: Nem az egyes értékek esnek 95%-os eséllyel az intervallumba, hanem az átlaguk! • Az országos átlagban a telephely tanulói is benne vannak! • Azért nagy a telephelyi átlag konfidencia-intervalluma,mert kevés elemű és nagy szórású adathalmazból becsüljüka tanulók átlagos teljesítményét. • Az országos szórás is nagy, viszont nagyon sok értékbőlszámolunk, ami megbízhatóbb becslésre vezet.
5. Szignifikancia • A statisztikai összehasonlításban gyakran használatos fogalom(szignifikáns=jelentős). • Például két telephelyet össze akarunk hasonlítani a tanulók kompetenciamérés eredménye alapján. • Megnézzük az átlagokat (nem elég!) • Megnézzük a konfidencia intervallumokat • Ez itt most nem elég a döntéshez, ezért statisztikai módszerrel (hipotézisvizsgálat –> 2 mintás t-próba)megállapítjuk, hogy van-e jelentős különbség, ekkor: • ki tudunk mutatni szignifikáns különbséget a két telephely közt(akkor egyértelmű, hogy melyik a jobb) • nem tudunk kimutatni lényeges különbséget(a hipotézisvizsgálat nem tudta megerősíteni, hogy különböznek,ezért lényegében egyformának tekintjük őket)
1. Bp. NAGY Ált. Iskola Egy konkréttelephely NINCS 1542 1408 1657 Országos átlag 2. 1612 1613 1611 További statisztikai vizsgálat szükséges Bp-iiskolák átlaga 3. 1658 1655 1662 VAN Bp-iNAGYiskolák átlaga 4. 1679 1682 1675 Konfidencia-intervallum,szignifikáns különbség Egy példa:
6. Percentilis • A változó eloszlásának jellemzésére szolgáló mutató. • A k. percentilis az az érték, amelynél a változó által felvett értékek k%-a kisebb, (100-k)%-a pedig nagyobb (k: 0 és 100 közötti egész szám). • Például az 5-ös percentilisnél az értékek 5%-a kisebb, 95%-a pedig nagyobb. • A 0-spercentilis a minimum, a 100-as percentilisa maximum, az 50-es percentilis pedig amedián.
6. Percentilis Szövegértés képességpont 20 db érték 100% 1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 15 dblegnagyobb érték 75% 25-ös percentilis: az értékek25%-a alatta, 75%-a fölötte van 1509 5 dblegkisebb érték 25%
6. Percentilis Szövegértés képességpont 20 db érték 100% 1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 10 db legnagyobb érték 50% 50-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van 1627 10 db legkisebb érték 50% 1509 25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van
6. Percentilis Szövegértés képességpont 20 db érték 100% 1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 5 db legnagyobb érték 25% 75-ös percentilis: az értékek 75%-a alatta, 25%-a fölötte van 1767 50-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van 1627 15 db legkisebb érték 75% 1509 25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van
7. CSH-index(családiháttér-index) • Egyetlen számadattal szeretnénk jellemezni a tanuló családi környezetének azon tényezőit, melyek a legnagyobb befolyással vannak az iskolai teljesítményére. • A családiháttér-index értéke a tanulói kérdőív néhány kérdésére adott válasz alapján kerül kiszámításra, amelyek az index 2006-os kialakításakor a legnagyobb magyarázóerővel bírtaka lineáris modellben: • az otthon található könyvek száma • a szülők iskolai végzettsége külön-külön • van-e otthon számítógép • tanulónak vannak-e saját könyvei 2013-tól a HHH státusz is része
7. CSH-index(családiháttér-index) • A telephelyi jelentésekben külön ábracsoport mutatja be, hogy a telephely tanulóinak átlagos CSH-indexe alapján milyen eredményre számítanánk a kompetenciamérésen, és ehhez képest a telephely hogyan szerepelt (hátránykompenzáló hatás).