380 likes | 517 Views
Gazdasági informatika. 2001/2002. tanév II. félév Gazdálkodási szak Nappali tagozat. Statisztikai számítások Excellel. Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!.
E N D
Gazdasági informatika 2001/2002. tanév II. félév Gazdálkodási szak Nappali tagozat
Statisztikai számítások Excellel Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!
Alapfogalmak • Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek • Ismérv: sokaság egységeire vonatkozó jellemzők • Közös ismérvek – egységek ez alapján egyformák • Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek
Sokaság típusok • Álló sokaság – valamely időpontra vonatkozik • Mozgó sokaság – valamely időtartamra vonatkozik
Ismérvek típusai • Területi – földrajzi jellegű • Időbeli – valamilyen időpontra vagy időtartamra utalnak • Minőségi – nem számszerűsíthető - kvalitatív • Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!
Statisztikai adatok • Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. • Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.
Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: • Nominális • Ordinális • Intervallum típusú • Numerikus
Nominális adatok • A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók • Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.
Ordinális adatok • Bármely két adat összehasonlítható • Példa: dolgozók iskolai végzettsége. • Jellemző: • Nincs távolság értelmezve az adatok között.(Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) • Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).
Intervallum típusú adatok • Sorba rendezhetőség mellett az egymástól való távolság is megadható. • Példa: hőmérsékleti adatok • Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)
Numerikus adatok • Valós számokkal jellemezhető adatok. • Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.
Feladat - megoszlási viszonyszám számolása • A MÁV tehervonatok üzemi teljesítményei vontatási nemenként 1993-ban a következők: • Feladat: Elemezze az üzemi teljesítmények vontatási nemenkénti megoszlását!
Megoldás • Összegzés: =SZUM() - SUM() függvénnyel • Viszonyszámok kiszámítása: Képlettel- abszolút hivatkozás Teljesítmény Gőz Villamos Diesel Motorkocsi Összesen Vontatás Vonatkilóméter (ezer egység) 19,21%36,73% 43,92% 0,13% 100,00% Elegytonnakm (millió egység) 11,02% 44,00% 44,90% 0,07% 100,00% Üzemi árutonnakm (millió egység) 10,41% 44,12% 45,41% 0,06% 100,00% =15877 / 43221 =8303 / 43221
Számított középértékek • Matematikai összefüggés alapján számíthatók ki: • Számtani (Aritmetikai) átlag • Egyszerű • Súlyozott • Harmonikus átlag • Egyszerű • Súlyozott • Mértani (Geometriai) átlag • Egyszerű • Súlyozott • Négyzetes (Kvadratikus) átlag • Egyszerű • Súlyozott
Számtani átlag • Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( )- AVERAGE()
Mértani átlag • Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: =MÉRTANI.KÖZÉP– GEOMEAN() Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét!
További átlagok megfelelő függvényei • Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()
Helyzeti középértékek • A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot • Valamilyen szabály szerint rendezni kell az adatokat Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Hetrogén sokaságok esetén jellemzőbbek, mint az átlagok
Helyzeti középértékek • Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg
X db Mediánnál kisebb MEDIÁN Y db Mediánnál nagyobb X=Y Feladat • Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt!
Excel függvényei • MEDIÁN() – MEDIAN() • KVARTILIS() – QUARTILE() • PERCENTILIS() – PERCENTILE(): k-dik percentilis • SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja • MAX • MIN • KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! • NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! • SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük
Módusz • Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendebn az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!
Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [CTRL + SHIFT + ENTER]
Gyakoriság • =Gyakoriság() – FREQUENCY() • Adott adathalmazban melyik érték hányszor szerepel
Átlag Kvantitatív Medián Ordinális Módusz Nominális Összefoglalás - Középértékek Az egyes adatfajtáknál milyen középértékeket alkalmazunk?
Mérőszámok • Terjedelem • Interkvartilis félterjedelem • Átlagos abszolút eltérés • Szórás – Szórásnégyzet (Variancia) • Relatív szórás(Variációs koefficiens)
Függvények az Excelben • = SQ()- átlagtól való eltérések négyzetének összegét adja eredményül • =SZÓRÁSP() –STDEVP()- szórás • =VARP() – variancia (szórásnégyzet)=ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()
Ferdeség mérése • =FERDESÉG() – SKEW() • A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. • =CSÚCSOSSÁG() – KURT() • Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek.
Adatok kezelése Számláló - keresőfüggvények
Függvények • DARAB () - COUNT() • a megadott tartomány számmal kitöltött celláinak a számát adja • DARAB2() – COUNTA() • a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja • DARABTELI () – COUNTIF () • a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak • DARABÜRES () – COUNTBLANK () • A megadott tartományban megszámolja hány db cella üres
Feladat • A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! • Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)
Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! • Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)