770 likes | 903 Views
STATISIK. LV Nr.: 1852 WS 2005/06 6. Dezember 2005. Inhalt. Maßzahlen: Konzentrationsmaße Verhältniszahlen 2-dimensionale Merkmale Darstellung: Kontingenztafel, Grafiken Korrelationsrechnung. Konzentrationsmaße. Metrisch skaliertes Merkmal X mit positiven Ausprägungen
E N D
STATISIK LV Nr.: 1852 WS 2005/06 6. Dezember 2005
Inhalt • Maßzahlen: • Konzentrationsmaße • Verhältniszahlen • 2-dimensionale Merkmale • Darstellung: Kontingenztafel, Grafiken • Korrelationsrechnung
Konzentrationsmaße • Metrisch skaliertes Merkmal X mit positiven Ausprägungen • Frage: Wie teilt sich die Summe der Merkmalswerte x1,…,xn in der Beobachtungsreihe auf die Untersuchungs-einheiten auf? • Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x1,...,xn. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf?
Konzentrationsmaße • n Merkmalswerte werden durch q Merkmalsausprägungen a1<...<aq mit absoluten- und relativen Häufigkeiten hi bzw. fi bestimmt. • Gesamtbetrag der Merkmalswerte in der Beobachtungsreihe:
Konzentrationsmaße • Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte • Koordinatenkreuz: • Abszisse: es werden die nach der Größe der Merkmals-ausprägung geordneten relativen Häufigkeiten aufsummiert • Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen
Konzentrationsmaße • Verbinden der Punkte (ki,li) ergibt die Lorenzkurve, wobei immer k0=l0=0 und kq=lq=1 gilt. 1 li 0 1 ki
Konzentrationsmaße • Interpretation: ein Punkt (ki,li) der Lorenz-kurve gibt an, dass auf ki · 100% der Untersuchungseinheiten li · 100% des Gesamtbetrages aller Merkmalsaus-prägungen entfallen. • Bsp. auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche
Konzentrationsmaße • Bsp. landwirtschaftliche Betriebe • Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit-kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. • Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.
Konzentrationsmaße • Bsp. landwirtschaftliche Betriebe
Konzentrationsmaße • Bsp: landwirtschaftliche Betriebe
Konzentrationsmaße • Bsp. Landwirtschaftliche Betriebe: • Interpretation: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche • auf 42% der Betriebe entfallen 6,3% der Nutzfläche, • auf 60% der Betriebe entfallen 12,5% der Nutzfläche, • auf 78% der Betriebe entfallen 27% der Nutzfläche, • auf 94% der Betriebe entfallen 55% der Nutzfläche.
Konzentrationsmaße Extremfälle: • Keine Konzentration, alle Untersuchungs-einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. • Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve ist (fast) senkrecht.
Konzentrationsmaße Extremfälle:
Konzentrationsmaße • Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. • Definiert als das 2-fache der Fläche (F) zw. Diagonale und Lorenzkurve. LKM = 2F. • Es gilt immer: 0 LKM(n-1)/n • Standardisierter Gini-Koeffizient: LKMnor = n/(n-1) LKM
Konzentrationsmaße • Berechnung von F: • k … Werte auf Abszisse • l … Werte auf Ordinate • q … Anzahl der verschiedenen Merkmalsausprägungen
Konzentrationsmaße • Bsp. Landwirtschaftliche Nutzfläche • LMK = 2F = i2Fi – 1 = 1,6048 – 1 = 0,6408 • mit i = 1,…,5 • LKMnor = 50/49 · 0,6408 = 0,6539
Verhältniszahlen • Quotient zweier Maßzahlen: Verhältniszahl • Gliederungszahlen • Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße • Beziehungszahlen • Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen • Index-Zahlen • Quotient zweier Maßzahlen gleicher Art
Gliederungszahlen • Gliederungszahlen • Bsp. Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl
Beziehungszahlen • Beziehungszahlen: • Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. • Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann.
Beziehungszahlen • Bsp. Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend-geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen.
Beziehungszahlen • Bsp. Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße.
Indexzahlen • Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. • Messzahlen oder Einfache Indizes • Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. • (Zusammengesetzte) Indexzahlen • Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.
Indexzahlen • Einfache Indizes: • Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x0,...,xt Maßzahlen zu Zeitpunkten t, x0 Maßzahl zum Basiszeitpunkt 0. Dann ist I0t = xt / x0 für t = 0, 1, 2, ... eine Zeitreihe einfacher Indizes
Indexzahlen • Messzahlen werden oftmals mit 100 multipliziert. • Bsp. Umsatz im Jahr 5, bezogen auf Jahr 0: I05·100 = x5/x0· 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. • Vergleich von I05·100=87 mit I06·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen.
Indexzahlen • Umbasieren: Gegeben: Indizes I0t zur Basisperiode 0 Gesucht: Indizes Ikt zur Basisperiode k Berechung ohne Ursprungsdaten: • Verkettung: Wenn für xt I0t berechnet werden soll, und x0 nicht bekannt ist. I0t = I0k· Ikt
Indexzahlen • Bsp. Umsatz für Jahre 1990 bis 1998
Indexzahlen • Umbasieren: Index von 1996 zur Basisperiode 1990 sollen in Index zur Basisperiode 1994 umgerechnet werden. • I1990,1996 = 0,90 (Basisperiode 1990) • I1990,1994 = 0,93 (Basisperiode 1990) • I1994,1996 = 0,90 / 0,93 = 0,97 (Basisperiode 1994) • Verkettung: Weiterer Wert für 1998 • I1990,1998 = I1990,1994· I1994,1998 = 0,93 · 1,04 = 0,97
Indexzahlen • Zusammengesetzte Indexzahlen (Indizes): • Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen qt1,...,qtn Preise pt1,...,ptn Wert des Warenkorbes in Periode t:
Indexzahlen • Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0
Indexzahlen • Bsp. Durchschnittlicher Verbrauch an Fleisch aller privaten Haushalte in einer Gemeinde. Basismonat 1, Berichtsmonat 12. • (Mengen in g, Preise in DM/kg)
Indexzahlen • Bsp. Wertindex
Indexzahlen • Bsp. Wertindex • 100 · W012 = 100 · 1,0119 = 101,19 • D.h. der tatsächliche Aufwand für Fleisch für die privaten Haushalte ist vom Basismonat bis zum Berichtsmonat um 1,19% gestiegen. • Es ist hier nicht berücksichtigt, dass der durchschnittliche Verbrauch im Berichtsmonat um 205g geringer ist.
Indexzahlen • Preisindizes: • Aussagen über die Preisentwicklung • Für verschiedene Perioden das gleiche Mengenschema verwenden
Indexzahlen • Preisindex nach Paasche • Man vergleicht den Wert eines Warenkorbes qt1,...,qtn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte.
Indexzahlen • Bsp. Preisindex nach Paasche
Indexzahlen • Bsp. Preisindex nach Paasche • D.h. nimmt man für beide Monate den durchschnittlichen Verbrauch an Fleisch im Berichtsmonat als Mengenschema (Warenkorb) an, so sind die Preise in diesem Zeitraum um 4,65% gestiegen.
Indexzahlen • Preisindex nach Laspeyres • Der Warenkorb q01,...,q0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert in der Berichtsperiode t wird mit seinem Wert in der Basisperiode verglichen.
Indexzahlen • Bsp. Preisindex nach Laspeyres • D.h. Für die im Basismonat verbrauchten Mengen an Fleisch muss man in der Berichtsperiode um 4,68% mehr Geld ausgeben.
Indexzahlen • Vergleich Preisindizes nach Paasche und Laspeyres: • L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) • P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) • Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. • Fishersche Idealindex:
Indexzahlen • Mengenindizes: • Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung)
Indexzahlen • Mengenindex nach Paasche • Standardisierung nach den Preisen zur Berichtsperiode
Indexzahlen • Bsp. Mengenindex nach Paasche • D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen im Berichtsmonat ist um 3,34% gesunken.
Indexzahlen • Mengenindex nach Laspeyres • Standardisierung nach den Preisen zur Basisperiode
Indexzahlen • Bsp. Mengenindex nach Laspeyres • D.h. der Verbrauch an Fleisch, gewichtet mit den Preisen zum Basismonat, ist um 3,31% gesunken.
Zweidimensionale Merkmale • Frage: Wie lässt sich der Zusammenhang bzw. die Abhängigkeit zw. zwei Merkmalen messen? • Wie stark ist der Zusammenhang bzw. die Abhängigkeit? Antwort durch Korrelationsrechnung. • Lässt sich der Zusammenhang in einer bestimmten Form darstellen? Antwort durch Regressionsrechnung.
Zweidimensionale Merkmale • n Untersuchungseinheiten, 2 Merkmale X und Y, Ausprägungen des Merkmals X a1,…,al und Ausprägungen des Merkmals Y b1,…,bm. • 2-dimensionales Merkmal (X,Y) mit Ausprägungen (aj,bk), mit absoluten Häufigkeiten hjk und relativen Häufigkeiten fjk=1/n·hjk
Kontingenztafel • Häufigkeitsverteilung von (X,Y) wird durch Kontingenztafel dargestellt.
Kontingenztafel • Bsp. Geschlecht (X) Rauchverhalten (Y): absolute und relative Häufigkeiten von (X,Y).
Kontingenztafel • Absolute Randhäufigkeiten • von aj für j=1,…,l und bk für k=1,...,m: • Relative Randhäufigkeiten • von aj für j=1,…,l und bk für k=1,…,m: • Randhäufigkeiten ergeben die Häufigkeits-verteilung des Merkmals X bzw.Y (Randverteilung).
Kontingenztafel • Kontingenztafel absoluten Häufigkeiten und Randhäufigkeiten