1 / 98

Grundbegriffe und Kennwerte

Grundbegriffe und Kennwerte. Gliederung Deskriptive Statistik Grundbegriffe Merkmale Variable Operationalisierung Skalenniveaus Fragebogenformate Datensätze in SPSS Kennwerte Häufigkeiten Maße der zentralen Tendenz Maße der Dispersion. Deskriptive Statistik. Definition:

tien
Download Presentation

Grundbegriffe und Kennwerte

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Grundbegriffe und Kennwerte 02_grundbegriffe_kennwerte 1 Gliederung • Deskriptive Statistik • Grundbegriffe • Merkmale • Variable • Operationalisierung • Skalenniveaus • Fragebogenformate • Datensätze in SPSS • Kennwerte • Häufigkeiten • Maße der zentralen Tendenz • Maße der Dispersion

  2. Deskriptive Statistik 02_grundbegriffe_kennwerte 2 Definition: „Unter deskriptiver Statistik versteht man ein Gruppe statistischer Methoden zur Beschreibung statistischer Daten anhand statistischer Kennwerte, Graphiken, Diagrammen oder Tabellen.“ (Leonhart, 2004) Deskriptive Statistik bezieht sich immer auf eine Stichprobe, d.h. auf die Personen, die tatsächlich untersucht bzw. beobachtet wurden. Die Inferenzstatistik zieht dagegen aus den in einer Stichprobe erhobenen Daten Schlüsse auf die zugrunde liegende Population.

  3. Grundbegriffe der Datenerhebung 02_grundbegriffe_kennwerte 3 • Bei einer Datenerhebung geht es darum, bestimmte Merkmalsausprägungen der untersuchten Einheiten zu messen. • Was sind Merkmale? • Was sind Einheiten? • Was ist eine Messung?

  4. Deskriptive Statistik 02_grundbegriffe_kennwerte 4 Beispiel 1: Merkmale von Psychologiestudierenden: Geschlecht Alter Größe Wohnort Ängstlichkeit Extravertiertheit Statistikkenntnisse

  5. Merkmale 02_grundbegriffe_kennwerte 5 Beispiel 2: Merkmale von Therapiemaßnahmen: Anzahl der therapeutischen Sitzungen (25 vs. 100) Therapeutisches „Setting“ (z.B. Einzel- vs. Gruppentherapie) Eingesetzte therapeutische Methoden (z.B. Gesprächsterapie vs. Verhaltenstherapie) Motivation des Klienten Motivation des Therapeuten …  Eine statistische Erhebung von Merkmalen muss nicht auf Basis von Personen erfolgen.

  6. Merkmale 02_grundbegriffe_kennwerte 6 Qualitative vs. Quantitative Merkmale • Qualitative Merkmale beschreiben die Zugehörigkeit einer Person oder eines Objektes zu einer Kategorie. • Quantitative Merkmale beschreiben die Ausprägung eines Merkmals auf einem Kontinuum. • Beispiele … • Qualitativ: Geschlecht, Wohnort • Quantitativ: Alter, Ängstlichkeit

  7. Merkmale 02_grundbegriffe_kennwerte 7 Manifeste vs. Latente Merkmale • Manifeste Merkmale können (im Prinzip) direkt beobachtet oder gemessen werden. • Latente Merkmale können nur indirekt zu erfasst werden. Diese Merkmale sind meist nur unzureichend operational definiert, so dass ihre Messung indirekt durch korrespondierender manifeste Merkmale geschieht. • Beispiele … • Manifest: Geschlecht, Körpergröße • Latent: Persönlichkeitseigenschaften

  8. Deskriptive Statistik 02_grundbegriffe_kennwerte 8 Klassifikation von Merkmalen:

  9. Messung 02_grundbegriffe_kennwerte 9 Vom Merkmal zur Variable Um ein Merkmal exakt zu erfassen, muss eine präzise Operationalisierung (Messvorschrift) vorliegen. Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals erfasst (kodiert) werden Die Kodierung der Merkmalsausprägungen erfolgt in der Regel in Zahlen. Man spricht nun von einer Variable, die die Information enthält. Ein Messung ist also eine Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.

  10. Operationalisierung 02_grundbegriffe_kennwerte 10 Beispiele für Operationalisierungen Die Variable „sex“ soll das Geschlecht erfassen. Es wird für Frauen der Wert 1 und für Männer der Wert 2 verwendet. Die Variable „alter“ soll das Alter der untersuchten Personen in Jahren erfassen. Die Variable „alter“ soll das Alter von Säuglingen in Monaten erfassen. Die Variable „opt“ soll den selbst eingeschätzten Optimismus auf einer Skala von -2 (überhaupt nicht optimistisch) bis +2 (extrem optimistisch) erfassen. Die Variable „angst“ soll die Ängstlichkeit erfassen. Diese wird gemessen als die Zeitdauer in Sekunden, bis eine Spinne angefasst wird.

  11. Variablen 02_grundbegriffe_kennwerte 11 Klassifikation von Variablen: Diskret vs. Kontinuierlich Diskrete Variablen: Die Anzahl der möglichen Werte ist abzählbar. Kontinuierliche Variablen: Die möglichen Werte liegen auf einem Kontinuum. Beispiele …

  12. Merkmale und Variablen 02_grundbegriffe_kennwerte 12

  13. Skalenniveaus Die Art der Operationalisierung beeinflusst das Skalenniveau und damit die Möglichkeiten der statistischen Auswertung! Möglichkeiten, das Konstrukt „Ängstlichkeit“ zu operationalisieren: • „Mutprobe“ (z.B. bungee jump) • Erfolg: angst=„0“ • Misserfolg: angst=„1“ • „Experten-Rating“ (Einschätzung) • nicht ängstlich („0“) • wenig ängstlich („1“) • eher ängstlich („2“) • klinisch relevante Angststörung („3“) • Ergebnis eines Ängstlichkeitsfragebogens • Werte von 0-40 • „Mutprobe“ • Zeit bis zur erfolgreichen Handlung (0 bis ? Sekunden) 02_grundbegriffe_kennwerte 13

  14. Skalenniveaus Vier Skalenniveaus: Nominalskala Ordinalskala Intervallskala Verhältnisskala Die Messgenauigkeit und Aussagekraft der Daten steigt mit dem Skalenniveau. Es sollte daher versucht werden, Daten auf einem möglichst hohem Skalenniveau zu erfassen. 02_grundbegriffe_kennwerte 14

  15. Skalenniveaus Die Nominalskala • Es werden „Namen“ (Zahlenwerte) für jede Merkmalsausprägung vergeben. • Beispiel: Geschlecht („m“ / „w“) • Zwei Annahmen müssen berücksichtigt werden: • Exklusivität: Unterschiedliche Merkmalsausprägungen werden unterschiedlichen Zahlen zugeordnet. • Exhaustivität: Jeder beobachteten Merkmalsausprägung eine Zahl zugeordnet. • Man spricht von einer homomorphen Abbildung, d.h. aus der Variablen kann immer auf das Merkmal zurückgeschlossen werden. 02_grundbegriffe_kennwerte 15

  16. Skalenniveaus Die Nominalskala • Aussagekraft von Variablenwerten: • Information über Gleichheit / Verschiedenheit der Merkmalsausprägung(Keine Aussagen zu größer/kleiner Relationen möglich!) • Mögliche Transformationen: • Die Variablenwerte können willkürlich vorgegeben und auch nachträglich geändert werden. • Es sind alle eineindeutigen Transformationen erlaubt • Beispiel: weiblich = 1; männlich = 2 oderweiblich = 2; männlich = 1 oderweiblich = 100; männlich = 200; 02_grundbegriffe_kennwerte 16

  17. Skalenniveaus Die Ordinalskala • Bei der Ordinalskala (Rangskala) geben die Variablenwerte Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals • Beispiel: Schulabschluss„0“=kein SA, „1“=Haupts., „2“=Reals., „3“=Gymnasium) • Zusätzliche Annahme für die Operationalisierung: • Die zugeordneten Zahlen repräsentieren eine Rangreihe der Merkmalsausprägung. 02_grundbegriffe_kennwerte 17

  18. Skalenniveaus Die Ordinalskala • Aussagekraft von Variablenwerten: • Information über Gleichheit / Verschiedenheit der Merkmalsausprägung • Größer / Kleiner Relationen • Mögliche Transformationen: • Erlaubt sind nur noch alle monotonen Transformationen. • Beispiele • y = x + 3 • y = 2x • y = log(x) 02_grundbegriffe_kennwerte 18

  19. Skalenniveaus Die Intervallskala • Bei der Intervallskala geben die Variablenwerte Aufschluss über die Abstände zwischen Merkmalsausprägungen. • Beispiel: Ergebnisse eines Intelligenztests(IQ (Peter) = 115; IQ(Anne) = 130  Differenz 15 Punkte ) • Zusätzliche Annahme für die Operationalisierung: • Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung. 02_grundbegriffe_kennwerte 19

  20. Skalenniveaus Die Intervallskala • Aussagekraft von Variablenwerten: • Information über Gleichheit / Verschiedenheit der Merkmalsausprägung • Größer / Kleiner Relationen • Größe von Unterschieden • Mögliche Transformationen: • Erlaubt sind nur noch alle linearen Transformationen (y = ax+b). • Beispiele • y = x - 100 • y = 0.1 x 02_grundbegriffe_kennwerte 20

  21. Skalenniveaus Die Verhältnisskala • Die Verhältnisskala kann vor allem bei der Messung physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden. • Beispiel: Reaktionszeit (ms) • Zusätzliche Annahme für die Operationalisierung: • Die Skala hat einen definierten Null-Punkt. 02_grundbegriffe_kennwerte 21

  22. Skalenniveaus Die Verhältnisskala • Aussagekraft von Variablenwerten: • Information über Gleichheit / Verschiedenheit der Merkmalsausprägung • Größer / Kleiner Relationen • Größe von Unterschieden • Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit) • Mögliche Transformationen: • Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax). • Beispiele • y = 0.001 ∙ x (Umrechnung von Millisekunden in Sekunden) • y = 24 ∙ x (Umrechnung von Jahren in Monate) 02_grundbegriffe_kennwerte 22

  23. Skalenniveaus 02_grundbegriffe_kennwerte 23

  24. Skalenniveaus • Das Skalenniveau hängt ab: • Von dem erhobenen Merkmal • Von der Operationalisierung der Messung • Beispiele: • Geschlecht ist immer Nominalskaliert, da das Merkmal an sich keine Rangreihe oder Intervalle definiert. • Ängstlichkeit kann jedoch nominal-, ordinal-, oder intervallskaliert erhoben werden (s.o.) • Durch die Art der Messung kann das Skalenniveau sinken. 02_grundbegriffe_kennwerte 24

  25. Skalenniveaus Niveau eines Merkmals vs. Niveau der Variablen • Beispiel 1: Zeit bis zum Anfassen der Spinne • Peter: 10 Sekunden; Martin: 20 Sekunden • Also: „Martin hat doppelt so lange gezögert wie Peter.“ (Zeit ist verhältnis-skaliert) • Also: „Martin ist doppelt so ängstlich wie Peter“ • Das ergibt keinen Sinn • Ängstlichkeit kann vermutlich nicht auf Verhältnisskalenniveau gemessen werden. • Für (latente) psychologische Konstrukte wird in aller Regel nur Intervallskalenniveau angenommen. 02_grundbegriffe_kennwerte 25

  26. Skalenniveaus Niveau eines Merkmals vs. Niveau der Variablen • Beispiel 2: Reaktionszeit • Viele psychologische Studien beruhen auf Reaktionszeiten • Die Zeit ist verhältnisskaliert • Aber: Unterschiede zwischen 500 ms und 600 ms sind „psychologisch bedeutsamer“ als Unterschiede zwischen 1500 ms und 1600 ms • Daher werden Reaktionszeiten vor der Auswertung manchmal logarithmiert • Nun gilt: • ln(600) - ln(500) = 6.40 – 6.22 = 0.18 • ln(1600) - ln(1500) = 7.38 – 7.31 = 0.07 • Eine Logarithmierung ist eigentlich nur für ordinalskalierte Variablen zulässig. • Dennoch wird angenommen, dass die logarithmierten Zeiten besser das intervallskalierte Konstrukt (z.B. Aufmerksamkeit) abbilden. 02_grundbegriffe_kennwerte 26

  27. Skalenniveaus Das Skalenniveau von Fragebogen • Oft ist das Skalenniveau umstritten: • z.B. Schulnoten (ordinal oder intervall?) • z.B. „Ratings“ (ordinal oder intervall?) • Für einzelne Fragebogenitems kann man nur von einem Ordinalskalennieveau ausgehen • Bei einer Aggregation von vielen „Items“ (Summenbildung) wird meist von einem Intervallskalenniveau ausgegangen. • Für psychologische Untersuchungen ist das Intervallskalenniveau von besonderer Bedeutung, da viele statistische Verfahren nur bei intervallskalierten Daten eingesetzt werden können. 02_grundbegriffe_kennwerte 27

  28. Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte 28 Zweistufige Antworten

  29. Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte 29 Mehrstufige Ratingskalen

  30. Unterschiedliche Fragebogenformate 02_grundbegriffe_kennwerte 30 Bipolare Ratingskalen

  31. Zusammenfassung Grundbegriffe 02_grundbegriffe_kennwerte 31 • Die deskriptive Statistik dient der Beschreibung einer Stichprobe. • Grundlage jeder Statistik ist ein Datensatz. Dieser entsteht durch die Messung von Merkmalen der Mitglieder dieser Stichprobe. • Dabei spielt die Operationalisierung der Merkmale eine entscheidende Rolle. • Die Daten können auf unterschiedlichen Skalenniveaus vorliegen: • Noninalskala, Ordinalskala, Intervallskala, Verhältnisskala • Grundsätzlich sollte versucht werden, bei einer Messung ein möglichst hohes Skalenniveau zu erreichen. • Bei der Erfassung vieler psychologischer Merkmale kann ein Intervallskalenniveau erreicht werden.

  32. Datensätze in SPSS 02_grundbegriffe_kennwerte 32

  33. Datensätze in SPSS 02_grundbegriffe_kennwerte 33

  34. Datensätze in SPSS Erstellen eines neuen Datensatzes • Definieren der Variablen (Variablenansicht) • Name (kurzer Bezeichner) • Typ (meist: Numerisch = Zahl oder String = Text) • evtl.: Variablenlable und Wertelable • wichtig: Wert für missings (fehlende Werte) definieren! • Messniveau (Skalenniveau): Nominal, ordinal, oder Metrisch • Eingabe der Daten (Datenansicht) • Jede Zeile ist ein Fall (eine Versuchsperson) • Bei fehlenden Angaben immer den Wert für missings eintragen! 02_grundbegriffe_kennwerte 34

  35. Statistische Kennwerte 02_grundbegriffe_kennwerte 35 • Daten können auf viele unterschiedliche Arten dargestellt werden. • Es gehört zu den Kompetenzen eines Statistikers zu entscheiden, welche Art der Darstellung geeignet ist. • Sinnvoll ist immer eine Zusammenfassung des ursprünglichen Datensatzes. • Gleichzeitig soll aber auch möglichst viel Information über das erhobene Merkmal erhalten bleiben. • Dies erfolgt z.B. durch die Darstellung von • Häufigkeiten • Maßen der Zentrale Tendenz • Maßen der Dispersion

  36. Häufigkeiten Eine Urliste enthält alle Werte einer Stichprobe Beispiel Geschlecht: (w, w, w, m, m, w, w, w, w, m, w, m, …) Zur Darstellung der Geschlechterverteilung fasst man diese Urliste zusammen: Berechnung der Prozente: 02_grundbegriffe_kennwerte 36

  37. Häufigkeiten in SPSS Befehle in SPSS • Grundsätzlich gibt es zwei Möglichkeiten, Befehle aufzurufen • Das Menu • Vorteil: Einfache Bedienung, wenn man sich nicht gut auskennt • Nachteil: Wenn man das Ergebnis nochmal braucht, muss man alles von neuem anklicken. • Das Syntaxfenster • Öffnen mit Datei > Neu > Syntax • Dann können Befehle direkt eingetippt werden. • Vorteil: Man kann die Syntax speichern, und alle Berechnungen später erneut ausführen • Nachteil: Man muss die Befehle kennen • Sie müssen den Syntax nicht für die Klausur lernen. • ABER: Ich empfehle jedem regelmäßigem SPSS Nutzer, sich mit der SPSS Syntax vertraut zu machen. 02_grundbegriffe_kennwerte 37

  38. Häufigkeiten in SPSS Häufigkeiten über das Menu berechnen Analysieren > Deskriptive Statistik > Häufigkeiten 02_grundbegriffe_kennwerte 38

  39. Häufigkeiten in SPSS Häufigkeiten über das Menu berechnen Die interessierenden Variablen aus der Liste (links) in das Auswahlfeld (rechts) schieben … und OK anklicken 02_grundbegriffe_kennwerte 39

  40. Häufigkeiten in SPSS Häufigkeiten über den Syntax berechnen • Ein Syntaxfester öffnen • Den Befehl eingeben: • frequency sex. • fre sex. • Den Befehl ausführen: • Strg. R („run“) • oder den blauen Pfeilanklicken 02_grundbegriffe_kennwerte 40

  41. Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte 41

  42. Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte 42

  43. Häufigkeiten in SPSS Häufigkeiten – SPSS Ausgabe 02_grundbegriffe_kennwerte 43

  44. Kategorisierung • Oft hat ein Merkmal zu viele Ausprägungen, um für jede einzelne die Häufigkeit anzugeben. • In diesem Fall kann es sinnvoll sein, Kategorien zu bilden. • Regeln für die Bildung von Kategorien: • Kategorien sind disjunkt (keine Überlappung) • Kategorien sind direkt benachbart (keine Lücken) • An den Rändern sind „offene“ Kategorien erlaubt • Alle geschlossenen Kategorien sind gleich breit • Je größer eine Stichprobe, desto mehr und desto schmalere Kategorien werden gebildet, in der Regel nicht mehr als 20. • Faustregel für die Anzahl der Kategorien (Leonhard, 2004): • Bei N Probanden: m = 1 + 3.32 · log (N) • Bei 20 Probanden: m = 1 + 3.32 · log (20) = 1 + 3.32 · 1.3 ≈ 4 • Bei 100 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 2.0 ≈ 8 • Bei 1000 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 3.0 ≈ 10 02_grundbegriffe_kennwerte 44

  45. Kategorisierung 02_grundbegriffe_kennwerte 45

  46. Kategorisierung • Selbsteinschätzung der Statistikkenntnisse (Kategorisiert) 02_grundbegriffe_kennwerte 46

  47. Maße der Zentralen Tendenz 02_grundbegriffe_kennwerte 47 • Maße der zentralen Tendenz geben an, wie ein Merkmal bei den meisten Mitgliedern einer Stichprobe bzw. in dieser Stichprobe im Durchschnitt ausgeprägt ist. • Es gibt dafür unterschiedliche Maße der zentralen Tendenz • Modalwert (für alle Skalentypen) • Median (für mindestens ordinalskalierte Daten) • Mittelwert (für mindestens intervallskalierte Daten).

  48. Der Modalwert 02_grundbegriffe_kennwerte 48 • Der Modalwert (Modus, Mo) ist derjenige Wert aus einer Verteilung, welcher am häufigsten besetzt ist. • Es kann auch mehrere Modalwerte geben. • SPSS gibt dann nur den kleinsten Wert aus. • Bei kategorisierten Daten wird die Mitte der am häufigsten besetzten Kategorie angegeben. • Die Angabe des Modalwertes ist besonders bei nominalskalierten Daten sinnvoll.

  49. Der Modalwert Beispiele: 02_grundbegriffe_kennwerte 49

  50. Der Modalwert in SPSS 02_grundbegriffe_kennwerte 50 Den Modalwert über das Menu berechnen Analysieren > Deskriptive Statistiken > Häufigkeiten… Auswahl „Statistiken …“ Auswahl „Modalwert“

More Related