490 likes | 923 Views
demnächst in Hörsaal 16 !!. Statistik I. PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006 E-mail: ina.grau@uni-bielefeld.de Sprechstunde Di 16-17 in Raum T4-134 Telefon 106-4310. Einführung
E N D
demnächst in Hörsaal 16 !! Statistik I
PD Dr. Ina Grau Termin der Vorlesung Fr 12-14 in Hörsaal 16 erster Termin 21.10.2005 letzter Termin 10.2. 2006 E-mail: ina.grau@uni-bielefeld.de Sprechstunde Di 16-17 in Raum T4-134 Telefon 106-4310
Einführung Vorgehen bei einer wissenschaftlichen Studie Möglichkeiten der Datenerhebung Grafische Darstellung von Variablen Analyse einzelner Variablen (z.B. Mittelwert) Zusammenhänge zwischen mehreren Variablen SPSS (Statistik II: Schlussfolgerungen aus einer Stichprobe auf die Population; Testverfahren) Themen der Vorlesung
Cemil Sahinöz cemil@misawa.de Kjell Hoffmann elkjell@gmx.net Floris van Veen floris@veen-van.com Sonja Schulz sonja1383@web.de Namen und E-mail der Tutoren
Mo 10-12 in E01-108 Di 10-12 in T2-214 Mi 10-12 in L3-108 Mi 12-14 in C01-148 Do 10-12 in U2-147 teilweise im Cip-Pool U4-114 (auch in der ersten Sitzung) Termine und Räume der Tutorien
Benninghaus, H. (2001): Einführung in die sozialwissenschaftliche Datenanalyse. 6. Aufl., München, Wien: Oldenbourg. Gehring, U.W./ Weins, C. (2002): Grundkurs Statistik für Politologen. 3., überarbeitete Auflage. Opladen: Westdeutscher Verlag. Dringend empfohlene Literatur
Diekmann, A. (1995): Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Hamburg: Rowohlt. Schnell, R.; Hill, P.B.; Esser, E. (1993): Methoden der empirischen Sozialforschung. 4., überarb. Aufl., München, Wien: Oldenbourg. Wright, D.B. (1997): Understanding statistics. An introduction for the social sciences. 1st edition. London et al.: Sage. Kühnel, S.M./ Krebs, D. (2001): Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen. Reinbek: Rowohlt Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A. (2002): Statistics for social data analysis. 4th edition. Itasca, Ill: Peacock. Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002): Statistik für Wirtschaftswissenschaftler. 13. Aufl. München: Vahlen. Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G. (2003): Statistik: der Weg zur Datenanalyse. 4., verbesserte Auflage. Berlin et al.: Springer. Bortz, J. (1999): Statistik für Sozialwissenschaftler. 5. Auflage Berlin/ Heidelberg: Springer. Weiterführende Literatur
in Tutoriumsliste eintragen zum Tutorium Disketten mitbringen, wenn es im Cip-Pool stattfindet Cip-Pool-Account im Internet beantragen https://www.cipux.uni-bielefeld.de/antrag und dann mit Vorlage der Immatrikulations-bescheinigung in Raum T4-142 freischalten lassen, Sprechst. Mo-Fr 11-12). Für Sie zu tun:
Curriculum „Methoden der empirischen Sozialforschung“ Das Curriculum sieht im Grund- und Hauptstudium eine Folge von aufeinander aufbauenden Vorlesungen, Übungen und Seminaren vor. Über die Veranstaltungen und die notwendigen Leistungsnachweise informiert die folgende Überblickstabelle.
Studienphase Semester Veranstaltung Leistungsnachweis Grundstudium 1 • Einführung in die Methoden der emp. Sozial-forschung (Do 18-20, H4) • Statistik I (Deskriptivstatistik) mit Tutorium 2 • Statistik II (Inferenzstatistik) mit Tutorium Klausur 3 • Grundkurs "Methoden der emp. Sozialforschung" 4 • Aufbaukurs "Methoden der emp. Sozialforschung" Schein Hauptstudium 5-8 • Seminar im Wahlpflichtfach "Methoden" Schein Curriculum „Methoden der empirischen Sozialforschung“
Curriculum „Methoden der empirischen Sozialforschung“ Wahlpflichtfach „Methoden der empirischen Sozialforschung“ Im Hauptstudium ist mindestens eine der scheinfähigen Wahlpflichtveranstaltungen erfolgreich zu absolvieren. Ein Leistungsnachweis wird durch eine schriftliche Arbeit im Rahmen einer der regelmäßig angebotenen Wahlpflichtveranstaltungen erworben. Im Bereich der Quantitativen Methoden wird erwartet, dass in den scheinfähigen Wahlpflichtveranstaltungen entweder ein Leistungsnachweis für den Themenbereich "Datenerhebungsverfahren" oder den Themenbereich "Datenanalyse (Statistik)" erworben wird. Der jeweils andere Themenbereich ist dann Gegenstand der Diplom-Fachprüfung.
Was ist empirische Sozialforschung? "Empirische Sozialforschung ist die systematische Erfassung und Deutung sozialer Erscheinungen. Empirisch bedeutet, dass theoretisch formulierte Annahmen an spezifischen Wirklichkeiten überprüft werden. Systematisch weist darauf hin, dass dies nach Regeln vor sich gehen muss. Theoretische Annahmen und die Beschaffenheit der zu untersuchenden Realität sowie die zur Verfügung stehenden Mittel bedingen den Forschungsablauf." (Atteslander 1991: 16)
Was sind Methoden? (1) "Unter Methoden der empirischen Sozialforschung versteht man die geregelte und nachvollziehbare Anwendung von Erfassungsinstrumenten wie Befragung, Beobachtung, Inhaltsanalyse. Je nach dem Grad der Kontrolle des Forschungsablaufs spricht man von Experimenten." (Atteslander 1991: 16)
Was sind Methoden? (2) "... sind erstens Mittel, um Realität zu erfassen - und damit auch zu schaffen, geleitet von Theorien, seien sie nun expliziert, bekannt oder nur 'background ignorance'. Zweitens, alle Methoden führen zu Aussagen, die auf bestimmten Stichproben von Objekten, von Räumen und von Zeiten beruhen. Immer wird die Wahrnehmung codiert, d.h. Erscheinungen werden Merkmale und ihre Ausprägungen zugeordnet. Die zentrale Frage ist, wie die vermuteten Regelmäßigkeiten, die unterstellte Struktur sozialer Prozesse, in der Sprache abgebildet und die Zusammenhänge als Gesetze formuliert werden." (Friedrichs 1973: 189)
Auswahl des Forschungsproblems Theoriebildung Konzeptspezifikation Operationalisierung Bestimmung der Untersuchungsform Auswahl der Untersuchungseinheiten Datenerhebung Datenerfassung Datenanalyse Publikation Quelle: Schnell et al. 1989, 110/Schnell et al. 1993, 118 Theoriegewinnung und Theorieprüfung (1)
Verallgemeinerungen Hypothesen Theoriegewinnung und Theorieprüfung (2) Theorien Beobachtungen
Stellenwert von Statistik im Forschungsprozeß (1) • 1. Heutzutage werden empirische Informationen zu allen möglichen • Sachverhalten erhoben, nicht jede Datenerhebung erlaubt jedoch inhaltlich valide Schlußfolgerungen. • Dieser Mangel kann auch nur begrenzt durch statistische (oder andere) Auswertungsverfahren ausgeglichen werden. Die Aussagekraft der erhobenen Daten hängt entscheidend von den verwendeten sozialwissenschaftlichen Theorien, Untersuchungsdesigns, Erhebungsinstrumenten und Auswahlverfahren ab. • 3. Es gibt keine "theoriefreie" empirische Beobachtung, auch wenn Theorien durch Konfrontation mit "neuen" empirischen Informationen "lernen".
Stellenwert von Statistik im Forschungsprozeß (2) • 4. Statistik ist eine wichtige wissenschaftliche Disziplin, aber die Relevanz einer Untersuchung hängt in erster Linie vom Inhalt und den verwendeten Methoden (s. Punkt 2) ab, nicht vom verwendeten statistischen Auswertungsverfahren. Gleichwohl helfen statistische Kenntnisse, empirische Untersuchungen so durchzuführen, daß gültige und zuverlässige Ergebnisse möglich sind. • In den Sozialwissenschaften gibt es neben statistischen auch andere Auswertungsmethoden für empirische Informationen. • Eines der Hauptziele von Statistik besteht darin, eine Vielzahl von Daten auf ihre wesentlichen Strukturen zu reduzieren. Die Annahmen über das, was als "wesentlich" betrachtet wird, werden in Form eines statistischen Modells zusammengefaßt. Dementsprechend sind die folgenden Ergebnisse modellabhängig (vgl. Stadtplanbeispiel). Ihre Verallgemeinerbarkeit steht und fällt daher mit der Angemessenheit des verwendeten Modells, die in jedem Anwendungsfall geprüft werden muß.
Stellenwert von Statistik im Forschungsprozeß (3) • 7. Bei der Auswertung und Interpretation empirischer Informationen dürfen drei Dinge nicht vergessen werden: • Theoretische Konstrukte, wie z.B. soziale Schicht oder Intelligenz, sind nicht direkt, sondern nur mittels bestimmter Indikatoren (z.B. Schichtindizes oder Intelligenztests) beobachtbar. Das verweist auf die Notwendigkeit der Entwicklung von validen Meßinstrumenten. • Erhebungsmethoden sind mit Meßfehlern verbunden. Daraus ergibt sich die Notwendigkeit der Entwicklung von zuverlässigen Meßinstrumenten bzw. der Verwendung geeigneter statistischer Methoden zur Kontrolle mangelnder Reliabilität. • Empirische Informationen bestehen in der Regel aus einer Auswahl von Objekten, Räumen und Zeiten. Daraus ergibt sich die Frage, ob und in welcher Weise die Auswertungsergebnisse über diese Auswahl hinaus verallgemeinert werden können.
Begriffsdefinition "Eine notwendige Voraussetzung zur Beschreibung und Erklärung eines sozialen Zustandes oder eines sozialen Ereignisses ist seine begriffliche Präzisierung. Wissenschaften - gleich welcher Richtung - arbeiten nie mit konkreten Ereignissen an sich, sondern immer mit in Sprache gefasster Realität, mit Aussagen über die Realität. Wenn solche Aussagen nicht nur von einer einzigen oder einigen ausgewählten Personen verstanden werden, sondern allen Interessierten zugänglich sein sollen, dann ist es unumgänglich, dass der 'gemeinte Sinn' der verwendeten Begriffe von allen erfasst und geteilt werden kann: Man muss wissen, worüber geredet wird. Die am Kommunikationsprozess Beteiligten sollen den verwendeten Begriffen weitestgehend die gleichen Bedeutungen, die gleichen Vorstellungsinhalte zuschreiben." (SN89: 38, SN93: 38, Herv. HJA)
Operationalisierung (1) Theorien beschreiben Zusammenhänge zwischen theoretischen Begriffen. Theoretische Begriffe als Bestandteile von Theorien (oder 'Konstrukte ') sind nicht direkt beobachtbar. Zur Überprüfung einer Theorie ist die Angabe von Korrespondenzregeln für theoretische Begriffe notwendig. Diese sog. Operationalisierung beinhaltet Angaben darüber, wie die theoretischen Konstrukte gemessen werden sollen.
Operationalisierung (2) Dimensionale Analyse, Konzeptspezifikation "Die meisten allgemeinen Konzepte sind viel zu unklar, als dass direkt Messanweisungen gegeben werden können. Aus diesem Grund beginnt die Operationalisierung eines theoretischen Begriffs meist mit der Klärung, welche theoretischen Aspekte eines bestimmten Gegenstandsbereichs ('Dimensionen') durch den theoretischen Begriff bezeichnet werden, bzw. welche Dimensionen das Konzept anspricht." (SN89: 120, SN93: 130, Herv. im Original) Operationalisierung "Die 'Operationalisierung' eines theoretischen Begriffs besteht aus der Angabe einer Anweisung, wie Objekten mit Eigenschaften (Merkmalen), die der theoretische Begriff bezeichnet, beobachtbare Sachverhalte zugeordnet werden können." (SN89: 122, SN93: 132, Herv. im Original)
Theorie: Aussage über Zusammenhang zwischen theoretischen Begriffen (hypothetischen Konstrukten), die zuvor definiert wurden Operationalisierung: Messbarmachen der Begriffe, Umwandlung von theoretischen Begriffen in Variablen (Variablen, die für ein hypothetisches Konstrukt stehen, nennt man Indikatoren) Hypothese: Aussage über Zusammenhang zwischen Variablen Forschung Grundbegriffe
Theorie: Frustration führt zu Aggression Begriffsdefinition: Frustration ist eine Hinderung an der Erreichung eines Ziels, Aggression ist das absichtliche Austeilen schädigender Reize an eine Person. Operationalisierung Frustration: Personen, die gerade eine Aufgabe lösen, werden kurz vor dem Ziel gestört. Aggression: Sie haben dann die Gelegenheit, einer anderen Person Elektroschocks zu verabreichen. Hypothese: Personen, die soeben gestört wurden, teilen mehr Elektroschocks aus als Personen, die nicht gestört wurden. Beispiel für die genannten Begriffe
Hypothesen (1) • Beispiele • Wenn der Entscheidungsspielraum (im Beruf) einer Person umfangreich ist, ist ihr Selbstwertgefühl hoch. • anders formuliert: Je größer der Entscheidungsspielraum einer Person ist, desto höher ist ihr Selbstwertgefühl. • Die zweite Formulierung berücksichtigt, dass beide Variablen viele Ausprägungen haben können.
Hypothesen (2) Definition von „Hypothese“ "Noch unbewiesene Annahme als Hilfsmittel für wissenschaftliche Erkenntnisse." (Wahrig 1991: Deutsches Wörterbuch) Eine Hypothese ist empirisch falsifizierbar. Behauptungen, die die Formulierung „Wenn-dann“ enthalten, sind widerlegt, sobald ein Gegenbeispiel vorliegt. In den Sozialwissenschaften wird üblicherweise eine bestimmte Anzahl von Gegenbeispielen zugelassen, ohne dass die Hypothese als widerlegt gilt.
Hypothesen (3) • Eine Hypothese ist eine Aussage, keine Frage… • Die Aussage enthält mindestens zwei semantisch gehaltvolle Begriffe [...] • Die Begriffe sind durch den logischen Operator 'wenn-dann' verbunden. [...] • Die Aussage ist nicht tautologisch, d.h. ein Begriff deckt den anderen semantisch nicht ab. [...] • Die Aussage ist widerspruchsfrei, d.h. ein Begriff schließt den anderen semantisch nicht aus. • Die empirischen Geltungsbedingungen sind implizit oder explizit im einzelnen aufgezählt. [...] • Die Begriffe sind auf Wirklichkeitsphänomene hin operationalisierbar. • Die Aussage ist falsifizierbar." • (Atteslander 1991: 65f.) 0
Zusammenhangshypothesen Schuhgröße und Körpergröße hängen positiv miteinander zusammen. Unterschiedshypothesen Frauen sind sprachlich begabter als Männer. Beides ist häufig austauschbar: Das Geschlecht hängt mit der Sprachbegabung zusammen. Häufige Formulierungen von Hypothesen
Symmetrische Hypothesen: Schuhgröße und Körpergröße hängen zusammen (die wenn-dann-Beziehung kann in beide Richtungen formuliert werden) Asymmetrische Hypothesen: Alter und Rückenbeschwerden hängen zusammen (die wenn-dann Beziehung ist nur in eine Richtung sinnvoll zu formulieren); eine Variable gilt als Ursache, die andere als Wirkung. Typen von Hypothesen
Hypothesen können positiv oder negativ sein. Je ein Beispiel: Je höher die Semesterzahl von Soziologiestudenten, desto größer ist das Wissen über soziologische Theorien. Je länger ein Mitarbeiter in einer Firma beschäftigt ist, desto niedriger ist seine Motivation Typen von Hypothesen
Für asymmetrische Hypothesen gilt: Die Variable, in der man die Ursache vermutet: unabhängige Variable Die Variable, in der man die Wirkung vermutet: abhängige Variable statistisch können kausale Zusammenhänge (Ursache – Wirkungs – Zusammenhänge) nicht bewiesen werden, sondern nur, dass überhaupt ein Zusammenhang besteht. Ein kausaler Beweis ist mit Experimenten möglich. Typen von Variablen
Ein Experiment unterscheidet sich durch andere Arten empirischer Untersuchungen dadurch, dass die unabhängige Variable nicht gemessen, sondern vom Versuchsleiter hergestellt wird (wie im Beispiel Frustration: Störung oder keine Störung bei der Erledigung einer Aufgabe. Anderes Beispiel: Medikament oder Placebo) Um die Wirkung von Störvariablen zu kontrollieren, müssen die Personen zufällig auf die Ausprägungen der UV aufgeteilt werden. Experiment
Messen: schematische Darstellung 1 Hauptschule Realschule 2 1 Hauptschule Gymnasium 3 Numerisches Relativ Empirisches Relativ
Messen und Messniveau (1) "Unter 'Messen' wird allgemein die Zuordnung von Zahlen ('Messwerten') zu Objekten gemäß festgelegten Regeln verstanden. Die Mängel dieser Definition werden bereits dadurch deutlich, dass die Zuweisung von Schulnoten durch Würfeln eine definitionsgemäße Messung wäre. Eine brauchbare Definition muss für eine Messung fordern, dass die Messwerte zueinander Beziehungen aufweisen, die den Beziehungen der gemessenen Objekte entsprechen. So wird z.B. für eine sinnvolle Längenmessung gefordert, dass der 'größte' Messwert dem 'längsten' Objekt entspricht, der 'kleinste' Messwert dem 'kürzesten' Objekt. Eine Messung in diesem Sinne ist eine 'strukturtreue Abbildung': Die Beziehungen der Objekte ('kürzer' - 'länger') werden durch die Beziehungen der zugeordneten Zahlen ('kleiner' - 'größer') korrekt wiedergegeben." (Schnell et al. 1993: 143, Herv. im Original)
Messen und Messniveau (2) "Die Verwendung eines bestimmten Kriteriums, z.B. Länge, definiert eine bestimmte Beziehung ('Relation') der Objekte zueinander. Eine Menge von Objekten, über die eine Relation definiert wurde, bezeichnet man als 'empirisches Relativ', eine Menge von Zahlen, über die eine Relation definiert wurde, als 'numerisches Relativ'. [...] Das Problem der Messung besteht nun darin, eine Zuordnung der Zahlen zu den Objekten zu finden, so dass die Ordnung im numerischen Relativ der Ordnung im empirischen Relativ entspricht: Das Problem besteht in der Angabe einer Regel, die eine strukturtreue Abbildung ermöglicht." (Schnell et al. 1993: 143f., Herv. im Original)
Bei einigen Variablen ergibt sich die Zuordnung von Zahlen zu Variablenausprägungen unproblematisch, z.B. Alter in Jahren – 20 Bei anderen Variablen muss man Entscheidungen treffen, z.B. beim Geschlecht Mann=1, Frau=2 Die codierten Werte werden dann in eine Datenmatrix eingegeben Codieren
Niveau: Eigenschaft: Beispiel: erlaubte Rechenoperationen Nominal-skala Name Geschlecht = Ordinal-skala Rangfolge Schulnoten < > Intervall-skala mit gleichen Intervallabständen Temperatur (Celsius) + - Verhältnis-skala mit absolutem Nullpunkt Länge (Meter), Alter * / Skalenniveaus Skalenniveaus
Diskrete Variablen haben begrenzte Ausprägungen, z.B. Zahl der Kinder Kontinuierliche Variablen: zwischen zwei Werten ist jeder Zwischenwert möglich, z.B. Alter, Größe für die Statistik reicht folgende Unterscheidung: Kategoriale Variablen: wenige Ausprägungen Kontinuierliche Variablen: viele Ausprägungen Arten von Variablen
Unterscheidung nach... Bezeichnungen Messniveau nominal ordinal intervall-, verhältnisskaliert nicht-metrisch metrisch Anzahl der Ausprägungen diskret kontinuierlich Art der Datenanalyse kategorial kontinuierlich Arten von Variablen
Nominal Ordinal Intervall Verhältnis Modus ja ja ja ja Median nein Ja ja ja Arithm. Mittel nein nein ja ja Geom. Mittel nein nein nein ja Mittelwerte und Streuungsmaße nach Messniveau (1) Zentrale Tendenz (Mittelwerte)
Nominal Ordinal Intervall Verhältnis Spannweite nein (ja) ja ja Quartilsabstand nein (ja) ja ja Mittl. absolute Abweichung nein nein ja ja VarianzStandardabweichung nein nein ja ja Variationskoeffizient nein nein nein ja Mittelwerte und Streuungsmaße nach Messniveau (2) Streuung (Streuungsmaße)
Häufig werden mehrere Variablen gemessen, die gemeinsam eine neue Variable ergeben: Index: eine Variable (soziale Schicht) ergibt sich aus mehreren anderen Variablen (Einkommen, Bildung, Berufsprestige). Die Berechnung der neuen aus den alten Variablen erfolgt nach definierten Rechenoperationen; im Beispiel ergibt sich das Problem unterschiedlicher Einheiten Skalierung
Skala: die Summe oder der Mittelwert aus mehreren Items (Fragen), die dasselbe Konstrukt messen sollen. Die Einheiten sind bei allen Items gleich. Es werden mehrere Items vorgelegt, um die Messgenauigkeit zu erhöhen. Wenn einige Items gegensinnig formuliert sind, müssen sie umgepolt werden, z.B. Ich habe Angst. nein 1 2 3 4 5 ja Ich bin ganz ruhig. nein 1 2 3 4 5 ja recode It2 (1=5) (2=4) (3=3) (4=2) (5=1). Skalierung
Der Skalenwert ergibt sich aus dem Mittelwert der einzelnen Items. Die Mittelung hat gegenüber einer Summierung zwei Vorteile: Das Minimum und das Maximum der Werte, die auftreten können, sind wie bei den Items, die Werte sind leichter interpretierbar. Fehlende Werte werden ausgeglichen, da nur durch die Anzahl vorhandener Werte geteilt wird. Skalierung