160 likes | 338 Views
Statistik: 25.2.04. Erheben von Daten kategoriale Merkmale. Datenquellen. Primäre Daten, aus Vollerhebung Stichprobenerhebung Sekundäre Daten Volkszählungsdaten Daten von Statistik Austria, von der OeNB Daten aus der Hörerevidenz der WU Personal-, Lagerkartei. Datenerhebungen.
E N D
Statistik: 25.2.04 Erheben von Daten kategoriale Merkmale
Datenquellen • Primäre Daten, aus • Vollerhebung • Stichprobenerhebung • Sekundäre Daten • Volkszählungsdaten • Daten von Statistik Austria, von der OeNB • Daten aus der Hörerevidenz der WU • Personal-, Lagerkartei PI Statistik, SS 2004
Datenerhebungen • Zielsetzung genau definieren • Stichprobenrahmen: Seine Qualität entscheidet über Qualität der Daten • Erhebungsinstrument bestimmt Kosten und Qualität der Daten (siehe unten) • Stichprobenumfang bestimmt Genauigkeit • Erhebungsmanagement: Planung, Mannschaft, Schulung, Formulare und EDV, Qualitätssicherung • Datenaufbereitung und -speicherung PI Statistik, SS 2004
Erhebungsinstrumente • Schriftliche Befragung • Persönliches Interview • Telephonische Befragung • Beobachtung • follow-up Verfahren • Schulung PI Statistik, SS 2004
Stichprobendesign Nichtzufälliges Erhebungsdesign • convenience sampling Zufälliges Erhebungsdesign • Einfache Zufallsstichprobe • Geschichtete Zufallsstichprobe • Systematische Zufallsstichprobe • Clusterstichprobe • Quotenstichprobe • mehrstufige Stichprobe PI Statistik, SS 2004
Fragebogen • Typen von Fragen • Dichotome Fragen • Multiple-Choice Fragen • Offene Fragen • Fragebogendesign • so kurz als möglich • einfach, verständlich, eindeutig • logischer Aufbau • gutes Layout PI Statistik, SS 2004
Erhebungen: Fehler Fehler = Stichprobenfehler + „non-sampling“ Fehler • Stichprobenfehler • „non-sampling“ Fehler • Daten-Fehler • Übertragungsfehler • „non-response“ (Verweigerung, nicht angetroffen) • Fehler durch Fragebogendesign PI Statistik, SS 2004
Kategoriales Merkmal • Auch qualitatives, kategorielles Merkmal • Ordnet der Beobachtungs- oder Untersuchungseinheit eine von endlich vielen Klassen (Kategorien) zu; • Dazu gehören nominale und ordinale Merkmale • Ist immer diskret (die Menge der Merkmalsausprägungen ist endlich oder abzählbar) PI Statistik, SS 2004
Kreisdiagramm Beispiel: Augenfarbe von Studierenden PI Statistik, SS 2004
Kreisdiagramm Explodierter 3D-Kreis PI Statistik, SS 2004
Säulen-, Stabdiagramm PI Statistik, SS 2004
Absolute & relative Häufigkeit • (absolute) Häufigkeit: gibt an, wie oft eine bestimmte Kategorie in der Datenmenge vorkommt; typisches Symbol: Hi • z.B.: 15 Studierenden haben blaue Augen • relative Häufigkeit (Anteil) h i • n: Umfang der Datenmenge • Oft als Prozente (Prozentanteil) angegeben PI Statistik, SS 2004
Kumulierte (relative) Häufigkeiten • Summe der relativen Häufigkeiten aller vorhergehenden Kategorien, einschließlich der aktuellen • Nur für ordinale Merkmale sinnvoll PI Statistik, SS 2004
Noten von 52 Studierenden PI Statistik, SS 2004
Pivot Table-Bericht • „Ein PivotTable-Bericht ist eine interaktive Tabelle, die große Datenmengen rasch kombinieren und vergleichen kann.“ • Wichtige Hilfe zum Auszählen von Datenmengen PI Statistik, SS 2004
Fragestellungen • Kommen alle Kategorien gleich häufig vor ? • Entsprechen die Häufigkeiten in den Kategorien einer bestimmten Vorgabe ? • Entspricht die Häufigkeit (Prozentsatz, Anteil) in einer bestimmten Kategorie einem bestimmten Wert? • In welchem Bereich kann man den Anteil einer Kategorie in der Grundgesamtheit erwarten ? PI Statistik, SS 2004