650 likes | 768 Views
Facultad de CCPP y Sociología UCM Dto. Sociología IV. Curso de Apoyo y Síntesis:. ATENCIÓN: Material incompleto pendiente de revisión, no distribuir. No es una versión final, pendiente de inserción de referencias bibliográficas, corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO
E N D
Facultad de CCPP y Sociología UCM Dto. Sociología IV Curso de Apoyo y Síntesis: ATENCIÓN: Material incompleto pendiente de revisión, no distribuir. No es una versión final, pendiente de inserción de referencias bibliográficas, corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO sujeto a erratas, errores y omisiones. Becario de Colaboración: 2009/2010 S. Christian Orgaz Alonso
Correo del grupo (comunicación y envíos): http://groups.google.com/group/spss2010 Dirección del grupo (descarga de archivos, en adelante esta función la suplirá la página pbwork): • http://spss2009.pbworks.com/ Página “pbwork”(diario del curso y descarga de archivos): spss2010@googlegroups.com schristianorgaz@gmail.com Correo personal (comentarios, dudas individuales…):
ÍNDICE UNIDAD 1: APROXIMACIÓN AL ENTRONO SPSS UNIDAD 2: ANALISIS UNIVERIABLE UNIDAD 3: TRAMIENTO DE LOS DATOS UNIDAD 4: TABLAS DE CONTINGENCIA UNIDAD 5: COMPARACIÓN DE MEDIAS UNIDAD 6: CORRELACIÓN
ÍNDICE UNIDAD 7: ANALISIS MULTIVARIABLE I REGRESIÓN LINEAL UNIDAD 8: ANALISIS MULTIVARIABLE II
UNIDAD 0 Conocimiento y “realidad” Supuestos: ontológicos, epistemológicos, lo ideológico y la ciencia. La construcción del dato y las implicaciones del conocimiento. De la “realidad” a la base de datos, propuestas de aproximación.
UNIDAD 1 APROXIMACIÓN AL ENTRONO SPSS Variables, medidas, escalas. Definición de conceptos. Clasificación de variables. Codificación (de preguntas a variables). Presentación del entorno SPSS. Construcción de la matriz de datos.
NIVEL DE MEDICIÓN DE LAS VARIABLES (I) RAZÓN INTERVALO ORDINAL NOMINAL ““CUALITATIVAS”” ““CUANTITATIVAS”” Elaboración: S. Christian Orgaz Alonso, 2009
NIVEL DE MEDICIÓN DE LAS VARIABLES (I) RAZÓN INTERVALO ORDINAL NOMINAL Sexo Clase Social Grados Centígrados Edad ““CUALITATIVAS”” ““CUANTITATIVAS”” Elaboración: S. Christian Orgaz Alonso, 2009
NIVEL DE MEDICIÓN DE LAS VARIABLES (I) RAZÓN INTERVALO 0 Absoluto Distancia Orden Clasificación Distancia Orden Clasificación ORDINAL NOMINAL Orden Clasificación Clasificación Sexo Clase Social Grados Centígrados Edad ““CUALITATIVAS”” ““CUANTITATIVAS”” Elaboración: S. Christian Orgaz Alonso, 2009
VARIABLES FICTICIAS O “DUMMY” (II) Variables Nominales u Ordinales DUMMY Sexo: Hombre = 1 No Hombre = 0 Sexo: Hombre = 1 Mujer = 2 --------------------------------- Mujer = 1 No Mujer = 0 Estado Civil: Con pareja = 1 Sin pareja= 0 Estado Civil: Soltero = 1 Casado = 2 Divorciado = 3 Elaboración: S. Christian Orgaz Alonso, 2009
NIVEL DE RELACIÓN DE LAS VARIABLES (II) [Dependencia estadística, Contraste de Hipótesis] DEPENDIENTE INDEPENDIENTE/S Tipo de prueba De significación ¿Nominal, Ordinal o Intervalo Razón? ¿Nominal, Ordinal o Intervalo Razón? ESPURIAS INTERVINIENTES Latentes Un ejemplo de una relación espuria puede ser ilustrado examinando las ventas de helados de una ciudad. Éstas son más altas cuando la tasa de sofocam”ientos” es mayor. Sostener que la venta de helados causa los sofocamientos sería implicar una relación espuria entre las dos. En realidad, una ola de calor puede haber causado ambas. La ola de calor es un ejemplo de variable no tenida en cuenta en este planteamiento, es decir, debido a esta variable la relación entre helados y “sofocamiento” es una relación espuria. (Fuente: Wikipedia) Elaboración: S. Christian Orgaz Alonso, 2009
ESQUEMA BIVARIABLE y MULTIVARIABLE Tema IV Tema V Tema VI-VII-VIII (Nominal/Ordinal) * (Nominal/Ordinal) (Nominal/Ordinal) * Numérica o Sólo numérica Numérica/s * Numérica/s Chi-Cuadrado Contraste de Medias y Anova Correlación (También categórica) y Técnicas Multivariables Elaboración: S. Christian Orgaz Alonso, 2009
CRITERIO DE ORDENACIÓN DE LAS PRUEBAS ESTADÍSTICAS RELACIONES entre Variables Tabla Contingencia(Categórica * Categórica) Correlaciones(Numérica * Numérica/Categórica) Regresión Lineal(Numerica Numérica [y Dummy]) COMPARAR GRUPOS o Variables Medias(Numérica [en realidad no es una prueba estadística, sólo es descriptivo]) Medias independientes(Numérica * Categórica) Medias relacionadas(Numérica * Numérica) Anova de un factor(Numérica * Categórica [> o = a 3 categorías]) Elaboración: S. Christian Orgaz Alonso, 2009
De preguntas a variables: Del cuestionario a la matriz de datos
Identifica para cada pregunta el número de variables que resultan al codificarla, así como el número de categorías de cada variable.
DE PREGUNTAS A VARIABLES ¿Cuántas variables, de qué tipo, cuántas categorías? Material docente de Carlos De la Puente Viedma http://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
DE PREGUNTAS A VARIABLES ¿Cuántas variables, de qué tipo, cuántas categorías? Material docente de Carlos De la Puente Viedma http://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
DE PREGUNTAS A VARIABLES ¿Cuántas variables, de qué tipo, cuántas categorías? Material docente de Carlos De la Puente Viedma http://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
DE PREGUNTAS A VARIABLES ¿Cuántas variables, de qué tipo, cuántas categorías? Material docente de Carlos De la Puente Viedma http://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
DE PREGUNTAS A VARIABLES ¿Cuántas variables, de qué tipo, cuántas categorías? Material docente de Carlos De la Puente Viedma http://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
Creación de una matriz de datos a partir de los distintos modelos de preguntas presentados anteriormente. Nombre Archivo “01_Ejercicio de Codificación”
Creación de una matriz de datos: Pasos: 1º) Definición y creación de las variables (“Vista de Variables”(SPSS)), en función del libro de códigos) 2º) Introducción de datos (“vista de datos”(SPSS)) Elaboración: S. Christian Orgaz Alonso, 2009
DE PREGUNTAS A VARIABLES Ejercicio de codificación en SPSS CUESTIONARIOS A CODIFICAR LIBRO DE CÓDIGOS ID:02Sexo: MujerEdad:22Estudios: AltosValoración: 8Ocio: Videojuegos V1: Nombre IdV2: Sexo Categorías: Hombre = 1 Mujer = 2V3: Edad (en años)V4: Estudios: Categorías: Bajos = 1 Medios = 2 Altos = 3Ns/Nc = 9V5: Valoración del Interés: De 0 (mínimo) a 10 (máximo)V6: Ocio: (Variable abierta/cadena)Ponemos el texto “tal cual”. ID:01Sexo: HombreEdad:23Estudios: MediosValoración: 7Ocio: TV ID:03Sexo: MujerEdad:25Estudios: NCValoración: 4 Ocio: Lectura ID:04Sexo: HombreEdad:24Estudios: AltosValoración: 8Ocio: Beber Cerveza ID:05Sexo: “12” “ “Edad:24Estudios: BajosValoración: 3Ocio: ID:06Sexo: MujerEdad:Estudios: MediosValoración: 5Ocio: TV Nombre Archivo “01_Ejercicio de Codificación” Elaboración: S. Christian Orgaz Alonso, 2009
UNIDAD 2 ANALISIS UNIVERIABLE Análisis descriptivo (univariable) de los datos, medidas de tendencia central, dispersión y forma. Representaciones gráficas mediante SPSS (barras, histogramas).
CASOS PERDIDOS i Tipos de casos perdidos: a) Por el Sistema. b) Por el Usuario. c) Errores y “”Casos Atípicos””. Elaboración: S. Christian Orgaz Alonso, 2009
VALORES PERDÍDOS y CASOS ATÍPICOS Por Sistema Elaboración: S. Christian Orgaz Alonso, 2009
VALORES PERDÍDOS y CASOS ATÍPICOS Por Usuario Elaboración: S. Christian Orgaz Alonso, 2009
VALORES PERDÍDOS y CASOS ATÍPICOS Casos atípicos o erróneos (localización) 1) Mediante tabla de Frecuencias. a) Información de las Variables b) “Buscar” c) “Recodificar”. 2) Mediante comandos Datos/Identificar casos atípicos o Analizar/Descriptivos/Explorar (Análisis Exploratorio) Elaboración: S. Christian Orgaz Alonso, 2009
CASOS PERDIDOS Localización y tratamiento: 1) Cómo es la variable, forma (utilidades) y contenido (tabla de frecuencias) 2) Localizar casos no validos (utilidades o recode) 3) Tratamiento: Eliminar, imputar…
Localizar y tratar los valores perdidos. Archivo: “03_ENI…”
ESTADÍSTICOS Y RELACIÓN CON LAS VARIABLES Tipos de Estadísticos: a) Tendencia Central. b) Dispersión. c) Frecuencias
Elaboración: Asier Amezaga Etxebarría y S. Christian Orgaz Alonso, 2009
DIFERENCIA ENTRE GRÁFICO DE BARRAS E HISTOGRAMA DIAGRAMA DE BARRAS HISTOGRAMA No hay distancia = Nominal/Ordinal HAY distancia = Numéricas Sexo Edad Elaboración: S. Christian Orgaz Alonso, 2009
Aplicación de estadísticos y gráficos en función del tipo de variable y lectura, para el archivo creado anteriormente.
UNIDAD 3 TRAMIENTO DE LOS DATOS Codificación y Recodificación de variables. Comandos de transformación/creación de variables -Compute, If y Recode-. Creación de índices y escalas. Filtros y selección de casos. Ponderación. Lectura de ficheros de datos: Importar, Exportar, Fundir archivos y Microdatos. Depuración de la matriz de datos. Tratamiento de la no respuesta y de la múltiple respuesta. Protocolo de explotación e interpretación de datos con estadísticos descriptivos. Elaboración: S. Christian Orgaz Alonso, 2009
TIPOS DE TABLAS DE FRECUENCIA Tipos de Tablas de Frecuencias: Tipo I: Un caso = Un valor. Tipo II: Un valor = varios casos. Tipo III: Un intervalo de valores = varios casos. Elaboración: S. Christian Orgaz Alonso, 2009
TIPOS DE TABLAS DE FRECUENCIAS T.1. Matriz de Datos: Un Caso = Caso Elaboración: S. Christian Orgaz Alonso, 2009
TIPOS DE TABLAS DE FRECUENCIAS T.2. Matriz Agrupada por Frecuencias: Un Valor = Varios Casos Elaboración: S. Christian Orgaz Alonso, 2009
TIPOS DE TABLAS DE FRECUENCIAS T.3. Matriz Agrupada por Intervalos: Un Intervalo de Valores = Varios Casos CÓMO SE HACE EN SPSS???? = Transformar / … Elaboración: S. Christian Orgaz Alonso, 2009
RECODIFICACIÓN DE VARIABLES (C): Recodificación Automática (Cerrando variables abiertas) Ejercicio: Asigna a la variable “Ocio” un valor para cada categoría.
RECODIFICACIÓN DE VARIABLES (Recode) Tipos : a) En la misma variable. b) En distintas variables. c) Automática Elaboración: S. Christian Orgaz Alonso, 2009
OPERADORES SPSS Elaboración: S. Christian Orgaz Alonso, 2009
RECODIFICACIÓN DE VARIABLES (A): Transforma la variable edad en una variable categórica con dos categorías, de forma que la primera categoría agrupe los valores de edad 22 y 23 años y la segunda categoría agrupe los valores 24 y 25 años)
RECODIFICACIÓN DE VARIABLES Y OPERACIONALIZACIÓN Tipos : a) RECODE (Analizar/Trasformar) b) COMPUTE (Analizar/Calcular) c) IF (Analizar/Calcular-Si…) Elaboración: S. Christian Orgaz Alonso, 2009
Creación y Recodificación de Variables: Ejercicio: (Archivo “04_Venta de casas por barrios”) 1º Recodificar los barrios en tres categorías. (RECODE) 2º Añadir al precio de venta de cada casa 3000€ de gastos de notaría. (COMPUTE) 3º Calcular el impuesto que graba cada uno de los tres barrios agrupando las casas en tres grupos en función del delimpuesto. (IF) Clase Alta = +9000 (Casa 1) Clase Media = +6000 (Casas 2,3,4) Clase Baja = - 2000 (Casas 5,6,7) 4º ¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?
Creación y Recodificación de Variables: Ejercicio: (Archivo “03_ENI_EDAD”) ¿Cómo sustituir los valores erróneos de la variable sexo?
SELECCIÓN DE CASOS Datos/Selección de Casos Tipos : a) Selección mediante condición b) Mediante variable filtro d) Selección aleatoria c) Rango de tiempo o casos Elaboración: S. Christian Orgaz Alonso, 2009
Selección de Casos Ejercicio: (04_Cires 96…”) 1) Crear una muestra de la matriz del 85% de los casos 2) Pedir los estadísticos que correspondan para la variable “edad” y “sexo” 3) Agrupar la edad en tres categorías 0 a 24/ 25 a 54/ 55 y más 4) Asignar a las anteriores categorías los siguientes ingresos semanales medios. 1) 200€ 2) 400€ 3)300€ 5) Calcular a continuación una nueva variable con los ingresos mensuales de cada grupo. 6) ´¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?
PONDERACION • Con variable de ponderación previa. • Datos/Ponderar Casos/ Variable de Ponderación • 2) Creación de una variable de ponderación (ver ejercicio). Elaboración: S. Christian Orgaz Alonso, 2009