1 / 51

XS-104 Estadística I

XS-104 Estadística I. Yadira María Alvarado Salas III Cuatrimestre 2013 - UNED. Capítulo 1. Naturaleza de la estadística. 1 Introducción. Es posible que todo lector del libro de texto, crea conocer lo que es estadística.

ona
Download Presentation

XS-104 Estadística I

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. XS-104 Estadística I Yadira María Alvarado Salas III Cuatrimestre 2013 - UNED

  2. Capítulo 1 Naturaleza de la estadística

  3. 1 Introducción • Es posible que todo lector del libro de texto, crea conocer lo que es estadística. • Es casi seguro que esa definición no coincidirá con la de otro lector. • Esto es así porque: • La palabra estadística es utilizada en varios sentidos. • Los propios estadísticos ponen de relieve unos aspectos o aplicaciones más que otros.

  4. 2 Datos estadísticos o estadísticas • Se asocia la palabra estadística con: • Publicaciones censales. • Noticias sobre producción. • Nacimientos, admitidos a la U, accidentes de tránsito. • Cuadros o gráficos en revistas o periódicos. • Cifras o porcentajes utilizados en discursos políticos. • Este sentido corresponde al plural estadísticas, el cual se utiliza para indicar: • Un conjunto de datos numéricos organizados, resumidos y presentados para perfilar un fenómeno de interés, como: • Estadísticas de población, de producción industrial o un campeonato de fútbol. • Un término más apropiado es “datos estadísticos”.

  5. 2 Datos estadísticos o estadísticas • No todo tipo de información es un dato estadístico: • Número aislado: • Si no se puede comparar o no muestra una relación significativa con otros números, no es un dato estadístico. • Ejemplos: • Los datos de un paciente en un hospital (temperatura de un paciente). • Monto, plazo y tasa de un solo préstamo. • Datos estadísticos: • Números referidos a una misma CARACTERÍSTICA. • Le interesa los patrones o regularidades que presenta un conjunto de datos, los cuales se puedan comparar, analizar o interpretar. • Ejemplos: • Los datos de un grupo de pacientes con la misma dolencia (temperatura promedio de un grupo de pacientes). • Monto, plazo y tasa de varios créditos.

  6. 3 La estadística como disciplina científica • La estadística es un campo del conocimiento. • Es una disciplina científica que se dedica a: • Desarrollo de la teoría y aplicación de técnicas. • Técnicas apropiadas para recolectar, clasificar, presentar, analizar e interpretar información cuantitativa. • Obtenidas por observación o experimentación. • Como ciencia, la estadística se concibe como: • Una rama de las matemáticas aplicadas. • Pero también incluye elementos teóricos y técnicas propias. • Es una herramienta esencial de la investigación en casi todos los campos de la actividad humana.

  7. 4. Unidad estadística, característica y observación • Unidad estadística • Es la unidad sobre la cual se hacen las mediciones. • Característica • Es la variable de interés. • Observación • Es el valor observado en una determinada unidad estadística. • Observaciones • Conjunto de observaciones o datos recolectados.

  8. 4. Unidad estadística, característica y observación

  9. 4. Unidad estadística, característica y observación

  10. 5. El concepto de población • La población es el total o el agregado de las unidades de estudio. Ejemplos: • Una investigación dirigida a conocer el ingreso mensual de las familias del Área Metropolitana de San José: • Unidad de estudio: la familia residente en esa zona geográfica. • Población: el conjunto de familias que viven en esa zona, en el momento del estudio. • Un profesor de matemática está interesado en analizar el rendimiento de sus alumnos de primer año de secundaria y tiene 2 grupos, uno de 26 y otro de 28 alumnos: • La población objeto de estudio es de 54 alumnos. • Un agrónomo zootecnista aplica una nueva dieta a una muestra de 20 vacas Holstein para determinar su efecto sobre la producción de leche: • La poblaciónestá dada por todas las reses de esa raza a las que se les podría aplicar la dieta.

  11. 5. El concepto de población • Una población puede ser finita o infinita: • Ej finita: conjunto de familias en el Área Metropolitana. • Ej infinita: procesos que se repiten indefinidamente. • El análisis se hace con los valores observados y no con las unidades estadísticas. • Unidad de estudio: familia residente en el AM. • Población: todas las familias residentes en el AM. • Población: conjunto de valores de esas familias. • La población la constituyen el conjunto de números. • Un mismo conjunto de unidades puede dar origen a diferentes poblaciones.

  12. El concepto de población

  13. Uso del muestreo • Se toma una parte de la población (muestra) y se generalizan los resultados • Es un procedimiento inductivo, de una inferencia que se hace de la parte hacia el todo • El riesgo es que la parte seleccionada no sea representativa del todo • Dos factores básicos para lograr que la muestra sea representativa: • El tamaño de la muestra: cuanto mayor sea, mayor representatividad • Forma de selección

  14. Uso del muestreo • El tamaño de la muestra depende de: • La homogeneidad de los elementos de la población • El nivel de precisión deseado para las estimaciones • El grado de confianza que se quiere en la inferencia • Cuanto más homogénea sea menor el tamaño de la muestra • Cuándo usar muestras: • Cuando la población es infinita o muy grande • Cuando es muy costoso y requiere mucho tiempo • Cuando la unidad de estudio se destruye o se transforma • Cuando los resultados de la muestra son suficientemente precisos

  15. Selección de la muestra • Se distinguen tres formas de selección: • Aleatoria o al azar: cada elemento tiene una probabilidad conocida y no nula de ser seleccionado. • Caso particular: todos los elementos tienen la misma probabilidad • Intencional: se utiliza el juicio de una persona con experiencia y conocimiento • Conveniencia: se escogen las unidades o elementos que están disponibles o son más fáciles de conseguir . Se corre el riesgo de que no sea representativa • Ejemplo: estimación de hogares con internet en AM • Si se extrae en Los Pinares, no es representativa. • Si se usa el juicio de un experto, sería más representativa, pero sesgada • Con un procedimiento aleatorio, podría no ser representativa, pero produce errores aleatorios

  16. Selección de la muestra • La representatividad de la muestra no está plenamente garantizada en las selecciones • Existen discrepancias entre el resultado de la muestra y el valor de la población • Los estadísticos utilizan muestras al azar porque: • Aunque esas discrepancias tienen magnitudes y sentido que no pueden predecirse, • la selección al azar las produce como errores aleatorios o de muestreo • Tienen su origen exclusivamente en el hecho de ser una muestra al azar • La selección intencional o por juicio, en cambio, produce sesgos de selección.

  17. Selección de la muestra • Los sesgos son errores sistemáticos, es decir, en un solo sentido y pueden ser: • Sesgos de selección: se presentan cuando se utilizan muestras • Sesgos de medición: son comunes a censos y a muestras (ej. Ingresos). • En general los sesgos se desconocen, por lo que no se pueden evaluar ni corregir • Los errores de muestreo no son predecibles individualmente, pero sí en muestras sucesivas • Pueden ser descritos con un modelo de probabilidades • Pueden utilizarse para evaluar la confianza que merece el resultado de una sola muestra.

  18. Selección de la muestra • Los sesgos de selección no pueden ser evaluados o medidos con un modelo • Los errores de muestreo, por su naturaleza aleatoria, sí pueden ser evaluados y medidos • El muestreo aleatorio o probabilístico se prefiere porque: • Elimina los sesgos de selección • Produce errores aleatorios que son medibles utilizando modelos probabilísticos • El error de muestreo puede hacerse pequeño, aumentando el tamaño de la muestra. • En muestras pequeñas, es más apropiado la selección intencional que la aleatoria.

  19. La tabla de números al azar • Gran número de dígitos obtenidos por un proceso que garantiza aleatoriedad • En Excel se tienen las funciones: • ALEATORIO() • ALEATORIO.ENTRE(1;60) • También existen los métodos computarizados que generan muestras de números aleatorios

  20. Atributos y variables • El análisis estadístico se realiza con datos que provienen de la operación de medir o contar • Ejemplos: peso (medir), cantidad de hijos (contar) • Los atributos o cualidades se definen bajo categorías • Ejemplos: estado conyugal (soltero, casado, viudo, divorciado, separado, unión libre • Para su manejo electrónico se les asigna números únicamente con fines de clasificación (códigos) • No es lícito ejecutar operaciones aritméticas con esos códigos • Cuando se mide una característica que difiere de unidad a unidad, se le llama variable.

  21. Atributos y variables • Cuantitativas: peso, número de hijos • Cualitativas o atributos: estado civil. • Cuantitativas continuas: variables con cualquier valor en un intervalo de números reales • Una variable es continua si teóricamente puede tomar cualquier valor en el intervalo. Ej: peso, estatura, velocidad, edad • Cuantitativas discretas o discontinuas: variables cuyos valores son numerables • No puede asumir todos los valores dentro de un intervalo, sino un número finito. Ej: cantidad de goles, octavos de kg de mantequilla

  22. Estadística descriptiva yEstadística inferencial • Estadística descriptiva: descripción del conjunto de datos observados • Técnicas: cuadros, gráficos, promedios, porcentajes y medidas de variabilidad • Estadística inferencial: obtención de conclusiones o inferencias que se generalizan a la población de la cual fueron extraídas las unidades • Proceso inductivo: se toma una parte (muestra), se examina y los resultados se generalizan al conjunto o universo (población) • 2 problemas para la toma de la muestra: el tamaño de la muestra y el método de selección • 2 problemas para la generalización: método de generalización y medición del error asociado.

  23. Capítulo 2 Fuentes de datos y Técnicas de recolección

  24. Introducción • Para llevar a cabo un estudio (de investigación científica o de obtención de información estadística para la toma de decisiones) se plantea el problemas: • Qué tipo de datos se requieren • Cómo van a obtenerse esos datos • Cuáles procedimientos y cuidados se siguen para lograr que sean pertinentes y de buena calidad • Se deben recoger buenos datos ya que una técnica estadística esmerada y compleja no puede compensar la mala calidad de los datos • El investigador debe hacer lo posible por lograr información precisa y confiable

  25. La obtención de la información estadística:datos existentes y no existentes

  26. Fuentes primarias yfuentes secundarias • Fuente: origen de la información utilizada en el estudio o análisis. • Fuente primaria: se refiere a la institución (pública o privada o sin fines de lucro), o si es del caso la persona, que recogió primero los datos y produjo la estadística. Ejemplos: • INEC (Censos de población y vivienda, estadísticas vitales, Encuesta de Hogares, Índice de precios, permisos de construcción) • Banco Central (PIB, IMAE, tipo de cambio) • CCSS (estadísticas de seguridad social y atención) • Tribunal Supremo de Elecciones (electorales) • Una fuente primaria no es necesariamente una publicación.

  27. Fuentes primarias yfuentes secundarias • Fuente secundaria: quien utiliza la información, en un estudio o análisis, no recolectó los datos estadísticos, sino que provienen de una fuente primaria ajena. • Ejemplos: • MIDEPLAN • Proyecto Estado de la Nación • Organización de las Naciones Unidas • Organización Internacional del Trabajo • Términos análogos a fuente primaria y secundaria • Datos primarios: recogidos por la misma persona o institución que los va a utilizar • Datos secundarios: recogidos por otra persona o institución.

  28. La necesidad de evaluar las fuentes • El usuario debe asegurarse del grado de confianza que merecen los datos • Toda fuente debe evaluarse: • Cobertura e integridad del estudio • Calidad, confiabilidad, comparabilidad y pertinencia de los datos • Los datos de fuentes primarias, son en general, más confiables: • La fuente secundaria puede contener errores de transcripción • La fuente primaria incluye a menudo, definiciones • La fuente primaria incluye a menudo el cuestionario y procedimientos • La fuente primaria suele proporcionar más detalle • Una fuente secundaria con frecuencia omite parte de la información, o combina categorías

  29. Técnicas para la recolección de datos no existentes • Experimento: procedimiento que somete a prueba una o varias hipótesis, mediante el manejo controlado de variables • Desventaja: debe realizarse en un ambiente artificial • Observación: el investigador observa lo que le interesa y registra sus observaciones (hoja de trabajo, contador, grabadora). Ejemplos • Ciencias físicas y naturales • Observación mecánica (rating) • Ciencias sociales (observación participante y no participante) • Entrevista cara a cara: visita del enumerador al informante (censos, encuestas) • Ventaja: el entrevistador está en control de la entrevista • Desventaja: costo elevado

  30. Técnicas para la recolección de datos no existentes • Entrevista telefónica: especialmente en opinión pública, política y mercado • Ventajas: reduce costos y acorta el tiempo • Desventajas: se debe tener teléfono, no se puede usar material visual, y los cuestionarios no deben ser largos. • Correo: envío de cuestionario para que se llene y devuelva • Ventajas: es más cómodo y barato • Desventajas: • Las instrucciones deben ser claras y preguntas ordenadas • Se requiere alto nivel educativo de parte de la población • No se tiene control sobre quién responde • Alto porcentaje de "no respuesta" (datos no representativos)

  31. Técnicas para la recolección de datos no existentes • Encuesta por Internet: primero se adjuntó el cuestionario, actualmente se coloca en un sitio web y se invita a las personas a responderlo • Ventajas: costo bajo y menor tiempo, posibilita la presentación de medios audiovisuales, cuestionario interactivo, información en tiempo real, rapidez en los resultados • Desventajas: no hay listados actualizados, la no respuesta puede ser baja, no hay control • Registro: se hace obligatorio el registro de ciertos hechos (oficinas públicas): matrimonios, nacimientos, defunciones, accidentes de tránsito • Ventaja: es muy barato • Desventaja: las personas no cumplen con las disposiciones legales (subregistro).

  32. Técnicas para la recolección de datos no existentes • Encuestas autoadministradas a personas o grupos: el cuestionario es llenado por el informante (luego de una explicación), en presencia del entrevistador • Ventaja: técnica barata y cómoda, permite que se planteen dudas o se pidan explicaciones • Desventaja: requiere de “poblaciones cautivas” que no siempre corresponden al universo • Estos métodos se pueden combinar

  33. Fases de una investigación estadística • Tres etapas principales: • Planeamiento y preparación • Ejecución del trabajo de campo • Procesamiento y análisis de los resultados • Etapas más detalladas • Definición del problema • Establecimiento de los propósitos específicos del estudio • Preparación de un plan de trabajo • Construcción del cuestionario • Diseño y selección de la muestra • Preparación y ejecución del trabajo y campo • Procesamiento de la información • Análisis e interpretación de los datos • Preparación del informe

  34. Capítulo 3 El cuestionario

  35. El cuestionario: características y funciones • La interrogación contempla dos pasos • Preparación de un cuestionario con preguntas de interés • Aplicación de ese cuestionario a los informantes • Factores que condicionan la entrevista • Grado de dificultad de la pregunta y medida de intimidad de las preguntas • Nivel de información, valores y sentido de autoestima del informante • Apariencia y actitud del entrevistador, vocabulario empleado • Presencia de otras personas

  36. El cuestionario: características y funciones • Las funciones del cuestionario: son tres • Traducir necesidades de investigación a preguntas, que permitan obtener respuestas válidas y confiables • Guiar la entrevista y motivar al entrevistador para que comunique información veraz. • Facilitar el correcto registro de las respuestas y etapas siguientes (codificación y procesamiento)

  37. El cuestionario: características y funciones • Primera función: traducir necesidades a preguntas • Investigar el problema, examinar exhaustivamente los datos existentes. • Pertinencia: no excluir preguntas claves, no incluir preguntas innecesarias, con excepción de las preguntas de “calentamiento” y las de transición. • DOS CUALIDADES FUNDAMENTALES que debe reunir el cuestionario: • Confiabilidad: una pregunta es confiable, si aplicada bajo las mismas condiciones, se obtienen respuestas similares. • Validez: una pregunta es válida si las respuestas reflejan lo que se quiere medir . • Considerar costo de entrevista y cansancio del informante.

  38. El cuestionario: características y funciones • Segunda función: guiar la entrevista y ayudar al entrevistador • El cuestionario gobierna la entrevista • Son esenciales: el vocabulario, la redacción y orden de las preguntas, forma de discurrir el cuestionario • Tercera función: facilitar el correcto registro de las respuestas • La información debe expresarse en códigos • Presentarse en un archivo electrónico de datos • Dos pasos básicos: codificación de las respuestas y digitación de códigos. El cuestionario lo facilita porque: • Las preguntas cerradas son “precodificadas” • En las preguntas abiertas se les coloca el código al margen • La información se centraliza en un mismo documento

  39. El cuestionario: características y funciones • Preguntas de la investigación y del cuestionario • La interrogante de investigación es de tipo abstracto • Existen problemas de lenguaje que provocan dificultades • Los entrevistados no son capaces de percibir y estructurar el tema • En el entrevistado hay desconfianza, temor, afán de prestigio que pueden falsear las respuestas • La investigación puede tener un gran componente inconsciente

  40. La forma de las preguntas:abiertas y cerradas • Preguntas estructuradas o no • Grado de libertad que se le permite al entrevistado

  41. La forma de las preguntas:abiertas y cerradas • Preguntas cerradas • Las opciones de respuestas se hallan limitadas o fijadas de antemano • Pueden ser: • Dicotómicas: sólo dos opciones (Ej sexo: femenino, masculino) • De opciones múltiples (Ej: estado conyugal) • Diferenciar entre opciones múltiples (sólo una respuesta es válida) y respuesta múltiples (se permiten varias respuestas) • ¿Posee usted automóvil? /___/ Sí /___/ No • Ejemplos en pág 73-74

  42. La forma de las preguntas:abiertas y cerradas • Batería de preguntas • Bloque de preguntas que indaga varias dimensiones de un cierto tópico (opiniones, actitudes, conceptos, objetos, productos) • ¿Cuánta confianza le tiene a … Mucha Alguna Poca Ninguna Asamblea Legislativa /__/ /__/ /__/ /__/ Gobierno /__/ /__/ /__/ /__/ Tribunal Elecciones /__/ /__/ /__/ /__/ ICE /__/ /__/ /__/ /__/ Sala Cuarta /__/ /__/ /__/ /__/ • Ejemplos: pág 75-76

  43. La forma de las preguntas:abiertas y cerradas • Preguntas abiertas • Permiten una respuesta libre, no limitada a alternativas preestablecidas. Ejpág 76 • Es común una pregunta abierta después de una cerrada. • Para usted ¿qué es tener éxito en la vida? _____________________________________________ _____________________________________________ • Ejpág 77

  44. La forma de las preguntas:abiertas y cerradas • Pregunta abierta con registro cerrado • La pregunta es abierta con opciones preestablecidas • Las opciones no se le leen al informante. Ejpág 77 • ¿Usted ha sido víctima de algún delito durante el año pasado? 1 /__/ Violación del domicilio o robo 2 /__/ Robo en bolsillos o de cartera 3 /__/ Daños o destrucción de su propiedad 4 /__/ Ataques o golpes 5 /__/ Robo de automóvil 8 /__/ Otros (especifique) ___________________ 0 /__/ Nada

  45. La forma de las preguntas:abiertas y cerradas • Pregunta semiabierta • Pregunta cerrada pero con posibilidad de que el entrevistado exprese una respuesta diferente • Cuando compra un pantalón de mezclilla, ¿a qué le da más importancia? 1 /__/ Marca 2 /__/ Talla 3 /__/ Tipo de tela 4 /__/ Precio 5 /__/ Otra (especifique) _________________________ 9 /__/ NS / NR

  46. Ventajas y desventajas comparativas entre las preguntas abiertas y cerradas • Preguntas abiertas • Ventajas: • El interrogado contesta espontáneamente • El interrogado explica siguiendo su propia lógica • Desventajas: • Plantean problemas de procesamiento y de análisis • Pueden ser laboriosas en su manejo y requerir mucho tiempo • Preguntas cerradas • Ventajas: • Pueden ser formuladas rápidamente, fáciles de anotar • Quedan clasificadas en el mismo momento • Procesamiento y análisis relativamente sencillos. • Desventajas: • Pueden llegar a forzar al entrevistado a dar una respuesta • Puede no incorporar la opción adecuada a su opinión • La respuesta puede ser interpretada erróneamente.

  47. Tipos de preguntassegún información que indagan • Preguntas de hechos: • Relativos a su persona, familia, organización, etc. • Podrían fáciles y precisas, otras no (ingreso) • Edad, lugar de residencial, nivel de educación. • Preguntas de acciones o conductas pasadas: • Realización de un acto. Ej: voto, marcas de café • Preguntas de intención: • Cómo actuaría si se presentara la ocasión, ej compras • Preguntas difíciles (recordar o imaginar) • Preguntas de opinión: • Se pide al individuo que diga lo que piensa, ej leyes nuevas • Preguntas de actitud: • Se asemejan a las de opinión, ej el aborto • Cada respuesta constituye un indicador de hecho o actitud

  48. Detalles acerca de la construcción de cuestionarios • El orden de las preguntas • Evitar contaminación, preguntas de calentamiento, efecto embudo, preguntas amenazantes • Preguntas filtro • Preguntas canalizadoras a ciertos informantes • El número de preguntas y la duración del cuestionario • Restringir las preguntas difíciles, realizar un número razonable de preguntas. • La modulación de los cuestionarios • Módulo básico y módulo específico, aplicados en dos grupos

  49. Detalles acerca de la construcción de cuestionarios • Algunos problemas frecuentes en la redacción de las preguntas • Tipo de lenguaje utilizado • Pregunta bidimensional o doble • La doble negación • Preguntas cargadas (sesgadas) (se sugiere respuesta) • Preguntas que suponen demasiado conocimiento • Instrucciones para el entrevistador • Las instrucciones deben aparecer en el cuestionario • La prueba del cuestionario • Identificar y eliminar problemas de mala redacción, mal ordenamiento, ítemes innecesarios, palabras con sesgos • Permite conocer la duración del cuestionario

  50. Procesamiento de los datos • Revisión de los cuestionarios • Preguntas aplicadas • Respuestas ilegibles • Respuestas confusas • Eliminar inconsistencias • Respuestas extrañas o poco comunes • Codificación • Manual de códigos • Digitación o captura de los datos • Digitación directa en el disco duro del computador • Captura directa por los entrevistadores • Captura utilizando lectura óptica • Tabulación de los datos

More Related