50 likes | 401 Views
Tema 22: Análisis de tablas de contingencia Prueba c 2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c 2 . Interpretación y principales características. Prueba c 2 como medida de asociación y como prueba de contraste
E N D
Tema 22: Análisis de tablas de contingenciaPrueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación y principales características.
Prueba c2 como medida de asociación y como prueba de contraste La prueba chi-cuadrado es una prueba no paramétrica que se emplea para medir la asociación entre dos variables cuando tenemos tablas de contingencia. También es empleada, de manera general, para evaluar la divergencia entre una puntuaciones observadas (empíricas) y unas puntuaciones predichas (teóricas).. De manera general, el estadístico chi-cuadrado se obtiene así: Donde fe representa las frecuencias empíricas y ft representa las frecuencias teóricas Bajo la hipótesis nula, dicho estadístico sigue una distribución chi-cuadrado con k-1 grados de libertad (donde k sería el número de filas) Rechazar la hipótesis nula significa indicar que el ajuste entre las puntuaciones observadas y las predichas no es bueno.
Prueba c2 como medida de asociación: El caso de independencia de 2 variables cualitativas La hipótesis nula será que ambas variables sean independientes Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple: Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de las columnas, y ese resultado se divide por N Bajo la hipótesis nula (ambas variables independientes), dicho estadístico sigue una distribución chi-cuadrado con (num_filas-1)*(num_columnas-1) grados de libertad Para calcular "chi-cuadrado" con tablas de contingencia en internet: http://faculty.vassar.edu/lowry/newcs.html
Prueba c2 como medida de asociación. Coeficientes derivados e interpretación A partir de la prueba chi-cuadrado, se han propuesto cierto número de medidas de asociación entre variables cuando tenemos frecuencias en tablas de contingencia. Es decir, la cuestión aquí no es decir si la relación es significativa o no (eso lo tenemos en la transparencia anterior...), sino cuantificar la fuerza de la relación Caso de tener tablas 2x2: Coeficiente phi Este índice se interpreta de manera análoga al coeficiente de Pearson (pero observa que phi no puede ser negativo...sólo de 0 a 1)
Prueba c2 como medida de asociación: Coeficientes derivados e interpretación Caso de tener más de 2 filas ó columnas: Prueba de Cramer m es el número menor entre el número de filas-1 y columnas-1 Este índice se interpreta análogamente al índice de Pearson (excepto por el tema del signo). Observa que si la tabla es 2x2 este índice coincide con el índice phi