Coeficiente de contingencia de Pearson

El coeficiente C de contingencia de Pearson es una medida de asociación estadística entre dos variables cualitativas que se calcula a partir de la tabla de contingencia que reúne los datos correspondientes a las dos variables en cuestión y calculando para ella el estadístico chi-cuadrado, como medida de discrepancia entre las frecuencias observadas o empíricas y las frecuencias teóricas en el caso de que las dos variables fuesen independientes. El cálculo del coeficiente se realiza de acuerdo a la siguiente fórmula:

$$C=\sqrt{\dfrac{\chi^2}{\chi^2+n}}$$

Cuando el coeficiente toma el valor 0, puede afirmarse que las dos variables cualitativas no tiene ningún tipo de asociación estadísitca entre ellas. A medida que el coeficiente se aleja de 0, la asociación entre las dos variables se va haciendo más intensa o estrecha, hasta llegar al valor 1, donde teóricamente la asociación es perfecta.

Sin embarrgo, dependiendo del número de filas y columnas de la tabla, la fórmula anterior toma un valor máximo que no llega al valor 1. Este valor máximo se calcula a través de la siguiente fórmula cuando la tabla tiene r filas y c columnas:

$$C_{max}=\sqrt{\cfrac{min(r,c)-1}{min(r,c)}}$$

Una vez calculado el valor máximo para una determinada tabla de contingencia, lo adecuado es dividir el coeficiente de contingencia obtenido entre su valor máximo \( \cfrac{C}{C_{max}} \) para obtener un coeficiente de contingencia normalizado o corregido, con valores entre 0 y 1. Generalmente y bajo reserva de estudios similares al que es está realizando, un coeficiente normalizado superior a 0.6 indicaría una asociación intensa, entre 0.3 y 0.6 asociación media, y en el caso de un coeficiente inferior a 0.3, asociación débil. 




Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Coeficiente de contingencia de Pearson" (en línea)   Enlace al artículo
Última actualización: 17/07/2024

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta

Medidas de dispersión estadística

La dispersión es la característica de las variables estadísticas cuantitativas unidimensionales que se refiere a la distancia que existe entre los datos (por ejemplo, el recorrido y el recorrido intercuartílico, entre otras) o la distancia entre estos y el centro de la distribución (desviación media...

Criterio (variable)

En estadística, y especialmente en psicometría, un criterio, variable criterio o variable criterial es una variable independiente que se utiliza para predecir el valor de una variable respuesta, a modo de causa o indicador de esta. En relacion a los tests, un criterio es una variable externa al test...

Tanto por mil

Tanto por mil, tanto por millar o pormilaje es una magnitud o cantidad relativa o promedio de elementos o casos considerados,  respecto de un número total de mil. Por  ejemplo, si se dice que las unidades defectuosas son 4 por mil, quiere decir que en promedio cada 1000 unidades habrá 4 un...

Estadísticos robustos

Estadísticos robustos son aquellos estadísticos muestrales cuyos resultados y conclusiones no se ven afectadas por el incumplimiento de las condiciones que se exigen para su utilizacion en un procedimiento, como por ejemplo el muestreo aleatorio, el modelo estadístico que se ha establecido previamen...