Coeficiente de contingencia de Pearson

kontingentziapearson.pngEl coeficiente C de contingencia de Pearson es una medida de asociación estadística entre dos variables cualitativas que se calcula a partir de la tabla de contingencia que reúne los datos correspondientes a las dos variables en cuestión y calculando para ella el estadístico chi-cuadrado, esta última como medida de discrepancia entre las frecuencias observadas o empíricas y las frecuencias teóricas en el caso de que las dos variables fuesen independientes. También puede calcularse a partir del coeficiente phi de Pearson. Tanto de una forma como de otra, el cálculo del coeficiente puede realizarse de acuerdo a las siguientes fórmulas:

$$C=\sqrt{\dfrac{\phi^2}{\phi^2+1}}=\sqrt{\dfrac{\chi^2}{\chi^2+n}}$$

siendo \(\phi\) el coeficiente phi, \(\chi^2\) el coeficiente chi-cuadrado y \(n\) el tamaño muestral. 

Cuando el coeficiente toma el valor 0, puede afirmarse que las dos variables cualitativas no tiene ningún tipo de asociación estadística entre ellas. A medida que el coeficiente se aleja de 0, la asociación entre las dos variables se va haciendo más intensa o estrecha, hasta llegar al valor 1, donde teóricamente la asociación es perfecta.

Sin embargo, dependiendo del número de filas y columnas de la tabla, la fórmula anterior presenta el inconveniente toma un valor máximo que no llega al valor 1. Este valor máximo se calcula a través de la siguiente fórmula cuando la tabla tiene r filas y c columnas:

$$C_{max}=\sqrt{\cfrac{min(r,c)-1}{min(r,c)}}$$

Una vez calculado el valor máximo para una determinada tabla de contingencia, lo adecuado es dividir el coeficiente de contingencia obtenido entre su valor máximo \( \cfrac{C}{C_{max}}\) para obtener un coeficiente de contingencia normalizado o corregido, con valores entre 0 y 1. Dicho ajuste toma también el nombre de corrección de Sakoda.

Generalmente y bajo reserva de estudios similares al que se está realizando, un coeficiente normalizado superior a 0.6 indicaría una asociación intensa, entre 0.3 y 0.6 asociación media, y en el caso de un coeficiente inferior a 0.3, asociación débil, teniendo siempre en cuenta que no se deben hacer equivalentes resultados para el coeficiente similares provenientes de tablas de dimensión muy diferente. 

El coeficiente de contingencia de Pearson coincide con el coeficiente de correlación lineal de Pearson cuando la tabla de contingencia tiene una dimensiones grandes, es decir, cuando el número de modalidades o valores en cada variable es grande. Puede considerarse pues como una estimación del coeficiente de correlación lineal, con la ventaja añadida de que es palicable para variables cualitativas. 

Puede interesarte también




Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Coeficiente de contingencia de Pearson" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Coeficiente de correlación biserial puntual

El coeficiente de correlación biserial puntual o coeficiente de correlación punto-biserial es un coeficiente que mide la correlación o relación estadística entre una variable cuantitativa y una variable dicotómica genuina o pura, esto es, que no ha sido el objeto de una dicotomización artificial. Un...

Hipótesis alternativa

En un contraste o prueba de hipótesis, la hipótesis alternativa o hipótesis alterna (Ha o H1) es aquella hipótesis estadística que se contrapone a la hipótesis nula para decidir sobre la aceptación o rechazo de la hipótesis nula. Frecuentemente, la hipótesis alternativa se establece como d...

Indicador (índice) coyuntural de fecundidad (indicador sintético de fecundidad)

Un indicador o índice coyuntural o sintético de fecundidad es un indicador demográfico que indica para una población el número medio teórico de hijos que tiene una mujer a lo largo de su etapa reproductiva. Se calcula sumando las tasa específicas de fecundidad para los diferentes tramos de edad en u...

Variables latentes (variables ocultas)

Las variables latentes, denominadas también variables ocultas, son variables no observables directamente, pero estimadas mediante otras variables observables dentro de un modelo estadístico. Un ejemplo de variable oculta es la ansiedad de un sujeto en un determinado momento, que está relacionada en ...