Coeficiente de correlación biserial puntual

El coeficiente de correlación biserial puntual o coeficiente de correlación punto-biserial es un coeficiente que mide la correlación o relación estadística entre una variable cuantitativa y una variable dicotómica genuina o pura, esto es, que no ha sido el objeto de una dicotomización artificial. Un ejemplo de esta situación es la correlación entre el sexo (variable dicotómica pura) y la calificación obtenida en un examen de matemáticas. Aunque el coeficiente de correlación biserial puntual coincide con el coeficiente de correlación lineal de Pearson cuando en este último la variable dicotómica se ha codificado en términos de 0s y 1s, lo habitual es referise a dicho coeficiente a través de esta fórmula:

$$r_{bp}=\cfrac{\overline{x}_p-\overline{x}_q}{s_x}\sqrt{pq}$$

donde \(\overline{x}_p\) y \(\overline{x}_q\) son las medias artméticas simples de las puntuaciones de la variable cuantitativa para cada grupo de la variable dicotómica (en el ejemplo del párrafo anterior, serían las medias de las calificaciones de los hombres, por un lado; y de las mujeres, por otro), \(s_x\) es la desviación típica de la variable cuantitativa, reuniendo los datos de los grupos (en el ejemplo, la desviación típica de todas las calificaciones, sin distinguir si corresponden a un hombre o una mujer), y \(p\) y \(q\) son las proporciones de elementos en cada grupo sobre el tamaño total de la muestra (en el ejemplo, proporción de hombres y proporción de mujeres).

Al igual que el coeficiente de correlación de Pearson, el coeficiente de correlación biserial puntual toma valores en el intervalo [-1,1] y se interpreta del mismo modo que aquel, siendo la correlación mas intensa según nos acercamos en valor absoluto  al valor 1, mientras que el signo indica que grupo de la variable dicotómica obtiene mayores puntuaciones en la variable cuantitativa.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Coeficiente de correlación biserial puntual" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Límite de clase

En estadística, los límites de clase o fronteras de clase son los límites inferior o superior de un intervalo de clase en el que se agrupan los datos correspondientes a una variable cuantitativa. Por ejemplo, en una distribución agrupada  de alturas de personas, respecto al intervalo 170cm-17...

Correlación múltiple

La correlación múltiple hace referencia a la correlación entre una variable y otro conjunto de variables, o entre una variable y una combinación lineal de otras variables. Se contrapone a la correlación simple. ...

Media aritmética para datos agrupados

La media aritmética para datos agrupados es conceptualmente la misma que la media aritmética para datos no agrupados, pero su cálculo en la práctica a partir de la distribuciones de frecuencias es diferente (consulta, además, datos agrupados). Veamos un ejemplo: Las calificaciones obtenidas por un ...

Distribución de frecuencias

En estadística, una distribución de frecuencias o distribución de datos, también llamada tabla de frecuencias o cuadro de frecuencias, es la presentación organizada y ordenada, en forma de tabla o como representación gráfica, de los diferentes valores que toma una variable estadística junto con la f...