Recta de regresión

Una recta de regresión es una recta que se ajusta a una distribución de datos bidimensional \((x_i,y_i)\), tomando como variable independiente una de las variables de la distribución, la que se considera variable explicativa (por convenio, se denominará la variable \(x\) )  y relacionándola con la otra variable \(y\) , que se considera variable dependiente o explicada. Por ejemplo, una recta de regresión puede utilizarse para relacionar las calificaciones \(x_i\) de un grupo de alumnos en una asignatura con las horas dedicadas al estudio \(y_i\) por dichos alumnos. Dado que generalmente, la distribución de datos bidimensional no sigue una relación lineal perfecta, el objetivo es especificar la recta \(\hat{y}=a+bx\) que mejor se ajuste a los datos, en otras palabras, estimar los parámetros \(a\) y \(b\)  de la recta, para lo cual existen diferentes métodos de estimación, aunque el más utilizado es el método de mínimos cuadrados. 

Estimados los parámetros de la recta de regresión, esta pueda utilizarse para realizar una predicción o estimación de la variable dependiente (en el anterior ejemplo, la calificación obtenida) para cada valor de la variable independiente (el número de horas de estudio) de esta forma: \(\hat{y_i}=a+bx_i\). Sin embargo en cada predicción se produce un error, que es la diferencia entre el valor real que toma para cada par de datos \(x_i,y_i)\) de la distribución bidimensional la variable dependiente y el valor de la predicción:  \(e_i=y_i-\hat{y_i}=y_i-(a+bx_i)\). El método más utilizado de ajuste de la recta de regresión es el de los mínimos cuadrados, que lo que persigue es minimizar la suma de los errores al cuadrado (al cuadrado, con el objetivo de que los errores no se compensen entre sí). Es decir, lo que se persigue en el método de mínimos cuadrados es calcular los valores de \(a\) y \(b\) que minimizan \(\sum e_i^2\):

$$ min_{a,b} \sum e_i^2$$

Puede demostrarse matemáticamente que los valores \(a\) y \(b\)  que minimizan la suma de errores al cuadrado, y que por tanto se considera que definen la recta que mejor se ajusta a los datos son: 

$$b=\cfrac{s_{xy}}{s_x^2}$$

$$a=\overline{y}- b\overline{x}$$

siendo respectivamente \(\overline{x},\overline{y},s_{xy}, s_x^2\) la media de la variable \(x\), la media de la variable \(y\), la covarianza entre ambas variable y la varianza de \(x\).



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Recta de regresión" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Pictogramas (estadística)

Imagen: Pictograma que representa la evolución de la producción de trigo en una región.  En estadística, los pictogramas son diagramas que representan totales, frecuencias o proporciones mediante iconos o elementos gráficos relacionados con los datos que es están representando; por ejemplo, ...

Tanto por uno

Un tanto por uno es una proporción, promedio o valor de referencia, que expresa el valor de una cantidad o magnitud por cada unidad de medida de una cantidad total. Por ejemplo, si por cada 20 euros en una operación, se van a cobrar 2 euros de comisión, el tanto por uno es 2/20=0.1; es decir, se va ...

Distribución asimétrica positiva (a la derecha)

Una distribución estadística es asimétrica positiva o a la derecha es aquella en la que los datos correspondientes a valores bajos se concentran en un intervalo más bien estrecho, mientras que los datos correspondientes a valores altos se encuentran dispersos en un intervalo más amplio. También pued...

Perturbación aleatoria

La perturbación aleatoria (en inglérs, random error, error term) es el componente no determinista en un modelo estadístico, no observable y que incluye de forma conjunta todos los factores no especificados en el modelo. Generalmente la perturbación aleatoria aparece en los modelos de regresión ...