la regresión lineal es la familia de algoritmos empleados en tareas de aprendizaje automático supervisado (para obtener más información sobre el aprendizaje supervisado, puede leer mi artículo anterior aquí). Sabiendo que las tareas de ML supervisadas normalmente se dividen en clasificación y regresión, podemos colocar algoritmos de regresión lineal en esta última categoría., Difiere de la clasificación debido a la naturaleza de la variable objetivo: en la clasificación, el objetivo es un valor categórico (‘sí/no’, ‘Rojo/Azul/Verde’, ‘spam/no spam’…); por otro lado, la regresión implica valores numéricos y continuos como objetivo, por lo que se le pedirá al algoritmo que prediga un número continuo en lugar de una clase o categoría. Es decir, imagine que desea predecir el precio de una casa en función de algunas características relativas: la salida de su modelo será el precio, por lo tanto, un número continuo.,
Las tareas de regresión se pueden dividir en dos grupos principales: aquellas que usan solo una característica para predecir el destino, y aquellas que usan más de una característica para ese propósito. Para darle un ejemplo, consideremos la tarea de la casa anterior: si desea predecir su precio solo basado en sus metros cuadrados, caerá en la primera situación (una característica); si va a predecir el precio basado en, digamos, sus metros cuadrados, su posición y la habitabilidad del entorno circundante, caerá en la segunda situación (múltiples características, en ese caso, tres).,
En el primer caso, el algoritmo que se puedan emplear será el de Regresión Lineal Simple, que es el que vamos a hablar en este artículo. Por otro lado, cuando se enfrenta a más de una entidad capaz de explicar la variable objetivo, es probable que emplee una regresión lineal múltiple.,
la regresión lineal Simple es un modelo estadístico, ampliamente utilizado en tareas de regresión ML, basado en la idea de que la relación entre dos variables se puede explicar mediante la siguiente fórmula: