Regresión lineal simple (RLS) La regresión lineal es una técnica estadística para modelar e investigar la relación entre dos o más variables. Tiene aplicación en la industria para investigar la relación entre el rendimiento de la producción y uno o más factores del (o de los) que depende, como la temperatura, la humedad ambiental, la presión, la cantidad de insumos, etc; con base en este análisis se puede pronosticar el comportamiento de una variable que se desea estimar. Si el ingeniero industrial logra determinar cómo se relacionan las variables conocidas de un proceso con el comportamiento futuro de otra variable de interés, podrá colaborar favorablemente y en gran medida al proceso de toma de decisiones. Los análisis de regresión y correlación nos permiten determinar tanto la naturaleza como la fuerza de una relación entre dos variables; de esta forma, se puede pronosticar, con cierta precisión, el valor de una variable desconocida basándonos en observaciones anteriores de ésa y otras variables. Pero este aspecto, el de la predicción será motivo de estudio en la sección 1.4.
El modelo de regresión lineal simple es: Yi =β0 + β1X + Єi
Donde Yi es la i-ésima observación de la variable dependiente (la que queremos estimar), X es el correspondiente valor de la variable independiente o explicatorio, β0 y β1 son los parámetros (valores desconocidos que se suponen con valores fijos) del modelo y Єi es la variable aleatoria de error.
Otros aspectos que deben considerarse: historia de cómo surge la técnica de la regresión, Galton y los datos de estaturas de padres e hijos, lo que al principio se denominaba regresión hoy se conoce como correlación. El concepto de regresión ha quedado exclusivamente para el caso en que se consideran variables dependientes e independientes.
Cuando la variable dependiente está en función de dos o más regresores se tiene el modelo de regresión múltiple (RLM): Yi =β0 + β1xi 1 + β2xi 2 + … + βqxi q + Єi .
Usando álgebra de matrices puede estimarse el vector de parámetros β_ = β0 β1 β2 . . . βq t con β_ = (x´x)−1xty donde X es la matriz de datos.