Regresión Lineal General: el modelo matemático

Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Sea Y la variable de interés, variable respuesta o dependiente y sean x1,x2,…,xk las variables explicativas o regresoras. La formulación matemática de estos modelos es la siguiente

donde es el error de observación debido a variables no controladas.

En el modelo de Regresión Lineal General se “supone” que la función de regresión m es lineal. Por tanto, la expresión matemática del modelo de regresión lineal general es

 	(8.1)

Un primer objetivo en el estudio de este modelo es el de estimar los parámetros del mismo 0, 1, 2,…, k, y la función de distr ibución del error F a partir de una muestra de n observaciones, que tendrá la forma

{(xi.;Yi)}ni=1 ={((xi1,xi2,…,xik) ;yi)}ni=1 .

De la expresión matemática del modelo de regresión lineal general se deduce que para i = 1,2,…,n se verifica la siguiente igualdad Y = a_0 + a_1 〖 x〗_(i 1) + a_2 x_i2 + …+ a_k x_ik + e_(i ) i = 1,2,…,n,

donde i es el error aleatorio o perturbación de la observación i-ésima. Es intererante escribir el modelo de regresión lineal general en forma matricial. De (8.1 ) se obtiene

Escrito en forma vectorial

Escrito en forma matricial

 	(8.2)

Donde es un vector n-dimensional (matriz n × 1) de la variable respuesta o dependiente, X es la matriz del diseño de las variables regresoras (matriz n × ), la primera columna de esta matriz está formada por unos, es la columna asociada con el parámetro 0; la columna j + 1 contiene la información relativa a la variable xj, j = 1,…,k, es la columna asociada al parámetro j.

 es el vector  -dimensional (matriz  × 1) de los parámetros del modelo, 
 es el vector n-dimensional (matriz n × 1) de las perturbaciones aleatorias.   

Desarrollando la ecuación matricial anterior se tiene,

La fila i-ésima de la matriz X, i. = se corresponde con los datos de las variables regresoras en el individuo i-ésimo, i = 1,2,…,n. Por tanto, la información acerca del individuo i-ésimo está contenida en el vector i. La columna j-ésima de la matriz X, .j = t se corresponde con los datos de la variable regresora xj, j = 1,2,…,k. La información acerca de la variable j -ésima está contenida en el vector .j. En resumen, las matrices del modelo de regresión lineal múltiple son:

En el estudio del modelo de regresión lineal general se asume que se verifican las siguientes hipótesis:

	La función de regresión es lineal, 

m( i.) = m = E = E

	=  0 +  1xi1 +  2xi2 + … +  kxik, i = 1,…,n, 

o, equivalentemente, E = 0, i = 1,…,n.

	La varianza es constante (homocedasticidad), 

o, equivalentemente, V ar = 2, i = 1,…,n.

	La distribución es normal, 

o, equivalentemente, i ~ N , i = 1,…,n.

	Las observaciones Y i son independientes (bajo normalidad, esto equivale a que la Cov(Y i,Y j) = 0, si i j). 

Esta hipótesis en función de los errores sería “los i son independientes, que bajo normalidad, equivale a que Cov = 0, si i j’‘.

	n > k + 1. En caso contrario no se dispone de información suficiente para estimar los parámetros del modelo. 
	Las variables regresoras x1,x2,…,xk son linealmente independientes.

En el siguiente cuadro se resumen las hipótesis del modelo de regresión lineal general. HIPÓTESIS del Modelo de Regresión Lineal General

 En base a la var. de error  i	 En base a la var. respuesta Y

E = 0 E =

 0 +  1xi1 +  2xi2 + … +  kxik 

Homocedasticidad V ar = 2 Homocedasticidad V ar = 2 Independencia, Cov = 0 los errores, i, son independientes Independencia las observaciones, yi, son independientes Normalidad

 i  N(0, 2) 	Normalidad 

Y/xi1,xi2,…,xik ~ N 2) n > k + 1 n > k + 1 Las variables regresoras son linealmente independientes Las variables regresoras son linealmente independientes

PARA ALGUNAS FORMULAS QUE NO SALEN VISTEN ESTA PAGINA http://www.udc.es/dep/mate/estadistica2/sec8_1.html


Búsqueda personalizada

GFDL