DISTRIBUCIONES MUESTRALES

DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS

Sean X1 y X2 dos variables aleatorias con valores esperados m1 y m2 y varianzas y , respectivamente. Por ejemplo, X1 puede ser la duración de una batería para carro de una marca, y X2 la duración de una batería de otra marca diferente. Si los medias m1 y m2 son desconocidas, podríamos estar interesados en conocer si ambas baterías tienen la misma duración media. En forma similar, si las varianzas son desconocidas, podríamos estar interesados en saber si son iguales o no. Para realizar estas inferencias, se pueden someter a pruebas idénticas diferentes baterías, controlando los factores externos, de tal forma que las diferencias se deban exclusivamente a la clase de marca probada

Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media poblacional, es decir si m1 = m2 ó equivalentemente m1 - m2 = 0.

Suponga que es una muestra aleatoria de tamaño n1 tomada de una población con media m1 y varianza , es otra muestra aleatoria de tamaño n2 tomada de una población con media m2 y varianza . Si deseamos realizar alguna inferencia sobre m1 - m2, nos podemos basar en la distribución de la diferencia de las medias muestrales. Por el TCL sabemos que tanto como se distribuyen normalmente con los siguientes parámetros: ,

Ahora bien, para la diferencia de las medias muestrales se tiene:

Para conocer la distribución muestral de las diferencias entre las medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de estos tres casos se analizará por separado.

a) Distribución de la diferencia entre dos medias cuando las varianzas son conocidas. Si las varianzas y son conocidas, tanto como se distribuyen normalmente. Por lo tanto la distribución de la diferencia entre las medias muestrales es normal con el valor esperado y la varianza dados anteriormente, es decir,

De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución normal estándar:

Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con respecto a la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede expresar como:

b) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas pero iguales ( = = )

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadística para verificar si éstas son iguales o diferentes. Para realizar esta prueba debemos hacer uso de la distribución F para verificar si la relación de varianzas es igual a uno o diferente de uno.

Para cada una de las dos muestras se definen sus respectivas varianzas como:

,

Además tienen distribuciones chi cuadrado con n1–1 y n2–1 grados de libertad respectivamente. Por lo tanto su suma también sigue otra distribución chi cuadrado con n1+n2–2 grados de libertad. Es decir:

Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribución chi cuadrado con n grados de libertad, entonces la variable tiene una distribución t con n grados de libertad. Para nuestro caso la variable Z corresponde a la distribución de la diferencia de las dos medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y acabada de definir. Por lo tanto

donde es un estimador ponderado de la varianza poblacional s

 obtenida ponderando las varianzas poblacionales por sus respectivos grados de libertad.

c) Distribución de la diferencia entre dos medias cuando las varianzas son desconocidas y diferentes (¹ )

Cuando las varianzas son diferentes se puede demostrar que la siguiente variable aleatoria T sigue una distribución t con n grados de libertad, donde

y el número de grados de libertad n está dado por:

Ejemplo. El gerente de una refinería piensa modificar el proceso para producir gasolina a partir de petróleo crudo. El gerente hará la modificación sólo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviación estándar de 2.3, y para el proceso propuesto fue de 28.2 con una desviación estándar de 2.7. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, ¿debe adoptarse el nuevo proceso?

Garfias Orozco Luis Alberto ITM


Búsqueda personalizada