El método simplex básico

El método Simplex, introducido en su forma original por Spendley; Hext y Himsworth [6] , en 1962, no se basa en planeamientos factoriales y por eso requiere pocos experimentos para moverse, desplazándose en la dirección del óptimo. La aplicación del método Simplex en Química Analítica fue efectuada por la primera vez en 1969. El método Simplex original, a lo largo de estos años, há sufrido modificaciones que obligaron a la distinción del mismo dentro de las estratégias de optimización, así

el método Simplex original pasó a ser llamado de Método Simplex Básico (MSB).

El procedimiento de optimización, en el método Simplex, comienza por la elección de los n+1 puntos donde será hecha la evaluación de la respuesta. En la Figura 5 tenemos un ejemplo del proceso, para el cual la optimización empieza con los puntos A, B y C. Evidentemente, por tratarse de un sistema (químico), la superficie de respuesta mostrada en la figura a continuación no es conocida, pero es adecuada para ilustrar lo que pasa durante el proceso. No hay necesidad de conocerla previamente, ya que nos interesa la respuesta que será obtenida en cada experimento previsto por el simplex. Este resultado será evaluado contra las demás respuestas para que el proceso pueda continuar, siendo que este tipo de desarrollo convierte al simplex en un método del tipo secuencial.

Los puntos A, B y C forman un triangulo y a través del análisis de la figura anterior, el punto A demuestra tener la peor respuesta de los tres. Una conclusión lógica es que la mejor respuesta está en la dirección opuesta a este punto. Por lo tanto, el simplex es reflejado de forma que el punto D, opuesto al punto A, sea obtenido. Entonces, un nuevo experimento es efectuado en las condiciones experimentales del punto D. Los puntos B, C y D, juntos forman un nuevo simplex. El procedimento es repetido sucesivamente, descartándose la peor respuesta. Por lo tanto, como vemos, el objetivo del método Simplex secuencial es forzar al simplex a moverse para la región de respuesta óptima. Las decisiones requeridas para que eso sea posible constituyen las llamadas “reglas” del procedimiento simplex.

Reglas para el movimiento del simplex básico

Regla nº 1: Después de determinar las respuestas de los n+1 experimentos necesarios para iniciar el proceso, com base en el conocimiento ya adquirido sobre el sistema, se debe clasificarlas en mejor [B (the Best)], peor [W (the Worst)] y resultados intermediarios [N (Next to worst)], según el objetivo de la optimización.

Regla nº 2: El simplex es movido para un simplex adyacente, el cuál es determinado descartando la respuesta menos deseada. El vértice correspondiente a esta respuesta es sustituido por un nuevo vértice, generado por su reflexión a través del centroide de la hiperfase de los vértices restantes.

Matematicamente, sí los vértices de un simplex k-dimensional son representados por coordenadas vectoriales P1, P2, …., Pj, ….Pk, …. Pk+1, la eliminación de la respuesta no deseada Pj resulta en la hiperfase formada por P1, P2, …., Pj-1, Pj+1, ….Pk, …. Pk+1 con el centroide definido por:

Pc = 1/k (P1 + P2 + …. + Pj-1 + Pj+1 + …. + Pk + Pk+1)

Pc = centroide de la hiperfase K = número de dimensiones del simplex Pj = vértice correspondiente a la peor respuesta.

El nuevo simplex es definido por esta fase y un nuevo vértice, P, que corresponde a la reflexión del vértice rechazado Pj, a través de la fase por el centroide Pc.

P = Pc + (Pc - Pj)

Regla nº 3: Sí el punto reflejado, P, tuviera la peor respuesta en el nuevo simplex, probablemente el desplazamiento no está sucediendo en dirección al óptimo. En este caso, se debe rechazar la 2ª peor respuesta de este simplex y continuar con la optimización.

Esta regla es necesaria, pués el simplex puede estar encima de una cresta y la aplicación directa de la Regla no 2 puede hacer con que el punto P sea reflejado de vuelta al punto anterior como ocurre en la Figura 6a. En este caso el simplex oscila y se vuelve sin recurso (decimos, que se mantiene parado).

La Figura 6b muestra el movimiento de un simplex sobre una cresta donde la Regla no 3 fue empleada entre los simplex DFG y FGH y entre los simplex FIJ y IJK.

Esta situación sucede com frecuencia en la región del óptimo. Sí un punto es obtenido cercano a él, todos los otros nuevos puntos tienden a pasar más allá del tope de la curva de respuesta. Entonces, un cambio en la dirección es indicado. En la región del óptimo, normalmente ocurre el simplex circular en vuelta de un óptimo temporario. Como se puede tratar de un resultado falso, el cual hace, con que el simplex se prenda a él, es necesario la siguiente excepción adicional a la Regla no 1.

Regla nº 4: Sí un vértice fuera mantenido en k+1 simplex, antes de aplicar la Regla no 2, haga una nueva observación del vértice persistente. Sí el vértice está realmente cercano al óptimo, es probable que la evaluación repetida de la respuesta sea consistente y de esta forma el punto será mantenido. Sí la respuesta en el vértice fuera alta por causa de un error de observación, es improbable que con la nueva evaluación eso ocurra y por lo tanto, el vértice será consecuentemente eliminado.

Regla nº 5: Sí el nuevo vértice encontrárase fuera de los limites aceptables de las variables optimizadas, no se deben realizar observaciones experimentales con estos valores, al contrario se debe atribuir a este la respuesta más indeseable.

La aplicación posterior de las Reglas nos 2 e 3 obligará al simplex a regresar dentro de los límites permitidos y este continuará buscando por la respuesta óptima. Cuando un óptimo es localizado, las reglas del simplex lo fuerzan a circular.

En la Figura 7 es ilustrado este tipo de efecto observado durante el proceso de optimización, en este caso el simplex se presenta “estancado” en un óptimo falso.

Localización y tamaño del simplex inicial

En la etapa inicial de los experimentos, es recomendable construir un simplex grande para que por sí mismo se mueva rapidamente sobre la superficie de respuestas y pueda localizar la región del óptimo. Para definir más precisamente el óptimo, se construye un simplex menor y se continua la optimización. En el caso que sea necesario, es posible repetir el proceso, dejando el simplex cada vez mas pequeño. Está claro que existe una limitación para el tamaño del simplex, pués, sí este fuera muy pequeño, los errores experimentales pueden enmascarar los verdaderos efectos sobre la respuesta y hacer con que el simplex se traslade irregularmente dentro de un área cercana al óptimo.

Para definición del primer simplex se debe establecer las variables que estarán sujetas a la optimización. Después, se define el tamaño del paso (step size) de cada variable del simplex. Con el auxilio de la Tabla 1, se puede construir el simplex inicial hasta con 7 (siete) factores.

Tabla 1: Valores para el tamaño del paso hasta para 10 factores

Vértice Fatores (variables)

no A B C D E F G

01 0 0 0 0 0 0 0

02 1,000 0 0 0 0 0 0

03 0,500 0,866 0 0 0 0 0

04 0,500 0,289 0,817 0 0 0 0

05 0,500 0,289 0,204 0,791 0 0 0

06 0,500 0,289 0,204 0,158 0,775 0 0

07 0,500 0,289 0,204 0,158 0,129 0,764 0

08 0,500 0,289 0,204 0,158 0,129 0,109 0,756

Ejemplo: Optimización de las condiciones de funcionamiento de un cromatógrafo para un determinado análisis.

Variables: 1- Temperatura, ºC. 2- Velocidad de flujo del gas de arraste, mL/min. 3- Longitud de la columna, cm.

Valores iniciales : Temperatura, T = 20 ºC. Velocidad de flujo del gas de arraste, V = 40 mL/min. Longitud de la columna, C = 200 cm.

Pasos de las Variables (Step size, SS): Temperatura => SSt = 10 ºC. Velocidad del flujo del gas de arraste => SSv = 5 mL/min. Longitud de la columna => SSc = 20 cm.

Los vértices nuevos son obtenidos sumándose al punto inicial el paso de cada variable multiplicado por el factor correspondiente de la Tabla 1. Los experimentos previstos para este ejemplo están relacionados en la Tabla 2.

Tabla 2: Determinación de los vértices del simplex inicial

Vértice Temperatura Flujo Longitud de la columna

Inicial ºC mL/min cm

01 20 40 200

02 20 + (SSt . 1) = 30 40 + (SSv . 0) = 40 200 + (SSc . 0) = 200

03 20 + (SSt . 0,5) = 25 40 + (SSv . 0,866) = 44,3 200 + (SSc . 0) = 200

04 20 + (SSt . 0,5) = 25 40 + (SSv . 0,289) = 41,4 200 + (SSc . 0,817) = 216,3

Consideraciones Generales

El método Simplex no requiere el uso de tests estadísticos de significancia por dos razones:

a) sí las diferencias en las respuestas son grandes al ser comparadas con el error experimental, el simplex se mueve en la dirección correcta.

b) sí las diferencias son bastante pequeñas para ser afectadas por el error experimental, el simplex se mueve en la dirección equivocada. Incluso, un movimiento en la dirección equivocada provocaria una respuesta indeseable, que rapidamente produciria una corrección en la dirección tomada, a través de las Reglas nos 2 e 3, y el simplex aunque momentáneamente fuera de curso, volveria nuevamente en dirección al óptimo.

Se debe llevar en cuenta que el método Simplex no puede ser utilizado en la determinación de variables cualitativas, del tipo presencia o no de un determinado factor. La aplicación de este método también no es aconsejable caso las condiciones experimentales sean de dificil control u obtención, además que sólo es posible optimizar un factor por vez.

En particular, en el uso del método simplex básico, tres limitaciones son evidentes:

Primero: El óptimo solamente es localizado con precisión por casualidad.

Segundo: Un óptimo falso puede ser localizado, tal como se puede observar en la Figura 7.

Tercero: El progreso del simplex en direción al óptimo solamente puede ser efectuado en una proporción constante.

Estos inconvenientes motivaron la modificación del método simplex básico, convirtiéndolo más eficiente en la búsqueda del óptimo, originando el método simplex modificado(MSM).

2. Método simplex modificado

En 1965, Nelder y Mead [7], propusieron modificaciones en el procedimiento original de movimentación del simplex básico, que permitió obtener un punto óptimo estacionário con suficiente precisión y claridad, además de permitir un desarrollo mas rápido del simplex en dirección al óptimo, originando el denominado Método Simplex Modificado (MSM), donde pueden ser alterados el tamaño y la forma del simplex. Las reglas de movimiento del método Simplex básico son válidas y a estas fueron aumentadas, por Nelder y Mead, otras que caracterizan el MSM, volviéndolo provablemente el más aplicado en química.

Reglas para el movimiento del simplex modificado

Las reglas adicionales de movimentación del Método Simplex Modificado [1,7], pueden ser mejor entendidas con el auxilio de la Figura 8.

Figura 8: Andamiento del Método Simplex Modificado Considere el simplex inicial representado por B, N y W en la figura 8. Suponga que W es el vértice que dá la peor respuesta, B la mejor respuesta y N la segunda peor respuesta. Así, como en el método simplex básico, el primer movimiento del simplex modificado es la reflexión y los vértices para la movimentación del simplex pueden ser resumidos por la ecuación:

P = Pc + b (Pc - W)

P = vértice para el movimiento del simplex. Pc= centroide. W= vértice correspondiente a la peor respuesta. b = coeficiente de movimiento del simplex. En el método simplex básico, el único valor permitido para el andamiento del simplex es b = 1, correspondiente a la reflexión, generando el vértice R. Sin embargo, para el Método Simplex Modificado otros valores son permitidos y definidos después de cada observación de la respuesta en comparación con las respuestas obtenidas en los vértices originales representados por B, N y W.

Existen cuatro posibilidades con relación a la respuesta obtenida en R para ser consideradas, las cuáles generan las siguientes reglas de movimiento del simplex modificado (observe la Figura 8):

Regla nº 1: Sí la respuesta en R fuera mejor que la respuesta en B, indica que el simplex está caminando en la dirección correcta. Se debe realizar una expansión del simplex inicial. Haciendo b = 2 se duplica el tamaño del simplex en la dirección deseada y se realiza el experimento en S. Sí la respuesta en S fuera mejor que las anteriores, el nuevo simplex será SBN.

Regla nº 2: Sí la respuesta en R fuera peor que en W, significa que el simplex además de no estar caminando en la dirección correcta, está con tamaño inadecuado. Se debe realizar una contracción con cambio en la dirección del simplex RNB, generando el vértice T, para el cual b = - ½ . Sí la respuesta en T fuera mejor que en W, el nuevo simplex será BNT.

Regla nº 3: Sí la respuesta en R fuera peor que en N, pero mejor que en W, significa que el simplex está muy grande, pero en la dirección correcta. Se hace una observación en U (b = ½). Sí la respuesta en U fuera intermediaria entre B y N, el nuevo simplex será BUN, osea, se hace una contracción.

Regla nº 4: Sí la respuesta en R fuera intermediaria entre B y N, estas operaciones no son recomendables y el nuevo simplex será BRN, procediéndose como en el caso del simplex básico.

Los movimientos del simplex modificado están resumidos en la Tabla 3. Los valores de b, correspondientes a la expansión y contracción del simplex pueden asumir valores diferentes de los relacionados en la tabla 3, pero en general estos son los más usados.

Tabla 3: Movimientos del simplex modificado

Coeficiente, b Vértice Movimiento

2 S Expansión

- ½ T CMD*

½ U Contracción

1 R Reflexión

  • CMD, contracción con cambio de dirección

Cuando los recursos adicionales de movimiento del simplex (MSM) se muestren equívocos (principalmente la contracción), es decir, el simplex no se mueve, se recomienda una reducción del simplex, también llamada de Contracción Brusca. Es decir, se conserva el vértice B del simplex y se hacen nuevas observaciones para determinar los otros vértices nuevos N’ y W’, representados en la Figura 9 y determinados de la siguiente forma:

N’ = (B + N) / 2 y W’ = (B + W) / 2

La idea, aunque efectiva, sufre dos desventajas. La primera, que requiere de la evaluación de los nuevos k vértices del simplex reduzido para que el proceso de optimización pueda continuar (donde k es el número de factores del procedimento en optimización). La segunda, es que el tamaño del simplex, cada vez que ocurre una contracción brusca, es reducido y esto puede resultar en la convergencia prematura del simplex en la presencia del error experimental.

Método simplex super modificado

Existe aún un algoritmo más sofisticado para la optimización utilizando el método simplex, el simplex super modificado [8]. En este método la forma y el tamaño del simplex pueden ser ajustados de acuerdo con las características de la superficie analisada, haciendo la búsqueda por el óptimo aún más eficiente. Sin embargo, el tratamiento matemático necesário para su desarrollo se vuelve más complejo, involucrando el ajuste de equaciones polinomiales, además, siendo necesario realizar un experimento más a cada movimiento del simplex.