Sistemas dinámicos disipativos y
métodos de aproximación en optimización convexa.
Felipe Alvarez Daziano.
Departamento de Ingeniería Matemática.
Facultad de Ciencias Físicas y Matemáticas.
Universidad de Chile.
|
Presentación.
El objetivo del presente artículo es proporcionar un resumen
de la tesis de doctorado del autor para optar al grado de Doctor en Ciencias
de la Ingeniería Mención Modelación Matemática,
grado académico otorgado por la Universidad de Chile en el mes de
Diciembre de 1998. Los trabajos que constituyen esta tesis se dividen en
cinco capítulos independientes, los que hemos agrupado en dos partes.
La primera parte dice relación con métodos dinámicos
continuos en optimización y está constituida por dos
capítulos; el primero ya ha sido publicado en una revista de circulación
internacional, mientras que el segundo se encuentra actualmente en prensa.
La segunda parte de esta tesis trata algunos métodos de aproximación
paramétrica; de los tres capítulos que la componen, el
primero ha sido aceptado para ser publicado y el tercero ha sido enviado
para su evaluación y eventual publicación. Para ser más
precisos, la composición de la tesis es la siguiente: |
Parte I: Sistemas dinámicos disipativos y optimización.
Capítulo 1.-Asymptotic analysis of
evolution equations associated with Newton's method for parametric approximations
of convex minimization problems, Journal on Applied Mathematics and
Optimization 38 (1998), pp. 193-217 (coautor: J.M. Pérez, U. de
Chile).
Capítulo 2.-On the minimizing property
of a second order dissipative system in Hilbert spaces, por aparecer
en SIAM Journal on Control and Optimization (en prensa).
Parte II: Aproximación paramétrica de problemas variacionales.
Capítulo 3.-Absolute minimizer in
convex programming by exponential penalty, por aparecer en Journal
of Convex Analysis.
Capítulo 4.-Local solutions for a
class of L problems by LP
approximation: variational, differential and geometric properties (en
colaboración con G. Bellettini, U. de Pisa).
Capítulo 5.- Homogenization of functionals
with parametric integrands, enviado para publicación (coautor:
J.-Ph. Mandallena, U. de Montpellier).
A continuación se expone el contenido
de la tesis. Comenzamos por una introducción a los temas y objetivos
principales de este trabajo, precisando el contexto general del estudio
realizado. Luego se proporciona un resumen, donde nos concentramos brevemente
sobre el contenido de cada capítulo; por razones de espacio, sólo
se detallan algunos de los resultados obtenidos. Finalmente, después
de extraer algunas conclusiones generales, damos una lista de referencias.
Introducción general
Todo problema de optimización está
definido a partir de ciertas variables de estado, de restriccionessobre
estas variables y de un criterio a minimizar. La motivación
principal de esta tesis es el estudio asintótico de algunos métodos
de aproximación para problemas de optimización cuando
todos los datos del problema son convexos. El objetivo es contribuir
con técnicas de análisis y nuevos métodos de optimización
para obtener soluciones aproximadas de problemas no necesariamente diferenciables
y eventualmente
degenerados, es decir, en presencia de una multiplicidad
de soluciones óptimas.
Optimización convexa:
Matemáticamente, un problema de optimización
se suele expresar como:
 
Aquí,
representa la variable de estado (o variable de decisión)
que pertenece a un espacio de Banach .
El criterio a minimizar está dado por una función ,
la cual suponemos convexa. La introducción del valor
es una forma de incorporar implícitamente las restricciones en la
definición de . Un
ejemplo típico de esto último es una función de la
forma:

En este caso particular, las restricciones
están definidas por el conjunto .
Al hecho de no satisfacer las restricciones se le asigna un costo infinito .
La convexidad de equivale
simultáneamente a la convexidad de la función
y del conjunto de restricciones ,
y el problema es equivalente
a .
Soluciones exactas y soluciones aproximadas:
Resolver el problema de minimización
significa:
Encontrar tal que .
A un tal
se le llama solución óptima y al correspondiente ,
valor
óptimo. Exceptuando ciertos casos muy particulares, en general
no es posible resolver de
manera exacta, y uno se ve obligado a contentarse con soluciones aproximadas.
Estas últimas satisfacen un criterio de suboptimalidad del tipo:
,
para alguna precisión .
La eficacia de todo método de optimización para obtener tales
aproximaciones dependerá tanto del tipo de problema al cual se aplica
como de ciertas consideraciones sobre la unicidad de soluciones
y la regularidad de los datos. En efecto, los métodos clásicos
proporcionan "buenas" aproximaciones cuando el problema en cuestión
posee una única solución óptima y las funciones que
intervienen son suficientemente diferenciables. Cuando alguna de estas
condiciones falla, lo que ocurre en diversas situaciones prácticas,
las principales propiedades de estos métodos se pierden y, más
aún, pueden aparecer serias dificultades numéricas al momento
de su implementación computacional. El desarrollo de nuevos métodos
y algoritmos es un tema interesante, cuyo estudio requiere un análisis
cuidadoso y donde existe un vasto campo a ser explorado aún.
Métodos trayectoriales para obtener soluciones aproximadas:
Un enfoque que ha recibido una atención
creciente en los últimos años consiste en obtener soluciones
aproximadas a partir de ciertas trayectorias que evolucionan hacia
una solución del problema que nos interesa resolver. En el caso
de la presente tesis, las trayectorias consideradas son de tres tipos:
-
Soluciones de un sistema dinámico disipativo asociado a una
ecuación de evolución en el tiempo.
-
Trayectorias óptimas asociadas a la aproximación paramétrica
de un problema de optimización.
-
Trayectorias dinámico-paramétricasque combinan (a)
y (b).
Consideremos estos puntos con algo más
de detalle.
(a) Métodos dinámicos:
La
idea es considerar un sistema de ecuaciones diferenciales ordinarias de
la forma
, o más generalmente ,
cuyas trayectorias evolucionan
en el tiempo y que, a largo plazo, convergen hacia un punto estacionario
gracias a un fenómeno de tipo disipación de energía.
Si los puntos estacionarios son los mínimos de una función,
todo método de resolución de la ecuación diferencial
puede interpretarse como un método de optimización. Un ejemplo
clásico es el método de máximo descenso continuo,
el
cual consiste en resolver la ecuación de evolución:

donde denota el gradiente de
una función , la cual
suponemos diferenciable, y es
un espacio de Hilbert real. Notemos que las soluciones de esta ecuación
satisfacen:
.
De este modo, la función a minimizar es
decreciente sobre toda la trayectoria. Decimos que
se disipa a medida que el tiempo
crece. Observemos además que corresponde
a una solución estacionaria
si y sólo si , que
es precisamente la condición necesaria de optimalidad. Es así
natural de esperar que las trayectorias
evolucionen en el tiempo hacia un punto estacionario, lo que en este caso
corresponde a un mínimo de f.
El método de máximo descenso
continuo es sólo un ejemplo entre los muchos sistemas diferenciales
que uno puede considerar. El estudio sistemático de tales sistemas
tiene muchas ventajas. En primer lugar, un sistema continuo con buenas
propiedades puede sugerir nuevos métodos iterativos asociados a
la integración numérica de las trayectorias. Por otra parte,
en algunas ocasiones es posible que las técnicas utilizadas en el
caso continuo puedan ser adaptadas para obtener resultados concernientes
a algoritmos discretos. En general, se espera tener un resultado del tipo:
-
Convergencia en valor:
cuando .
-
Convergencia de las soluciones: Existe
tal que cuando 
Estas propiedades han sido establecidas para el
método de máximo descenso continuo en un marco teórico
muy general; ver [BRE],[BRU] y [LEM].
En la práctica, la principal desventaja
del método de máximo descenso es relativa lentitud en la
convergencia de las trayectorias. Esto motiva el estudio de las versiones
continuas de otros métodos. En el primer capítulo de la parte
I de esta tesis, se estudia el comportamiento asintótico cuando
de algunas variantes del método de Newton continuo. En el
capítulo 2, se considera un sistema de tipo gradiente de segundo
orden en el tiempo, a diferencia del método de máximo
descenso que es sólo de primer orden. Dado que la motivación
es desarrollar algoritmos de optimización, al final del capítulo
2 se estudia teóricamente un método de discretización
implícita de segundo orden.
(b) Métodos de aproximación
paramétrica: Una idea natural para tratar un problema de
optimización cuyos
datos presentan ciertas irregularidades tales como no diferenciabilidad
o pérdida de convexidad estricta (degenerancia), consiste en reemplazar
las funciones que describen el problema original por aproximaciones que
posean mejores propiedades. El problema así modificado se considera
como una aproximación del problema original ,
y se espera que la(s) solución(es) del problema aproximado sean
próximas a una solución de .
Sea
la función objetivo que nos interesa minimizar e introduzcamos una
aproximación , donde
es un parámetro, de modo tal que
cuando es pequeño.
Así, el problema de minimización original
 
se aproxima por
 .
Con frecuencia, es posible escoger la aproximación
de forma que posea buenas propiedades tales como coercividad y convexidad
fuerte. Suponemos entonces que para cada
existe una única solución de ,
la que denotamos por . Esta
hipótesis se verifica en diversas aplicaciones: métodos de
penalización en programación lineal y no lineal, métodos
de regularización, etc. El problema interesante es estudiar el comportamiento
de cuando .
Buscamos un resultado de convergencia del siguiente tipo:
-
Convergencia en valor:
cuando 
-
Convergencia de las soluciones: Existe
tal que cuando 
Típicamente, la convergencia de las soluciones
es una propiedad difícil de demostrar. Esto se debe básicamente
a que toda solución del problema original
es en principio "candidata" a ser límite de ,
lo que podría inducir oscilaciones en la trayectoria a medida
que tiende a cero. En este
último caso, no sólo no se tendría convergencia de
la trayectoria si no que las oscilaciones podrían provocar además
fuertes inestabilidades numéricas en la implementación práctica
del método. Sin embargo, en muchos esquemas de aproximación
paramétrica ocurre que la trayectoria selecciona en el límite
una solución particular entre todas las soluciones óptimas
del problema original; ver por ejemplo [ATT2,ATT-COM2,COM-SAN,GON,MCL,MEG,TIK-ARS].
Esta propiedad de selección es muy importante desde el punto de
vista de la estabilidad del método. Más aún, en la
mayor parte de los casos la solución particular seleccionada posee
interesantes propiedades variacionales que la distinguen de las otras soluciones
y que hacen su cálculo interesante para el optimizador.
En la parte II de esta tesis, comenzamos por
considerar en el capítulo 3 una técnica clásica de
penalización para problemas de programación matemática
conocida como el método de penalización exponencial.
Con respecto a la dimensión infinita, en el capítulo 4 consideramos
la aproximación
de una clase de problemas en .
En
ambos casos se establece una propiedad de selección del esquema
de aproximación considerado, y se caracterizan las soluciones particulares
obtenidas en el límite.
En lo anterior, el problema que nos interesa
resolver es , para lo cual
se introduce una familia paramétrica de problemas
con buenas propiedades. Sin embargo, en muchas situaciones donde aparecen
esquemas paramétricos, el problema que se quiere resolver es
para algún valor pequeño del parámetro .
Esto último ocurre en los modelos matemáticos de ciertos
fenómenos físicos cuya descripción requiere el uso
de ciertos parámetros pequeños. En muchos de estos casos
la resolución de
puede ser difícil. Con el fin de obtener una descripción
aproximada del fenómeno real, la idea es estudiar el comportamiento
asintótico de las soluciones cuando los parámetros tienden
a cero. De este modo, el problema
se puede interpretar como un modelo matemático límite para
el caso " ". Nos encontramos así
ante la situación inversa de la anterior: nos interesa resolver ,
para lo cual se estudia su comportamiento asintótico cuando
lo que permite introducir un problema límite
que se espera sea más simple de resolver. Este tipo de análisis
puede ser difícil debido a comportamientos singulares, discontinuidades,
no linealidades y coeficientes crecientemente oscilantes. Las nociones
de convergencia variacional para sucesiones de funciones que han sido introducidas
en las ultimas décadas proporcionan un marco adecuado para estudiar
este tipo de problemas; ver [ATT1,DEG,DAL].
En el capítulo 5, y final de esta tesis,
se estudia un esquema de aproximación paramétrica del tipo
recién descrito. Se trata de la homogeneización de materiales
compuestos en elasticidad no lineal.En este caso se considera el modelo
paramétrico de materiales compuestos y se estudia su comportamiento
asintótico con el fin de obtener un modelo límite "más
sencillo".
(c) Combinación de los enfoques
dinámico y paramétrico: Para finalizar esta
introducción, notemos que los enfoques dinámico y aproximación
paramétrica están fuertemente relacionados, no sólo
por los resultados buscados sino que también por la metodología
y las técnicas utilizadas. Supongamos que la aproximación
es diferenciable para . Una
condición necesaria para la optimalidad es entonces .
Bajo algunos requerimientos apropiados, el teorema de la función
implícita permite asegurar que la trayectoria óptima es diferenciable
con respecto a y, más aún,
se tiene que
.
De este modo, el camino óptimo satisface
una ecuación diferencial; uno podría pensar en aplicar el
enfoque dinámico para estudiar el comportamiento asintótico
cuando (lo que correspondería
a hacer luego del cambio
de variable ). Sin embargo,
debido a la naturaleza singular de esta ecuación en
(en general, la función límite será no diferenciable),
el comportamiento asintótico de las trayectorias es delicado de
estudiar. En lugar de utilizar los métodos clásicos de la
teoría de ecuaciones diferenciales, nuestro enfoque consiste en
aplicar métodos variacionales y de la teoría de optimización.
Estos últimos parecen estar mejor adaptados a esta situación.
Por otra parte, también es posible combinar ciertos métodos
dinámicos con métodos de aproximación paramétrica.
A modo de ejemplo, podemos mencionar el método de máximo
descenso con esquemas de aproximación, que consiste en resolver
el sistema diferencial

donde es una función
positiva que decrece a 0 cuando ,
por ejemplo o
con . Ver [ATT-COM1
,COM,FUR-MIY,KEN,MCC].
Al final del capítulo 1 (parte I), se
introduce un nuevo sistema dinámico que considera la combinación
del método de Newton continuo con esquemas de aproximación.
Resumen de la tesis
Esta tesis está dividida en dos partes.
La primera está dedicada al estudio de ciertos sistemas dinámicos
disipativos en optimización, mientras que en la segunda parte se
presentan algunos resultados nuevos sobre la aproximación paramétrica
y análisis asintótico de problemas variacionales. A continuación
proporcionamos un breve resumen de los cinco capítulos que componen
este trabajo. La mayor parte de las definiciones y notaciones que utilizamos
en lo que sigue son las usuales en Análisis Convexo; ver [EKE-TEM]
o bien [ROC1].
Parte I: Sistemas dinámicos disipativos y optimización
Capítulo 1: El método de Newton continuo.
El primer capítulo de la tesis contiene
un estudio de una versión continua del método de Newton.
Consideremos una función
dos veces diferenciable donde
es un espacio de Hilbert. Recordemos que el método de Newton para
minimizar consiste en resolver
iterativamente
.
Es bien sabido que, bajo ciertas condiciones
adecuadas, si el punto de partida
se encuentra lo bastante cerca de un minimizador local
entonces la sucesión
así generada converge a .
Más aún, se tiene que
para una constante (convergencia
cuadrática). Cuando el método se inicia en un punto relativamente
lejano de la solución, no hay ninguna garantía de convergencia.
Una estrategia para resolver este inconveniente es introducir un paso de
tamaño , escogido
de manera adecuada para forzar la convergencia, lo que conduce a una iteración
de la forma
.
Este último esquema iterativo puede
ser interpretado como una discretización explícita
de
(NC) ,
que llamamos método de Newton continuo. Lo anterior requiere
que la matriz Hessiana ,
la cual contiene las segundas derivadas de ,
sea invertible. Esto se tiene en particular cuando es
definida positiva, lo que implica que la función
es estrictamente convexa. Es fácil verificar que toda solución
de (NC) satisface , y en
consecuencia, . En el caso
convexo, esto proporciona la siguiente caracterización variacional
de las trayectorias asociadas al método de Newton continuo:
,
donde denota el producto interno
en . Para esta caracterización
no se requiere que sea de
clase ni que tenga una matriz
Hessiana invertible, e incluso
tiene sentido para funciones no difereciables (basta reemplazar
por cualquier con
el subdiferencial de ).
En este capítulo se demuestra la existencia global de una trayectoria
y que la función
es decreciente en . Cuando
es fuertemente convexa, se establece una tasa de convergencia exponencial
de hacia el único
minimizador de . La convexidad
fuerte y la diferenciabilidad de la función objetivo
son condiciones demasiado restrictivas en vista de las aplicaciones. Esto
nos conduce a examinar el caso donde
se reemplaza por una familia paramétrica de funciones aproximantes .
Habitualmente es posible escoger la familia de aproximaciones
de modo tal que para cada ,
sea diferenciable y fuertemente convexa, es decir, existe
tal que
.
Bajo estas condiciones, para cada
existe un único minimizador de ,
el cual denotamos por . Inspirados
por un trabajo previo de Attouch y Cominetti en el caso del método
de máximo descenso continuo, introducimos aquí un nuevo método
de Newton continuo aproximado. Más precisamente, la caracterización
variacional de las trayectorias de Newton nos conduce de manera natural
al siguiente problema de evolución no-autónomo:
(NCA) ,
donde es una función
positiva que decrece a 0 cuando .
Esta ecuación combina una corrección de Newton con
un término de extrapolación. La primera atrae la trayectoria
hacia la solución exacta ,
mientras que el segundo término anticipa los eventuales cambios
en el punto objetivo . Se
tiene el siguiente resultado:
Teorema 1.- Para toda condición inicial ,
existe una única solución de
(NCA)
que
satisface la siguiente estimación
.
En particular, si y
la parametrización se
escoge de modo tal que ,
entonces
la trayectoria converge
a .
En otras palabras, cuando
converge a 0 suficientemente lento entonces
se aproxima asintóticamente a la trayectoria óptima ,
definida por las soluciones exactas de los problemas aproximantes. La rapidez
a la que la parametrización
debe converger a 0 se mide en términos del parámetro de convexidad
fuerte Estos resultados
se ilustran a través de algunas aplicaciones a métodos de
barrera y de penalización en programación lineal, y a métodos
de viscosidad para problemas variacionales. Las estimaciones proporcionadas
por este resultado permiten establecer resultados duales. También
se dan comparaciones con los resultados conocidos para el método
de máximo descenso, mostrándose que en general las tasas
de convergencia son mucho mejores para el método de Newton.
Capítulo 2: Una ecuación de segundo orden de tipo gradiente
El método de Newton tiene el gran inconveniente
de hacer intervenir la inversa de la matriz Hessiana de la función
objetivo, lo que puede significar en ciertos casos un esfuerzo enorme en
términos de cálculo numérico. Es natural estudiar
métodos que sólo consideren el gradiente de
para hacer los cálculos y cuyas trayectorias puedan ser aceleradas
con respecto a las del método de máximo descenso. En este
capítulo se estudia el comportamiento asintótico cuando
de las soluciones de la siguiente ecuación de segundo orden en el
tiempo:
.
El parámetro
es estrictamente positivo y la función objetivo se
supone convexa y diferenciable. Este sistema diferencial se conoce comúnmente
como oscilador no lineal amortiguado. Aunque ecuaciones diferenciales
similares a ésta aparecen en diversas situaciones físicas
con distintas interpretaciones, nuestra motivación aquí no
proviene de ningún problema físico en particular si no más
bien de la "tendencia" que tiene este sistema a disipar energía.
En
efecto, definiendo , entonces
es directo verificar que en este caso
.
En otras palabras, la energía es
una función decreciente sobre .
Es natural esperar que la trayectoria
evolucione en el largo plazo hacia un mínimo de la energía,
lo cual corresponde a una solución estacionaria que satisface
y . De este modo, la resolución
de esta ecuación diferencial puede interpretarse como un método
de minimización para .
El interés de este sistema es la posibilidad de impulsar las
trayectorias con el fin de acelerar la convergencia, gracias a la naturaleza
de segundo orden que posee la ecuación (la trayectoria posee cierta
"inercia").
Con respecto al comportamiento asintótico,
en [HAR-JEN] se demuestra convergencia hacia un equilibrio en el caso de
dimensión finita ( ) y bajo
la hipótesis de que
es analítica. Sin embargo, esta restricción es muy fuerte
desde el punto de vista de la optimización. En este capítulo,
se demuestra el siguiente resultado:
Teorema 2. Supongamos que es
convexa y acotada inferiormente. Entonces ,
cuando y .
Más
aún, si el conjunto de minimizadores Argmin es
no vacío, entonces existe Argmin
tal que (débilmente)
en cuando .
Esta convergencia es en norma, i.e. ,
si la función es par
o bien si el interior del conjunto Argmin es
no vacío.
Consideremos ahora la discretización
de esta ecuación diferencial. Recordemos primero que el método
Proximal en optimización convexa consiste en resolver el siguiente
esquema iterativo:
.
En este caso, >0,
es una función convexa, semicontinua inferior y propia. (Prox) se
puede interpretar como una discretización implícita del método
de máximo descenso continuo. Bajo condiciones muy generales,
es posible demostrar que la sucesión converge
hacia un minimizador de ;
ver [GUL] y [ROC2].
Una desventaja importante de los métodos
de tipo gradiente como (Prox) es su relativa lentitud en la convergencia,
propiedad que viene heredada de su versión continua. En el
caso particular del sistema diferencial estudiado en este capítulo,
su discretización implícita nos conduce a considerar el siguiente
algoritmo iterativo, el cual es válido aún en el caso no
diferenciable:

Los parámetros satisfacen
y , la función
es convexa, semicontinua inferior y propia. Notemos que cuando ,
y tomando , se recupera el
método Proximal. Por otra parte, tomando
es posible impulsar la sucesión con el fin de acelerar la convergencia.
Bajo ciertas condiciones sobre los parámetros, se establecen resultados
de convergencia similares al caso continuo. Más precisamente, se
tiene:
Teorema 3. Supongamos que es
convexa, semicontinua inferior, propia y acotada inferiormente. Sea
una sucesión generada por el método a dos pasos anterior,
con:
(i) y
es acotada inferiormente por una constante positiva.
(ii) La sucesión es
no creciente.
Entonces  .
Más aún, si Argmin
es no vacío, suponemos además que:
(iii) y
es acotada.
Entonces existe 
tal que (débilmente)
cuando .
Parte II: Aproximación de problemas variacionales
Capítulo 3: La penalización exponencial
Consideremos el problema de optimización
en programación matemática:
,
donde cada es convexa.
Bajo condiciones apropiadas, es posible asegurar a priori la existencia
de una solución óptima, la cual no necesariamente es única.
Sin embargo, en general no es posible calcular de manera exacta una solución
de este programa convexo. La pregunta natural es cómo obtener una
buena aproximación de una solución. El método de la
penalización exponencial consiste en resolver para
fijo el siguiente problema sin restricciones
.
Observemos que si se define
entonces

donde es el conjunto
de restricciones. Bajo ciertas hipótesis generales, se puede probar
que para cada el problema
penalizado posee una única solución óptima, la cual
denotamos por . Se espera
que cuando sea "suficientemente
pequeño", la solución
del correspondiente problema penalizado proporcione una buena aproximación
de una solución óptima del programa convexo original (antes
de penalizar). De este modo, la convergencia de
cuando es una cuestión
interesante tanto desde el punto de vista teórico como del práctico
en lo que se refiere al estudio y eventual implementación de este
método. Esta convergencia está bien determinada cuando el
programa convexo original admite una única solución. En el
caso en que existe una multiplicidad de soluciones, lo que ocurre en muchas
ocasiones, la convergencia no está en absoluto asegurada pues en
principio toda solución óptima es un candidato potencial
a ser límite de la trayectoria de soluciones aproximadas .
Sin embargo, sobre la base de resultados similares para otros esquemas
de aproximación, es natural preguntarse si el método de penalización
exponencial tiene la propiedad de seleccionar en el límite una solución
particular del problema original. El primer resultado positivo en este
sentido fue dado en [COM-SAN]. En ese artículo, la penalización
exponencial en programación lineal fue estudiada cuidadosamente,
demostrando la trayectoria óptima
converge hacia una solución particular del problema original, llamada
el centroide de la cara óptima. Esta solución particular
se caracteriza mediante ciertas propiedades analíticas y variacionales
que la distinguen de las otras soluciones óptimas. El objetivo de
este capítulo es extender este resultado a una clase bastante general
de programas convexos no lineales, sin asumir condiciones de unicidad
o de segundo orden, lo que constituye la novedad de este trabajo.
Teorema 4. Supongamos que todas las funciones que constituyen
los datos del programa convexo satisfacen la siguiente propiedad: si
es constante sobre el segmento con ,
entonces es constante sobre
toda la recta que pasa por los puntos
e . Entonces para todo
el problema penalizado admite una única solución y,
más aún,
,
donde es una solución
particular del programa convexo original.Esta solución particular,
que llamamos minimizador absoluto, se caracteriza como la única
solución de un esquema jerárquico de problemas de tipo minimax.
Así, este método tiene el interés
de seleccionar una única solución óptima, la cual
satisface ciertas propiedades variacionales que la distinguen del resto.
También se obtienen resultados de convergencia dual.
Capítulo 4: Soluciones locales Para problemas en
mediante aproximación
En este capítulo se estudia un esquema
de aproximación paramétrica en dimensión infinita,
el cual presenta ciertas similitudes con el método de penalización
exponencial estudiado en el capítulo 3. Sea
una abierto acotado que representa una región del espacio. Consideremos
el siguiente problema:

donde es la frontera
de ,
es una función dato y la incógnita es una función
lipschitziana , i.e.
tal que . Como siempre se
tiene que , una solución
de este problema no es otra cosa que una extensión lipschitziana
de la función desde
a toda la región ,
de modo tal que la constante de Lipschitz asociada sea mínima. Este
problema, que fue estudiado por primera vez en [ARO], se conoce como el
problema de extensión lipschitziana minimal y, por analogía
con el caso y el problema
de Dirichlet, es considerado como el problema fundamental del cálculo
de variaciones en . Problemas
similares aparecen en muchas aplicaciones cuando el modelo se plantea naturalmente
en espacios de tipo . Este
es el caso de algunos problemas de ingeniería estructural tales
como el diseño de columnas y otras estructuras donde debe minimizarse
el esfuerzo o la deformación maximales. Otro ejemplo lo constituye
el control optimo de las temperaturas maximales en un sistema termodinámico.
Este problema de optimización no es diferenciable y es débilmente
convexo, y por lo tanto admite en general una multiplicidad de soluciones
óptimas. Un punto de vista que ya ha sido considerado consiste en
reemplazar este problema por su análogo

Este último problema es más regular
que el problema original. Más aún, para cada
existe una única solución óptima, que denotamos por ,
que se caracteriza por ser la única solución de la ecuación
del -laplaciano con
condiciones de Dirichlet

donde . Debido a que
la norma en converge a la
norma en , se espera que
para "suficientemente grande"
la correspondiente solución
proporcione una buena aproximación del problema original. El problema
que nos interesa es la convergencia de la aproximación
cuando , lo que es delicado
de estudiar debido a la no unicidad de soluciones del problema límite.
Esta cuestión fue resuelta en [JEN], donde se prueba que existe
una solución particular
del problema de extensión lipschitziana tal que
cuando . Más aún,
esta solución límite satisface la siguiente propiedad variacional:
para todo abierto ,
para toda función tal
que sobre .
Debido a esta propiedad de optimalidad local,
a se le llama extensiónlipschitziana
minimal absoluta.
En algunas situaciones, el criterio que
debe ser minimizado está dado por una función no homogénea.
Es el caso del diseño óptimo de estructuras mecánicas
a partir de materiales compuestos. Esto nos conduce a considerar en este
capítulo problemas de la forma:
 ,
donde la norma usual se reemplaza por una función de
crecimiento lineal con respecto a .
Aproximando este problema por su análogo
se obtiene:
Teorema 5. Bajo ciertas hipótesis técnicas sobre
el núcleo , del tipo
regularidad y convexidad con respecto a ,
se tiene que para todo existe
una única solución
de
,
la sucesión generalizada
es equicontinua y acotada en ,
cada valor de adherencia
de es una solución
óptima de y .
Más aún, para todo abierto
se satisface:
para toda función
tal que sobre .
De este modo se generaliza parcialmente el
resultado conocido en el caso homogéneo. Sin embargo, aún
queda abierto el problema de la convergencia de toda la trayectoria de
soluciones aproximadas ,
lo
que equivale a probar que esta trayectoria admite un único valor
de adherencia. La conjetura es que similarmente a lo que ocurre en el caso
homogéneo, la propiedad de unicidad local debería ser suficiente
para tener unicidad del límite.
Capítulo 5: homogeneización de materiales compuestos
en elasticidad no lineal
Por material compuesto entendemos aquellos
materiales, naturales o sintéticos, que a escala microscópica
poseen una estructura heterogénea (combinación de diversos
materiales) pero cuyo comportamiento macroscópico es homogéneo.
A modo de ejemplo podemos mencionar el vidrio, cerámicas, aleaciones
de metales, etc. El estudio de esta clase de materiales por parte de las
ciencias de la ingeniería ha tenido un gran impulso en las últimas
décadas, teniendo un fuerte impacto tanto en el ámbito teórico
como tecnológico. Desde el punto de vista de las ciencias de los
materiales, el análisis matemático de los modelos teóricos
de tales materiales presenta grandes desafíos.
Sea
un abierto regular de que
representa la región del espacio ocupada por un material. Si dicho
material es homogéneo, su energía almacenada
tiene la forma
,
donde es un campo
de desplazamientos. Si el material está sometido a una distribución
de fuerzas y los desplazamientos
en la superficie son conocidos, entonces para determinar la configuración
de equilibrio se debe resolver el siguiente principio de minimización
de energía:

Cuando la densidad de energía depende
también del punto en la
región , decimos que
el material es heterogéneo. En el caso de los materiales
compuestos, se tiene que los diversos componentes son distinguibles a una
cierta escala microscópica definida por un parámetro .
Para simplificar el modelo, se suele suponer que los componentes están
distribuidos periódicamente dentro de la región. Todo
esto nos conduce a considerar un principio de minimización de energía
de la forma

Aquí se supone que para todo
la función es -
periódica, lo que significa que basta conocerla en la celda unitaria
para conocerla en todo el espacio. De este modo se modela un material elástico,
no homogéneo y periódico que ocupa una región finita
del espacio definida por .
Si es muy pequeño,
entonces la estructura microscópica de la estructura se vuelve muy
complicada. El problema que surge es cómo describir el comportamiento
macroscópico
del material, lo que corresponde matemáticamente a hacer .
Si a escala macroscópica el material se comporta de manera homogénea,
entonces se espera que cuando
el problema anterior "tienda" a un problema del tipo
 ,
donde es una densidad
límite que corresponde a una suerte de material homogéneo
ideal, el cual se genera a partir de una mezcla de materiales a escala
microscópica. Cuando esto ocurre así se dice que un proceso
de homogeneización ha tenido lugar. Para resultados en este
sentido ver [A-L-M,ATT1,DAL,MULL].
En el capítulo final de esta tesis se
considera la situación más general de una familia paramétrica
de densidades periódicas
donde es un vector de parámetros.
En este caso, el principio de minimización
 
determina la configuración de equilibrio de un material elástico,
no homogéneo y periódico de escala microscópica ,
y además el vector de parámetros
describe ciertas propiedades del material como la rigidez o el espesor
de ciertas componentes; ver [LIC-MIC]. Como antes, queremos describir el
comportamiento macroscópico del material. Sin embargo, en muchas
situaciones físicas pasar de la escala microscópica a la
macroscópica requiere hacer ,
es decir, todos los parámetros tienden a cero simultáneamente.
En este capítulo se proporcionan algunas condiciones suficientes
que aseguran que en este caso multiparamétrico también ocurre
un fenómeno de homogeneización. En otras palabras, se obtiene
un resultado del tipo:
Teorema 6. Bajo ciertas hipótesis sobre el comportamiento
del modelo cuando , se tiene
que cuando las soluciones
y valores óptimos de los correspondientes principios de minimización
de energía convergen
hacia una solución y valor óptimos de un problema homogéneo
del tipo .
Conclusiones
En el desarrollo y estudio de algoritmos de
optimización, el enfoque dinámico posee varias ventajas.
Un sistema continuo con buenas propiedades sugiere su utilización
como método de optimización a partir de la integración
numérica de las trayectorias continuas. Además, en algunas
ocasiones es posible adaptar las técnicas utilizadas en el caso
continuo para obtener resultados concernientes al algoritmo discreto asociado.
Varios de los resultados se enuncian en un nivel de abstracción
que permite su aplicación en otros contextos, tales como la teoría
de ecuaciones en derivadas parciales y otros problemas de evolución.
Por otra parte, los métodos de aproximación
en optimización aparecen como una herramienta particularmente eficaz
para el estudio de problemas mal puestos en unicidad o con datos irregulares.
Tales problemas provienen de las más diversas áreas de las
matemáticas aplicadas, desde la programación matemática
hasta el cálculo de variaciones. La idea fundamental consiste en
seleccionar una solución particular del problema original como límite
de una trayectoria de soluciones óptimas de una familia parametrizada
de problemas aproximantes. La solución así obtenida habitualmente
posee propiedades variacionales importantes que la distinguen del resto.
Ambos puntos de vista están estrechamente
relacionados. En el caso de los métodos de aproximación,
aún cuando es posible describir la trayectoria como una solución
de una ecuación diferencial, parece ser que los métodos variacionales
y de la teoría de optimización están mejor adaptados
a esta situación que los métodos clásicos de la teoría
de ecuaciones diferenciales.
Bibliografía
-
[A-L-M] Y. Abddaimi, C. Licht, G. Michaille, Stochastic homogenization
for an integral functional of a quasiconvex function with linear growth,
Asymptotic Analysis 15 (1997), pp. 183-202.
-
[ARO] G. Aronsson, Extension of functions satisfying Lipschitz conditions,
Ark. Math 6 (1967), pp. 551-561.
-
[ATT1] H. Attouch, ``Variational convergence for functions and
operators", Pitman Advanced Publishing Program (1984).
-
[ATT2] H. Attouch, Viscosity solutions of minimization problems,
SIAM J. Optimization, Vol. 6, No. 3 (1996): 769-806.
-
[ATT-COM1] H. Attouch, R. Cominetti,
A dynamical approach
to convex minimization coupling approximation with the steepest descent
method, J. of Differential Equations 128 (1996): 519-540
-
[ATT-COM2] H. Attouch, R. Cominetti,
approximation of variational problems in
and , J. of Nonlinear
Analysis.
-
[BRA-CHI] A. Braides, V. Chiadò Piat, Remarks on the Homogenization
of Connected Media, Nonlinear Anal. 22 (1994), pp. 391-407.
-
[BRE] H. Brezis, Asymptotic behaviour of some evolution systems,
Nonlinear Evolution Equations, Academic Press, (1978).
-
[BRU] R. E. Bruck, Asymptotic convergence of nonlinear contraction semigroups
in Hilbert spaces, Journal of Functional Analysis 18, (1975), pp. 15-26.
-
[COM] R. Cominetti, Asymptotic convergence of the steepest descent method
for the exponential penalty in linear programming, J. of Convex Analysis
2 1/2 (1995), pp. 145-152.
-
[COM-SAN] R. Cominetti, J. San Martín,
Asymptotic analysis of
the exponetial penalty trajectory in linear programming, Math. Programming
67 (1994), pp. 169-187.
-
[DAL] G. Dal Maso, "An Introduction to
-convergence",
Birkh\"auser, Boston, 1993.
-
[DEG] E. De Giorgi, Sulla convergenza di alcune successioni di integrali
del tipo dell'area, Rend. Mat. Appl. (6) 8 (1975), pp. 277-294.
-
[EKE-TEM] I. Ekeland, R. Temam, "Analyse convexe et problèmes variationnels",
Dunod, Gauthier-Villars, Paris, 1974.
-
[FUR-MIY-KEN] H. Furuya, K. Miyashiba, N. Kenmochi,
Asymptotic behavior
of solutions to a class of nonlinear evolution equations, J. Diff.
Equations, 62, (1986), pp. 73-94
-
[GON] C. G. Gonzaga, Path-following methods for linear programming,
SIAM Review 34 (1992), pp. 167-224.
-
[GUL] O. Güler, On the convergence of the proximal point algorithm
for convex minimization, SIAM J. Control and Optimization 29(2)(1991),
pp. 403-419.
-
[HAR-JEN] A. Haraux, M.A. Jendoubi, Convergence of solutions of second-order
gradient-like systems with analytic nonlinearities, J. Differential
Equations 144 (1998), pp. 313-320.
-
[JEN] R. Jensen, Uniqueness of Lipschitz extensions: minimizing the
sup norm of the gradient, Arch. Rational Mech. Anal. 123 (1993), pp.
51-74.
-
[LEM] B. Lemaire, An asymptotical variational principle associated with
the steepest descent method for a convex function, Journal of Convex
Analysis 3, No. 1 (1996), pp. 63-70.
-
[LIC-MIC] C. Licht, G. Michaille, A modelling of elastic adhesive bonding
joints, Advances in Math. Sciences and Applications, Vol. 7, No. 2
(1997), pp. 711-740.
-
[MCC] G.P. McCormick, The projective SUMT method for convex programming,
Math. Oper. Res. 14(2) (1989), pp. 203-223.
-
[MCL] L. McLinden, An analogue of Moreau's proximation theorem with
application to the nonlinear complementary problem, Pacific J. Math.,
Vol. 88 (1980): 101-161
-
[MEG] N. Megiddo, Pathways to the optimal set in linear programming,
in Progress in Math. Prog.: interior-point and related methods, Springer-Verlag
(1989), pp. 131-158.
-
[MUL] S. Müller, Homogenization of Nonconvex Integral Functionals
and Cellular Elastic Materials, Arch. Rat. Mec. (1987): 189-212.
-
[ROC1] R.T. Rockafellar, "Convex Analysis", Princeton University
Press, Princeton, N.J., 1970.
-
[ROC2] R.T. Rockafellar, Monotone operators and the proximal
point algorithm, SIAM J. on Control and Optimization (1976), pp. 877-898.
-
[TIK-ARS] A. Tikhonov, V. Arsenine, "Méthodes de résolution
de problèmes mal posés", MIR, Moscú, 1974.
|
     |