Optimizacion-Dinamica.pdf - Universidad Nacional Mayor de San Marcos Facultad de Ciencias Econ\u00f3micas Taller de Macrodin\u00e1mica Programaci\u00f3n Din\u00e1mica

Optimizacion-Dinamica.pdf - Universidad Nacional Mayor de...

This preview shows page 1 - 3 out of 6 pages.

Universidad Nacional Mayor de San Marcos Facultad de Ciencias Econ°micas Taller de MacrodinÆmica Programaci°n DinÆmica Miguel Ataurima Arellano [email protected] [email protected] [email protected] Febrero 2011 En este art±culo se presentan ideas y mØtodos bÆsicos de la programaci°n dinÆmica. Se establecen los elementos bÆsicos de un problema de optimizaci°n recursivo, se describe el funcionamiento la ecuaci°n (la ecuaci°n de Bellman), se presenta tres mØtodos para resolver la eecuaci°n de Bellman, y se da la f°rmula de Benveniste-Scheinkman de la derivada de la funci°n de valor °ptima. 1 El Problema Secuencial Sea ° 2 [0 ; 1] un factor de descuento. Se desea escoger una secuencia in²nita de controles f u t g 1 t =0 = f u 0 ; u 1 ; : : : g para maximizar 1 X t =0 ° t r ( x t ; u t ) (1) sujeto a x t +1 = g ( x t ; u t ) con x 0 dado. Asumimos que r ( x t ; u t ) es una funci°n c°ncava y que el conjunto ° ( x t +1 ; x t ) : x t +1 ° g ( x t ; u t ) ; u t 2 R k ± es convexo y compacto. La programaci°n dinÆmica busca encontrar una funci°n de pol±tica h invariante en el tiempo que mapee el estado x t en el control u t , de tal manera que la secuencia f u s g 1 s =0 generada mediante la iteraci°n de las siguientes dos funciones u t = h ( x t ) (2) x t +1 = g ( x t ; u t ) iniciando desde la condici°n inicial x 0 en t = 0 , resuelva el problema general Una soluci°n de la forma de las ecuaciones (2) se dice que es recursiva . Para encontrar la funci°n de pol±tica h necesitamos conocer una funci°n V ( x ) que exprese el valor °ptimo del problema original, iniciando desde una condici°n arbitraria x 2 X . Esta es la llamada funci°n valor . En particular, de²nimos V ( x 0 ) = max f u s g 1 s =0 1 X t =0 ° t r ( x t ; u t ) (3) 1
Image of page 1
Taller de MacrodinÆmica Programaci°n DinÆmica donde una vez mas, la maximizaci°n estÆ sujeta a x t +1 = g ( x t ; u t ) con x 0 dado. Como es de esperarse, no podemos conocer V ( x 0 ) hasta despuØs de haber resuelto el problema, sin embargo, vamos a proceder con fØ. Si conociØcemos V ( x 0 ) , entonces la funci°n de pol±tica h puede ser calculada resolvendo para cada x 2 X el problema max u f r ( x; u ) + °V ( e x ) g (4) sujeto a v = g ( x; u ) con x dado, y e x denota el estado del periodo siguiente. As±, hemos intercambiado el problema original de encontrar una in²nita secuencia de controles que maximizan la expresi°n (1) por el problema de encontrar la funci°n val°r °ptima V ( x ) y una funci°n h que resuelva la continuidad de los problemas de maximizaci°n (4) - un problema de maximizaci°n para cada valor de x . Este intercambio no parece un progreso, pero veremos que a menudo si lo es.
Image of page 2
Image of page 3

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture

  • Left Quote Icon

    Student Picture